先分类,真的是对的吗?——一个物料系统设计者的思考

最近在备考时看到一句话:信息是数据的内涵,数据是信息的表达。 这句话虽然抽象,但是它解释了为什么工程师和程序员在讨论同一个东西时,永远说不明白。 工程师和程序员说的是两种语言 当工程师说"物料"的时候,他心里想的是一条信息——“我知道这是什么东西”。他看表格里的几个属性:材质、规格、图号,就能认出"这是一块钢板"。工程师不需要所有字段都填满,他凭几个关键信息就能判断。 但当程序员说"物料"的时候,他心里想的是数据库里的一条记录——有固定的字段结构,每个字段的类型和含义都是预先定义好的。 这两种理解都没有错,但它们指向的不是同一个东西。工程师关心的是"这是什么",程序员关心的是"数据长什么样"。 问题在于:为什么工程师觉得自然的事(知道这是什么就行),程序员却总觉得"不够规范"? 不是谁固执,而是长期的技术约束塑造了我们所有人的思维。在传统开发范式下,程序必须预先知道所有字段的类型和含义,才能运行。一个字段不确定,整个系统就没法写。所以我们会本能地把一切模糊的东西变成固定的结构——分类就是最自然的工具。 这不是谁的选择,是技术条件的选择。 我之所以会意识到这一点,是因为我们最近在建一个物料数据库。一位工程师负责设计分类树,建完之后,这位设计者觉得结构很清晰、很完美,但我看的时候觉得意义不大,而其他一些使用它的工程师也觉得不理想。 同一个分类系统,三种完全不同的感受。为什么? 仔细想想,原因其实很简单: 设计者觉得完美,因为这个分类树符合他的组织习惯——他是按"文件夹"的逻辑来建的,东西该放哪一层的哪个抽屉,他心里很清楚。 我觉得没用,因为我平时管理电脑里的文件就不怎么依赖文件夹。我习惯用全局搜索软件,或者现在直接用 AI 来帮我找东西。不管文件放在哪个文件夹里,我搜关键词就能找到。分类树对我来说只是一个多余的浏览入口。 其他人觉得不理想,因为这个分类树不是按照他们的思路建的。他们有自己的分类习惯,但系统只有一种分法,自然觉得别扭。 两个推论 从这里可以得出两个结论。 第一,分类不是人类的刚需。 我和设计者对分类的态度截然不同,但我们都很好地管理着自己的数据和文件。分类树很大程度上是 Windows 文件夹文化培养出来的习惯——它教我们把东西放到不同的目录里。但这种习惯不是强制性的,也不是唯一的管理方式。很多人(像我一样)用搜索代替分类,照样能找到需要的东西。 第二,分类的不一致性是不可避免的。 人类天然就有不同的组织习惯。设计者喜欢文件夹式,我喜欢搜索式,其他人有各自的偏好。不可能存在一个让所有人都满意的分类结构。既然每个人的想法都不一致,那分类系统只有两种结局:要么是冗余的、复杂的,试图覆盖所有人的需求从而勉强稳定;要么是灵活的,但注定让大部分人觉得不顺手。 既然分类不是人类的真实需求,那为什么一提到物料库,所有人还是会理所当然地觉得"先分类"? 当企业要建立物料库的时候,问题来了:我们管的东西五花八门,有螺栓、钢板、电机、阀门、软件、油漆……它们需要的信息完全不一样。 螺栓需要标准号和规格,钢板需要材质和厚度,电机需要功率和电压,软件需要授权码和版本号。 面对这些五花八门的对象,大家的第一反应都是"先分类,每类一套字段结构"。不是因为这个方案有多好,而是因为在传统的技术约束下,这是最容易实现的方案。 传统的系统必须是严格的、准确的,它需要预先定义好所有字段,每条记录都填满相同的结构。编写能处理维度不确定数据的系统非常困难——并非无法实现,比如购物网站的分面搜索就是一个例子——但开发成本和 UI 实现难度都很高。 所以当我们需要管理多种类型对象的系统时,分类是最自然的选择。每个类别一张表,表结构固定,字段统一。每个物料必须先分到一个类别,才能获得对应的数据结构。 分类之所以成为物料库的基础设施,不是因为人类觉得分类好用,而是因为系统需要统一的字段结构,而分类是实现统一结构的最简单方式。 这种技术约束持续了太久,久到大家都把它当成了理所当然——“系统本来就该这样设计”。但当我们回到工程师的视角,就会发现:工程师真正需要的从来不是填对分类,而是让系统帮他找到这是什么。 我们一直在用解决数据问题的方式,去处理一个信息问题。 如果我们先不去想数据库表怎么建,而是回到信息本身——要确认一个信息,到底需要多少数据? 信息的识别,需要的数据维度天生不一致 举个例子:要区分一个人,如果他的名字很特殊,只需要知道名字就够了;但如果是一个很常见的名字,就还需要知道他在哪个部门、什么岗位。同样是要识别"这个人是谁",需要的数据维度却完全不同。 物料的识别也是一样。一颗螺栓,如果它的图号是一个罕见的规格,光知道规格就够了;但如果它的规格只是"M8×25",那就远远不够——还需要知道材质、强度等级、表面处理,甚至品牌。同样是要确认"它是什么",因为数据值的不同,需要的字段数量就不同。 这就是信息的特点:同一类对象,因为数据值的独特程度不同,区分它需要的字段数量就不同。数据值足够独特的,少一点字段就够了;数据值很常见的,就需要更多字段来缩小范围。 还有另一个因素:对象的总数也会影响区分它需要的字段数量。在一个小部门里,叫"张伟"的可能只有一个,知道名字就够了;但放到全公司几千人里,重名概率大增,就必须加上部门、工号才能区分。信息还是那个信息,但区分它需要的数据量变了。 螺栓也一样。如果一家企业平时只用四五种标准螺栓,说"M8×25 8.8级"就够了,所有人都知道是哪一种。但如果涉及关键受力部位,比如压力容器、起重机吊臂、钢结构连接,光说"M8×25"就不够了,还得加上材质、强度等级、表面处理方式、螺纹精度等级才能区分。同样的规格,在不同的使用范围里,区分它需要的字段数量不同。 从这里可以得出一个和分类相似的推论。 数据的维度也是演进的,它随着系统面临的情况越来越复杂而不断增加。 一个螺栓,刚录入的时候可能只需要规格和材质;后来有人用在关键场合,加上强度等级和表面处理;再后来有人需要区分供应商,又加上品牌。系统每遇到一个新的区分维度,就会多一个字段。 这种演进在固定表结构的模式下注定是不稳定的——要么字段越来越多、越来越冗杂,试图覆盖所有可能的区分需求从而勉强稳定;要么字段太少,牺牲实际业务需求以换取结构稳定。 结果就是:有的记录空了一半,有的记录填了一堆用不上的信息。 人们为什么没有对这个冗余提出异议?因为软件开发的限制让人们习惯了这一点,Excel 的使用也让人们习惯了这一点。过去不是没有人注意到这个冗余,只是没有更好的办法。人脑自动过滤了不必要的信息,久而久之,大家都觉得"表里每一行都有相同数量的列"是天经地义的事。 如果我们抛开这些限制,回到需求本身——一个理想的系统应该长什么样? 它应该能接受不定维度的数据。你告诉它什么,它就记下来;不需要填满所有字段,不需要预先定义结构。它还能理解这些信息——分辨哪些关键、哪些冗余,在查询时帮你找到你要的东西。 这种系统不是想象出来的,它是需求的本来面目。只是在过去的技术条件下,实现它的代价太大了。 LLM 让我们有机会换个角度 大语言模型出现之后,我们终于有能力去接近那个"需求的本来面目"了。 它不需要统一的字段结构。你给它一段描述,它能理解里面包含了什么信息;你给它不同维度的数据,它能自动分辨关键和冗余。更重要的是,它能理解不同表达方式背后的实际含义。 “材质"和"材料”、“DN50"和"口径50mm”——在传统系统看来是完全不同的字段,无法匹配;但 LLM 能认出它们说的是同一个东西。 这意味着我们不再需要预先统一所有字段的命名和结构。过去,系统要找到一条数据,字段名必须完全一致;现在,LLM 可以自动寻找语义上相似的数据,挖掘字段名的实际含义。系统不再只能做精确匹配,它开始"理解"了。 这正是 LLM 对程序设计思维转变的意义——过去我们认为"必须先统一结构才能管理",是因为系统只会按字段名匹配数据。当系统能够理解语义本身,统一结构就不再是前提条件了。 这意味着我们可以回到问题的本质去重新设计系统——站在信息与数据的关系这个角度去思考,而不是被传统开发范式牵着走。 分类不会消失,但它应该退回到它真正的位置——辅助浏览,而不是管理数据的基础设施。

May 22, 2026 · 1 min · 68 words · Snailya

当“不值得”成为护城河————观察AI对于行业的渗透

AI 的兴起令人振奋:它在信息检索、文本生成与知识整合上的能力,显著提升了普通用户的工作效率。然而,“AI 是否将取代人类”的疑虑亦如影随形。观察可见,在部分领域,取代已然发生。但这一进程并非均质推进——其路径由经济逻辑主导,而非技术可能性本身。 被率先渗透的行业,普遍具备两个特征:其一,历史利润丰厚,足以支撑高昂的模型开发成本,如金融、法律;其二,核心门槛在于信息处理:金融依赖对海量数据的快速分析,法律依赖对庞杂条文的精准调用,医疗则要求从业者长期积累大量病例经验。这些工作中大量重复性、结构性强的环节,正被 AI 以更高效率、更低成本完成。 相较之下,另一些领域尚未经历同等程度的冲击。其原因并非技术不可逾越,而在于经济可行性不足。以系统级设计为例——规划一条柔性产线时,需权衡“换型时间缩短两分钟是否值得追加五十万元投入”,或“为操作者预留三十厘米空间致整体效率下降百分之二,但工伤风险降低百分之四十,是否合理”。此类决策依赖对业务目标、人性需求与风险边界的综合判断。表面观之,似为 AI 难以企及之域;实则,相关模型在理论上可构建——通过强化学习结合数字孪生,量化多维目标并输出帕累托解集。 障碍不在能力,而在成本:数据采集、系统集成与定制训练的投入,远超当前所能兑现的经济回报。设计行业与金融行业从业者薪资的显著差异,正折射出资本对 ROI 的天然取舍。 需强调的是,“当下不值得”不等于“永远不可行”。技术本身持续演进,传感器成本下降、数据积累深化,终将压缩经验数字化的边际成本。届时,许多所谓“直觉”或将被证实为高维模式匹配——与 AI 的机制并无本质区别。老师傅凭异响判断轴承故障,实为长期实践中形成的“声纹—失效”映射;若企业愿系统模拟万次故障并记录声学特征,专用模型完全可能超越人类表现。区别仅在于:前者是沉没成本,后者需显性投入。 当资本在头部高利润领域完成初步整合、边际收益递减时,其必然向次级高潜力领域延伸。设计、医疗、教育等曾被视为“中产堡垒”的行业,或将迎来更深度的流程重构。此时,所谓“护城河”的实质,更接近一种暂时的经济洼地。 唯一可能构成实质性阻滞的,是责任归属问题。现行制度要求关键设计文件须由注册工程师签字,终身担责。此非技术局限,而系制度选择——人类社会需要明确的问责主体,以维系系统稳定。重大事故后,公众要求一个可指认的负责者,以疏导焦虑、恢复秩序。这种“替罪羊机制”具有深层社会功能:正如历史上诸多群体对立被用作内部凝聚的工具,责任归属的本质,是为复杂系统失效提供一个可操作的出口。只要此机制持续存在,人类的签字权便难以被彻底替代。 至于奢侈品手工艺的存续,其逻辑亦属经济理性:行业规模有限,虽单品溢价高,但总体利润不足以吸引大规模 AI 投入;从业者遂采取主动收缩策略——限制产能、不再扩招,仅由少数匠人分享剩余价值,维持个体收益水平。这并非技术护城河,而是一种清醒的退守。 综上,AI 的演进轨迹由经济可行性划定:它优先取代高利润、高标准化、高数据密度的环节;对低 ROI 领域的渗透,则取决于资本流动的阶段性需求。人类经验的数字化并非不可行,而是成本与收益的权衡问题。 最终,行业演化或呈现两种路径: 高 ROI 领域走向“极简人力 + AI 大规模复制”,单位产值利润率反升; 低 ROI 领域走向“小规模、高单价、少人力”的收缩模式; 而横亘其间的责任归属问题,则构成一道暂时难以逾越的制度性边界。 技术不会决定未来,但会放大我们已有的选择。而真正的挑战在于:当效率的边界不断拓展,我们是否仍保有定义“值得”的能力。

December 16, 2025 · 1 min · 36 words · Snailya

从词向量到“人工天才”:我的LLM认知思辨录

本文是在与AI助手深度对话后,对我个人理解大语言模型(LLM)过程的梳理与总结。它不代表学术观点,仅是一个探索者的思想航行日志。 一、起点:从“词频统计”到“语义宇宙” 我的思考始于一个最朴素的问题:如何判断两篇文章是否相关? 最直观的想法是统计共有的词语——这就是“词袋模型”。但它有一个显而易见的缺陷:无法理解语义。正是在这里,我遇到了第一个关键概念:词向量。 在我的想象中,词向量就像是为机器建造了一个高维的语义宇宙。每个词不再是孤立的符号,而是这个宇宙中的一颗星星: 语义相近的星(如“国王”和“王后”)会在宇宙中彼此靠近 语义关系(如“国王-男人+女人≈女王”)通过星星之间的相对方位来体现 但很快我发现了一个问题:这个词向量宇宙是静态的。无论上下文如何,“苹果”这颗星的位置,总是固定在“水果”和“科技”的模糊中点。这显然不符合我们对语言的理解——同一个词在不同语境下应有不同的含义。 二、突破:三重变换与“动态侦探” 为了解决静态词向量的局限,我接触到了Transformer架构——当代LLM的核心引擎。为了理解它,我构建了这样一个比喻: 词向量像一本权威词典:每个词都有个固定不变的定义 大语言模型像一位顶级侦探:他能根据具体情境,动态理解每个词的真实含义 这位“侦探”的思考过程,可以简化为三个关键的矩阵变换: 输入嵌入:将词语转换为初始的“思维符号” Transformer加工:通过自注意力机制,让所有词语的符号相互交流,生成富含上下文的全新表示 输出投影:将最终的思维结果“翻译”成人类语言 这个过程让我意识到:LLM不是在简单预测下一个词,而是在深度理解整个语境后,让最合适的词语自然流淌出来。 三、镜像:当LLM照见人类思维 理解LLM的过程,意外地成为了一面审视人类自身的镜子。 我们都是“模式识别”系统 我回想起自己解数学题的方法:列出已知量和待求量,然后在脑中搜索可能的公式——这本质上就是一种模式识别。LLM的注意力机制不也是在庞大的知识库中进行加权搜索吗? “通才”与“天才”的鸿沟 大多数人和当前的LLM一样,是优秀的“内插器”——在已知模式间进行组合。而天才,或许就是那些能在更高维度进行“外推”,创造出全新模式组合的系统。 顺序的迷思 我们日常交流中经常使用倒装、省略,但彼此仍能理解。这让我怀疑:智能的核心或许不是表面上的词序,而是深层的语义关系网络。 语法顺序只是通往这个网络的康庄大道,但不是唯一的路径。 四、深化:动态智能的未来图景 在对比人与LLM时,一个关键差异浮现出来:我们的思维是动态的,而LLM是静态的。 LLM的“静态心智”:使用固定的激活函数,如同一个永远保持同一种情绪的思考者 人脑的“动态大脑”:受化学物质调节,思考效率随状态波动——有时思如泉涌,有时头脑迟滞 这指向了一个迷人的方向:为LLM引入动态激活机制。比如: 动态稀疏:根据问题难度激活不同数量的神经元 情境化思考:让激活函数能根据任务类型自我调整 神经调制:引入类似“好奇心”的全局信号 这或许是LLM从“博学通才”迈向“创造天才”的关键一步。 五、哲思:智能、意识与存在的终极之问 这场思辨最终将我带向了一些哲学性的边界问题。 如果人脑与LLM在本质上都是“模式处理系统”,那么我们的意识、创造力,是否也只是更复杂算法的涌现? 这个想法让我联想到《模拟人生》的游戏——如果为游戏角色接入LLM,他们将产生“模拟的自主意识”,却永远无法认知自己被创造的事实。那么,我们是否也可能身处某个“上层游戏”之中? 面对这个令人战栗的推论,我找到了自己的答案:即使我们是模拟的,但我们此刻的思考、困惑、爱与恐惧,这些体验本身的质感是100%真实的。 意义不依赖于底层基质(是原子还是比特),而依赖于体验的深度与丰富度。 结语:作为镜子的LLM 回顾这段思考历程,我意识到LLM不仅仅是一项技术,更是一面珍贵的镜子。通过理解它的运作原理,我们得以用新的视角审视自己的思维方式。 从词向量到Transformer,从静态模式匹配到动态条件计算,这条技术发展路径,恰恰映照出我们对“智能”本身不断深化的理解。 或许,未来真正的突破不在于建造更大的模型,而在于为模型注入那种我们称之为“灵感”、“直觉”和“创造力”的动态本质——而这,将需要我们更深刻地理解我们自己。

November 28, 2025 · 1 min · 45 words · Snailya