随笔 | Snailya虾啵啵

先分类，真的是对的吗？——一个物料系统设计者的思考

最近在备考时看到一句话：信息是数据的内涵，数据是信息的表达。这句话虽然抽象，但是它解释了为什么工程师和程序员在讨论同一个东西时，永远说不明白。工程师和程序员说的是两种语言当工程师说"物料"的时候，他心里想的是一条信息——“我知道这是什么东西”。他看表格里的几个属性：材质、规格、图号，就能认出"这是一块钢板"。工程师不需要所有字段都填满，他凭几个关键信息就能判断。但当程序员说"物料"的时候，他心里想的是数据库里的一条记录——有固定的字段结构，每个字段的类型和含义都是预先定义好的。这两种理解都没有错，但它们指向的不是同一个东西。工程师关心的是"这是什么"，程序员关心的是"数据长什么样"。问题在于：为什么工程师觉得自然的事（知道这是什么就行），程序员却总觉得"不够规范"？不是谁固执，而是长期的技术约束塑造了我们所有人的思维。在传统开发范式下，程序必须预先知道所有字段的类型和含义，才能运行。一个字段不确定，整个系统就没法写。所以我们会本能地把一切模糊的东西变成固定的结构——分类就是最自然的工具。这不是谁的选择，是技术条件的选择。我之所以会意识到这一点，是因为我们最近在建一个物料数据库。一位工程师负责设计分类树，建完之后，这位设计者觉得结构很清晰、很完美，但我看的时候觉得意义不大，而其他一些使用它的工程师也觉得不理想。同一个分类系统，三种完全不同的感受。为什么？仔细想想，原因其实很简单：设计者觉得完美，因为这个分类树符合他的组织习惯——他是按"文件夹"的逻辑来建的，东西该放哪一层的哪个抽屉，他心里很清楚。我觉得没用，因为我平时管理电脑里的文件就不怎么依赖文件夹。我习惯用全局搜索软件，或者现在直接用 AI 来帮我找东西。不管文件放在哪个文件夹里，我搜关键词就能找到。分类树对我来说只是一个多余的浏览入口。其他人觉得不理想，因为这个分类树不是按照他们的思路建的。他们有自己的分类习惯，但系统只有一种分法，自然觉得别扭。两个推论从这里可以得出两个结论。第一，分类不是人类的刚需。我和设计者对分类的态度截然不同，但我们都很好地管理着自己的数据和文件。分类树很大程度上是 Windows 文件夹文化培养出来的习惯——它教我们把东西放到不同的目录里。但这种习惯不是强制性的，也不是唯一的管理方式。很多人（像我一样）用搜索代替分类，照样能找到需要的东西。第二，分类的不一致性是不可避免的。人类天然就有不同的组织习惯。设计者喜欢文件夹式，我喜欢搜索式，其他人有各自的偏好。不可能存在一个让所有人都满意的分类结构。既然每个人的想法都不一致，那分类系统只有两种结局：要么是冗余的、复杂的，试图覆盖所有人的需求从而勉强稳定；要么是灵活的，但注定让大部分人觉得不顺手。既然分类不是人类的真实需求，那为什么一提到物料库，所有人还是会理所当然地觉得"先分类"？当企业要建立物料库的时候，问题来了：我们管的东西五花八门，有螺栓、钢板、电机、阀门、软件、油漆……它们需要的信息完全不一样。螺栓需要标准号和规格，钢板需要材质和厚度，电机需要功率和电压，软件需要授权码和版本号。面对这些五花八门的对象，大家的第一反应都是"先分类，每类一套字段结构"。不是因为这个方案有多好，而是因为在传统的技术约束下，这是最容易实现的方案。传统的系统必须是严格的、准确的，它需要预先定义好所有字段，每条记录都填满相同的结构。编写能处理维度不确定数据的系统非常困难——并非无法实现，比如购物网站的分面搜索就是一个例子——但开发成本和 UI 实现难度都很高。所以当我们需要管理多种类型对象的系统时，分类是最自然的选择。每个类别一张表，表结构固定，字段统一。每个物料必须先分到一个类别，才能获得对应的数据结构。分类之所以成为物料库的基础设施，不是因为人类觉得分类好用，而是因为系统需要统一的字段结构，而分类是实现统一结构的最简单方式。这种技术约束持续了太久，久到大家都把它当成了理所当然——“系统本来就该这样设计”。但当我们回到工程师的视角，就会发现：工程师真正需要的从来不是填对分类，而是让系统帮他找到这是什么。我们一直在用解决数据问题的方式，去处理一个信息问题。如果我们先不去想数据库表怎么建，而是回到信息本身——要确认一个信息，到底需要多少数据？信息的识别，需要的数据维度天生不一致举个例子：要区分一个人，如果他的名字很特殊，只需要知道名字就够了；但如果是一个很常见的名字，就还需要知道他在哪个部门、什么岗位。同样是要识别"这个人是谁"，需要的数据维度却完全不同。物料的识别也是一样。一颗螺栓，如果它的图号是一个罕见的规格，光知道规格就够了；但如果它的规格只是"M8×25"，那就远远不够——还需要知道材质、强度等级、表面处理，甚至品牌。同样是要确认"它是什么"，因为数据值的不同，需要的字段数量就不同。这就是信息的特点：同一类对象，因为数据值的独特程度不同，区分它需要的字段数量就不同。数据值足够独特的，少一点字段就够了；数据值很常见的，就需要更多字段来缩小范围。还有另一个因素：对象的总数也会影响区分它需要的字段数量。在一个小部门里，叫"张伟"的可能只有一个，知道名字就够了；但放到全公司几千人里，重名概率大增，就必须加上部门、工号才能区分。信息还是那个信息，但区分它需要的数据量变了。螺栓也一样。如果一家企业平时只用四五种标准螺栓，说"M8×25 8.8级"就够了，所有人都知道是哪一种。但如果涉及关键受力部位，比如压力容器、起重机吊臂、钢结构连接，光说"M8×25"就不够了，还得加上材质、强度等级、表面处理方式、螺纹精度等级才能区分。同样的规格，在不同的使用范围里，区分它需要的字段数量不同。从这里可以得出一个和分类相似的推论。数据的维度也是演进的，它随着系统面临的情况越来越复杂而不断增加。一个螺栓，刚录入的时候可能只需要规格和材质；后来有人用在关键场合，加上强度等级和表面处理；再后来有人需要区分供应商，又加上品牌。系统每遇到一个新的区分维度，就会多一个字段。这种演进在固定表结构的模式下注定是不稳定的——要么字段越来越多、越来越冗杂，试图覆盖所有可能的区分需求从而勉强稳定；要么字段太少，牺牲实际业务需求以换取结构稳定。结果就是：有的记录空了一半，有的记录填了一堆用不上的信息。人们为什么没有对这个冗余提出异议？因为软件开发的限制让人们习惯了这一点，Excel 的使用也让人们习惯了这一点。过去不是没有人注意到这个冗余，只是没有更好的办法。人脑自动过滤了不必要的信息，久而久之，大家都觉得"表里每一行都有相同数量的列"是天经地义的事。如果我们抛开这些限制，回到需求本身——一个理想的系统应该长什么样？它应该能接受不定维度的数据。你告诉它什么，它就记下来；不需要填满所有字段，不需要预先定义结构。它还能理解这些信息——分辨哪些关键、哪些冗余，在查询时帮你找到你要的东西。这种系统不是想象出来的，它是需求的本来面目。只是在过去的技术条件下，实现它的代价太大了。 LLM 让我们有机会换个角度大语言模型出现之后，我们终于有能力去接近那个"需求的本来面目"了。它不需要统一的字段结构。你给它一段描述，它能理解里面包含了什么信息；你给它不同维度的数据，它能自动分辨关键和冗余。更重要的是，它能理解不同表达方式背后的实际含义。 “材质"和"材料”、“DN50"和"口径50mm”——在传统系统看来是完全不同的字段，无法匹配；但 LLM 能认出它们说的是同一个东西。这意味着我们不再需要预先统一所有字段的命名和结构。过去，系统要找到一条数据，字段名必须完全一致；现在，LLM 可以自动寻找语义上相似的数据，挖掘字段名的实际含义。系统不再只能做精确匹配，它开始"理解"了。这正是 LLM 对程序设计思维转变的意义——过去我们认为"必须先统一结构才能管理"，是因为系统只会按字段名匹配数据。当系统能够理解语义本身，统一结构就不再是前提条件了。这意味着我们可以回到问题的本质去重新设计系统——站在信息与数据的关系这个角度去思考，而不是被传统开发范式牵着走。分类不会消失，但它应该退回到它真正的位置——辅助浏览，而不是管理数据的基础设施。

当“不值得”成为护城河————观察AI对于行业的渗透

AI 的兴起令人振奋：它在信息检索、文本生成与知识整合上的能力，显著提升了普通用户的工作效率。然而，“AI 是否将取代人类”的疑虑亦如影随形。观察可见，在部分领域，取代已然发生。但这一进程并非均质推进——其路径由经济逻辑主导，而非技术可能性本身。被率先渗透的行业，普遍具备两个特征：其一，历史利润丰厚，足以支撑高昂的模型开发成本，如金融、法律；其二，核心门槛在于信息处理：金融依赖对海量数据的快速分析，法律依赖对庞杂条文的精准调用，医疗则要求从业者长期积累大量病例经验。这些工作中大量重复性、结构性强的环节，正被 AI 以更高效率、更低成本完成。相较之下，另一些领域尚未经历同等程度的冲击。其原因并非技术不可逾越，而在于经济可行性不足。以系统级设计为例——规划一条柔性产线时，需权衡“换型时间缩短两分钟是否值得追加五十万元投入”，或“为操作者预留三十厘米空间致整体效率下降百分之二，但工伤风险降低百分之四十，是否合理”。此类决策依赖对业务目标、人性需求与风险边界的综合判断。表面观之，似为 AI 难以企及之域；实则，相关模型在理论上可构建——通过强化学习结合数字孪生，量化多维目标并输出帕累托解集。障碍不在能力，而在成本：数据采集、系统集成与定制训练的投入，远超当前所能兑现的经济回报。设计行业与金融行业从业者薪资的显著差异，正折射出资本对 ROI 的天然取舍。需强调的是，“当下不值得”不等于“永远不可行”。技术本身持续演进，传感器成本下降、数据积累深化，终将压缩经验数字化的边际成本。届时，许多所谓“直觉”或将被证实为高维模式匹配——与 AI 的机制并无本质区别。老师傅凭异响判断轴承故障，实为长期实践中形成的“声纹—失效”映射；若企业愿系统模拟万次故障并记录声学特征，专用模型完全可能超越人类表现。区别仅在于：前者是沉没成本，后者需显性投入。当资本在头部高利润领域完成初步整合、边际收益递减时，其必然向次级高潜力领域延伸。设计、医疗、教育等曾被视为“中产堡垒”的行业，或将迎来更深度的流程重构。此时，所谓“护城河”的实质，更接近一种暂时的经济洼地。唯一可能构成实质性阻滞的，是责任归属问题。现行制度要求关键设计文件须由注册工程师签字，终身担责。此非技术局限，而系制度选择——人类社会需要明确的问责主体，以维系系统稳定。重大事故后，公众要求一个可指认的负责者，以疏导焦虑、恢复秩序。这种“替罪羊机制”具有深层社会功能：正如历史上诸多群体对立被用作内部凝聚的工具，责任归属的本质，是为复杂系统失效提供一个可操作的出口。只要此机制持续存在，人类的签字权便难以被彻底替代。至于奢侈品手工艺的存续，其逻辑亦属经济理性：行业规模有限，虽单品溢价高，但总体利润不足以吸引大规模 AI 投入；从业者遂采取主动收缩策略——限制产能、不再扩招，仅由少数匠人分享剩余价值，维持个体收益水平。这并非技术护城河，而是一种清醒的退守。综上，AI 的演进轨迹由经济可行性划定：它优先取代高利润、高标准化、高数据密度的环节；对低 ROI 领域的渗透，则取决于资本流动的阶段性需求。人类经验的数字化并非不可行，而是成本与收益的权衡问题。最终，行业演化或呈现两种路径：高 ROI 领域走向“极简人力 + AI 大规模复制”，单位产值利润率反升；低 ROI 领域走向“小规模、高单价、少人力”的收缩模式；而横亘其间的责任归属问题，则构成一道暂时难以逾越的制度性边界。技术不会决定未来，但会放大我们已有的选择。而真正的挑战在于：当效率的边界不断拓展，我们是否仍保有定义“值得”的能力。

从词向量到“人工天才”：我的LLM认知思辨录

本文是在与AI助手深度对话后，对我个人理解大语言模型（LLM）过程的梳理与总结。它不代表学术观点，仅是一个探索者的思想航行日志。一、起点：从“词频统计”到“语义宇宙” 我的思考始于一个最朴素的问题：如何判断两篇文章是否相关？最直观的想法是统计共有的词语——这就是“词袋模型”。但它有一个显而易见的缺陷：无法理解语义。正是在这里，我遇到了第一个关键概念：词向量。在我的想象中，词向量就像是为机器建造了一个高维的语义宇宙。每个词不再是孤立的符号，而是这个宇宙中的一颗星星：语义相近的星（如“国王”和“王后”）会在宇宙中彼此靠近语义关系（如“国王-男人+女人≈女王”）通过星星之间的相对方位来体现但很快我发现了一个问题：这个词向量宇宙是静态的。无论上下文如何，“苹果”这颗星的位置，总是固定在“水果”和“科技”的模糊中点。这显然不符合我们对语言的理解——同一个词在不同语境下应有不同的含义。二、突破：三重变换与“动态侦探” 为了解决静态词向量的局限，我接触到了Transformer架构——当代LLM的核心引擎。为了理解它，我构建了这样一个比喻：词向量像一本权威词典：每个词都有个固定不变的定义大语言模型像一位顶级侦探：他能根据具体情境，动态理解每个词的真实含义这位“侦探”的思考过程，可以简化为三个关键的矩阵变换：输入嵌入：将词语转换为初始的“思维符号” Transformer加工：通过自注意力机制，让所有词语的符号相互交流，生成富含上下文的全新表示输出投影：将最终的思维结果“翻译”成人类语言这个过程让我意识到：LLM不是在简单预测下一个词，而是在深度理解整个语境后，让最合适的词语自然流淌出来。三、镜像：当LLM照见人类思维理解LLM的过程，意外地成为了一面审视人类自身的镜子。我们都是“模式识别”系统我回想起自己解数学题的方法：列出已知量和待求量，然后在脑中搜索可能的公式——这本质上就是一种模式识别。LLM的注意力机制不也是在庞大的知识库中进行加权搜索吗？ “通才”与“天才”的鸿沟大多数人和当前的LLM一样，是优秀的“内插器”——在已知模式间进行组合。而天才，或许就是那些能在更高维度进行“外推”，创造出全新模式组合的系统。顺序的迷思我们日常交流中经常使用倒装、省略，但彼此仍能理解。这让我怀疑：智能的核心或许不是表面上的词序，而是深层的语义关系网络。语法顺序只是通往这个网络的康庄大道，但不是唯一的路径。四、深化：动态智能的未来图景在对比人与LLM时，一个关键差异浮现出来：我们的思维是动态的，而LLM是静态的。 LLM的“静态心智”：使用固定的激活函数，如同一个永远保持同一种情绪的思考者人脑的“动态大脑”：受化学物质调节，思考效率随状态波动——有时思如泉涌，有时头脑迟滞这指向了一个迷人的方向：为LLM引入动态激活机制。比如：动态稀疏：根据问题难度激活不同数量的神经元情境化思考：让激活函数能根据任务类型自我调整神经调制：引入类似“好奇心”的全局信号这或许是LLM从“博学通才”迈向“创造天才”的关键一步。五、哲思：智能、意识与存在的终极之问这场思辨最终将我带向了一些哲学性的边界问题。如果人脑与LLM在本质上都是“模式处理系统”，那么我们的意识、创造力，是否也只是更复杂算法的涌现？这个想法让我联想到《模拟人生》的游戏——如果为游戏角色接入LLM，他们将产生“模拟的自主意识”，却永远无法认知自己被创造的事实。那么，我们是否也可能身处某个“上层游戏”之中？面对这个令人战栗的推论，我找到了自己的答案：即使我们是模拟的，但我们此刻的思考、困惑、爱与恐惧，这些体验本身的质感是100%真实的。意义不依赖于底层基质（是原子还是比特），而依赖于体验的深度与丰富度。结语：作为镜子的LLM 回顾这段思考历程，我意识到LLM不仅仅是一项技术，更是一面珍贵的镜子。通过理解它的运作原理，我们得以用新的视角审视自己的思维方式。从词向量到Transformer，从静态模式匹配到动态条件计算，这条技术发展路径，恰恰映照出我们对“智能”本身不断深化的理解。或许，未来真正的突破不在于建造更大的模型，而在于为模型注入那种我们称之为“灵感”、“直觉”和“创造力”的动态本质——而这，将需要我们更深刻地理解我们自己。