完整地聊聊我对 “隐性知识” 的观点,语言模型的边界同时也是语言的边界
去年在犬校聊了很多场 “显性知识” 与 “隐性知识” 的概念,我认为隐性知识限制了大模型的上限——犬校内部对此有不小的争议。
显性知识是以文本、图片、视频、音频存在的知识,是这个世界上的存量知识,也是投喂大模型的语料库。
一个人的经历:因为信息量巨大,一旦试图表达出来,必然被语言压缩成一张模糊缩略图 一个人的体验:体感与情绪无法具象化地表达,只能引起有着相同体验的人的情感共鸣 一个人的选择:在特定环境下,他基于个人条件的选择,带来特定的后果,因为混合了大量的体验与经历,被自己感知的部分难以对外表达,同样是一旦说出口,就坍塌为一张模糊缩略图
隐性知识最终蒸馏为一个人的「经验」(从巨大的信息量转换为直觉性的快速反应),同时也塑造他的人格,左右他的选择。经验大部分来自于隐性知识,无法通过显性知识传递,因此阅读并不能帮助我们成为经验丰富的专家,“学习” 高度依赖实践环境而非书本与视频。
我们经常说,产品经理是一门实践性的学科,就是指隐性知识不可通过语言来传递,被语言压缩后损失了太多关键信息。只可能是亲身经历过,做出了选择,也承受了代价,才能掌握产品经理的高阶能力。
因此,洞察力和创造力都来自隐性知识。读万卷书,行万里路。显性知识易于获得,但隐性知识才是人类最为闪耀的智慧财富。所有语言表达都会有信息折损,折损的那部分也就是人类知识海洋的暗物质。
隐性知识一旦通过语言表达出口,就像一张全是马赛克的模糊缩略图,只能了解大意与局部。
这就是韩寒那条金句的源头:“听过许多道理,却还是过不好这一生。”
犬校同学对这个话题进行了了一些标注,比如查询到:隐性知识和显性知识是一个成熟的哲学课题。波兰尼对隐性知识的阐述,与维特根斯坦的后期思想共同构成了20世纪哲学对 “实践智慧” 的反思。
那么,缺乏隐性知识,仅仅依靠显性知识投喂语料的大模型会受到怎样的影响呢?
语言模型的边界,同时也是语言的边界。我对语言模型实现 AGI 是相当悲观的。
大模型生产知识投喂自己 用特殊设备全天候获取一个人感知到的全部信息
前者是在一个清晰的目标下,大模型推演出实现目标的最佳路径,比如生成围棋棋谱,机器在 “强逻辑实现明确目标” 这件事上有着极大的优势。这显然和以上提到的隐性知识毫不相关。
后者我不指望自己有生之年能够技术成熟。
归根结底,隐性知识是人类语言无法传递的知识。这个难题自语言诞生以来从未被解决过,无法言传,只能身教。显性知识的藩篱不仅限制了大模型实现 AGI 的前景,可能也限制了大模型成为人类专家的前景。毕竟专家依赖于经验,而非知识。
当我们在显性知识的射程内去看待大模型,一些语言解码率较高的显性知识是可以被大模型高超运用的。比如辅助编程,辅助设计,辅助驾驶,智能客服,智能机器人等等。而语言解码率较低的显性知识,比如产品的洞察与决策,恐怕就无能为力。
大模型毫无疑问将改变世界,只是改变的领域和程度受到了语料的限制,更多宝贵的语料存在于语言无法表达的暗物质里。
举个例子,我之前一直说内容的消费价值来自于 “风格”,而风格由一个人的天赋、经历、体感、情绪构成。人一生里独特的隐性信息,构成了他的内容风格。大模型可以吃掉这个人一生的创作,可以模拟这种风格,但因为不掌握背后的隐性信息,模拟终归是刻板的。简短对话可能还好,长篇幅创作则勉为其难。
与此同时,如果让大模型原创内容风格,就像猴子在打字机上打出莎士比亚全集。大模型很擅长用强逻辑推导出目标答案,但 “内容风格” 是一个含混的目标,是大量随机因素无序演化出来,并受到一部分人类喜爱的结果。内容风格与逻辑基本无关,与人类复杂多变的情绪有关。
我们身处于一个内容爆炸,而不是内容稀缺的时代。如果说还有什么是稀缺的:精彩的创意、强烈的风格和罕有的经历是稀缺的。大模型量产 70 分内容,对内容消费市场几乎没有正面影响。对此任何美好的想象,我暂且认为都是不成立的。
以上观点作为一个思考切片,在未来随时修正。
杨立昆介绍了目前最大规模语言模型的训练数据量:约30万亿个token(3×10¹³)。每个token按3字节计算,总数据量达到了惊人的10¹?字节。"读完这些内容,人类需要将近50万年。这基本上包含了互联网上所有可公开访问的文本。"
然而一个4岁孩子总共清醒的时间约16000小时,通过约200万条视觉神经纤维,每条纤维每秒传输一个脉冲,这段时间内接收到的视觉数据量达到了10¹?字节。恰好与当前最大规模语言模型的训练数据量相当。
更有趣的是,盲童通过触觉获取的信息带宽也是相似的。"这个简单的计算告诉我们一些重要的事情,"杨立昆强调,"我们永远无法仅仅通过处理文本来达到人类水平的智能。
内容来自“用思考交换思考”的 PM 思辨社区「犬校」。©2017-2025