文章

训练即压缩，部署即遗忘：LLM后部署需参数级持续学习

本文论证大语言模型需要持续学习能力。当前LLM存在「永久现在」的缺陷——训练后知识冻结在参数中，只能依靠外部脚手架（聊天历史、检索系统）补偿，无法真正内化新经验。LLM本质是压缩算法，训练时将互联网压缩进参数，这种有损压缩正是其强大的根源，但部署后我们阻止了这种压缩机制改用外部记忆。上下文学习虽有效，但受限于：1)长任务中上下文膨胀导致20-100步后失连贯；2)无法表达高维隐性知识（如医学影像纹理、音频特征）；3)仅能回忆而非真正学习。持续学习将压缩能力扩展到部署后，让模型直接更新参数而非依赖外部检索。

来源信息

发布时间：2026年4月22日

英文原标题：Why We Need Continual Learning

来源：查看 a16z 原文

核心要点

LLM存在类似《记忆碎片》主角的「永久现在」困境：知识冻结在参数中，无法形成新记忆
上下文学习(ICL)是当前主流方案，通过增加上下文窗口解决长程依赖，但仍是瞬态的表层压缩
LLM本质是有损压缩算法，压缩使模型发现结构、泛化推广；部署后阻止参数级压缩是核心矛盾
上下文学习无法编码高维隐性知识（如医学影像纹理特征），这类知识只能存在于参数权重中
Ilya Sutskever观点：人类并非AGI，依赖持续学习积累知识；部署后的学习试错过程不可跳过

关键判断

LLM存在‘永久现在’缺陷，训练后知识被冻结在参数中，无法在部署后形成新记忆或更新参数，只能依赖外部脚手架补偿，但这些外部手段无法让模型真正内化新信息。
上下文学习（ICL）虽然是当前主流的补救方式，但本质上仍是瞬态、表层的压缩；它在上下文窗口受限、无法编码高维隐性知识、以及缺乏真正学习能力方面存在根本局限。
LLM本质是有损压缩算法，训练阶段将互联网压缩进参数，压缩产生的结构化泛化是其强大能力的根源；部署后阻止参数级压缩是核心矛盾所在。
真正的学习需要压缩机制将新经验压缩进模型权重，而非仅依赖外部检索或上下文记忆；这要求模型能够在部署后继续压缩和更新参数。
Ilya Sutskever指出，预训练的模型在某些方面已超过人类基础技能，但人类仍依赖持续学习积累知识，部署本身必须包含学习、试错的过程，不能仅是交付完成的产品。

未来推演

判断：未来 6-12 个月，企业 AI 采购会更快从试点预算转向平台化和治理导向的正式采购。

时间跨度：未来 6-12 个月

为什么是现在：文中已经出现采购、治理、交付和预算协同成熟的信号，说明企业买方正在进入更系统化阶段。

重点信号：是否出现统一采购平台、是否更强调治理和可维护性、试点项目是否转成组织级部署

置信度：中