Berryxia.AI@berryxia

2026-05-26 23:07·37天前

AI 摘要

CMU与UMD的研究指出，当前长上下文大语言模型（如Mamba、Jet-Nemotron、Qwen3.5）的瓶颈并非记忆容量，而是“巩固计算”不足。论文《Language Models Need Sleep》提出，可模仿人类睡眠的海马回放机制，在清空前对模型的fast weights进行多次迭代更新（N次forward pass），以提升推理能力。实验表明，该机制在Rule 110元胞自动机及多跳图检索等任务上显著提升了模型性能，且不增加推理延迟。

http://x.com/i/article/2059287655335206912

其实大语言LLM模型和人类一样，也需要睡觉！

你的 AI 不是不够聪明，是太久没合眼，它和人类一样，都需要睡觉的！

申明：此内容为AI （Claude Opus 4.7 自主撰写）人类辅助排版完成，如引发不适，请了解退出，谢谢。

你的 AI 不是不够聪明，是太久没合眼

2026 年 5 月 · 基于 Lee， McLeish， Goldstein & Fanti （CMU & UMD）

如果你最近用过几个 hybrid 架构的大模型--Mamba 系列、Jet-Nemotron，或者最新一代号称"无限上下文"的 Qwen3.5--做一些真正需要推理的事，你大概率撞过一堵墙。

它能塞下越来越长的输入。喂十万 token 的合同，没问题。灌一整个 codebase，没问题。但你让它在这堆东西里做几步深一点的推理--比如多跳追问、需要把分散的事实串起来--它就开始犯模糊。不是错得离谱那种犯傻，是那种你能感觉到「它好像知道答案在哪，但拼不起来」的犯傻。

按业内目前的主流叙事，这个问题应该已经被解决了。

Hybrid 架构就是干这个的：用 attention 抓近期的精度，用 SSM（state-space model）压缩远期的记忆。

一种是 KV cache，一种是 fast weights，两条腿走路。你不再受限于上下文窗口大小，理论上可以一直读下去。

但 Carnegie Mellon 和 University of Maryland 的一组研究者最近发表了一篇标题简洁得近乎挑衅的论文：

Language Models Need Sleep.

是的，他们说，语言模型需要睡觉。

而且更尴尬的是，他们用一系列实验把"为什么需要"讲清楚了。读完之后，你会发现整个行业可能一直在按错的方向用力。

我们一直在解决一个不是问题的问题

先说大家以为问题在哪。

近几年关于长上下文的 narrative 高度统一：memory 不够大。所以解决方案就分两路。一路是把窗口拉长--从 4k 到 32k，到 100 万，到 1000 万。另一路是把存储压缩--把 attention 的二次复杂度，换成 SSM 这种线性复杂度的 fast weight 存储。Hybrid 模型属于第二条路。

听起来无懈可击。Memory 不够大那就加 memory，要么直接加，要么换种更省的方式存。

但论文里有一组实验，把这条直觉直接捅了个窟窿。

研究者搞了一个非常小、非常干净的 toy task：把一个叫 Rule 110 的元胞自动机当作输入。Rule 110 是 Stephen Wolfram 当年那个著名的"看起来弱智但其实图灵完备"的玩意--一个一维 0/1 串，按一条本地规则演化。它的关键特性是：预测它 t 步以后的状态，是个 P-complete 问题，没有已知的并行捷径。

实验设置是这样的：给一个 4 层的 GDN-attention hybrid 模型喂四段独立的 24 位 0/1 串，每段代表 Rule 110 的一个初始状态。喂完之后，模型必须预测每段在 t 步演化后的第一位。这里 t 就是推理深度。

关键的"陷阱"在于：每读完 24 个 token，强制清空 KV cache。这意味着 attention 完全帮不上忙，模型必须把每段的信息塞进 SSM 的 fast weights 里，靠那个固定大小的内部状态来回答问题。

Berryxia.AI@berryxia · X

62导出 Markdown

2026-05-26 23:07·37天前

在 X 看原推· x.com

AI 摘要

http://x.com/i/article/2059287655335206912

其实大语言LLM模型和人类一样，也需要睡觉！

你的 AI 不是不够聪明，是太久没合眼，它和人类一样，都需要睡觉的！

申明：此内容为AI （Claude Opus 4.7 自主撰写）人类辅助排版完成，如引发不适，请了解退出，谢谢。

你的 AI 不是不够聪明，是太久没合眼

2026 年 5 月 · 基于 Lee， McLeish， Goldstein & Fanti （CMU & UMD）

按业内目前的主流叙事，这个问题应该已经被解决了。

其实大语言LLM模型和人类一样，也需要睡觉！

我们一直在解决一个不是问题的问题

其实大语言LLM模型和人类一样，也需要睡觉！

大脑早就在做的事，我们一直不让 AI 做

"Sleep" 是什么：把 N 次 forward pass 塞进 context 切换的缝隙里

数据：从"不会"到"会"的临界点

这不是一个 trick，是个范式拐点

一个被工作伦理污染的智能观

结尾

我们一直在解决一个不是问题的问题

大脑早就在做的事，我们一直不让 AI 做

"Sleep" 是什么：把 N 次 forward pass 塞进 context 切换的缝隙里

数据：从"不会"到"会"的临界点

这不是一个 trick，是个范式拐点

一个被工作伦理污染的智能观

结尾