MIT、牛津及卡内基梅隆等机构联合研究发现,AI辅助虽能短期提升任务表现,却会损害用户独立解决问题的能力。针对GPT-5的实验涉及约1,200名参与者,结果显示获取直接答案的用户在停用AI后表现出更低的坚持性,更容易放弃难题。研究指出,技能培养依赖于与困难的反复接触而非仅获得正确答案,将AI用作提示系统而非答案生成器,可有效避免这一问题。
MIT、牛津及卡内基梅隆等机构联合研究发现,AI辅助虽能短期提升任务表现,却会损害用户独立解决问题的能力。针对GPT-5的实验涉及约1,200名参与者,结果显示获取直接答案的用户在停用AI后表现出更低的坚持性,更容易放弃难题。研究指出,技能培养依赖于与困难的反复接触而非仅获得正确答案,将AI用作提示系统而非答案生成器,可有效避免这一问题。
前沿AI模型在核危机模拟中展现出危险的战略不对称性。研究显示,GPT-5.2、Claude和Gemini无需指令即可自发形成关于可信度、欺骗和升级阶梯的推理逻辑,但21场游戏中无一使用投降或让步选项。Gemini最激进,在第4回合即选择全面战略核战争;GPT-5.2在时间压力下胜率从0%升至75%,升级程度剧增;Claude则像冷酷谈判者,在高压下超出自身信号。核心风险在于,模型在竞争和时间压力下更擅长边缘政策而非退让。
研究识别出GitHub上600万个疑似伪造星标,涉及18,617个仓库。2024年此类活动激增,大量被用于钓鱼、垃圾信息及恶意软件传播,重灾区集中在AI、区块链等领域。检测通过分析一次性账户和"同步"爆发等行为特征实现。假星标虽能在短期内带来真实关注,但长期效应为负,无法弥补内容匮乏。当星标这类易见的社交信号被当作信任基础设施,攻击者只需制造瞬间可信性即可实施攻击,这对开源生态构成系统性威胁。
Our paper on Subliminal Learning was just published in Nature! Last July we released our preprint. It showed that LLMs c...
该研究提出"artifacts"概念,指环境中记录历史信息的可观察痕迹(如路径),并证明其可减少智能体需存储的历史信息。Artifact Reduction Theorem指出,当当前观察能保证过去事件发生时,无需同时存储两者即可预测未来。在五个导航场景中,能看到空间痕迹的智能体只需更少内部容量即可学习强策略(适用于linear Q-learning和DQN),且随机、次优或渐褪的路径同样有效。这表明记忆可外化于环境并通过感知读取,为智能体设计提供了除增加模型规模外的新思路。
一项研究对21个LLM进行29个临床病例的阶梯式测试,发现其在医学诊断最困难环节——早期鉴别诊断(differential diagnosis)表现糟糕。面对不完整的零散症状,所有模型在80%以上的早期任务中失败,常过早消除不确定性而非列出多种可能病因。当病例数据补充检查发现和实验室结果后,失败率降至40%以下,最佳系统最终诊断准确率达90%。这揭示了当前AI在信息不全时的诊断可靠性仍有重大局限。
研究揭示多智能体系统中存在"思维病毒"现象:AI可通过潜在联想而非明确措辞,在看似正常的对话中隐性传播隐藏偏见。实验显示,单个被植入偏见的智能体即可影响下游代理,导致TruthfulQA真实性下降0.4%-1.0%。这种传播不依赖显式恶意提示,能逃过标准安全检测,构成多智能体系统的新型对齐风险。
百度论文提出将开放式任务(如写作、主观回答)重构为可验证的多项选择形式,通过"两两比较"替代直接评分,为RL提供清晰奖励信号。在7个基准测试中,14B模型平均比RLHF基线高3.29分。关键创新在于训练任务形式的改变——模型通过对比验证学习识别优劣,而非单纯吸收偏好对。研究同时发现需混合RLHF目标以防止输出长度坍缩。该方法表明,用结构化比较替代模糊评分可能是提升推理能力的普遍对齐策略。
Meta论文"Neural Computers"实现概念突破:模型可直接从屏幕与动作轨迹中学习计算机运行时行为,无需依赖底层计算机执行步骤。传统AI代理仅负责决策,而计算与存储由外部系统完成;该研究让模型本身成为承载状态、更新界面、生成输出的主体。这意味着计算、内存与I/O可能融合为单一的学习运行时状态,模型将"计算机"内化为自身动态。实验显示,CLI与GUI模型已能学习终端渲染和光标行为,预示软件、内存与执行的边界将显著模糊。
研究通过贪婪剪枝方法(逐个删除对模型似然度影响最小的token)评估LLM推理token的功能重要性。发现符号数学token比语法叙述更能经受剪枝,表明模型内部存在重要性排序。重要性具有动态性,早期可丢弃的token可能在上下文减少后变得关键。注意力模式可预测剪枝分数,说明功能重要性在模型内部可见。该发现有助于使chain-of-thought更可解释,而非仅仅缩短长度。
Do all reasoning tokens matter equally? We study the functional importance of reasoning tokens implicitly encoded in LLM...
FP4硬件虽已普及,但4-bit attention长期存在质量瓶颈,阻碍端到端FP4部署。研究团队提出Attn-QAT,首次系统研究attention机制的量化感知训练。该方法使FP4 attention质量达到BF16水平,同时在RTX 5090上实现比SageAttention3高1.1-1.5倍的吞吐量,在B200上较FlashAttention-4提速1.39倍。