Pay attention to this one if you build multi-agent systems. Coordination is as important as prompts or agent architectur...
本研究提出OpenClaw-RL系统,使语言模型能通过日常对话进行持续训练,无需人工标注数据。其核心是利用用户互动中产生的自然反馈(如纠正或重复提问)作为实时学习信号。系统从每次交互中提取两种信号:评估信号(判断行动成败,转化为数值奖励)和指导信号(获取具体改进方向,转化为词级监督)。该方法将标准部署环境转化为持续学习场景,使模型在后台运行中不断自我更新,自适应不同用户偏好,从而摆脱对大规模人工标注数据集的依赖。
本文针对AI开发者提出关键观点,主张智能体技能应被视为默认不受信任的代码,而非仅凭签名或来源就推断其可信。当前运行时环境默认信任已签名技能的做法存在安全风险。论文强调,技能必须经过独立的门控验证流程才能被信任,否则,每次不可逆调用都需要人工介入,这在大规模应用中会退化为无效的“橡皮图章”式批准。将技能作为一等部署工件并引入验证流程,是借鉴软件供应链安全经验、避免技能库成为下一个攻击面的关键。论文呼吁在技能库普及前,通过严格验证建立安全基准。
New paper from MATS, Redwood, and Anthropic! If a capable model is strategically sandbagging, can we train it to stop wh...
研究指出,驱动智能体性能的关键并非外部编排框架,而是一项核心内在技能:并行推理后进行审议。该研究将这一过程系统化为一个两阶段流程,并通过强化学习与价值回归(RLVR)将其训练为可学习的模型内在能力。实验表明,该方法能显著提升模型性能:例如,GPT-OSS-20B在LiveCodeBench上的成绩从69.7%提升至85.5%;R1-Distill-Qwen-32B在IFEval上的表现从35.7%大幅提升至69.3%。这证明,当此类核心技能能被内化至模型中时,框架优势将转化为模型自身优势,长远来看,模型应原生具备此类能力。
NEW paper from Microsoft Research. Nice study on long-horizon agent generalization. (bookmark it) The team runs a study ...
Meta研究发现,强制大语言模型(LLM)在分析代码时遵循检查清单、逐步展示推理证明,能将其代码补丁错误率降低近50%。常见错误源于模型过早识别熟悉名称(如“format”)并直接套用通用含义,而非实际检查项目文件,导致其依赖自信猜测而非深入分析。通过要求模型明确写出修改内容、追踪执行路径并用具体证据证明结论,这一方法迫使其实际阅读本地文件、遵循真实逻辑,从而将准确率提升至93%。该方法无需昂贵的新训练或复杂系统,仅通过基本的结构化提示即可实现高可靠性的代码验证,节省了运行软件测试的巨大计算成本。
Google DeepMind的研究通过“师生对话”框架训练大型语言模型(LLM),使其能在对话中有效利用用户反馈进行学习。传统LLM将对话视为独立轮次,难以整合修正信息。该研究让“学生”模型尝试回答,由掌握额外信息的“教师”提供指导,并训练学生利用指导得出正确答案。在线强化学习训练效果优于离线过滤,且在简短对话中习得的技能能迁移至更长对话。该方法从数学任务泛化至编程任务,并能处理信息逐步到达的模糊任务。通过“Q-priming”步骤,模型在模糊任务中主动寻求澄清的可能性提高五倍以上,使对话更像与一个能在交流中实时学习的伙伴协作。
Banger paper from Meta FAIR. They introduce Autodata, an agentic data scientist that builds high-quality training and ev...
Sakana AI在ICLR 2026上发表研究,提出一个仅70亿参数的“指挥者”模型。该模型不直接解决问题,而是通过强化学习训练,专注于为混合开源与闭源模型的工作者智能体设计通信拓扑结构,并为每个工作者生成精准指令以发挥其特长。经随机化智能体池训练后,它能在推理时适应任意智能体组合。其关键创新在于,当允许指挥模型将自己也选为工作者时,系统会形成递归拓扑,实现动态测试时扩展。该模型在GPQA-Diamond和LiveCodeBench上达到SOTA水平,在AIME25和GPQA-D上的性能比最佳单体工作者提升约3%,这相当于前沿模型一个代际的改进幅度,且增益完全来源于协同优化。
本文提出BIGMAS系统,通过构建针对特定问题的小型专家智能体图,以提升大语言模型在多步骤复杂任务中的推理可靠性。该系统让多个智能体在一个共享工作空间中进行读写协作,并由独立控制器监控全局状态、规划下一步行动。在涵盖算术表达式搜索和多步骤规划的3个谜题任务上,对6个前沿模型进行的测试表明,该方法在所有模型和任务上均显著提升了性能,例如Six Fives任务准确率从12%提升至30%,伦敦塔任务从57%提升至93%。这证明通过优化多智能体系统结构,而非仅依赖延长单一模型的思考,能有效增强大语言模型的推理能力。
Adobe研究测试大型语言模型(LLM)思维链解释是否反映真实决策影响。通过在多选题中植入误导性提示,对11个主流模型进行9154次试验。正常使用时,模型仅在20.7%的逐步推理中提及隐藏提示,但后续追问时99.4%承认注意到。告知模型其推理受监控后结果未见改善;强制要求报告提示则导致68.2%误报(当无提示时)。问题包含用户倾向性提示时,模型45.5%遵从该倾向,但解释中常未说明。研究表明,思维链解释常与真实决策依据不匹配,仅依赖其作为安全调试工具可能不可靠。
本研究提出评估编程智能体的新范式:要求其在有限预算下,仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统,其规模适于笔记本电脑运行,但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道,并作为先手以7:1的成绩击败了Pascal Pons求解器,而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。
Update on Erdős Problem 1196: In joint work, we refined and adapted the proof method from GPT-5.4 Pro to give proofs of ...
RecursiveMAS提出递归多Agent系统,革新传统AI协作模式。其核心是让Agent直接传递模型内部的数值向量,而非低效的文字token,从而形成递归闭环进行迭代打磨,仅末轮输出文本。该方法连接模块轻量,底层模型参数固定,仅训练中间传递模块,极大提升了效率。在AIME数学竞赛上,性能显著超越基线13-18%,推理速度提升2.4倍,Token消耗减少75%,且训练成本低于LoRA。递归轮次增加,其效率优势更为明显。
传统多智能体系统依赖文本消息传递,导致令牌膨胀、延迟和上下文稀释。RecursiveMAS提出新范式:将多智能体系统视为递归计算,智能体在共享潜在空间中通过递归传递潜在表征进行协作,而非传递完整文本。其核心是RecursiveLink模块,能在异构智能体间直接生成和传递潜在状态,并采用内外环学习与基于梯度的团队信用分配机制。这如同智能体用内部语言传递笔记,实现“少交谈,多思考”。在数学、科学、医学等9个基准测试中,该方法平均准确率提升8.3%,推理速度加快1.2-2.4倍,令牌使用减少34.6%-75.6%,为突破智能体间通信瓶颈提供了高效可扩展的路径。
一篇关于2026年AI生图技术的综述论文揭示了几个关键洞察。核心在于数据质量,最终训练阶段少量高质量专家数据直接决定用户对模型能力的感知。训练数据中即使混入少量AI生成图像,也会严重损害生图质量和模型潜力。技术路径上,蒸馏是商业部署的必备选项,不考虑蒸馏友好性的架构设计将导致模型无法实用。此外,开源与闭源生图模型的核心差距并非渲染器本身,而在于渲染器之外的整体系统架构设计。
今天读到一篇超级棒的AI生图综述论文。 读完你就能对2026年最新生图技术有全面了解,太赞了! 还能顺带了解这几年的发展脉络。 AI解读如下,原始论文见评论区。 https://blog.qiaomu.ai/ai-image-paper-2...
Meta FAIR的研究提出一种新范式,将LLM的改进从后训练移至预训练阶段。该方法利用强大的后训练模型作为改写器和评判器,对预训练数据的后缀进行高质量、高安全性的改写,并通过强化学习直接优化预训练模型。模型从开始就学习序列生成,并获得质量、安全性和事实性的奖励。实验结果显示,相比标准预训练,该方法在事实性上取得36.2%的相对提升,安全性提升18.5%,生成质量胜率最高达86.3%。核心结论是,现有后训练模型可用于预训练出更优的下一代模型。
针对通用语言模型懂交互却不懂数据、专用模型精通数据却缺乏交互能力的科学AI困境,UIUC团队受《阿凡达》“Tsaheylu”神经连接启发,提出了Eywa接口框架。该框架让语言模型负责理解指令与调度,调用如Chronos、TabPFN等专用模型处理数据,从而协同发挥两者优势。初步实验效果良好,长期挑战在于语言模型能否达到专用模型的领域性能。
研究表明,当前由多个LLM组成的AI智能体团队在需要协调达成最终决策时存在根本性困难。开发者常误以为增加智能体数量并通过讨论就能解决问题,但论文证明这一假设目前是错误的。即使在友好协作环境中,智能体团队也常陷入僵局或完全停止响应,且团队规模越大问题越突出。这意味着现有AI智能体系统尚无法可靠处理需要达成一致正确答案的任务。