6月23日

13:13

HuggingFace Daily Papers（社区热门论文）

针对长序列转录中KV缓存累积导致显存增加和速度下降的问题，研究团队提出Unlimited OCR。该模型以DeepSeek OCR为基线，用提出的Reference Sliding Window Attention（R-SWA）替换解码器所有注意力层，在保持恒定KV缓存的同时降低注意力计算成本。结合DeepSeek OCR编码器的高压缩率，Unlimited OCR在32K标准最大长度下单次前向可转录数十页文档。R-SWA是一种通用解析注意力机制，同样适用于ASR、翻译等任务。代码和模型权重已开源。

DeepSeek 多模态论文/研究

13:13

HuggingFace Daily Papers（社区热门论文）

锥形语言模型（TLM）

现代语言模型（Transformer、循环、记忆变体）默认在深度上均匀分配参数。固定预算下的实验表明，早期层分配更多容量、后期层更少容量可改善困惑度，反向分配则有害。基于此提出锥形语言模型（TLM）架构原则：对MLP宽度通过平滑余弦调度进行单调锥形缩减。在三种模型规模和四种架构（Transformer、Gated Attention、Hope-attention、Titans）上，TLM一致优于均匀宽度基线，提升困惑度和下游基准性能，且不增加参数或计算成本。

数据/训练论文/研究

12:13

HuggingFace Daily Papers（社区热门论文）

VESFlow：通过速度编辑实现安全少步生成

流匹配模型成为少步文本到图像生成的主流范式，但现有安全方法难以适应极少采样步数。VESFlow是一种无需训练的安全方法，直接利用流匹配模型学习的边际速度场，通过安全条件后验编辑速度场，将轨迹导向安全输出而不改变提示词。引入基于风险分数的过滤，绕过良性提示的速度编辑以降低计算开销。进一步提出VESFlow+，同时向安全方向编辑并远离不安全方向。实验表明，在4步MeanFlow模型上，VESFlow+将目标概念攻击成功率降至6.3%（Ring-A-Bell）和6.8%（MMA-Diffusion），同时保持良性提示的生成保真度。

图像生成安全/对齐论文/研究

12:13

HuggingFace Daily Papers（社区热门论文）

EnterpriseClawBench：从真实工作会话构建的企业智能体基准

EnterpriseClawBench 是一个从专有真实工作会话档案构建的企业智能体基准，产出 852 个可复现任务，配有恢复的夹具、重写的提示词、角色类、技能子类、硬规则和语义评估细则。因含企业内部内容，不公开基准数据。在 EnterpriseClawBench 上，最佳配置（Codex with GPT-5.5）仅达 0.663。结果表明企业智能体评估必须报告多种维度（如 harness-模型组合、产物交付、视觉质量、成本、运行时和技能迁移行为），而非单一分数。代码已公开。

智能体 GitHub 数据/训练论文/研究

12:13

HuggingFace Daily Papers（社区热门论文）

causal-learn+：智能体应辅助因果发现而非提供因果结论

当前将大语言模型（LLM）与因果发现结合的做法，常让模型推断边方向、提出图结构或注入先验与约束，但这混淆了数据与假设支撑的证据与文本关联、提示词产物及幻觉机制。本文主张智能体应扮演辅助角色：检查数据、检索上下文、解释方法假设并澄清图输出，而不应提供边、方向、先验、约束或因果结论。因果主张必须基于数据、显式假设、正式算法、诊断及用户/领域专家决策。该原则在causal-learn+在线平台中实现，协调数据分析、预处理、方法推荐等。Big Five人格数据案例展示了无需LLM不可靠性的智能体辅助因果发现流程。平台地址causallearn.com。

智能体 arXiv 论文/研究

12:13

HuggingFace Daily Papers（社区热门论文）

密集可验证奖励框架 DR-MV3D：全局地图与局部视图驱动的多视角 3D 推理

多视角 3D 视觉问答（MV3D-VQA）需整合局部观测为 3D 场景并规划信息视角。现有多模态大模型仅用答案级稀疏监督，导致跨视角推理不一致。DR-MV3D 提出地图级密集可验证奖励框架，将任务分解为异心全局地图构建、问题条件化视角轨迹规划、自我中心定位回答预测。引入全局一致性奖励（利用冻结 3D 视觉基础模型 VGGT 和 SAM3 对齐预测地图）和局部轨迹奖励（监督有序视角选择），并通过轨迹级策略优化（GRPO）训练全流程。在 MindCube、VSI-Bench 和 BLINK 上优于强多图像基线，验证过程级密集监督的有效性。

具身智能多模态论文/研究

11:13

HuggingFace Daily Papers（社区热门论文）

KaLM-Reranker-V1：快速但非延迟交互的压缩文档重排序器

KaLM-Reranker-V1 是一种快速但非延迟交互（FBNL）重排序器，采用编码器-解码器架构。编码器使用 Matryoshka 嵌入池化预编码段落，解码器建模系统指令、用户指令和查询意图，再通过交叉注意力捕获查询与段落间的相关性，实现解耦计算并保持高效。模型提供 Nano（0.27B）、Small（1B）和 Large（4B）三种激活参数尺寸。在 BEIR 上达到 SOTA，与 Qwen3-Reranker 系列持平；在 MIRACL 上未经大量多语言训练仍表现优异；在 LMEB 上，0.27B Nano 模型可与 7-12B 嵌入模型竞争。

arXiv 检索增强搜索论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

精选71

SkillHone：基于持久决策历史的持续智能体技能演进工具

SkillHone 通过持久决策历史将技能修订与评估证据配对，记录诊断、修订、证据和结果。角色分离的子智能体在实践探测上运行候选技能，并基于先前决策提出修订，实现跨会话改进。在深度研究基准上，SkillHone 无需预集成搜索栈，在 GAIA 上超越商业深度研究智能体 15.8 分，在 WebWalkerQA-EN 上超越 3.2 分，同时优于先前技能进化方法。内部工具中介分析场景中，平均准确率提升 18.8 分。

智能体论文/研究

推荐理由：SkillHone 把 agent 技能进化从一次性优化变成了持续记录的迭代过程，在 GAIA 上超越商业 agent 15.8 个点，做 agent 产品的团队该认真读一下。

08:00

HuggingFace Daily Papers（社区热门论文）

基于检索增强搜索的LLM程序优化方法

提出检索增强搜索（RAS）方法，通过束搜索优化候选程序，每一步从慢-快程序对训练数据中检索上下文示例引导LLM。基于LLM生成的自然语言描述进行上下文检索效果优于基于源代码的检索。同时提出AEGIS方法，将训练示例分解为原子编辑以提高可解释性。在C++程序优化上，RAS比先前最先进黑盒适应策略性能提升2.06倍，AEGIS提升1.37倍且编辑量更小。对于Python程序，RAS使平均运行时间百分位提升10.27。

arXiv 搜索编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Tailor-Bench：修剪视觉世界建模评估的长尾

Tailor-Bench评估视觉世界模型模拟非常规物理交互的能力，设计三种渐进难度场景：常规（常见工具-任务组合）、非常规（属性兼容替代品）、不可能（违反属性工具）。在统一协议下，预测生成与描述生成分别测试无引导推理与忠实实现。实验表明模型性能从常规到非常规再到不可能逐步退化，暴露物理建模的长尾差距。失败分析显示图像模型无法实现正确状态变化，视频模型还有时间不一致，说明模型依赖表面视觉模式而非内化物理原理。

图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

AsyncOPD：异步在线策略蒸馏中的陈旧性问题研究

在线策略蒸馏异步训练中，轨迹生成与学习器更新解耦引入陈旧策略数据；KL方向决定影响：教师加权正向KL鲁棒，学生加权反向KL脆弱。异步RL稳定方法无效，反向计算当前学生信号更优。有限教师分数缓存导致稀疏采样反向KL估计器的偏差-方差权衡，多采样蒙特卡洛可降低方差。基于此，开源AsyncOPD全异步管道在严格同步训练基础上实现1.6至3.8倍吞吐量提升，精度相当。

推理数据/训练论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

ConvFill：对话式填充实现语音智能体响应与能力兼得

语音智能体面临响应速度与复杂能力的权衡。ConvFill 提出“对话式填充”（conversational infill）方法：用小参数 talker 模型实时生成上下文响应，隐藏外部 reasoner 模型的推理延迟，并在推理中动态整合 reasoner 的流式知识。基于 290,571 条合成数据、6 个领域、7 个 135M–1.7B 参数小语言模型验证任务可学习性。系统保持毫秒级首次响应时间，准确性差距缩小至前沿 reasoner 模型的 6.3% 以内。在 Apple M2 SoC 上的 18 人用户研究中，ConvFill 整体与前沿模型持平，检索密集型任务更受青睐，响应性显著更高。代码、模型和数据集已开源。

推理论文/研究语音

08:00

HuggingFace Daily Papers（社区热门论文）

精选75

推理模型的思考Token真的有助于提升安全性吗？--来自GPT-OSS、Qwen、Olmo和Phi家族的证据

对GPT-OSS、Qwen、Olmo和Phi系列前沿开源推理模型的研究发现，所谓的“思考token”并未带来真正的安全性深思熟虑。模型是否拒绝或服从指令，在第一个token的

arXiv 安全/对齐推理论文/研究

推荐理由：这篇论文直接挑战了「思考令牌提升安全性」的业界直觉，证据表明拒绝行为在思考的极早期就已锁定，现有安全干预反导致过度谨慎。安全团队必读，需要重新审视推理模型的对齐方式。

08:00

HuggingFace Daily Papers（社区热门论文）

Lite Any Stereo V2 （LAS2）：更快更强的零样本立体匹配

Lite Any Stereo V2 (LAS2) 是专为零样本立体匹配设计的超高速模型系列。它采用仅2D的成本聚合框架，针对实际推理延迟而非理论MACs进行优化。训练采用三阶段策略：合成监督、自蒸馏和真实世界知识蒸馏，并通过伪标签过滤和误差钳制操作提升伪标签可靠性。LAS2包含多个前馈变体和一个迭代变体。其中LAS2-H在零样本整体性能上优于迭代方法Fast-FoundationStereo，且在H200和Orin上推理速度分别快1.8倍和2.7倍。项目页面、演示和代码已公开。

数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

中间层知晓：从熵动力学检测越狱攻击

通过分析冻结大语言模型各层的 token 级预测熵轨迹，发现越狱攻击相关信息主要编码在中间层而非输出头。静态聚合熵统计量（如均值、方差）区分力弱，而反映熵随 token 位置演化的特征（如单调排名趋势分数）更具判别力。该信号在 Llama、Qwen、Gemma 等多个模型和对抗性基准上表现一致，无需额外训练。

安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

CAVEWOMAN：语言输入与输出压缩对大语言模型的影响

研究提出两通道评估协议Cavewoman，同时测量任务准确率、实际成本及与无约束基准的文本一致性。在5个数据集上对8个模型进行5级压缩测试，发现输出压缩降低API模型实际成本1.4–2.4倍（最佳达3倍），开源权重模型同样受益；输入压缩则严格双输：平均成本升高约1.15倍（最差1.8倍，强压缩2.7倍），准确率暴跌，半数正确生成不再蕴含模型自身无约束基准文本。该分歧在长度控制重评分、多重比较校正及补充语义度量下仍然稳健。

推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

我们准备好迎接智能体原生记忆系统了吗？

从数据管理视角对LLM智能体记忆系统进行系统性实验研究，将其分解为表示与存储、提取、检索与路由、维护四个核心模块。评估了12个代表性记忆系统和两个参考基线，覆盖5个基准工作负载共11个数据集。端到端结果显示无单一架构占优，效果取决于记忆结构与工作负载瓶颈的对齐。细粒度消融实验量化了各模块对表示保真度、检索精度、更新正确性和长期稳定性的影响。实际工作负载下局部维护比全局重组更具成本效益。代码已公开。

智能体检索增强论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

RoPE感知的KV缓存量化位分配方法Block-GTQ

现有低比特KV量化器将每个key视为平面向量，而RoPE下key的注意力贡献分解为二维频率块的和。Block-GTQ基于TurboQuant-MSE，为每层和KV头计算每个RoPE块的无标签能量分数，通过边际增益贪心分配整数位宽。在10模型诊断集上，2/3 b/dim单K量化下每层MAE降低32–80%，367/367层全部优于均匀TQ-MSE。在Llama-3.1-8B-Instruct的K2V2设置下，六任务NIAH平均分从70.6提升至97.4，LongBench-EN平均分从36.87升至53.31。在DeepSeek-R1-Distill-Qwen-7B的AIME 2024/2025上，K3V2无fp16近期key缓冲区时得分51.7/37.5，接近fp16的54.2/37.9。基于打包缓存的推理路径在单H800、Qwen2.5-3B-Instruct上，K3V3实现3.24倍压缩，128K下比fp16 FlashAttention2快1.34倍，峰值内存从56.31GB降至19.85GB，并在256K和512K下仍可运行。

推理论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

面向艺术字场景文本识别的数据集WATER-S与模型WATERec

针对艺术字高度定制化的字体、纹理与布局导致的识别困难，研究构建了2M规模的合成数据集WATER-S，包含两部分：由升级渲染管线SynthWordArt生成的高精度可控数据，以及结合Qwen3-VL挖掘提示词与Z-Image图像合成生成的多样化真实感数据。同时提出WATERec模型，采用支持任意形状输入的视觉编码器与自回归解码器，突破了固定模板限制。在WordArt-Bench上达到90.40%准确率，大幅超越通用视觉语言模型和OCR专用模型。代码与数据已开源。

数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

IV-CoT：面向结构感知文本到图像生成的隐式视觉思维链

统一多模态大语言模型在文本到图像生成中难以准确遵循物体计数、空间关系等结构感知提示。IV-CoT提出隐式视觉思维链框架，将视觉条件查询分解为结构查询与语义查询的级联：结构查询先形成潜在视觉计划，语义查询再基于该计划渲染外观。训练时引入草图监督引导结构查询捕获结构信息，推理时无需草图或中间解码，单次前向传播完成隐式推理。在GenEval和T2I-CompBench上取得更优结果。

图像生成多模态推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

MEMPROBE：基于隐藏用户状态恢复的长期记忆智能体探测基准

MEMPROBE是一个评估长期记忆AI智能体的新基准，通过隐藏用户状态恢复直接衡量记忆质量。基准在受控任务中模拟50个用户，每个携带31个隐藏维度（共1550个恢复目标），让配备记忆的智能体辅助完成任务，随后从记忆中重构用户状态，支持全存储与top-k两种访问模式。测试5种代表性记忆系统后，任务完成率几乎饱和（无记忆基线也达），但类别平衡恢复率仅约0.6，在top-k检索下进一步下降。MEMPROBE是首个直接研究记忆恢复的基准，将恢复率作为可优化目标。

智能体论文/研究

05:12

Hacker News 热门（buzzing.cc 中文翻译）

提示注入理论（以及为何应研究角色）

一篇理论论文提出提示注入的本质是角色混淆（role confusion）——攻击通过让模型误判系统角色与用户角色的边界来达成注入。作者论证当前防御措施多聚焦于输入过滤，却忽视了角色本身的可欺骗性，并主张从角色建模入手增强模型对指令来源的区分能力。该工作为理解提示注入提供了统一的理论框架，而非具体防御方案。

安全/对齐论文/研究

01:41

Hacker News 热门（buzzing.cc 中文翻译）

Moebius：0.22B参数轻量级图像修复框架，性能媲美百亿级模型

Moebius是一个仅0.22B参数的轻量级图像修复框架。其核心是Local-λ Mix Interaction（LλMI）模块，将空间上下文与全局语义先验压缩为固定大小线性矩阵，大幅减少参数。结合自适应多粒度蒸馏策略，在隐空间中从教师模型迁移表征能力，动态平衡多层级梯度损失。在Places2、CelebA-HQ、FFHQ等6个自然场景和人像基准上，Moebius的生成质量与11.9B参数的FLUX.1-Fill-Dev持平甚至超越，参数量不足其2%，总推理速度提升超过15倍。

arXiv 图像生成论文/研究

00:08

Google Developers Blog（RSS）

精选61

Google Labs 提出用"洞察策略"评估 AI 编码智能体的主动性

Google Labs 提出以“洞察策略”评估 AI 编码智能体的主动性，而非仅按任务完成度打分。团队基于 Google 内部代码库 705 个 bug（1178 个 CL），通过时空近邻与语义相似度聚类还原开发者实际的高层级目标。初步实验显示：Jules 在单轮探索下洞察相关性评分平均 4.5/5；探索预算从两轮增至三轮时，Hit@5 准确率从 33% 升至 57%。团队正将评估方法扩展至公开 GitHub 数据，并探索纳入问题追踪器、对话等更丰富的上下文。

智能体 Google 编码论文/研究

推荐理由：AI 编码代理的评估从任务修复转向目标洞察，Google 这个思路让评估更接近真实开发场景，但实验还是内部数据，等公开 GitHub 版本再看落地效果。

6月22日

23:41

AK@_akhaliq

PerceptionDLM 平行区域感知与多模态扩散语言模型

多模态论文/研究

22:37

elvis@omarsar0

多智能体通信协议五维分类法报告发布

该报告针对LLM多智能体系统的通信瓶颈，构建了五维分类法（对方、有效载荷、交互状态、发现机制、模式灵活性），系统梳理了9个积极维护的开源智能体协议，覆盖MCP和A2A的实际格局。报告发现两个突出模式：每个智能体间协议都采用混合有效载荷与会话状态持久化组合，而去中心化发现机制仍极为罕见。领域正悄然标准化有状态会话，但发现与策略执行层仍留白。该报告为今年选择通信层时提供了九大协议的真实对比参考。

智能体 arXiv MCP/工具论文/研究

22:09

Nathan Lambert@natolambert

TMax发布：开源终端智能体RL配方与数据

TMax 是面向终端任务的开源 RL 配方，基于 Qwen 3.5 较小密集模型，在默认设置和 65k token 预算下超越此前开源工作。训练需 8 节点 H100（2 训练+6 推理）运行 2-3 天，配方经约 100 次训练才稳定。发布模型权重、数据及训练 rollouts。配方工作强调从零获得初始基线成本高昂（1 万至百万美元），需要明确决策阶梯和稳定性改进。

Hamish Ivison: Trained some terminal agents with friends! Introducing Tmax, open RL terminal agent models. Under default settings and s...

智能体开源生态论文/研究

13:07

Rohan Paul@rohanpaul_ai

《LLM智能体能推断世界模型吗？来自智能体自动机学习的证据》

Rohan Paul引用新论文指出，尽管LLM智能体有时能通过交互发现隐藏结构，但其推断世界模型的能力存在根本局限：随着隐藏世界复杂度增加，AI智能体的表现迅速落后，难以将积累的反馈转化为稳定的内部模型，尤其在提问规划、记忆利用和反馈整合方面表现薄弱。结论是，在复杂环境中，LLM智能体建立可靠心智模型的速度跟不上难度增长。

智能体 arXiv 推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

程序性记忆管理：LLM智能体的控制、适应与评估

程序性记忆可帮助LLM智能体在重复工作中产生可复用技能，但其迁移能力尚不明确。AFTER基准包含382个真实企业任务，覆盖6种职业角色和22个程序性技能，评估跨任务、跨角色、跨模型的技能迁移。实验表明，单轮优化使整体性能提升3.7–6.7个百分点；基于多模型执行轨迹演化的技能在跨模型测试中达到73.1%准确率，优于所有单模型轨迹。部分技能可广泛泛化，另一些则专化于特定角色流程，迁移后效果下降。这些结果为生产级智能体平台构建和部署程序性记忆系统提供了实践指导。

智能体数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

HeRA：面向多模态大语言模型的逐头表示对齐方法

HeRA在单个注意力头级别执行跨模态对齐，基于柏拉图表示假说，利用互K近邻（MKNN）度量定义对比损失，作为匹配局部拓扑结构的可微代理。训练时选择MKNN对齐分数最低的注意力头进行对齐，发现对齐最差的头反而带来最大收益。在多个MLLM和18项基准上的评估表明，HeRA一致提升视觉密集任务性能，并通过自然抑制对语言先验的过度依赖，有效缓解视觉幻觉。代码已开源。

多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

RaysUp：基于几何感知射线表示的超轻量通用特征上采样框架

RaysUp是一个超轻量、任务无关且与视觉基础模型无关的特征上采样框架，通过将重建提升至几何感知光线域，在任意分辨率下重建高分辨率特征图。核心组件包括空间解耦引导编码器、任意分辨率交叉注意力机制、基于6D Plücker射线坐标的RayPE（射线位置编码）和几何感知邻域注意力模块。在多种密集预测任务中取得SOTA性能，参数量仅为AnyUp的16%，推理速度提升约7倍。代码已开源。

开源生态论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

ReasoningLens：大型推理模型层级可视化与诊断审计框架

ReasoningLens是一个开源框架，用于对大型推理模型的超长思维链进行层级可视化与诊断审计。它通过三方面解决信息埋没问题：将推理轨迹组织成交互式层级，分离高级策略与低级执行；利用智能体审计器自动检测错误并进行工具增强验证；综合系统推理画像以揭示模型特定盲点。该框架将无结构文本转化为可操作的洞察，为解释、调试和优化推理AI提供基础。

开源生态推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

SingGuard：政策自适应多模态LLM护栏模型系列

SingGuard是一种将活跃政策作为运行时输入的多模态LLM护栏模型系列，可逐条检查内容并预测安全标签与触发规则。支持快速、混合和慢速三种推理模式，并通过快慢解耦强化学习优化。同时发布SingGuard-Bench基准，含56,340个样本，覆盖80+细粒度风险类型及跨模态联合风险。在6个基准家族（35个数据集）上均取得平均F1 SOTA；动态规则评估下政策遵循准确率从0.6465提升至0.7415。代码已开源。

arXiv GitHub 多模态推理

08:00

HuggingFace Daily Papers（社区热门论文）

GUI vs. CLI：屏幕仅限与技能中介的计算机使用智能体的执行瓶颈

该研究引入一项匹配执行层基准测试（440个桌面任务、18个应用、12个工作流类别），对屏幕仅限的GUI智能体与技能中介的CLI智能体进行控制对比，两者接受相同目标、状态和最终状态验证器，但仅限使用模态原生操作。最强GUI智能体全通过率59.1%，高于最强原始技能CLI智能体的48.2%；经验证器引导的技能增强后，CLI成功率升至69.3%，表明CLI缺陷主要来自技能覆盖不完整。结果揭示两类智能体不同的执行瓶颈：GUI受限于长时程工作流中的可靠接地交互，CLI受限于技能接口的覆盖率和可扩展性。

智能体 arXiv 论文/研究评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

ABACUS：适配统一基础模型以桥接图像计数理解与生成

ABACUS是一个统一的视觉语言模型，无需基准特定训练即可处理对象计数、人群计数、指代表达式计数和计数忠实的图像生成。它基于3B参数基础模型，通过三项创新适配目标定位：基于目标图的密度感知自适应缩放实现空间定位；GRPO边界感知计数策略消除裁剪边界错误；循环一致GRPO策略让理解分支自我批判生成输出，无需外部标注缩小理解-生成差距。在七个基准上取得SOTA，超越任务专用专家和更大通用模型。

arXiv 多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

计划不持久：为何上下文管理对LLM智能体至关重要

研究揭示标准LLM智能体依赖上下文窗口保持计划信息，而非将其内化为持久状态。在Llama-3.1-70B上，计划信号写入一步后从0.453骤降4.1倍，HotpotQA下降12.4倍。推理模型（DeepSeek-R1-Distill-Llama-70B）的思维链痕迹会重新推导计划，严格剥离后恢复样本内+163%、样本外+153%信号，非推理模型仅+4.8%。基于Llama训练的分类器迁移到R1上AUROC为0.748，R1专用分类器达1.000。压力测试中，丢弃计划导致ALFWorld成功率下降34.7个百分点。该框架证明关键信息仅驻留于上下文而非持久存在。

智能体论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ReNIO：为大语言模型同策略蒸馏重加权负轨迹重要性

同策略蒸馏平等对待所有学生生成输出。实验发现，仅用错误输出训练效果优于仅用正确输出，因错误输出保留模型能力边界附近的探索性推理。为此，ReNIO利用学生-教师概率比识别导致错误推理轨迹的关键token，聚合为归一化样本权重，无需观测最终答案正确性即可自动赋予负轨迹更高权重。在数学推理和代码生成任务上，ReNIO同时提升同策略蒸馏和同策略自蒸馏，对Qwen3-1.7B最高提升8.90%，对R1-Distill-Qwen-7B最高提升10.00%。代码已开源。

GitHub 推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

VeriEvol：通过可验证进化指令扩展多模态数学推理

VeriEvol 是一个迭代框架，将多模态数学推理的奖励可靠性问题转化为可验证的数据构造问题。其类型感知进化模块将低难度图像-问题种子改写为更难的图像化提示；HTV-Agent 验证器在多项反证失败后才接受答案。在五个视觉数学基准上，将进化 SFT 数据从 10K 扩展至 250K 样本，平均准确率从 35.42 升至 54.73；固定 backbone、SFT 初始化和 GRPO 配方后，VeriEvol 相比未进化 RL 基线累积提升 +3.88，其中进化提示贡献 +1.82，验证器贡献 +2.06。项目开源全部提示、数据、模型、代码及验证轨迹。

多模态推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

AI智能体模型批判--从笛卡尔思想到GIC通用架构

论文基于笛卡尔独立思想奠基与科幻自主存在体描绘，从目标、身份、决策、自我调节与学习五维度剖析当前AI智能体架构。区分能力来自外部工程组装的agentic系统与能力（含社交互动）内生的agentive系统。提出Goal-Identity-Configurator（GIC）通用架构，融合分层目标分解、身份演化、基于世界模型的模拟推理、习得性自我调节与自我导向学习，并讨论agentive系统在人类监督下的可审计性、可控性与安全性。

智能体安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

语义浏览：图像生成的可控多样性

现有文本到图像模型虽保真度高，但生成样本单一。现有多样性方法往往产生偶然变化而非有意义的设计选择。本文提出可控多样性方法“语义浏览”，让用户沿可解释变化轴系统遍历结构化图像画廊。核心思路是将语义决策与像素生成分离，直接在文本层面诱导多样性：利用视觉语言模型（VLM）操作完整场景上下文，并通过智能体工作流强制执行与原始提示一致的结构化变化。该方法生成多样且可导航的设计空间，每种变化对应一个可理解的语义决策。

图像生成多模态论文/研究