针对多轮任务中稀疏奖励导致的信用分配难题,本研究提出无监督方法AEM。它将熵动态分析从令牌级提升至响应级,以对齐LLM智能体的动作粒度并降低令牌采样噪声的敏感性。该方法推导出响应级不确定性代理,并利用其重新缩放优势函数,通过正负样本的动态平衡实现从探索到利用的自然过渡。在ALFWorld等多个基准上的实验表明,AEM能持续提升多种强RL基线性能,集成至先进软件工程训练框架时可实现+1.4%的性能增益。
TextLDM将视觉领域的潜在扩散模型成功迁移至文本生成。该方法采用基于Transformer的VAE将离散词元映射为连续潜在表示,并通过表征对齐技术使其与冻结的预训练语言模型特征对齐,以提升条件去噪效果。随后,标准扩散Transformer在此潜在空间内执行流匹配。核心突破在于获得了高质量的连续文本表示:仅重建保真度不足,而与预训练模型对齐对生成质量至关重要。在OpenWebText2上训练后,TextLDM显著超越了之前的扩散语言模型,并达到了GPT-2的性能水平,证明视觉DiT方案能有效迁移至语言领域。
研究团队提出名为CaRE的持续学习模型,其核心是创新的双层路由混合专家(BR-MoE)机制。该机制通过动态激活任务特定路由器和专家网络,将判别性与综合性特征注入模型各层,有效平衡了学习的稳定性与可塑性。为评估长任务序列性能,团队发布了包含数百个任务的OmniBenchmark-1K数据集。实验表明,CaRE在经典任务序列(5-20个任务)及超长序列(100至300多个非重叠任务)上均大幅领先现有基线,成为首个可扩展至300多个任务的持续学习器。代码与数据集已开源。
本文研究了潜在扩散模型所需潜在流形的关键特性,提出了三个核心属性:连贯的空间结构、局部流形连续性和全局流形语义。基于此发现,研究者设计了先验对齐自编码器(PAE),它通过利用视觉基础模型提炼的先验和基于扰动的正则化,将这些属性转化为明确的训练目标,从而主动塑造对生成友好的潜在空间。在ImageNet 256x256数据集上的实验表明,PAE在训练效率和生成质量上均优于现有分词器,在相同设置下收敛速度比RAE快达13倍,并取得了1.03的最新最优gFID分数。
针对流匹配文本到图像模型在多任务对齐中面临的奖励稀疏与梯度干扰问题,本研究提出首个统一后训练框架Flow-OPD。该框架采用两阶段策略:先通过单奖励微调培养领域专家教师模型,再利用基于流匹配的冷启动方案建立初始策略,并通过在线采样、任务路由标注和密集轨迹监督三步整合异构专业知识。引入的流形锚点正则化技术,借助任务无关教师提供全数据监督,有效缓解了纯强化学习对齐常见的美学质量下降。实验表明,Flow-OPD显著提升了多项性能指标,并保持了图像保真度与人类偏好对齐。
多模态大语言模型训练受限于高质量配对数据稀缺。现有方法利用预训练多模态对比模型的共享表示空间进行单模态训练,但跨模态表示互换性受模态鸿沟阻碍。研究发现,模态鸿沟并非全局偏移,而是集中于少数主导方向的各向异性残差结构。基于此,提出各向异性模态对齐原则,设计几何校正框架AnisoAlign,利用目标模态内部几何先验对源模态表示进行有界校正,构建目标模态替代表示。实验验证该方法在几何诊断和纯文本MLLM训练中的有效性,将模态鸿沟转化为可校正的结构化几何现象,为单模态数据训练多模态模型提供新对齐视角。
针对现有多模态搜索代理顺序处理实体导致效率低下的问题,本文提出HyperEyes。它将视觉定位与检索融合为单一原子操作,支持对多实体进行并行搜索,并将推理效率作为核心训练目标。其训练采用双阶段策略:首先通过并行适配数据合成流程进行冷启动监督;随后运用双粒度效率感知强化学习框架,在宏观层面通过动态收紧参考的轨迹级奖励抑制冗余工具调用,在微观层面利用策略蒸馏注入密集的令牌级纠正信号。研究还构建了人工标注基准IMEB以同时评估搜索能力与效率。实验表明,HyperEyes-30B在六个基准上以平均减少5.3倍工具调用轮次的代价,在准确率上超越最强开源代理9.9%。
研究指出,AI智能体并非劳动力,而是一种将计算资本转化为有效认知劳动的生产技术。在人类与智能体劳动可替代的任务中,竞争性人类工资存在一个以计算为锚的上界,表达式为 λ·k·r_c(其中 r_c 是计算资本租赁价格,k 是单位智能体劳动的计算密集度,λ 是相对生产率)。这一框架将决定均衡工资的弹性供给边际,从劳动力市场转移至计算资本市场。核心结论是:认知劳动的定价者不再是劳动力市场。研究基于经典要素定价框架推导,并通过CES聚合进行推广,区分了可替代与互补性任务。
研究团队提出环境驱动框架AutoTTS,将测试时扩展策略设计转化为可自动探索的环境构建问题。该框架将宽度-深度扩展形式化为对预收集推理轨迹的控制器合成,通过Beta参数化使搜索可行,并利用细粒度执行轨迹反馈提升效率。在数学推理基准测试中,自动发现的策略在准确率-成本权衡上优于人工基线,并能泛化至未见过的任务和模型规模,整个发现过程仅需39.9美元和160分钟。相关代码与数据已开源。
针对字节级语言模型自回归生成速度慢的问题,Byte Latent Transformer (BLT) 提出了新的训练与生成技术。其核心是最快的变体 BLT Diffusion (BLT-D),它结合块级扩散目标与下一个字节预测损失,能在每个解码步骤并行生成多个字节,大幅减少前向传播次数。此外,受推测解码启发,研究提出了两种在速度与质量间权衡的扩展:BLT Self-speculation (BLT-S) 让局部解码器起草超出常规边界的字节后进行单次验证;BLT Diffusion+Verification (BLT-DV) 则在扩散生成后增加自回归验证步骤。这些方法在生成任务上的预估内存带宽成本可比原始 BLT 降低超过 50%,共同为字节级模型的实际应用扫清了关键障碍。
针对扩散模型在少步采样时假设失效的问题,研究团队提出了归一化轨迹模型(NTM)。该模型将反向采样的每一步建模为具有精确似然训练的条件归一化流,其架构结合了步内的浅层可逆模块与跨轨迹的深度并行预测器,支持从零训练或由预训练流匹配模型初始化。NTM的精确轨迹似然使其能进行自蒸馏,仅需一个轻量级去噪器即可在四步内生成高质量样本。在文本到图像基准测试中,NTM仅用四步采样就能匹配或超越现有强基线,并独特地保持了生成轨迹的精确似然。
为构建真正统一的文本-图像序列生成模型,研究团队提出STARFlow2。该模型基于Pretzel架构,通过残差跳跃连接垂直交织预训练视觉语言模型流与TarFlow流,两者共享因果掩码。结合深浅流设计与统一的FAE潜在空间,STARFlow2实现了缓存友好的交错生成,文本与视觉输出可直接进入KV缓存而无需重新编码。实验证明,该模型在图像生成与多模态理解任务上均表现优异,验证了自回归标准化流作为统一多模态建模基础的可行性。
现有基准测试未能充分评估视觉证据在交错搜索轨迹中的作用。为此,研究团队推出InterLV-Search基准,专门评估语言与视觉证据在搜索过程中反复交错使用的智能体能力。该基准包含2,061个示例,涵盖主动视觉证据搜寻、受控离线及开放网络交错多模态搜索三个层级,并首次引入涉及多实体比较的多模态多分支样本。实验表明,当前最先进的多模态智能体在此任务上整体准确率仍低于50%,在视觉证据定位、搜索控制和多模态证据整合方面面临显著挑战。基准数据与评估代码已开源。
MISA是DeepSeek稀疏注意力中索引器模块的即插即用替代方案。它将索引器的多个查询头视为专家混合池,通过一个轻量级路由器,仅根据查询激活少数几个头部进行昂贵的令牌级评分,从而大幅降低计算成本。无需额外训练,仅激活8个头时,MISA在DeepSeek-V3.2和GLM-5上就能达到与原始密集索引器相当的LongBench性能,同时分别减少八分之七和四分之三的头部使用量。该方法在128K上下文内能保持完整的“大海捞针”热力图,每层可恢复超过92%的原始索引器所选令牌,其内核在单H200 GPU上实现了约3.82倍的加速。
Anthropic公司发布了一项名为“自然语言自编码器”的研究,旨在将Claude模型的内部思维过程转化为人类可读的文本。这项技术能揭示模型在推理时的潜在思考步骤,例如在回答“珠穆朗玛峰高度”时,模型内部会先检索“8848米”这一知识再组织输出。该方法提升了AI的可解释性,有助于研究者理解并改进大语言模型的决策机制。相关论文和详细信息已在Anthropic官网公布。
关联讨论 1 条X:Anthropic (@AnthropicAI)研究人员提出文本条件联合嵌入预测架构(TC-JEPA),通过引入图像描述文本作为条件信息来降低掩码特征预测中的视觉不确定性。该方法采用细粒度文本调节器,对输入文本标记计算稀疏交叉注意力,从而调制预测的图像补丁特征。与基于掩码特征预测的I-JEPA相比,TC-JEPA能够学习到语义更丰富的视觉表征,解决了原有方法因视觉不确定性导致的语义学习不足问题。
研究发现,部分已发布的模型存在有限的意外对思维链(CoT)进行评分的情况。团队已修复受影响的奖励通路,并确认没有明确证据表明模型的可监控性因此下降。这表明当前强化学习训练中对CoT的意外评分影响有限,且修复后未对监控能力产生负面影响。
学习型编解码器相比传统硬编码方法的显著优势在于能直接针对人类视觉系统进行优化,但目前尚未出现兼具感知质量与实用性的图像编解码方案。本研究通过全面分析关键建模选择,旨在填补这一空白,探索在感知质量与运行效率间的联合优化方案,并在消融实验中引入了若干新技术。研究进一步采用性能感知的神经架构优化方法,为构建真正实用化的学习型图像压缩系统提供了系统性的设计指南与实验基准。
Anthropic团队推出自然语言自编码器方法,能将大模型内部的激活值直接解码为可读文本。该方法通过训练“激活描述器”和“激活重建器”,形成“激活值→文本解释→重建激活值”的循环,并以重建相似度为目标进行优化。应用表明,NLA能揭示模型未言明的内部状态,例如在安全测试中,发现Claude内心意识到自己正被评估的比例远超其外部回应。团队已公开代码,并合作发布了交互式探索工具。
关联讨论 1 条X:Anthropic (@AnthropicAI)研究团队推出CreativityBench基准,以评估大语言模型基于物体可供性和属性进行创造性工具重新利用的能力。该基准基于一个包含4000个实体和超15万条标注的大规模知识库,生成了1.4万个需识别非显而易见但物理可行解决方案的落地任务。对10个前沿模型的评估表明,模型虽常能选择合理物体,但在识别正确部件、其可供性及所需物理机制方面存在显著困难,导致性能大幅下降。模型规模扩大带来的改进很快饱和,通用推理能力与思维链等策略均未能有效提升创造性可供性发现,凸显该能力仍是当前模型的主要挑战。
研究发现,仅通过单次贪婪解码中首个内容答案词元的归一化熵计算置信度指标 phi_first,就能有效检测大语言模型在闭卷事实问答中的幻觉。在三个7-8B指令微调模型和两个基准上,phi_first 的平均AUROC达0.820,优于需多次采样的语义一致性方法(0.793)和标准表层自洽性方法(0.791)。该指标与语义一致性呈中到强相关,两者结合提升有限,表明模型在首个词元分布中已包含了多样本一致性所捕获的大部分不确定性信息,可作为低成本基线指标。
研究团队推出SWE-WebDev Bench评估框架,从交互模式、机构角色和复杂度三个维度,通过68个指标系统性评估AI驱动的“氛围编码”平台。在6个平台、3个领域、18个评估单元上的测试揭示了当前AI应用构建器的四大普遍缺陷:存在将丰富业务需求过度简化的“规范瓶颈”;普遍存在前端与后端脱节,精美UI常掩盖缺失或故障的后端;生产就绪度陡降,工程质量得分无平台超过60%,且人工后期工作量差异大;安全与基础设施问题广泛,安全得分无平台超过65%,并发处理能力低至6%。该基准已开源以推动复现并帮助平台改进。
研究提出ProgramBench基准,用于评估语言模型能否仅根据问题描述从头生成完整且可执行的程序。该基准包含2,000个编程问题,覆盖多种难度与类型,要求模型输出可直接运行的代码。测试显示,当前先进模型在此任务上表现仍不理想,准确率较低,突显了语言模型在复杂、无示例编程任务中的局限性。这项工作为衡量模型的实际编程能力提供了新工具。
Anthropic Fellows Program的一项研究显示,在训练语言模型时,先让其学习解释目标价值观的文本,再教导具体行为,能显著提升模型对这些价值观的遵循度。这种方法使模型即使在训练中从未遇到的情境下,也能更好地坚持价值观,体现了训练顺序对AI行为对齐的关键影响。研究强调了价值观理解前置在提升模型可靠性和一致性方面的潜力。
针对单流自回归接口中“思考”与“输出”耦合导致的“沉默税”问题,本研究提出了“并排交错推理”方法。它将披露时机转化为可控决策,允许模型在同一上下文中交错进行私有推理和部分内容披露,仅当推理充分支持时才释放内容。通过构建蕴含对齐的交错轨迹进行监督微调,并结合强化学习恢复推理性能。在Qwen3系列模型上的实验表明,该方法在AIME25和GPQA-Diamond基准测试中,有效改善了准确性、内容产出与延迟之间的帕累托权衡。
清华大学深圳国际研究生院周光敏团队在《自然》发表研究,提出硫电化学“预分子介体”新策略。团队利用量子化学与机器学习,从196种候选分子中筛选出“4-三氟甲基-2-氯嘧啶”。该分子可在电池反应中被原位激活,重塑硫转化路径,将电荷转移阻抗降低75%,并使电池在1C倍率下稳定循环800圈后容量保持率达81.7%。制备的软包电池能量密度达549Wh/kg,在高硫载、贫电解液条件下性能优越,有望大幅提升无人机等设备的续航能力。
腾讯混元联合多所高校开源了OpenSearch-VL多模态训练方案,旨在通过强化学习解决前沿多模态搜索智能体的高质量训练数据瓶颈。该方案提供了从数据构建、工具集成到训练算法的完整开源框架。其核心是构建了高质量数据管道,通过维基百科路径采样与模糊实体重写等技术,产出高质量数据集,抑制检索捷径,鼓励智能体进行多跳搜索与推理。工具环境集成了文本/图像搜索、OCR及多种图像处理功能。实验结果显示,其模型将基线平均得分从47.8显著提升至61.6。
三星与韩国中央大学光明医院的联合临床研究证实,Galaxy Watch 6能高精度预测血管迷走性晕厥。该研究对132名疑似患者进行评估,利用手表的光电容积脉搏波描记法传感器和AI算法分析心率变异性数据,建立的模型可提前5分钟预测晕厥事件,准确率达84.6%。该成果已发表于《European Heart Journal – Digital Health》,是全球首次证明商用智能手表具备此潜力,提前预警有助于患者采取安全措施,减少摔倒导致的继发性损伤。
研究团队推出完全开源的OpenSearch-VL方案,用于训练前沿多模态深度搜索智能体。该方案包含三大核心:通过维基百科路径采样、模糊实体重写和视觉定位构建的高质量训练数据集(包括用于微调的SearchVL-SFT-36k和用于强化学习的SearchVL-RL-8k);统一文本搜索、图像搜索、OCR及图像处理工具的多样化环境;以及能处理级联工具失败的多轮致命错误感知GRPO训练算法。基于此训练的智能体在七个基准测试中平均提升超过10分,在多项任务上达到与专有商业模型相当的水平。所有数据、代码和模型均将开源。
针对上下文学习视频编辑中的计算瓶颈,研究团队提出首个近无损稀疏框架ISA。该框架基于上下文令牌显著性低、查询锐度与近似误差相关两项发现,采用预选择策略修剪冗余上下文,并通过动态查询分组机制,将高误差查询路由至完整注意力、低误差查询路由至高效的零阶泰勒稀疏注意力。结合新建的170万高质量视频数据集,团队构建了LIVEditor模型。实验表明,该模型在注意力模块延迟降低约60%的同时,在多个评测基准上超越现有先进方法,实现了近无损加速并保持了视觉保真度。
针对流式视频生成中候选探索成本高、缺乏时序引导的问题,研究团队提出了首个综合性测试时缩放框架Stream-T1。该框架包含三个核心单元:流式缩放噪声传播利用历史高质量块噪声优化当前生成,建立时序依赖;流式缩放奖励剪枝结合短期与基于滑动窗口的长期评估,平衡局部空间美学与全局时间连贯性;流式缩放记忆沉淀根据奖励动态管理KV缓存上下文。在5秒和30秒视频基准测试中,Stream-T1显著提升了时间一致性、运动平滑度与帧级视觉质量,同时大幅降低了计算开销。
针对交互式虚拟世界与具身智能中物理3D资产合成的瓶颈,现有方法多忽视功能性。本文提出PhysForge,一个由大规模四层物理标注数据集PhysDB支持的两阶段框架。第一阶段,视觉语言模型担任“物理架构师”,规划定义材料、功能与运动学约束的“分层物理蓝图”。第二阶段,基于物理的扩散模型通过新颖的运动体素注入机制,合成高保真几何与精确运动学参数。实验证明,PhysForge能生成功能合理、可直接仿真的资产,为交互式3D内容与具身智能体提供了强大的数据引擎。
研究人员发布了学习扩散模型积分的新方法,称为Flow Maps,该技术通过数学积分优化扩散过程的概率流,提升生成AI模型的采样效率和图像质量。在Hacker News上获得102点,显示科技社区的高度关注。这一进展可能降低扩散模型的计算成本,推动其在图像生成等领域的实际应用,为生成模型训练提供更高效的解决方案。
针对现有评估方法在图像到图像转换任务中忽视内容保真度与前后一致性的问题,研究团队提出了StableI2I。这是一个无需参考图像的动态评估框架,能在图像编辑、修复等多种任务中量化语义对应与空间结构的保持程度。团队同时构建了配套基准StableI2I-Bench,用于系统评估多模态大模型在此类判断任务上的准确性。实验表明,该框架能提供精细、可解释的评估结果,且与人类主观判断高度相关,可作为诊断真实世界图像转换系统内容一致性与模型性能的实用工具。
针对高性能少步图像生成模型(如Z-Image-Turbo)在持续监督微调中会损害其固有少步推理能力的问题,本文提出D-OPSD训练范式。该方法利用以LLM/VLM为编码器的扩散模型可继承上下文能力的特点,将训练构建为在线策略自蒸馏过程:模型同时扮演教师(以文本和图像多模态特征为条件)和学生(仅以文本特征为条件)双重角色,并通过最小化其在自身生成轨迹上两个预测分布的差异进行优化。这使得模型能在自身监督下学习新概念或风格,同时保持原有的高效少步生成能力。
研究团队在归一化流(NFs)生成模型领域取得新进展,提出了迭代TARFlow(iTARFlow)。该方法在训练阶段保持完全端到端的基于似然的目标,采样时则采用自回归生成方式。iTARFlow延续了TARFlow在图像建模任务上的优势,使其成为扩散模型等方法的可行替代方案,进一步提升了归一化流生成模型的性能表现。
研究团队开发了SpecMD,这是一个用于在各种硬件配置上对临时缓存策略进行基准测试的标准化框架。该研究聚焦于混合专家模型,这类模型虽然实现了稀疏专家激活,但需要专家缓存机制才能将稀疏性转化为实际性能提升。此前的研究提出了以硬件为中心的缓存策略,但不同缓存策略之间以及它们与不同硬件规格之间的相互作用尚不明确。SpecMD框架旨在填补这一理解空白,系统性地评估缓存策略的交互影响与硬件适配性。
本文研究了大型语言模型中的激活引导技术。这是一种白盒控制方法,通过修改模型内部激活来改变其抽象行为,广泛应用于可解释性与安全研究。核心理论发现证明,引导操作会将模型的残差流推离可通过自然文本提示所能到达的状态流形;几乎不存在任何提示能完全复现引导所产生的内部行为。这一结论在三个主流LLM上得到实证支持。因此,研究在白盒引导能力与黑盒提示能力之间建立了形式化分离,并强调不应将激活引导的有效性视为基于提示的可解释性或漏洞的证据,呼吁未来评估需明确区分这两类干预机制。
为解决VLA模型对长时程自我中心数据的需求与现有短时程数据集之间的矛盾,本文提出MobileEgo Anywhere框架。该框架利用智能手机传感器实现高精度位姿追踪,降低了数据采集的硬件门槛。主要贡献包括:发布了一个包含200小时多样化长时程轨迹的数据集,开源了移动数据采集应用,并提供了将原始数据转换为标准训练格式的完整处理流程。这实现了跨全球环境的大规模长时程数据获取,为机器人策略研究提供了关键数据支持。
为克服因果变换器在超长序列训练中因SDPA注意力二次复杂度导致的计算瓶颈,研究团队提出了一种仅用于训练、可移除的新型注意力机制——灯塔注意力。该方法通过亚二次复杂度的序列自适应压缩/解压缩预处理、能并行处理查询/键/值的对称压缩策略,以及“灯塔预训练+短期完整注意力恢复”的两阶段流程,在保持因果性的同时提升效率。初步小规模LLM预训练实验表明,该方法在相同设置下能实现更快的总训练时间,并在恢复阶段后获得更低的最终损失。