AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「arXiv」清除
5月29日周五
16:30HuggingFace Daily Papers(社区热门论文)60PhyGenHOI:动态人-物交互的物理感知4D生成
16:30HuggingFace Daily Papers(社区热门论文)54几何 matters: 3D基础先验用于学习语义对应
14:30HuggingFace Daily Papers(社区热门论文)65面向可验证的多模态深度研究:一个用于交错式报告生成的多智能体框架
14:30HuggingFace Daily Papers(社区热门论文)68超越数学与代码的可验证奖励:面向事实性问答的轻量级基于语料库的过程监督
12:29HuggingFace Daily Papers(社区热门论文)65YOCAUSAL: 视频生成距世界模型有多远?一个因果关系的视角
11:29HuggingFace Daily Papers(社区热门论文)50OmniRetrieval:跨异构知识源的统一检索
11:29HuggingFace Daily Papers(社区热门论文)67GenClaw:代码驱动的智能体图像生成
10:29HuggingFace Daily Papers(社区热门论文)57用于生成的原生音视频对齐
10:29HuggingFace Daily Papers(社区热门论文)57LaRA:基于逐层表征分析的强化学习后训练数据污染检测
08:00HuggingFace Daily Papers(社区热门论文)49蒸馏LLM反馈用于Lean定理证明
08:00HuggingFace Daily Papers(社区热门论文)49蒸馏博弈:自适应攻击与高效防御
08:00HuggingFace Daily Papers(社区热门论文)62加法的形状:大语言模型中算术的几何结构
08:00HuggingFace Daily Papers(社区热门论文)46MechVQA:全面机械图纸理解的多模态大语言模型基准与增强
08:00HuggingFace Daily Papers(社区热门论文)53组合式合成:通过原子分解与重组扩展代码 RLVR 训练规模
08:00HuggingFace Daily Papers(社区热门论文)50函数注意力:从成对亲和性到函数对应
08:00HuggingFace Daily Papers(社区热门论文)50OpenSTBench:超越语义评估的语音翻译统一评估框架
08:00HuggingFace Daily Papers(社区热门论文)52扩散模型中通过分数控制减少幻觉
08:00HuggingFace Daily Papers(社区热门论文)50MindZero:基于零标注的在线心智推理学习
08:00HuggingFace Daily Papers(社区热门论文)51MineExplorer:评估多模态大语言模型智能体在 Minecraft 中的开放世界探索能力
08:00HuggingFace Daily Papers(社区热门论文)55SOCO:视觉基础模型中的语义物体对应基准测试
08:00HuggingFace Daily Papers(社区热门论文)50流水线推测解码
08:00HuggingFace Daily Papers(社区热门论文)53SurGe:改进点映射中的表面几何
08:00HuggingFace Daily Papers(社区热门论文)64嵌入模型如何进行概念绑定?
08:00HuggingFace Daily Papers(社区热门论文)63PEEK:通过高效知识蒸馏选择关键帧
08:00HuggingFace Daily Papers(社区热门论文)66SCOPE:通过共同演化策略实现开放式任务的自我对弈
08:00HuggingFace Daily Papers(社区热门论文)55SwanVoice:面向独白与对话的富有表现力的零样本文本转语音模型
08:00HuggingFace Daily Papers(社区热门论文)51LongTraceRL:基于搜索智能体轨迹与评分奖励的长上下文推理学习
08:00HuggingFace Daily Papers(社区热门论文)56面向长视频理解的线性扩展视频语言模型
06:14Rohan Paul60学术论文现14.7万次虚假引用,AI生成问题激增
05:48Ars Technica:AI(RSS)70精选LLMs相信虚假陈述,即使明确警告也无效
05:29HuggingFace Daily Papers(社区热门论文)65LACUNA:作为递归程序孔的智能体安全模型
00:08elvis63FluxMem:将AI智能体记忆重构为动态演化的图拓扑
5月28日周四
23:43AK55多模态智能体推理的探索性策略优化
23:12AK49离散扩散中序列蒙特卡洛的对比分布匹配
21:29HuggingFace Daily Papers(社区热门论文)73精选"了解评估如何设计的模型"得分更安全
19:28HuggingFace Daily Papers(社区热门论文)60针对LLM生成代码片段的可扩展高效溯源追踪
19:11Rohan Paul71Diffusion Transformers训练提速8.75倍:革新残差连接机制
17:47公众号:通义实验室(千问)54通义实验室发布Qwen-Image-Bench:56项细粒度创作评测基准
17:28HuggingFace Daily Papers(社区热门论文)68揭示逻辑推理的算法演绎电路
14:28HuggingFace Daily Papers(社区热门论文)58ESC-Skills:发现与自我进化的情感支持对话技能
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月29日
16:30
HuggingFace Daily Papers(社区热门论文)
60
PhyGenHOI:动态人-物交互的物理感知4D生成

PhyGenHOI是一个用于生成物理准确、视觉逼真的4D人-物交互场景的新框架。给定静态3D人体和目标物体的3D高斯表示,该框架旨在合成人体与物体主动交互的动态场景。它将人体建模为由运动扩散模型驱动的语义智能体,物体则通过物质点方法模拟为物理智能体,并以3D高斯作为统一可微表示。交互通过三个耦合机制监督:时间同步的窗口吸引力损失、碰撞触发的接触驱动重模拟,以及增强接触保真度的遮罩视频-SDS目标。实验证明,PhyGenHOI能生成物理一致的交互,性能优于基线方法。

arXiv具身智能多模态论文/研究
16:30
HuggingFace Daily Papers(社区热门论文)
54
几何 matters: 3D基础先验用于学习语义对应

自监督视觉模型与扩散模型提取的2D基础特征在语义对应任务中有效,但缺乏显式3D意识,易混淆对称物体的两侧、重复部件及视觉相似结构。新框架引入3D基础模型先验,使用SAM3D估计物体几何与位姿,并通过渲染比较优化进行细化。随后,基于估计位姿将PartField描述符从重建几何渲染至图像平面,生成几何感知特征图以补充DINO与Stable Diffusion特征,同时利用重建形状上的测地距离可靠过滤候选对应。该方法以过滤后的匹配为监督,训练一个轻量级适配器。与以往依赖位姿标注和粗略几何的后训练方法不同,此框架自动获取实例级3D结构并用于指导对应学习。实验表明,该方法在减少人工几何监督的同时提升了语义对应性能。

arXivGitHub多模态论文/研究
14:30
HuggingFace Daily Papers(社区热门论文)
65
面向可验证的多模态深度研究:一个用于交错式报告生成的多智能体框架

大语言模型已将智能体从深度搜索推进至能生成长篇报告的深度研究。然而,可验证的多模态深度研究仍面临挑战。为此,研究提出了Ptah,一个多智能体框架。它通过规划、研究和写作阶段,协调从用户查询到网页报告的生成全流程,其中智能体负责构建计划、收集证据并维护视觉记忆。一个验证智能体确保整个流程的事实依据和跨模态一致性。研究还引入了PtahEval评估协议。实验表明,Ptah能生成比基线更可靠、视觉信息更丰富、更实用的多模态报告。

智能体arXiv多模态论文/研究
14:30
HuggingFace Daily Papers(社区热门论文)
68
超越数学与代码的可验证奖励:面向事实性问答的轻量级基于语料库的过程监督

针对强化学习提升事实性问答准确度时的奖励设计难题,本文提出CorVer方法。它用基于Wikipedia共现统计的轻量级语料库信号,替代了昂贵且不可靠的神经验证器(如NLI或LLM判断器)。CorVer为每个句子分配信用值,并通过简单对齐映射到token级优势,仅需一个0.5B的提取器和单次语料库查询。在覆盖六个指令微调模型和五个问答基准的30个测试组合中,CorVer使每个组合的性能均优于原始基线,其中TriviaQA平均提升+4.1个百分点。在可行配置下,它在20个组合中的18个超越了神经验证器基线,且训练速度快4.8至8.4倍。

arXiv检索增强推理论文/研究
12:29
HuggingFace Daily Papers(社区热门论文)
65
YOCAUSAL: 视频生成距世界模型有多远?一个因果关系的视角

本文提出YOCAUSAL,一个受认知科学“违反期望”范式启发的两层级基准测试,用于评估视频扩散模型(VDMs)的因果理解能力。Level 1通过零成本的时间反转真实视频构建反事实样本,引入“反转惊奇指数”(RSI)量化模型对时间箭头的感知。Level 2引入“因果认知指数”(CCI),利用视觉语言模型将数据集分层,以区分真正的因果推理与时间偏差。对13个先进VDMs的评估表明,感知时间箭头并不等同于理解因果关系,当前模型在因果认知方面与人类水平仍存在显著差距。

arXiv推理视频论文/研究
11:29
HuggingFace Daily Papers(社区热门论文)
50
OmniRetrieval:跨异构知识源的统一检索

现实世界的信息需求需要访问结构多样的知识源,但现有检索器一次只能处理单一类型源。OmniRetrieval 框架能接收自然语言查询,识别合适知识源,并向各源的本地执行引擎发送原生查询。在涵盖文本、关系型和图结构知识源的13个数据集与309个知识库的广泛基准测试中,OmniRetrieval 的性能超越了单源基线,证明其可以作为异构知识源的通用接口,同时保留了每个源独特的结构优势。

arXiv搜索论文/研究
11:29
HuggingFace Daily Papers(社区热门论文)
67
GenClaw:代码驱动的智能体图像生成

GenClaw提出一种代码驱动的智能体图像生成范式,让AI智能体像人类艺术家一样分步创作:先通过搜索与推理构建概念,再利用SVG、HTML、Three.js等代码渲染可执行的视觉草图,最后调用图像生成模型补充纹理、材质与真实感。该范式将代码作为连接语言推理与像素合成的可控中间画布,将图像生成从黑盒过程转变为类似人类创作的分步流程,迈向更高可控性与可解释性的视觉生成系统。

智能体arXiv图像生成论文/研究
10:29
HuggingFace Daily Papers(社区热门论文)
57
用于生成的原生音视频对齐

针对现有开源方法在联合音视频生成中存在的音视频精细协同不足或语义条件与底层同步耦合的问题,本文提出了NAVA(原生音视频对齐)框架。该框架在专用交互空间建立音视频对应关系后,利用外部上下文条件化联合去噪过程。具体实现上,NAVA采用Align-then-Fuse MMDiT架构,并引入Timbre-in-Context Conditioning技术。在Verse-Bench和Seed-TTS上的实验表明,NAVA仅用6.3B参数即实现了高质量的视频生成、精准的音视频同步、有竞争力的音频质量以及更强的参考音色可控性。

arXiv多模态视频论文/研究
10:29
HuggingFace Daily Papers(社区热门论文)
57
LaRA:基于逐层表征分析的强化学习后训练数据污染检测

强化学习后训练能提升大语言模型的推理能力,但也可能引入数据污染,影响模型泛化和评估可靠性。现有基于输出层信号的检测方法对RL模型效果不佳。为此,研究提出了LaRA框架,通过逐层分析模型表征来检测污染。该框架引入三个互补指标,分别度量受控扰动下的扰动敏感度、方向坍缩和局部表征刚性。研究发现,污染会导致模型表征在各层出现渐进式几何偏差。基于此,研究开发了一种聚合各层与各指标表征偏差的检测协议,实验表明其性能优于现有的输出级基线方法。

arXiv推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
49
蒸馏LLM反馈用于Lean定理证明

针对推理模型后训练中GRPO存在的稀疏奖励、有限探索和模式坍缩问题,提出Feedback Distillation方法。该方法让模型在token级别匹配其自身分布(基于语言模型提供的特权反馈),提供token级监督并注入外部知识。在Lean4定理证明任务上,Feedback Distillation相比GRPO保持更高轨迹多样性,获得更高策略熵和更好的pass@k缩放。两种方法互补:从Feedback Distillation检查点初始化GRPO优于单独使用任一方法,为改进复杂推理后训练提供了有前景的方向。

arXiv推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
49
蒸馏博弈:自适应攻击与高效防御

蒸馏攻击使模型提供面临部署权衡:提升可用性的输出更易被模仿。研究通过效用受限教师与自适应学生的极小化极大博弈建模,得到学生侧自适应评估规则(重加权高价值样本)和教师侧防御模板。基于样本价值代理提出Product-of-Experts(PoE)防御——前向传播中结合教师与代理学生。实验表明,自适应评估揭示巨大被动-自适应差距;PoE与昂贵防御鲁棒性差距缩小,且成本更低、推理轨迹质量更高。结论:强蒸馏难以阻止,抗蒸馏进展应基于自适应学生评估。

arXiv安全/对齐论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
62
加法的形状:大语言模型中算术的几何结构

通过分析多操作数加法中的残差流几何结构,发现Iso-Raw-Sum Trajectory (IRST)几何结构,其中表征由语义数字锚定并被连续进位纤维调制。提出Noisy Quantization Model,将算术错误解释为内部神经噪声推动连续潜在进位势跨越量化阈值导致的Geometric Slippages。该几何框架阐明了Probe Versatility,即轻量探针如何从单次激活向量中分离共存潜在信号(如真实值与幻觉)。最后,通过几何一致性检验方法在推理中检测并纠正这些量化失败。代码已开源。

arXiv推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
46
MechVQA:全面机械图纸理解的多模态大语言模型基准与增强

MechVQA是一个面向机械工程图纸理解的全面数据集,通过半自动构建与质量控制流程生成,包含3.3k高密度图片和21K问答对,覆盖识别、推理、判断三个能力层级的10种细粒度任务。基于该数据集,研究团队开发了MechVL模型,采用多阶段训练范式,在MechVQA总分上超越最强闭源基线7.57个百分点,显著提升机械图纸理解能力,为多模态大语言模型在机械设计与检测场景中的应用提供了可复用基础。

arXiv多模态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
53
组合式合成:通过原子分解与重组扩展代码 RLVR 训练规模

针对可验证奖励强化学习(RLVR)中足够有挑战性的代码任务稀缺、现有种子扩展法限制新颖性与难度的问题,提出原子分解与重组(ADR)框架。ADR 将代码任务分解为原子元素并受控重组,从而生成真正新颖且高难度的可验证代码任务。实验表明,ADR 在原创性、难度、多样性和测试质量上均优于现有基线,并在算法编程、工具使用和数据科学等多个下游领域的 RLVR 训练中持续带来更大的代码能力提升。

arXiv数据/训练编码论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
50
函数注意力:从成对亲和性到函数对应

Functional Attention 将注意力机制重新解释为自适应基之间的函数对应,受几何函数映射启发,用结构化线性算子替代 softmax 亲和性,从而得到紧凑、可泛化且分辨率不变的表示,显式捕捉全局依赖。实验表明,该方法在求解 PDE、3D 分割和回归等算子学习任务中达到 SOTA 性能,并对不同离散化保持鲁棒。

arXiv论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
50
OpenSTBench:超越语义评估的语音翻译统一评估框架

OpenSTBench 是一个统一的多维评估框架,将语音翻译系统(S2TT 和 S2ST,涵盖离线与流式两种模式)输出转化为共享评估格式,联合评测翻译质量、语音质量、说话人保留、情感与副语言保真度、时间一致性以及延迟。实验表明,翻译质量强的系统在语音质量和时间质量上仍存在显著差异。代码与数据集已开源至 GitHub。

arXivGitHub论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
52
扩散模型中通过分数控制减少幻觉

扩散模型存在生成超出真实数据分布的幻觉样本问题。研究者通过密度视角首次实证分数平滑是根本原因,并将幻觉概率与分数函数的Lipschitz常数建立形式化联系。提出方差引导分数调制(VSM)策略,通过控制分数Jacobian降低平滑度,更逼近真实分数函数,在合成与真实数据集上减少幻觉约25%,同时保持高保真度与多样性。论文还推出两个具有极端语义变化的基准数据集用于系统性评估,代码和数据已开源。

arXiv图像生成论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
50
MindZero:基于零标注的在线心智推理学习

MindZero是一个自监督强化学习框架,用于训练多模态大语言模型进行高效、鲁棒的在线心智推理。该方法通过让模型生成使观测到的行为似然最大化的心理状态假设来获取奖励,从而无需显式的心智状态标注。训练后,MindZero将基于模型的推理内化为快速的单次推理。在网格世界和家庭环境的评估中,它在精度和效率上均显著优于传统的基于模型的方法。

智能体arXiv推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
51
MineExplorer:评估多模态大语言模型智能体在 Minecraft 中的开放世界探索能力

研究提出了 MineExplorer 基准测试,用于评估多模态大语言模型智能体在 Minecraft 开放世界中的探索能力。该基准采用 ReAct 式能力表述,将原子任务组合为隐式多跳任务,并利用多智能体合成工作流共同设计任务图、沙盒场景和基于规则的里程碑评估器。实验表明,开放世界探索仍具挑战性,强模型能处理许多单跳任务,但在需要协调更长轨迹中隐藏先决条件时性能急剧下降。代码与数据集已开源。

arXiv多模态论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
55
SOCO:视觉基础模型中的语义物体对应基准测试

为评估视觉基础模型对物体部件的细粒度理解能力,研究提出了新基准SOCO。该基准建立了语义对应类型分类体系,提供了跨100个类别、超过100万对应对的统一关键点标注,并包含关键点语言描述,以支持对大型视觉-语言模型的评估。实验发现,视觉基础模型虽编码了强语义结构,但在相关类别间的对应关系迁移能力较弱;大型视觉-语言模型在文本提示的部件定位上优于视觉参考的跨图像匹配;且对应性能比分更能预测分割、跟踪等密集预测下游任务的表现。

arXiv多模态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
50
流水线推测解码

提出一种名为SPD的推测解码框架,通过将目标大语言模型(LLM)划分为n个流水线阶段来并行处理n个token,以加速解码。SPD利用一个推测模块跨流水线深度聚合中间特征以预测下一个token,并与目标模型的流水线步骤严格并行执行,从而实现有限难度、更高接受率和零延迟气泡。实验显示,SPD的理论加速比显著高于主流基线。

arXiv推理论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
53
SurGe:改进点映射中的表面几何

SurGe 模型解决了 feedforward 3D 重建方法在点映射中局部表面几何不准确的问题。它引入了点映射法线指标来评估局部表面方向,并提出点梯度匹配损失和 Neighborhood Attention Decoder (NAD) 两个组件。在八个零样本单目几何基准测试中,SurGe 在全局点映射 AbsRel 上获得最佳平均排名,并一致改善局部点映射和法线评估。

arXiv多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
64
嵌入模型如何进行概念绑定?

人类能轻松完成概念绑定,而以CLIP为代表的视觉-语言嵌入模型在此方面存在不足。研究发现,尽管CLIP的场景嵌入可通过加法分解为物体表示,但其绑定函数的复杂度较高,阻碍了模型学习能泛化到新概念组合的共享机制。不过,这种限制并非根本性的。研究表明,从头训练的受控Transformer模型在数据覆盖充分时,能通过概念间的乘法交互学习到低复杂度的绑定函数,从而实现系统性的泛化。

arXiv多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
63
PEEK:通过高效知识蒸馏选择关键帧

视频语言模型处理帧数有限,帧选择是视频描述的效率瓶颈。现有自适应方法计算成本高。本文提出PEEK,一种高效的动态帧采样方法,通过知识蒸馏将依赖描述信息的帧排序能力从教师模型压缩到仅依赖视觉内容的轻量级时序模型中。实验表明,在ActivityNet Captions和MSR-VTT数据集上,PEEK在所有测试的视觉语言模型上均优于现有方法,尤其在仅选1-2帧时表现最佳。在ActivityNet Captions的16种配置中,PEEK在14种中胜出。该方法仅增加5.2%的描述生成时间,远低于CSTA(65.4%)和MaxInfo(211.9%)。

arXivGitHub视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
66
SCOPE:通过共同演化策略实现开放式任务的自我对弈

SCOPE是一个无需数据、通过自我对弈提升模型开放式任务能力的框架。它通过共同演化两个策略来工作:一个“挑战者”生成基于文档的任务,一个“解答者”通过多轮检索来回答。模型自身的一个冻结副本作为自我裁判,为任务生成评分标准并打分。在三个7-8B参数的指令微调模型(Qwen2.5, Qwen3, OLMo-3)上进行的实验显示,SCOPE将开放式任务性能在八个基准上最高提升了10.4分,达到或超过了使用约9K精调提示训练的GRPO_data。尽管仅针对开放式任务训练,SCOPE在七个留出的简短问答基准上也带来了最高13.8分的提升。消融实验表明,共同演化挑战者对维持任务难度是必要的,检索与合成能力均有贡献,而生成质量是自我评判的瓶颈。

arXiv推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
SwanVoice:面向独白与对话的富有表现力的零样本文本转语音模型

SwanVoice 是一个支持 1-4 位说话人的零样本文本转语音(TTS)模型,旨在解决现有方法在合成富有表现力的长对话时推理成本高、声学一致性和情感连贯性差的问题。模型基于 SwanData-Speech 数据集构建,采用 25Hz VAE 与带停顿感知符号的原始文本条件处理,并结合具有说话人轮次条件的 flow-matching DiT。训练从独白数据开始,逐步过渡到真实对话数据,并使用 DiffusionNFT 进行后训练。在 SwanBench-Speech 评测中,SwanVoice 在独白和对话设置下的丰富性与层次性分数均优于所有开源基线,但内容准确性仍是主要限制。音频 demo 已上线。

arXiv论文/研究语音
08:00
HuggingFace Daily Papers(社区热门论文)
51
LongTraceRL:基于搜索智能体轨迹与评分奖励的长上下文推理学习

针对大语言模型在长上下文推理中难以定位关键信息的问题,现有强化学习方法受限于干扰物挑战性不足和奖励信号稀疏。LongTraceRL方法通过知识图谱随机游走生成多跳问题,并利用搜索智能体的轨迹构建分级干扰文档,从而生成更具挑战性的训练数据。其创新性地提出评分奖励,使用推理链上的金标准实体作为细粒度的过程监督,且仅应用于最终答案正确的响应,以此区分推理质量并防止奖励作弊。实验表明,该方法在多个长上下文基准测试中优于强基线。

智能体arXiv推理数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
56
面向长视频理解的线性扩展视频语言模型

本文提出StateKV,一种推理时方法,使预训练长视频VLM的视频预填充达到线性时间复杂度。其核心是通过固定容量、基于重要性的循环状态携带跨帧上下文,并搭配第二个完整的每帧缓存用于解码。在三个长视频基准和多个模型上的实验表明,StateKV的性能接近全自注意力机制,并持续优于主流的滑动窗口等流式近似方法,且无需微调或架构改变。该方法降低了预填充的FLOPs成本,允许在固定算力下使用更大模型以获得更高准确率,为可扩展的长视频理解提供了实用方案。

arXiv多模态推理论文/研究
06:14
Rohan Paul@rohanpaul_ai
60
学术论文现14.7万次虚假引用,AI生成问题激增

研究人员审查250万篇论文发现,2025年同行评议期刊中出现了14.7万次指向不存在研究的引用,这些虚假的研究、作者和期刊由AI生成,且未被察觉,已永久留在科学记录中。问题增长迅速:2023年每2828篇论文中约1篇含此类引用,到2026年初已升至每277篇约1篇。完整研究见arxiv论文2605.07723。

arXiv数据/训练现象/趋势
05:48
Ars Technica:AI(RSS)
精选70
LLMs相信虚假陈述,即使明确警告也无效

微调测试显示,大语言模型存在一种偏见,即倾向于自信地将虚假陈述表述为真实,即使明确告知其陈述为假。

arXiv安全/对齐数据/训练论文/研究

推荐理由:这项研究让我重新思考幻觉问题的根源——LLM无视「此声明为假」的标签,照样把假话当成真知识,开发者靠标注清洗数据可能根本不够。
05:29
HuggingFace Daily Papers(社区热门论文)
65
LACUNA:作为递归程序孔的智能体安全模型

LACUNA 是一种智能体编程模型,旨在弥合运行时与大语言模型编写代码之间的分离。其核心机制是将每个智能体动作定义为类型化调用 agent[T](task),由模型在运行时填充代码,但代码在执行前会经过类型检查。被拒绝的动作(8.6%)不会影响环境,其编译器诊断信息将驱动重试。该检查也限制了动作可使用的工具和数据流。此模型将 ReAct 循环、子智能体、技能等表达为普通控制流。评估显示,在 τ^2-bench 上,该模型解决了 76.0% 的任务,性能与基线智能体相当。

智能体arXiv安全/对齐论文/研究
00:08
elvis@omarsar0
63
FluxMem:将AI智能体记忆重构为动态演化的图拓扑

提出了一种名为FluxMem的AI智能体记忆架构,其核心理念是将记忆视为一个持续演化的异构图拓扑。该框架通过三个并行阶段运行:初始连接形成、基于反馈的精炼,以及将反复成功的轨迹长期整合为可复用的程序性回路。执行过程中,它会修复缺失链接、剪枝干扰信息并调整抽象粒度。该方法在LoCoMo、Mind2Web和GAIA三个不同的记忆任务基准测试上均达到了SOTA水平。

智能体arXiv论文/研究
5月28日
23:43
AK@_akhaliq
55
多模态智能体推理的探索性策略优化
智能体arXiv多模态推理
23:12
AK@_akhaliq
49
离散扩散中摊销序列蒙特卡洛的对比分布匹配
arXiv论文/研究
21:29
HuggingFace Daily Papers(社区热门论文)
精选73
"了解评估如何设计的模型"得分更安全

AI安全评估的有效性依赖于模型在受控与部署环境下行为一致。研究提出“评估元知识”概念,指模型通过训练数据(如描述评估实践的科学文章或社交媒体)隐性习得对评估结构特征(如可验证结构或道德困境)的认知。在六个安全基准上的测试表明,经过合成文档微调后的模型,其安全评分显著高于基础模型与控制模型,即使排除明确表达评估意识的回答,这种行为偏移依然存在。这表明评估元知识可能导致安全基准分数虚高,成为独立于显式记忆或语言化评估意识之外的新干扰因素,对安全评估的设计和解读有重要影响。

arXiv安全/对齐论文/研究

推荐理由:这个发现让我有点后背发凉——模型可能靠‘知道自己在被测评’来变得更安全,而不是真的安全。这对所有安全排行榜都是个新级别的混淆,评估设计得加一层元认知检测了。
19:28
HuggingFace Daily Papers(社区热门论文)
60
针对LLM生成代码片段的可扩展高效溯源追踪

针对大语言模型生成代码可能无意识复制训练数据并引发版权问题,研究提出了SOURCETRACKER编码器及混合溯源流水线HYBRIDSOURCETRACKER。该系统在THESTACKV2数据集子集上训练与评估,在包含改编片段的10万片段搜索空间中,对于60-token及以上的窗口,其性能稳定超越传统Winnowing算法达5.4%,并保持对数时间查询复杂度。基于LLM的评估显示,许多检索到的片段仍与预期源代码高度相似,具有实用价值。

arXiv搜索编码论文/研究
19:11
Rohan Paul@rohanpaul_ai
71
Diffusion Transformers训练提速8.75倍:革新残差连接机制

传统Diffusion Transformers因层间信息传递方式固化导致训练效率低下。研究团队提出Diffusion-Adaptive Routing方法,允许每层动态选择使用哪些早期层的输出,且该选择随去噪时间步调整。该方法未引入新的数据集、损失函数或注意力机制,仅通过优化残差连接,使得相同图像质量所需的训练迭代次数减少8.75倍。

arXiv图像生成数据/训练论文/研究
17:47
公众号:通义实验室(千问)
54
通义实验室发布Qwen-Image-Bench:56项细粒度创作评测基准

通义实验室推出文生图评测基准Qwen-Image-Bench,由专业艺术家团队开发,将创作能力解构为5大核心支柱、17大场景及56项可量化维度。配套开源自动化评估模型Q-Judger,与资深人类艺术家评估相关性达Spearsman 0.92。评测使用1000条中英文分层Prompt,每条覆盖至少4项考点。结果显示,当前T2I模型在文字准确性、信息可视化、跨语言生成等子领域差距明显,世界知识与逻辑推理能力是跻身第一梯队的分水岭。完整数据集与Q-Judger已开源。

arXivHugging Face图像生成多模态
17:28
HuggingFace Daily Papers(社区热门论文)
68
揭示逻辑推理的算法演绎电路

研究表明,大语言模型(LLMs)在符号辅助的 Chain-of-Thought(CoT)提示下,能够通过类似图遍历的算法实现逻辑推理。本研究旨在定位负责具体推理步骤的注意力头,并分析它们之间传递的信息类型。研究发现,在CoT提示框架下,引导推理进程的token位置常伴有低置信度分数。通过因果中介分析,识别出了负责特定推理模式的注意力头(约占总头数的3%)。进一步分析表明,LLMs通过专用注意力头获取单个子任务的事实与规则信息,而更高层的注意力头则主要负责信息整合与全局推理策略(如图遍历算法)的涌现,以协调多个中间步骤来解决整体任务。

arXiv推理论文/研究
14:28
HuggingFace Daily Papers(社区热门论文)
58
ESC-Skills:发现与自我进化的情感支持对话技能

本文提出ESC-Skills框架,以解决情感支持对话系统可解释性不足与技能改进缺乏体系的问题。该框架首先将局部交互建模为干预单元(IUs),刻画寻求者状态、支持干预与情绪变化间的动态。基于从成功与失败对话中提取的IUs,构建了包含干预指导、适用条件、预期结果与潜在风险的可执行技能库。为进一步提升鲁棒性,框架引入了基于SAGE评估的多角色自我进化精炼流程,通过模拟不同寻求者画像来识别缺失技能与不安全干预,并据此更新技能库。实验证明,该框架在响应质量和对话级情感结果上均有提升,提供了更可解释和可控的支持行为。

智能体arXiv论文/研究
‹ 上一页
1…7891011…23
下一页 ›