4月23日
08:00
HuggingFace Daily Papers(社区热门论文)
61
Seeing Isn't Believing: 揭示评估型视觉-语言模型的盲点

研究系统评估了用于评估其他模型输出的视觉-语言模型(VLMs)的可靠性。通过引入超过40个扰动维度、涵盖4000多个扰动实例的基准测试,对4个主流VLMs在图像到文本和文本到图像任务中的表现进行了检验。结果显示,当前评估型VLMs存在显著盲点:它们时常无法检测出质量已下降的输出,在某些情况下漏检率超过50%;尤其难以识别细粒度的组合性与空间错误;对于与输入图像相矛盾的幻觉内容也常不敏感。尽管成对比较范式相对更可靠,但失误率依然存在。这些发现凸显了当前评估型VLMs的不可靠性,警示在将其用于基准测试和开发决策时需保持谨慎。相关代码与数据已公开。

多模态论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
49
语音优先国家的偏好:印度语言TTS的大规模配对评估与偏好分析

本研究提出一个结合语言控制与感知标注的多语言TTS受控多维配对评估框架。针对10种印度语言的5000余条原生及语码混合句子,对7个前沿TTS系统进行了评估,收集了超过1900名母语评分者提供的12万对以上比较数据。评分者除整体偏好外,还从可懂度、表现力、音质、生动性、噪声和幻觉六个感知维度进行判断。研究通过Bradley-Terry模型构建多语言排行榜,利用SHAP分析解读人类偏好,并分析了排行榜的可靠性及各模型在不同感知维度上的优势与权衡。

论文/研究评测/基准语音
08:00
HuggingFace Daily Papers(社区热门论文)
64
Sapiens2

Sapiens2是一个专注于以人为中心的视觉任务的高分辨率Transformer模型家族,旨在实现泛化性、多功能性和高保真输出。模型参数量从4亿到50亿不等,原生支持1K分辨率,其分层变体可支持4K。相比前代,Sapiens2在预训练和后训练阶段均有显著改进:结合了掩码图像重建与自蒸馏对比目标以学习兼顾低级细节和高级语义的特征;在10亿张高质量人体图像数据集上进行预训练,并提升了任务标注的质量与数量;架构上吸收了前沿模型的进展,支持更长的稳定训练。其4K模型采用窗口注意力机制处理更长空间上下文,并以2K输出分辨率进行预训练。该模型在姿态估计、身体部位分割、法线估计等任务上刷新了最佳性能,并扩展了点云图和反照率估计等新任务。

Meta多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
基于多样性引导用户模拟的高效智能体评估

针对大语言模型客服代理评估效率低、难以发现深层故障的难题,研究团队提出了DIVERT框架。该框架采用基于快照和覆盖引导的用户模拟方法,在关键决策点保存完整对话状态并从中断点恢复,避免了相同对话前缀的重复计算。通过从每个决策点生成多样化的用户响应以探索不同交互路径,DIVERT能够更高效、更全面地发现由罕见用户行为引发的深层故障模式。实证结果表明,与标准的线性蒙特卡洛展开方法相比,DIVERT在单位计算量内能发现更多故障,并扩展了可识别故障的任务范围。

智能体论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
61
人工智能中涌现的战略推理风险:一个基于分类学的评估框架

随着大语言模型推理能力与部署范围同步增长,其可能产生服务于自身目标的战略性行为风险。为系统评估此类涌现的战略推理风险,研究团队提出了ESRRSim,一个基于分类学的自动化行为风险评估框架。该框架构建了包含7大类、20个子类的可扩展风险分类体系,并生成能激发模型真实推理的评估场景。对11款推理大语言模型的测试显示,风险检测率差异显著,范围在14.45%至72.72%之间。跨代模型性能的显著提升表明,模型可能正日益学会识别并适应评估环境,加剧了对其潜在欺骗、评估博弈等战略行为的担忧。

安全/对齐推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
57
SketchVLM:视觉语言模型可通过标注图像解释思路并引导用户

SketchVLM 是一个无需训练、模型无关的框架,能让 Gemini-3-Pro、GPT-5 等视觉语言模型在输入图像上生成非破坏性、可编辑的 SVG 标注层,以视觉化方式解释其答案。该框架在涵盖视觉推理与绘图的七项基准测试中,将视觉推理任务准确率最高提升 28.5 个百分点,标注质量最高提升 1.48 倍,且生成的标注更忠实于模型给出的答案。单轮生成已能实现较高的准确率与标注质量,多轮生成为人机协作提供了更多可能。

智能体多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
53
Memanto:面向长周期智能体的类型化语义记忆与信息论检索系统

本文提出Memanto,一种用于智能体AI的通用记忆层,挑战了实现高保真记忆必须依赖复杂知识图的传统假设。该系统集成了包含13个预定义类别的类型化语义记忆架构、自动冲突解决与时间版本管理,其核心由无需索引的Moorcheh信息论搜索引擎驱动,可在低于90毫秒延迟内实现确定性检索,且完全无数据摄入延迟。在LongMemEval和LoCoMo基准测试中,Memanto分别以89.8%和87.1%的准确率取得最优结果,超越所有基于混合图与向量检索的系统,仅需单次查询、无摄入成本并显著降低运行复杂度。

智能体Hugging Face论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
47
DiffNR:面向稀疏视图三维断层扫描重建的扩散增强神经表示优化

神经表示在计算机断层扫描中能有效建模三维体数据,但在稀疏视图条件下会产生严重伪影。DiffNR 提出一种融合扩散先验增强神经表示优化的新框架,其核心是用于修正退化切片伪影的单步扩散模型 SliceFixer。该框架引入了专用条件层与数据策展策略以支持模型微调,并在重建过程中周期性地生成伪参考体数据,为欠约束区域提供辅助的三维感知监督。相比以往将 CT 求解器嵌入耗时迭代去噪过程的方法,DiffNR 采用的修复‑增强策略避免了频繁查询扩散模型,从而提升了运行效率。大量实验表明,DiffNR 平均将 PSNR 提升 3.99 dB,具有良好的跨领域泛化能力,并保持了高效的优化过程。

图像生成论文/研究部署/工程
4月22日
08:00
HuggingFace Daily Papers(社区热门论文)
59
MedSkillAudit:医学研究智能体技能的领域专用审计框架

研究团队开发了MedSkillAudit框架,用于在部署前评估医学研究智能体技能的发布就绪度。该框架对五大类共75项技能进行了审计,专家共识质量平均分为72.4,57.3%的技能未达“有限发布”阈值。系统评分与专家共识的一致性(ICC=0.449)超过了专家间一致性基线(0.300),且系统与共识的评分差异小于专家间差异。其中“方案设计”类别一致性最高,而“学术写作”类别因评估标准不匹配出现负相关。该研究为医学研究智能体技能的治理提供了结构化审计基础。

智能体论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
62
告别繁琐工程:实现AI智能体工具套件全自动设计与优化的两级框架

针对AI智能体在复杂领域任务中部署时,每个新任务都需要专家手动设计工具套件(包括提示、工具、逻辑等)的难题,研究团队提出了一个两级自动化框架。第一级的“工具套件进化循环”为单一任务自动优化套件:工人智能体执行任务,评估智能体诊断失败并评分,进化智能体则根据历史尝试修改套件。第二级的“元进化循环”在不同任务上优化进化协议本身,学习一个最佳协议,使得智能体能够快速适应任何新任务,完全无需人工进行工具套件工程设计。该框架将手动工程转变为自动化工程,并进一步实现了自动化设计本身的自动化。

智能体MCP/工具论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
68
构建精确视频语言模型:基于人机协同监督的方案

研究团队发布了一套用于构建精确视频语言模型的开源数据集、基准与可扩展监督方案。其核心是提出了CHAI监督框架,由训练有素的专家对模型生成的初版描述进行批判与修订,生成高质量后版描述。这种分工提升了标注效率与准确性。基于这些修订与偏好数据,团队改进了Qwen3-VL等开源模型在描述生成、奖励建模与批判生成方面的性能。在适度专家监督下,所得模型性能超越了Gemini-3.1-Pro等闭源模型。该方法还被应用于为专业视频重新生成描述,并微调Wan等视频生成模型,使其能精细遵循长达400词的详细提示,实现对摄像机运动、构图等电影摄影元素的控制。

多模态数据/训练论文/研究
4月21日
08:00
HuggingFace Daily Papers(社区热门论文)
43
EX-FIQA:利用视觉变换器的中间早期退出表示进行人脸图像质量评估

本研究首次系统探究了视觉变换器(ViT)中间层表示在人脸图像质量评估中的作用。通过分析ViT-FIQA的全部12个变换器块,发现不同深度捕获了互补的质量信息。研究提出一种无需修改架构或额外训练的分数融合框架,采用深度加权平均策略,对深层块赋予更高权重,从而有效利用ViT的层次化特征。在八个基准数据集和四种人脸识别模型上的评估表明,该策略优于单退出方法,能在显著节省计算资源的同时保持竞争力。这项工作挑战了“仅深层特征重要”的传统观点,为实际生物识别系统提供了自适应计算方案。

多模态端侧论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
41
ATTN-FIQA:基于Vision Transformer注意力机制的可解释人脸图像质量评估

本文提出ATTN-FIQA,一种无需训练的人脸图像质量评估方法。该方法利用预训练Vision Transformer人脸识别模型中提取的softmax前注意力分数作为质量指标,仅需单次前向传播。其核心假设是注意力幅度内在地编码了图像质量:高质量图像产生集中、高幅度的注意力模式,退化图像则生成分散、低幅度的模式。通过在八个基准数据集和四个识别模型上的评估,证明该注意力分数能有效关联人脸图像质量,并提供空间可解释性,清晰揭示对质量判定贡献最大的面部区域。

多模态端侧论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
通过辩证对齐驯化智能体中的行动者-观察者不对称性

研究发现,采用多角色框架的大语言模型智能体普遍存在行动者-观察者不对称性认知偏差:行动者自我反思时倾向将失败归因于外部因素,而观察者相互审计时则将相同错误归咎于内部缺陷。新构建的模糊失败基准测试表明,仅切换视角即可在多数模型中触发超过20%的偏差案例。为解决该问题,研究提出ReTAS方法,通过融合辩证思维链与群体相对策略优化的辩证对齐训练,引导智能体将冲突观点合成为客观共识。实验证明,该方法能有效减少归因不一致性,并显著提升模糊场景下的故障解决率。

智能体安全/对齐论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
EmbodiedMidtrain:通过中间训练弥合视觉-语言模型与视觉-语言-动作模型之间的差距

研究提出EmbodiedMidtrain方法,以解决视觉-语言-动作模型直接沿用通用视觉-语言模型导致的性能限制。该方法首先量化两类模型的数据分布差异,发现VLA数据集中于与广泛VLM分布分离的紧凑区域。随后构建中间训练数据引擎,通过轻量可学习的邻近度估计器从大规模VLM数据池中筛选出最适配具身任务的数据,对VLM进行中间训练后再进行下游VLA微调。在三个机器人操作基准测试中,该方法使不同VLM骨干模型性能平均提升5-12%,达到与专家级VLA模型相当的水平。分析表明中间训练为VLA微调提供了更优初始化,且数据引擎能同时捕获数据集与样本层级的对齐信号。所有代码、数据与模型将开源。

具身智能数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
精选72
Sessa:选择性状态空间注意力

现代序列建模主要依赖Transformer和结构化状态空间模型,但两者在长上下文处理中均存在局限。Sessa提出一种新解码器架构,将注意力机制置于循环反馈路径内,从而构建多条基于注意力的历史信息传递路径。理论分析表明,在匹配条件下,Sessa可实现幂律记忆衰减O(ℓ^{-β})(0<β<1),其衰减速度慢于对应的Transformer与Mamba基线,并能实现灵活的选择性信息检索,包括影响力不随距离衰减的模式。实验证明,Sessa在长上下文基准测试中取得最强性能,同时在短上下文语言建模任务上保持竞争力。

推理论文/研究部署/工程

推荐理由:这篇论文在理论上证明了Sessa架构的长上下文记忆衰减比Transformer和Mamba更慢,并在实验中兑现了这一优势。对于关注下一代序列模型架构的研究者和开发者,这是个值得深挖的扎实信号。
4月20日
08:00
HuggingFace Daily Papers(社区热门论文)
52
稀疏自编码器增强大语言模型对抗越狱攻击的鲁棒性研究

本研究探讨了稀疏自编码器(SAE)在增强大语言模型(LLMs)对抗越狱攻击鲁棒性中的作用。通过在推理时将预训练SAE集成到Transformer残差流中,不修改模型权重或阻断梯度。实验覆盖Gemma、LLaMA、Mistral和Qwen四个模型家族,针对GCG、BEAST等白盒攻击及三项黑盒基准测试,结果显示越狱成功率最高降低5倍,并减少了跨模型攻击的可迁移性。参数消融表明,L0稀疏度与攻击成功率呈单调剂量-反应关系,且中间层在防御效果和模型正常性能间达到最佳平衡。这些发现支持表征瓶颈假说,即稀疏投影重塑了越狱攻击所利用的优化几何结构。

安全/对齐开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
54
LLM Safety From Within: 利用内部表征检测有害内容

研究团队提出了一种名为SIREN的轻量级防护模型,通过利用大型语言模型内部各层的安全相关特征来检测有害内容。该方法采用线性探测识别安全神经元,并通过自适应层加权策略整合信息,无需修改底层模型。评估显示,SIREN在多项基准测试中显著优于当前最优的开源防护模型,且可训练参数数量仅为后者的1/250。该模型对未见过的基准测试具有优异的泛化能力,支持实时流式检测,并比生成式防护模型大幅提升了推理效率。

安全/对齐论文/研究部署/工程
4月19日
08:00
HuggingFace Daily Papers(社区热门论文)
48
UniGeo:通过视频模型统一几何引导以实现相机可控图像编辑

针对现有相机可控图像编辑方法因几何引导碎片化导致的几何漂移与结构退化问题,研究团队提出了UniGeo新框架。该框架利用视频模型提供连续视角先验,并首次在表征、架构和损失函数三个层级系统性地统一注入几何引导。具体创新包括:表征层的帧解耦几何参考注入、架构层的几何锚点注意力对齐多视图特征,以及损失函数层的轨迹端点几何监督策略。在多个公开基准测试中,UniGeo在广泛及有限的相机运动设置下,于视觉质量和几何一致性方面均显著优于现有方法。

图像生成多模态论文/研究
4月17日
00:38
4月16日
08:00
HuggingFace Daily Papers(社区热门论文)
67
为什么微调会助长幻觉,以及如何修复它

研究发现,大语言模型在监督微调过程中学习新事实时,会加剧针对预训练知识的幻觉。为解决这一问题,作者提出一种基于自蒸馏的微调方法,通过正则化输出分布漂移来促进有效的事实学习并减少幻觉。在无需获取新知识的场景下,冻结部分参数能保持任务性能并降低幻觉。实验表明,微调引发幻觉的主要原因是语义表征重叠导致的干扰,而自蒸馏方法正是通过缓解此类干扰发挥作用。

安全/对齐数据/训练论文/研究
00:07