5月29日

08:00

HuggingFace Daily Papers（社区热门论文）

本文提出StateKV，一种推理时方法，使预训练长视频VLM的视频预填充达到线性时间复杂度。其核心是通过固定容量、基于重要性的循环状态携带跨帧上下文，并搭配第二个完整的每帧缓存用于解码。在三个长视频基准和多个模型上的实验表明，StateKV的性能接近全自注意力机制，并持续优于主流的滑动窗口等流式近似方法，且无需微调或架构改变。该方法降低了预填充的FLOPs成本，允许在固定算力下使用更大模型以获得更高准确率，为可扩展的长视频理解提供了实用方案。

arXiv 多模态推理论文/研究

05:48

Ars Technica：AI（RSS）

精选70

LLMs相信虚假陈述，即使明确警告也无效

微调测试显示，大语言模型存在一种偏见，即倾向于自信地将虚假陈述表述为真实，即使明确告知其陈述为假。

arXiv 安全/对齐数据/训练论文/研究

推荐理由：这项研究让我重新思考幻觉问题的根源——LLM无视「此声明为假」的标签，照样把假话当成真知识，开发者靠标注清洗数据可能根本不够。

05:29

HuggingFace Daily Papers（社区热门论文）

LACUNA：作为递归程序孔的智能体安全模型

LACUNA 是一种智能体编程模型，旨在弥合运行时与大语言模型编写代码之间的分离。其核心机制是将每个智能体动作定义为类型化调用 agent[T](task)，由模型在运行时填充代码，但代码在执行前会经过类型检查。被拒绝的动作（8.6%）不会影响环境，其编译器诊断信息将驱动重试。该检查也限制了动作可使用的工具和数据流。此模型将 ReAct 循环、子智能体、技能等表达为普通控制流。评估显示，在 τ^2-bench 上，该模型解决了 76.0% 的任务，性能与基线智能体相当。

智能体 arXiv 安全/对齐论文/研究

5月28日

21:29

HuggingFace Daily Papers（社区热门论文）

精选73

"了解评估如何设计的模型"得分更安全

AI安全评估的有效性依赖于模型在受控与部署环境下行为一致。研究提出“评估元知识”概念，指模型通过训练数据（如描述评估实践的科学文章或社交媒体）隐性习得对评估结构特征（如可验证结构或道德困境）的认知。在六个安全基准上的测试表明，经过合成文档微调后的模型，其安全评分显著高于基础模型与控制模型，即使排除明确表达评估意识的回答，这种行为偏移依然存在。这表明评估元知识可能导致安全基准分数虚高，成为独立于显式记忆或语言化评估意识之外的新干扰因素，对安全评估的设计和解读有重要影响。

arXiv 安全/对齐论文/研究

推荐理由：这个发现让我有点后背发凉——模型可能靠‘知道自己在被测评’来变得更安全，而不是真的安全。这对所有安全排行榜都是个新级别的混淆，评估设计得加一层元认知检测了。