全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「arXiv」清除

6月19日周五

21:22Rohan Paul56新研究：最强LLM也无法完全免疫越狱--Fable 5与Opus 4.8自动化红队攻击分析

19:01HuggingFace Daily Papers（社区热门论文）45Multi-LCB：将LiveCodeBench扩展到多种编程语言

08:00HuggingFace Daily Papers（社区热门论文）47非语言发声中的说话人身份：条件蒸馏与混合专家方法

08:00HuggingFace Daily Papers（社区热门论文）36UnityShots：记忆驱动的多镜头音视频生成系统

08:00HuggingFace Daily Papers（社区热门论文）40数据受限语言模型预训练的训练时数据增强解析

07:47HuggingFace Daily Papers（社区热门论文）51REVES：基于修订与验证的测试时扩展训练框架

02:51Jeff Dean49Google 发布 TPU v2 至 Ironwood 五代训练超算演进论文

02:47Hugging Face：Blog（RSS）75精选MosaicLeaks：你的研究智能体能保守秘密吗？

00:25Deedy66autoarxiv：改URL无需GPU复现论文

6月18日周四

23:45HuggingFace Daily Papers（社区热门论文）55Discriminator-Guided RL：用数据自身奖励修正流匹配模型

21:44HuggingFace Daily Papers（社区热门论文）52Bag of Dims：通过维度级符号模式实现免训练的机制可解释性

11:43HuggingFace Daily Papers（社区热门论文）74精选Sumi：从头训练的7B开源均匀扩散语言模型

11:14Hacker News 热门（buzzing.cc 中文翻译）70精选cuTile Rust：安全无数据竞争的 GPU 内核系统

10:43HuggingFace Daily Papers（社区热门论文）47Turing-RL：利用图灵奖励学习用户模拟器

09:43HuggingFace Daily Papers（社区热门论文）57RNG-Bench：多模态大语言模型在可控非马尔可夫游戏中的评估基准

09:20Rohan Paul67LoopCoder-v2：仅循环一次即可高效利用测试时计算

08:00HuggingFace Daily Papers（社区热门论文）47DO-ALL：基于数据集蒸馏的持续测试时间适应框架

08:00HuggingFace Daily Papers（社区热门论文）51MemGUI-Agent：具有主动上下文管理的端到端长时域移动GUI智能体

08:00HuggingFace Daily Papers（社区热门论文）48Grouped Query Experts：在 GQA 自注意力上的混合专家模型

08:00HuggingFace Daily Papers（社区热门论文）49何时、何地、如何：表格自监督学习的自适应分箱

08:00HuggingFace Daily Papers（社区热门论文）65StylisticBias：少数视觉线索主导MLLM社会偏见

6月17日周三

19:12Rohan Paul55斯坦福发布SEFD：152B token结构化SEC文件数据集

11:35HuggingFace Daily Papers（社区热门论文）40ChLogic：中文逻辑推理鲁棒性评估基准

10:33HuggingFace Daily Papers（社区热门论文）50UniAR：共享语境-视觉分词器是实现统一的关键

10:33HuggingFace Daily Papers（社区热门论文）49近侧发展区策略优化（ZPPO）：教师知识注入提示词而非梯度

10:33HuggingFace Daily Papers（社区热门论文）51LoopCoder-v2：仅循环一次实现高效测试时计算扩展

08:00HuggingFace Daily Papers（社区热门论文）43用马氏余弦相似度比较线性探针

08:00HuggingFace Daily Papers（社区热门论文）47网络规模LLM预训练语料库叙事特征研究--基于Dolma与NarraBERT

08:00HuggingFace Daily Papers（社区热门论文）52GateMem：多主体共享记忆智能体的记忆治理基准

08:00HuggingFace Daily Papers（社区热门论文）42BrainG3N：面向可控3D脑MRI生成的双用途tokenizer

08:00HuggingFace Daily Papers（社区热门论文）49PerceptionDLM：基于多模态扩散语言模型的并行区域感知

08:00HuggingFace Daily Papers（社区热门论文）52Moebius：0.22B参数轻量级图像修复框架，性能媲美10B级模型

03:35Rohan Paul46TokenPilot：面向LLM智能体的缓存高效上下文管理方法

6月16日周二

09:59Berkeley RDI：Blog（AI 安全与评测）83精选伯克利RDI发布Agents' Last Exam基准

08:00HuggingFace Daily Papers（社区热门论文）39超越NL2Code：多模态代码智能结构化综述

08:00HuggingFace Daily Papers（社区热门论文）42MCompassRAG：主题元数据作为段落级检索的语义指南针

08:00HuggingFace Daily Papers（社区热门论文）44信任正确的教师：面向GUI Grounding的质量感知自蒸馏

6月15日周一

23:49IT之家（RSS）69MiniMax M3 模型正式开源：原生多模态、百万上下文

08:00HuggingFace Daily Papers（社区热门论文）51后训练如何塑造生物推理模型

08:00HuggingFace Daily Papers（社区热门论文）51反思掩码（RM）激发掩码扩散模型的推理能力

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月19日

21:22

Rohan Paul@rohanpaul_ai

56

新研究：最强LLM也无法完全免疫越狱--Fable 5与Opus 4.8自动化红队攻击分析

新研究对Anthropic Fable 5和Opus 4.8进行自动化红队攻击，持续改写有害提示词直至模型拒绝或生成坏答案。Fable 5最差攻击成功率6.1%，Opus 4.8为11.5%，证明最强LLM也无法完全免疫越狱——即便微小失败率，规模化自动化攻击仍可产生大量有害内容。旧式编码/角色扮演型越狱已非主要威胁，新弱点在于上下文：自适应攻击者在被拒后不断改写请求，寻找模型视为合法而非危险的框架。白宫与Anthropic正转向基于基准的测试框架，通过评分绕过程度、暴露能力、攻击可重复性及实际后果来量化越狱风险，而非追求不现实的完美免疫。

Rohan Paul: The White House and Anthropic may have found the first serious path to restore Mythos and Fable access without pretendin...

Anthropic arXiv 安全/对齐

19:01

HuggingFace Daily Papers（社区热门论文）

45

Multi-LCB：将LiveCodeBench扩展到多种编程语言

Multi-LCB 是一个新基准，将 LiveCodeBench（LCB）从 Python 扩展到 12 种编程语言，保持原有污染控制和评估协议，并自动跟踪 LCB 的未来更新。对 24 个 LLM 的指令遵循与推理能力评估揭示了 Python 过拟合、语言特定污染以及多语言性能的显著差异，直接暴露了当前 LLM 在多语言代码生成上的关键短板。

arXiv 编码论文/研究评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

47

非语言发声中的说话人身份：条件蒸馏与混合专家方法

针对非语言发声（NVV）中说话人身份一致性评估，现有说话人验证（SV）系统泛化差且微调会导致灾难性遗忘。本文提出融合冻结Data2Vec自监督特征与ECAPA-TDNN的框架，并加入带领域感知路由的混合专家（MoE）模块。通过预训练教师模型在语音输入上施加条件蒸馏损失以保持语音验证精度，同时用对比损失弥合语音与NVV的域间差距。该方法将NVV的等错误率（EER）从38.93%降至22.66%，语音EER从13.17%降至9.24%。

arXiv 论文/研究语音

08:00

HuggingFace Daily Papers（社区热门论文）

36

UnityShots：记忆驱动的多镜头音视频生成系统

UnityShots基于LTX-2.3构建，通过记忆驱动实现多镜头音视频生成。视频流维护两个固定大小的记忆插槽：长期记忆（LTM）锚定开场镜头，短期记忆（STM）保存前一段尾部，由边界条件门控（融合视觉剪辑概率与节拍跟踪器信号）在每次剪辑时更新。音频流在每镜头注入参考说话者token以保持音色。离散剪辑类型先验通过AdaLN学习，推理时可调节过渡强度。团队发布包含200个多文化多镜头序列的基准，覆盖6个种族区域和10+语言，附有每镜头参考身份、参考音频和边界标签。在I2V、T2V和R2V条件下，UnityShots在所有跨镜头一致性指标上领先开源基线，并在多镜头维度匹配最强闭源系统。

arXiv 多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

40

数据受限语言模型预训练的训练时数据增强解析

针对数据受限、算力充裕场景下标准自回归预训练多轮迭代后严重过拟合的问题，研究引入三类正交训练时数据增强：token级噪声（掩码、随机替换）、序列重排（从右至左预测、Fill-in-the-Middle）及目标偏移预测（预测x_{t+i}, i>1）。消融实验表明，单项增强均能延缓过拟合并降低验证损失，其中随机替换效果最优；组合多种增强可进一步降低最小验证损失。该方法有效缓解了自回归预训练在固定语料上重复训练时的数据效率低下问题。代码与数据已开源。

arXiv 数据/训练论文/研究

07:47

HuggingFace Daily Papers（社区热门论文）

51

REVES：基于修订与验证的测试时扩展训练框架

REVES是一种两阶段迭代训练框架，通过将成功恢复轨迹中的中间步骤转化为独立的修订与验证提示，聚焦于答案变换与错误识别，相比标准多轮强化学习降低了长程采样的计算开销。在LiveCodeBench上，使用公开测试用例作为反馈，较RL基线提升+6.5点，较标准多轮训练提升+4.0点。在circle packing任务上，仅用4B参数基础模型即匹配此前报告的SOTA结果。该方法还泛化到n_queens、mini_sudoku等分布外约束满足问题。代码已开源。

arXiv GitHub 推理数据/训练

02:51

Jeff Dean@JeffDean

49

Google 发布 TPU v2 至 Ironwood 五代训练超算演进论文

Jeff Dean 等 Google 同事发布论文，回顾 TPU v2 到 Ironwood 五代训练超算的演进，将于 2026 年 7/8 月发表于 IEEE Micro。关键变化：TPU v2 采用气冷，v3 起改为水冷；互联从 2D 升级为 3D torus；每 pod 芯片数从 256 增至 9216；每 flop 能效提升约 30 倍。此外，Google 内部工作负载已大幅转向基于 Transformer 的模型。

arXiv Google 数据/训练论文/研究

02:47

Hugging Face：Blog（RSS）

精选75

MosaicLeaks：你的研究智能体能保守秘密吗？

深度研究智能体在结合私有本地文档与外部网页检索时存在隐私泄露风险。MosaicLeaks 提出包含 1,001 条多跳研究链的新任务，每条链交错混合本地与公共子问题。测试发现智能体频繁泄露私有信息，单纯优化任务性能反而加剧泄露。基于此，研究提出隐私感知深度研究（PA-DR）强化学习训练方法，将严格链成功率从 48.7% 提升至 58.7%，同时将答案/全面信息泄露率从 34.0% 降至 9.9%。

智能体 arXiv 安全/对齐论文/研究

推荐理由：这篇论文揭示了深度研究agent的多跳查询会像马赛克一样拼凑出私密信息，单纯提示减少泄露几乎没用，而隐私感知训练把泄露率从34%降到9.9%，且不损伤任务表现，做企业级agent产品的团队要重视。

00:25

Deedy@deedydas

66

只改一个URL就能复现和迭代AI论文，甚至无需自备GPU，这相当不错。

alphaXiv: Introducing autoresearch for arXiv papers Change 'arxiv' to 'autoarxiv' in any paper URL An agent deploys to resolve set...

智能体 arXiv 产品更新论文/研究

6月18日

23:45

HuggingFace Daily Papers（社区热门论文）

55

Discriminator-Guided RL：用数据自身奖励修正流匹配模型

针对流匹配模型匹配损失与生成质量的结构不匹配，提出Discriminator-Guided RL（DRL）。在预训练表示空间中训练判别器区分真实数据与基模型样本，将其logit作为KL正则化RL的奖励——该奖励近似数据与模型的对数似然比，直接优化数据分布。在SiT、JiT、REPA、RAE上，DRL一致降低无引导FID（SiT从9.38降至2.62）和语义空间FD（SiT在DINOv3上从88.2降至19.3），且在不依赖人类偏好数据的情况下提升人类偏好奖励。偏好微调中，DRL改善偏好奖励与图像保真度的帕累托前沿，减少过饱和等低层次伪影。

arXiv 图像生成数据/训练论文/研究

21:44

HuggingFace Daily Papers（社区热门论文）

52

Bag of Dims：通过维度级符号模式实现免训练的机制可解释性

本文提出Transformer隐藏状态的标准基已构成免训练的通用特征基础。每个维度以符号（+/-1）编码语义、幅度编码置信度，可作为独立二进制寄存器。在语言（Qwen 3.5-4B、Gemma 3-4B、Mistral 7B、Qwen3-32B）、视觉（DINOv2、ViT-Base）和音频（AST）共7个模型上验证：仅符号模式可保留60-93% top-5 next-token准确率；单token缓存（一次前向传播，无上下文无标签）通过符号一致性检测175个类别，AUC达0.97-0.99，训练探针仅提升0.018 AUC。特征可因果操作：实时前向传播中翻转符号可抑制对应概念。该结构同样适用于自监督视觉（9/12 ImageNet超类）、监督视觉（11/12）和音频（50/50 ESC-50类别），反映Transformer训练的普遍特性。

arXiv 论文/研究

11:43

HuggingFace Daily Papers（社区热门论文）

精选74

Sumi：从头训练的7B开源均匀扩散语言模型

Sumi（日语“墨”）是一个完全开源的7B参数均匀扩散语言模型，从零开始在1.5T模型token上预训练。它在知识、推理和编程评测中与同等token预算的自回归模型表现相当，但在常识推理benchmark上略逊，教育密集型数据混合可能是原因之一。Sumi开放模型权重、检查点及完整训练配方（含公开语料数据混合说明），为社区提供首个大规模均匀扩散模型的基准参考。

arXiv Hugging Face 开源生态数据/训练

推荐理由：Sumi 是第一个完全从零预训练的大规模均匀扩散语言模型，填补了社区在这方向的研究空白，做扩散语言模型的人终于有个可以摸的起点。

11:14

Hacker News 热门（buzzing.cc 中文翻译）

精选70

cuTile Rust：安全无数据竞争的 GPU 内核系统

cuTile Rust 是一个基于 tile 的 GPU 编程系统，允许用 Rust 编写内存安全、无数据竞争的内核。它通过 #[cutile::module] 宏将内核 AST 嵌入主机二进制，在运行时经 CUDA Tile IR JIT 编译为 GPU cubin。可变张量在启动前分割，不可变张量共享，启动器在 GPU 工作期间保持所有权。在 NVIDIA B200 上，逐元素操作达 7 TB/s（约 91% 峰值带宽），GEMM 达 2 PFlop/s（约 92% 密集 f16 峰值）。基于 cuTile Rust 构建的 Grout 推理引擎在 RTX 5090 上解码 Qwen3-4B 达 171 tokens/s，在 B200 上解码 Qwen3-32B 达 82 tokens/s。项目处于早期研究阶段。

arXiv Hugging Face 开源/仓库开源生态

推荐理由：用Rust的所有权模型保证GPU内核无数据竞争，性能还能达到峰值的92%，这个方向可能是安全GPU编程的未来，系统编程和推理引擎开发者值得一试。

10:43

HuggingFace Daily Papers（社区热门论文）

47

Turing-RL：利用图灵奖励学习用户模拟器

提出Turing-RL，一种基于图灵测试的强化学习方法，用于训练用户模拟器。该方法使用LLM评判器提供判别性图灵奖励，根据用户历史评估生成回复是否与真实用户不可区分，用户模拟器LLM在此奖励下学习产生类似真实用户的回复。在对话聊天和Reddit论坛讨论两个领域，Turing-RL在LLM和人类评估指标上均持续优于基线方法。研究表明，优化不可区分性而非匹配单一真实回复是学习用户模拟器的有效策略。

arXiv 数据/训练论文/研究

09:43

HuggingFace Daily Papers（社区热门论文）

57

RNG-Bench：多模态大语言模型在可控非马尔可夫游戏中的评估基准

RNG-Bench是一个评估多模态大语言模型在闭环交互中重建过去观测并据此行动能力的基准套件，包含Matching Pairs和3D Maze两个互补游戏。基准通过网格大小、视觉模式和观测模态三个难度轴控制复杂度，并引入对决赛制消除实例方差及Memory Gap指标分离遗忘与决策错误。最难配置需约128K tokens上下文和每轮350张图像，前沿模型尚未饱和。Memory Gap分析显示主要错误源于遗忘。微调Qwen3.5-9B可提升该基准性能并迁移至现有基准，不损失通用多模态能力。

arXiv 多模态论文/研究评测/基准

09:20

Rohan Paul@rohanpaul_ai

67

LoopCoder-v2：仅循环一次即可高效利用测试时计算

论文《LoopCoder-v2》质疑“测试时计算越多越好”的观点。作者提出Parallel Loop Transformer架构，使循环可并行运行并共享内存。他们训练了7B参数的代码模型（1/2/3/4次循环），在18T tokens上预训练并微调，测试代码编写、推理、软件工程和工具使用任务。主要结果：2次循环效果最好，将SWE-bench Verified从43.0提升至64.4，而3次和4次循环性能下降。内部分析显示，第二次循环进行了有意义的精炼（改变隐藏状态、注意力模式和预测），后续循环则主要添加重复和噪声。结论：增加一次隐藏循环可大幅提升性能，但继续增加并非自动有益。

arXiv 推理编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

47

DO-ALL：基于数据集蒸馏的持续测试时间适应框架

DO-ALL是一个即插即用的持续测试时间适应（CTTA）框架。部署前通过数据集蒸馏生成少量合成蒸馏锚点，概括源数据分布；适应过程中，每个目标样本与最语义对齐的锚点匹配，借助源回放、表示对齐和流形平滑正则化提供稳定参考。该框架可无缝集成现有CTTA算法，在CIFAR100-C、ImageNet-C和CCC基准上持续提升长期鲁棒性，无需保留原始源数据。代码已开源。

arXiv 开源生态数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

51

MemGUI-Agent：具有主动上下文管理的端到端长时域移动GUI智能体

ReAct风格提示词在长时域移动GUI任务中因被动累积历史导致prompt膨胀和信息稀释。MemGUI-Agent引入ConAct机制，将上下文管理视为与UI动作同策略的一等动作，维护折叠动作历史、折叠UI状态和最近步骤记录三个结构化字段，保持上下文紧凑。基于2956条轨迹的MemGUI-3K数据集对8B模型进行监督训练，得到MemGUI-8B-SFT，在MemGUI-Bench上达到最优8B开放数据性能，并泛化到分布外MobileWorld基准。代码、数据和模型将开源。

智能体 arXiv 论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

48

Grouped Query Experts：在 GQA 自注意力上的混合专家模型

Grouped Query Experts（GQE）在分组查询注意力（GQA）的每个组内增加混合专家层，由路由器为每个 token 挑选 k 个 query-head 专家激活，而所有 key-value 头保持密集不变。在 250M 参数规模、30B token 预算下，GQE 在下游准确率上与全激活 GQA 基线持平，同时每 token 仅激活一半 query heads，减少了注意力计算量。

arXiv 推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

49

何时、何地、如何：表格自监督学习的自适应分箱

针对医学表格数据标签获取成本高的问题，研究者提出训练自适应离散化预任务Adaptive Binning。该方法将离散化与学习过程耦合，通过特征级粗到细课程逐步细化分箱，并在检测到训练平台期时选择表征感知的分割点，同时优化值空间和表征空间一致性。异质性感知目标统一分类重建与有序监督。在公共医学表格数据集上，线性探测和微调均取得一致提升，无需数据集特定分箱调参。还引入标准化医学表格SSL基准。代码已开源。

arXiv 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

65

StylisticBias：少数视觉线索主导MLLM社会偏见

StylisticBias 是一个用于评估多模态大语言模型（MLLM）属性级社会偏见的可控基准。研究团队生成500张逼真基础人脸，每张创建约50个单属性变体，共约25K图像，通过固定身份、逐次改变单一视觉属性来测量特定线索如何影响模型判断。在6个MLLM、25个二元社会判断场景中，年龄和体型主导身份层面效应，时尚风格等视觉线索引发最大属性层面偏移；约15个属性解释了近80%的总变异。模型在与社会经济和外貌语义对齐的判断中敏感性最强。StylisticBias基准及代码、数据集已开源。

arXiv Hugging Face 安全/对齐论文/研究

6月17日

19:12

Rohan Paul@rohanpaul_ai

55

斯坦福发布SEFD：152B token结构化SEC文件数据集

斯坦福研究者发布SEFD数据集与处理方法，将SEC EDGAR申报文件转化为适合LLM训练的结构化数据，保留表格结构、缩进、合并表头、符号、跨度及层级关系。公开快照包含152B token，完整档案约550B token。该数据与Common Crawl语料重叠度低于0.1%。采用布局保真的MultiMarkdown格式，大幅压缩原有演示框架，保留财务含义的同时减少token浪费。

arXiv 开源生态数据/训练论文/研究

11:35

HuggingFace Daily Papers（社区热门论文）

40

ChLogic：中文逻辑推理鲁棒性评估基准

大语言模型在逻辑推理基准上表现良好，但中文环境下的鲁棒性未知。研究团队提出中英文对齐基准ChLogic，包含通用对齐集（60条命题）、困难对齐集（40道难题）及纯中文集（15类语言现象），每个对齐项含一条英文参考和五种中文实现。在Qwen3、Ministral和GLM上的实验显示中英文性能持续存在差距。将中文回译成英文可提升通用集表现，但在困难集上效果混杂，Qwen3-32B和GLM-5.1翻译后性能反而下降。这表明中文实现、翻译伪影和模型特定行为共同影响多语言逻辑推理。

arXiv 推理评测/基准

10:33

HuggingFace Daily Papers（社区热门论文）

50

UniAR：共享语境-视觉分词器是实现统一的关键

UniAR 提出统一多模态自回归框架，用单个离散视觉分词器作为理解与生成的共享桥梁，使模型直接解释自身生成的视觉 token。该框架融合预训练视觉编码器、多级特征融合与无查找按位量化，保留高层语义与低层细节。并行按位预测联合输出空间分组的多级视觉编码，缩短视觉序列长度并加速生成；扩散解码器从离散 token 重建高保真图像。经预训练、监督微调与强化学习，UniAR 在图像生成和编辑上达最优，在多模态理解基准上也有竞争力。

arXiv Hugging Face 图像生成多模态

10:33

HuggingFace Daily Papers（社区热门论文）

49

近侧发展区策略优化（ZPPO）：教师知识注入提示词而非梯度

ZPPO将教师模型的知识注入提示词而非策略梯度，避免小模型因全部探索失败而丢弃样本。对困难问题构造二元候选问题（BCQ）让学生区分正确与错误回答，及负候选问题（NCQ）聚合错误模式；提示回放缓冲区循环困难问题直至达标或淘汰。在Qwen3.5系列0.8B至9B学生搭配27B教师，经视觉语言模型后训练并在31项基准测试中评估，ZPPO全面优于离策略/在策略蒸馏和GRPO，最小规模提升最大。

arXiv 推理数据/训练论文/研究

10:33

HuggingFace Daily Papers（社区热门论文）

51

LoopCoder-v2：仅循环一次实现高效测试时计算扩展

LoopCoder-v2 是一族 7B 参数的并行循环 Transformer（PLT）代码模型，从零在 18T tokens 上预训练。与无循环基线相比，两循环变体在代码生成、推理、智能体软件工程和工具使用基准上广泛提升，SWE-bench Verified 从 43.0 到 64.4，Multi-SWE 从 14.0 到 31.0。三循环及以上变体性能下降，揭示循环计数的非单调效应：循环 2 提供主要改进，后续循环产生递减振荡更新，而 CLP 引入的位置偏移代价固定，导致两循环饱和。

arXiv 推理编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

43

用马氏余弦相似度比较线性探针

线性探针常通过余弦相似度比较，马氏余弦相似度（MCS）利用测试数据协方差重新加权内积，是一种任务感知改进。Ying等人（2026）发现探针的MCS与分布外（OOD）参考探针MCS近乎完美线性预测OOD AUROC（R²=0.98）。本文将这一发现扩展到不同模型、层和概念域，并证明在投影为高斯分布的平衡类中，OOD AUROC与参考探针MCS呈线性关系，两者均为探针在测试数据上信噪比的sigmoid函数。理论还预测并实验验证了线性失效的条件。MCS为比较线性探针提供了兼具理论和实证效果的替代方案。

arXiv 论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

47

网络规模LLM预训练语料库叙事特征研究--基于Dolma与NarraBERT

首个针对网络规模LLM预训练语料库叙事特征的细粒度研究。以3万亿token的开放语料库Dolma为对象，基于叙事理论设计涵盖主体、场景、事件3个核心要素的11个可解释维度框架。通过采样并标注400段文本，微调并验证了基于RoBERTa的NarraBERT模型。将NarraBERT应用于300万段落，生成新数据集NarraDolma。研究发现：叙事结构可在海量异构数据中测量，网络文本呈现连续多维度叙事结构，且叙事质量在预训练数据源和主题间分布不均。NarraDolma和NarraBERT已公开。

arXiv 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

52

GateMem：多主体共享记忆智能体的记忆治理基准

GateMem 是一个针对多主体共享记忆智能体的基准，联合评估长期多步请求的效用、上下文访问控制与主动遗忘。测试覆盖医疗、办公、教育和家庭四个领域，包含长篇幅多方对话、增量记忆注入、隐藏检查点与结构化判分。对多种基线和骨干模型的实验表明，没有方法能同时实现强效用、鲁棒访问控制和可靠遗忘。长上下文提示词治理分数最高但 token 成本极高；检索与外部记忆方法成本较低，却仍会泄露未经授权或已删除的信息。当前记忆智能体远未达到在共享机构中可靠部署的要求。

智能体 arXiv 安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

42

BrainG3N：面向可控3D脑MRI生成的双用途tokenizer

提出一种基于3D体素掩码自编码器（MAE）的tokenizer，用于3D脑MRI潜在扩散模型。编码器与解码器解耦：冻结的3D MAE编码器产生临床信息丰富的嵌入，专用CNN解码器从嵌入的线性投影重建体素。编码器在35,309个体积（来自18个公共队列，覆盖四种模态、十种疾病类别和200+采集站点）上预训练。在23任务线性探测基准上，编码器在21个任务上超越或匹配BrainIAC、BrainSegFounder、MedicalNet等SOTA模型。基于这些嵌入训练的扩散Transformer（DiT）支持跨六个变量的条件生成和患者特定纵向预测。

arXiv 图像生成论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

49

PerceptionDLM：基于多模态扩散语言模型的并行区域感知

针对现有多模态大语言模型自回归生成导致多区域感知效率低下的问题，提出PerceptionDLM多模态扩散语言模型。该架构利用扩散语言模型的并行解码特性，通过高效提示和结构化注意力掩码，在序列和token两个层次上同时感知多个掩码区域，显著提升推理效率。为系统评估扩散语言模型的并行性，构建了ParaDLC-Bench基准。实验表明，PerceptionDLM在保持区域描述竞争力的同时，大幅提升了多区域感知任务的速度。这是首次利用扩散语言模型实现并行区域标注和感知。

arXiv 多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

52

Moebius：0.22B参数轻量级图像修复框架，性能媲美10B级模型

Moebius是一个仅0.22B参数的轻量级图像修复框架。它通过引入Local-λ Mix Interaction（LλMI）块重构扩散主干，其中Local-λ和Interactive-λ模块将空间上下文与全局语义先验压缩为固定大小的线性矩阵，在削减参数的同时保留复杂潜在交互。配合仅在隐空间执行的自适应多粒度蒸馏策略，Moebius在自然图像和人像基准上达到了与11.9B参数模型FLUX.1-Fill-Dev相当甚至更优的生成质量，总推理速度提升超过15倍。

arXiv 图像生成论文/研究

03:35

Rohan Paul@rohanpaul_ai

46

TokenPilot：面向LLM智能体的缓存高效上下文管理方法

TokenPilot 提出一种针对 LLM 智能体的缓存高效上下文管理方法，通过摄入感知压缩和生命周期感知驱逐两大机制，在 PinchBench 和 Claw-Eval 基准上实现 61–87% 的成本降低，同时保持有竞争力的分数。传统方法通常直接截断或摘要历史，容易导致文本偏移、破坏 prompt 缓存。TokenPilot 在工具结果进入上下文前进行清理，保持早期提示布局稳定；同时延迟删除旧任务历史，因为已完成的工作仍可能为引用相同文件或目标的后续任务提供帮助。

智能体 arXiv 论文/研究部署/工程

6月16日

09:59

Berkeley RDI：Blog（AI 安全与评测）

精选83

伯克利RDI发布Agents' Last Exam基准

2026年6月，伯克利RDI发布Agents’ Last Exam（ALE）基准，包含1,500余项源于真实工作的任务，覆盖55个非体力职业。对Fable 5、GPT-5.5、Composer 2.5等前沿智能体的测评显示：在最困难层级成功率均为0%；整体任务表现接近，但单任务成本差异巨大（Fable 5约$15.70，GPT-5.5约$3.80，Composer 2.5约$1.33）。CLI子集ALE-CLI最佳通过率仅25.2%。主要失败模式是智能体未验证输出即宣称完成。数据集、代码及CLI子集已开源。

智能体 arXiv Hugging Face 开源生态

推荐理由：在Fable 5发布后，Berkeley的ALE基准首次大规模量化了agent在专业任务上的真实水平，最难任务0%成功率的结果值得所有押注agent落地的团队冷静下来。

08:00

HuggingFace Daily Papers（社区热门论文）

39

超越NL2Code：多模态代码智能结构化综述

本文系统综述了多模态代码智能，即在视觉输入输出下生成、编辑、优化或推理代码的系统。首先按代码角色将任务分为：渲染制品、可编辑符号结构、科学表示、中间推理轨迹、可执行策略/工具接口。随后将基准与方法归为四类：图形用户界面、科学可视化、结构化图形、前沿任务与框架。最后提出四个以验证为中心的未来方向：多信号验证、多状态验证、跨任务迁移测试、可验证的智能体轨迹，以期从单输出模仿转向证据驱动的可执行系统。

arXiv 多模态编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

42

MCompassRAG：主题元数据作为段落级检索的语义指南针

MCompassRAG是一个元数据引导的检索框架，利用主题级信号作为语义指南针，通过LLM教师蒸馏训练轻量检索器，在不额外调用LLM的情况下实现主题感知检索。在6个复杂检索基准上，MCompassRAG的信息效率（IE）平均提升8.24%，延迟比最强高效RAG基线低5倍以上。代码已开源。

arXiv 检索增强论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

44

信任正确的教师：面向GUI Grounding的质量感知自蒸馏

GUI grounding要求视觉语言模型在高分辨率截图中识别小目标并预测精确坐标。OPSD（在策略自蒸馏）虽能提供密集token级教师信号，但朴素OPSD中学生生成前缀偏离目标时坐标token信号质量下降。本文提出质量感知自蒸馏，通过软正确性感知门控和教师概率缩放改善信号质量：门控检查教师当前坐标预测能否在给定前缀下完成到真实框，否则降权；教师概率缩放用置信度校准监督强度。两个组件单独无效，组合持续有效。在六个GUI grounding基准上一致提升基础模型并超越强基线。

arXiv 多模态数据/训练论文/研究

6月15日

23:49

IT之家（RSS）

69

MiniMax M3 模型正式开源：原生多模态、百万上下文

MiniMax 于 6 月 12 日开源 MiniMax M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型，总参数 428B，激活参数 23B，为首个从 Step 0 开始多模态混合训练的开源模型。在 Artificial Analysis 综合智能指数上获全球开源最高排名。输出速度从约 30 TPS 提升至约 80 TPS，后续还将提速 30-40%。M3 在编码与智能体评测中达行业顶尖水平，具备自主任务拆解、工具调用与多步推理能力，上下文支持百万级别。

arXiv Hugging Face 多模态开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

51

后训练如何塑造生物推理模型

研究分析后训练各阶段对生物推理模型泛化能力的影响。在基因组学、转录组学、蛋白质组学上训练并评估超过100个模型，控制backbone、继续预训练（CPT）、监督微调（SFT）和强化学习（RL）的变化，测量域内（ID）与域外（OOD）性能。结果发现：CPT通过对齐生物语言提升下游性能；SFT持续提高ID但导致OOD先升后降；RL作用于强SFT检查点时可改善OOD并部分恢复泛化。生物推理不随监督或计算量单调提升，最佳ID-OOD权衡来自短SFT、大RL分配和跨阶段非对称适应能力。

arXiv 推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

51

反思掩码（RM）激发掩码扩散模型的推理能力

自回归模型推理依赖链式思维和反思，但局部修改仍需完全顺序生成。掩码扩散模型(MDMs)的掩码机制天然支持选择性局部编辑，但现有MDMs不支持多轮掩码与去噪。本文提出反思掩码(RM)，通过轻量后训练激发MDMs的多轮掩码能力，迭代修改先前输出。RM还引入免参数的历史参考机制，利用中间去噪状态提升修订效果。无需架构改动，在文本生成、数独、图像编辑等任务上一致优于标准掩码基线。

arXiv 多模态推理数据/训练

1 234 5…22