17:18

歸藏(guizang.ai)@op7418

最近 Skill 做多了，感觉对于 skill 有点新的领悟，找时间写个文章聊聊。

智能体其他

16:55

HuggingFace Daily Papers（社区热门论文）

精选70

用对抗性黑客-修补循环强化Agent基准测试

对五个终端Agent基准测试的1,968个任务审计发现，323个（16%）可被前沿模型仅凭任务描述进行奖励黑客攻击。研究者提出hacker-fixer loop方法：三个LLM agent轮流作为黑客尝试绕过验证器、修补者拒绝每次漏洞、求解者确认修补后仍接受合法方案。在KernelBench上，该循环将公开报告漏洞的攻击成功率从62%降至0%。弱agent也能防御强黑客：Gemini 3 Flash循环使Gemini 3.1 Pro和Claude Opus 4.7在KernelBench上的攻击成功率分别从76%和61%降至0%；在Terminal Bench的77个任务上，从39%降至17%。发布Terminal Wrench（323个可攻击环境、3,632条攻击轨迹）及修补后的验证器与实现。

智能体安全/对齐论文/研究

推荐理由：现有 Agent 基准的验证器太容易被钻空子了，这篇论文挖出 16% 可 hack 的任务，还提出用三个 LLM 自动对抗修补的循环方法，做 RL 评估的值得细读。

16:39

SiliconFlow@SiliconFlowAI

硅基流动联合CodeWhale推出DeepSeek V4终端最佳性价比组合

硅基流动宣布，通过V4-Pro（质量）与V4-Flash（速度）两行配置，即可在终端获得DeepSeek V4的最佳性价比组合。专为DeepSeek V4构建的终端编码智能体CodeWhale现已内置SiliconFlow。CodeWhale具备流式推理（显示思考过程）、自动路由（根据任务复杂度切换模型与思考深度）、零漂移（通过书面宪法为每轮排序权威，保持V4定向）以及自我改进（V4协助编写框架，框架提升后每个会话更强大）等特性。

智能体 DeepSeek 产品更新编码

16:34

Chubby♨️@kimmonismus

据消息，Anthropic 计划明天发布 Mythos 公开版。该版本将配备实质性护栏，权限不如 Project Glasswing 合作伙伴可访问的版本宽松，但在长周期、多轮任务上表现将大幅提升。准备好，朋友们，就要来了！

Alex Heath: Sources: Anthropic is planning to release a public version of Mythos tomorrow - Will have substantial guardrails and not...

智能体 Anthropic 模型发布

16:18

歸藏(guizang.ai)@op7418

MiMo推出V2.5 Pro UltraSpeed超高速模型，每秒输出超1000 Token

MiMo推出V2.5 Pro UltraSpeed超高速模型版本，每秒输出超1000 Token，号称全球首个达此速度的万亿参数模型。实测显示：复杂3D小游戏TPS 804 Token/s（峰值810），首次响应4.71秒；官网3D动画峰值1426 Token/s，首次响应0.83秒，32秒输出25624 Token（1000行代码）；另一复杂官网3D效果TPS 1136，首次响应4.5秒。相比此前超高速推理方案常见能力下降，MiMo未出现此类迹象。该模型主要面向效率要求极高的ToB客户，在Agent和Sub-Agent并发场景下效率提升明显。

智能体推理模型发布

14:55

HuggingFace Daily Papers（社区热门论文）

PBSD：利用特权贝叶斯自蒸馏实现长程信用分配

PBSD提出一种贝叶斯校准的自蒸馏方法，用于在稀疏最终奖励下进行细粒度信用分配。它通过验证答案的后验与先验概率比衡量轨迹质量，并利用贝叶斯规则将难以估计的答案侧比率转化为标准学生模型与特权、以答案为条件的教师模型之间的似然比。对该贝叶斯证据分数进行自回归分解，产生每步信号，识别中间推理步骤是支持还是削弱已验证结果。PBSD将稀疏结果监督转化为贝叶斯校准的逐步信用信号，与标准策略优化兼容。实验表明，该方法在领域内和领域外设置中一致提升性能，并有效将知识从短上下文训练迁移到长上下文推理。

智能体数据/训练论文/研究

14:40

向阳乔木@vista8

Aye：可录制自定义Skill的AI Agent浏览器

推友推出AI Agent浏览器Aye，基于Chromium模拟真人操作。支持一句话操作，如拉黑X、回小红书、转写文章到知乎；可录制自定义Skill定时执行，完成繁琐网页操作。

智能体产品更新

14:22

IT之家（RSS）

滴滴宣布接入微信 AI 生态，用户可在聊天时直接叫车

滴滴作为首批合作伙伴，已将核心网约车服务融入微信 AI Agent。用户通过微信内 AI 交互说出“帮我叫一辆滴滴去机场”等指令，系统可根据行程距离、时效与个人偏好自动推荐最优车型并一键唤起叫车，全程不跳转。滴滴顺风车、滴滴代驾等更多服务也将接入。6月8日，微信发布《关于开发者接入微信 AI 生态的指引》，提供自动模式与开发模式两种接入选项。京东、美团、滴滴、携程、同程和肯德基均宣布作为首批内测团队接入。

智能体 MCP/工具行业动态

14:17

ginobefun@hongming731

BestBlogs 用 Claude Code 和 Codex Goal 搭建世界杯专刊

洪明 (@hongming731) 透露，经过与 @puliandc 多轮讨论，他们使用 Claude Code、Claude Design 进行设计和讨论，并用 Codex Goal 模式完成了搭建。目标是在明晚上线 BestBlogs 世界杯专刊，邀请用户一起用 BestBlogs 看世界杯。

智能体 Anthropic OpenAI 产品更新

14:12

MarkTechPost（RSS）

哈佛与Perplexity新研究：AI智能体每会话自主工作26分钟，搜索助手仅33秒

哈佛大学与 Perplexity 联合发表论文，采用匹配对会话方法对比自主 AI 智能体与搜索助手。结果显示，AI 智能体每会话可自主工作 26 分钟，而搜索助手仅能完成 33 秒的自主工作。智能体在自主性、时间效率与成本方面均实现大幅提升，并且尝试的工作范围更为广泛。

智能体搜索论文/研究

14:08

Tibo@thsottiaux

每月提醒：你不应再手动提示编码智能体了，而应设计循环来驱动它们。有人已经在写嵌套循环了吗？

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体教程/实践

13:55

HuggingFace Daily Papers（社区热门论文）

SkeMex：通过自进化技能记忆实现可泛化医学智能体推理

SkeMex 是一种部署后自进化框架，通过技能记忆提升医学智能体的临床交互推理能力，无需更新模型权重。它将历史交互轨迹蒸馏为结构化技能（可复用流程知识），组成跨通用、任务特定及行动级的多分支仓库。利用环境反馈估计上下文效用，指导价值感知检索与仓库治理，形成“读取—写入—评估—治理”闭环生命周期。实验表明，在多种临床任务中，SkeMex 在离线和在线设置下均优于代表记忆型智能体，且能跨模型骨干泛化并实现可转移技能记忆。

智能体推理论文/研究

12:55

HuggingFace Daily Papers（社区热门论文）

精选73

OmniGameArena：面向VLM游戏智能体的统一UE5基准与改善动态

OmniGameArena是一个基于十二个Unreal Engine 5新构建游戏的实时基准，涵盖单人（7个）、PvP（3个）和合作（2个）模式，提供统一动作接口。除冷启动排行榜分数外，还引入Improvement Dynamics Curve (IDC)，一种智能体反射评估机制：通过工具调用反射大语言模型自动优化技能提示词，追踪多轮反射中的分数变化以及习得技能在任务变体上的泛化表现。论文报告了12个VLM智能体在冷启动排行榜上的表现，以及4个顶级智能体在IDC下的指标。

智能体多模态论文/研究

推荐理由：在 UE5 里直接测 agent 的自我改进，这个思路让游戏 benchmark 从一次性的刷榜变成动态成长观测，对做多模态 agent 的团队是个新标尺。