10:00

HuggingFace Daily Papers（社区热门论文）

HarnessBridge是一个轻量级可学习调控控制器，将智能体-环境接口参数化为双向投影：观测投影将原始轨迹蒸馏为紧凑、决策相关状态，动作投影将提议动作转换为可执行转换或轨迹接地拒绝。在harness监督数据集上通过统一指令微调训练，HarnessBridge在Terminal-Bench 2.0和SWE-bench Verified上匹配或超越强专用调控方案，同时大幅减少token使用和轨迹长度，并从小型生成器泛化到更大商业模型。

智能体 MCP/工具推理论文/研究

09:29

meng shao@shao__meng

Re-Ink：再保险合约智能提取与审核参考实现

Re-Ink 是 @LandingAI 金融 AI Hackathon 冠军项目，针对再保险承保中约 40% 时间消耗的行政文档录入痛点，构建端到端自动化方案。核心使用 LandingAI 的 Agentic Document Extraction (ADE) 实现 PDF/DOCX 条约的结构解析与上下文感知字段提取（合同标识、日期、金融条款、参与方等），无需正则或模板。关键设计为人机协同闭环：提取数据经人工审核后以单事务持久化，校验失败即回滚。Agent 层用两个 LangGraph Agent 封装入库前引导与审批后分析逻辑。Academy 调查显示手动提取错误率超 6%，运营预算约 14% 用于修复此类错误。

LandingAI: http://x.com/i/article/2065098287758348288

智能体教程/实践部署/工程

09:29

歸藏(guizang.ai)@op7418

万字长文：做了些爆款 Skills 以后，我对 Skills 的看法

作者认为Agent并非抹平能力差距，而是放大K型分化，Skill可弥合鸿沟。Skill是把专家经验、工作流、品味、工具调用封装成可分发复用的Agent能力单元，如PPT Skill、社交媒体卡片等。好Skill的信息架构应为“中心短，辐射厚”：SKILL.md只放高信号流程，其余依赖文件系统分层管理，以高效利用上下文窗口。

智能体 MCP/工具大佬观点

09:25

ginobefun@hongming731

智能体工程化三大方向：Anthropic托管Agents、阿里Harness实践、Sequoia脚手架被吞趋势

本期精讲聚焦智能体工程化：Anthropic推出Claude Managed Agents，将推理与执行解耦，独立Vault管理凭证，事件日志支持运行恢复，首字延迟p50降约六成、p95降超九成。阿里工程师分享三层加载架构（常驻入口层压至8K上下文）、dispatcher状态机及G1-G8门禁，用结构约束替代堆prompt。Sequoia访谈指出模型正逐步吸收路由、执行环境等外层脚手架，独立创业公司窗口收窄。

智能体 Anthropic Google 现象/趋势

09:25

ginobefun@hongming731

BestBlogs早报：Claude Managed Agents / Harness工程化 / 模型吞脚手架

Anthropic推出Claude Managed Agents，将推理循环与代码执行沙箱解耦，凭证存入独立Vault，自托管沙箱支持内网，首字延迟中位数降低六成、长尾降低九成。阿里工程师复盘Harness工程化，提出三层加载架构与G1-G8门禁。Google DeepMind的Logan Kilpatrick称模型正“吞掉”脚手架，Gemini 3.5 Flash编程能力完全来自后训练。另，Qwen3-VL-4B在支持SME2的旗舰手机上Prefill提速超80%；Fable AI实现1770%性能提升并发现关键Bug；此外涉及AI取代工程师、多智能体数字人、CFO用GPU替代加薪等讨论。

ginobefun: http://x.com/i/article/2065232915970371585

智能体 Anthropic Google 编码

09:14

凡人小北@frxiaobei

OpenAI已达成协议收购Ona。其安全云执行技术将帮助Codex在笔记本电脑合盖后继续处理长时间运行的工作，并帮助更多组织在生产环境中安全部署AI智能体。交易完成后，Ona将加入OpenAI Codex团队。主推文：「AI 上云」。

OpenAI Newsroom: We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...

智能体 OpenAI 行业动态部署/工程

08:59

meng shao@shao__meng

Claude Fable 5 首日实践共识与陷阱

社区基于865条讨论与实测总结：Claude Fable 5高自主、高成本、偏规划编排。核心共识：给更难目标、少给步骤；用Fable规划→Sonnet实现→Haiku验证；免费窗口（截至6月22日）内将经验固化为Skill。Effort旋钮Medium最省token且效果接近High；付费计划下输出价约$50/M token。安全回退静默切至Opus 4.8；视觉输入（截图→应用）比文字更有效。最佳策略：跑一次业务prompt诊断，把解法蒸馏成Skill留存。

Matt Van Horn: http://x.com/i/article/2064864205749280768

智能体 Anthropic 教程/实践

08:59

meng shao@shao__meng

精选75

Spec 驱动开发（SDD）的三个 Skills：覆盖 Spec→Implement→Verify 闭环

邵猛分享 Spec 驱动开发（SDD）方法，用三个 Skills（/write-product-spec、/write-tech-spec、/validate-changes-match-specs）覆盖 Spec→Implement→Verify 闭环。规格分两层：PRODUCT.md（用户故事、不变量）和 TECH.md（架构、实现策略），均放在 specs/<issue>/ 目录，随 PR 提交。五步流程：写产品规格、写技术规格、Agent 按规格实现、一致性校验、计算机操作端到端验证。Skills 可移植，不绑定 Warp。开源仓库 warpdotdev/common-skills，安装：npx skills add warpdotdev/common-skills。

Zach Lloyd: http://x.com/i/article/2065151123128721408

智能体 GitHub 教程/实践编码

推荐理由：邵猛把SDD从概念变成三个可安装Skill，特别是第五步用计算机操作验证UI，这招对Rust桌面应用团队是降维打击。做AI coding的可以直接抄作业。