Claude Managed Agents / Harness 工程化 / 模型吞脚手架 / Logan Kilpatrick / Gemini 3.5 Flash

【1】 ★ 精讲|智能体交互界面的演进：使用 Claude Managed Agents 进行构建 | Claude Anthropic 推出 Claude Managed Agents，把智能体的「大脑」（推理循环）和「双手」（代码执行沙箱）彻底解耦，靠可恢复的事件日志连接两端：凭证统一存进独立的 Vault，绝不暴露给生成的代码，自托管沙箱还能让代码留在企业内网，首字延迟中位数降低六成、长尾降低九成以上，Notion、Sentry、Rakuten 等都已在生产环境跑通。来源：Claude Blog https://www.bestblogs.dev/article/8e6ddfdf

【2】 ★ 精讲|AI 不缺智商缺纪律：一场 Harness 工程化实践一位阿里工程师复盘两个月的 AI Harness 演进：从把所有规则堆进 CLAUDE.md 导致「读完规则没脑容量读代码」，到三层加载架构 + dispatcher 状态机 + 文件交接 + G1-G8 门禁，再用 7 维确定性评分给每次改动打分，结论是「用更好的结构约束 AI，而不是用更多的字」。来源：阿里技术 https://www.bestblogs.dev/article/07b28cbc

【3】 ★ 精讲|Google DeepMind 的 Logan Kilpatrick：为什么模型会吞掉智能体脚手架【视频】 Google DeepMind 的 Logan Kilpatrick 在 Sequoia 访谈中提出「模型吞掉脚手架」：路由、执行环境这类原本搭在外层的工程能力正被模型本身逐步吸收，Gemini 3.5 Flash 的编程能力提升完全来自后训练；他认为随着基础模型不断「吃掉」周边脚手架，独立创业公司的出路只剩垂直领域的深度专精。来源：Sequoia Capital https://www.bestblogs.dev/video/568d29c

【4】为什么 AI 还没有取代软件工程师，而且也不会本文通过"决策-执行-交付三明治"模型论证 AI 不会取代软件工程师，解释了人类在决策和问责中的角色为何仍然至关重要。来源：AI as Normal Technology https://www.bestblogs.dev/article/28a90882

【5】云原生 - AI Native 多智能体数字人架构实践本文介绍了阿里云基于云原生理念打造的 AI Native 多智能体数字人协作平台 AgentTeams，通过声明式 CRD 将组织结构与协作策略模型化，实现多 Agent 像团队一样协同工作，并分享了在研发、值班、开源维护等场景的落地实践。来源：阿里云开发者 https://www.bestblogs.dev/article/cb8e134b

【6】端侧 AI 提速 80%？如何让 Qwen3-VL 在手机起飞本文手把手演示如何利用 Arm SME2 指令集与 MNN 推理引擎，在支持 SME2 的旗舰手机上实现 Qwen3-VL-4B 多模态模型的高效部署，Prefill 阶段提速超 80%。来源：通义实验室 https://www.bestblogs.dev/article/2e22b643

【7】人是最慢的节点，还怎么管 AI Agent？|AI 跃迁者调研本文深度访谈 Multica 创始人张佳圆，揭示了一个 4 人团队如何通过 Agent 协作平台实现组织效率革命，并探讨了人在 AI 时代的新角色与思考边界。来源：腾讯研究院 https://www.bestblogs.dev/article/7bf0f7d2

【8】 Fable AI 实现 1770% 性能提升并发现关键 Bug：我的个人奇点时刻 Taelin 报告称，Anthropic 的 Fable AI 在代码优化方面以数量级优势超越了他本人、Opus 4.8 以及一群 GPT-5.5 智能体，甚至还发现了他自己代码中的一个微妙 Bug。来源：Taelin（@VictorTaelin） https://www.bestblogs.dev/status/2064448425936994742

ginobefun@hongming731 · X

63导出 Markdown

2026-06-12 08:47·21天前

在 X 看原推· x.com

AI 摘要

Anthropic推出Claude Managed Agents，将推理循环与代码执行沙箱解耦，凭证存入独立Vault，自托管沙箱支持内网，首字延迟中位数降低六成、长尾降低九成。阿里工程师复盘Harness工程化，提出三层加载架构与G1-G8门禁。Google DeepMind的Logan Kilpatrick称模型正“吞掉”脚手架，Gemini 3.5 Flash编程能力完全来自后训练。另，Qwen3-VL-4B在支持SME2的旗舰手机上Prefill提速超80%；Fable AI实现1770%性能提升并发现关键Bug；此外涉及AI取代工程师、多智能体数字人、CFO用GPU替代加薪等讨论。

BestBlogs 早报 · 06-12