# BestBlogs早报：Claude Managed Agents / Harness工程化 / 模型吞脚手架

- 来源：ginobefun (@hongming731)
- 发布时间：2026-06-12 08:47
- AIHOT 分数：63
- AIHOT 链接：https://aihot.virxact.com/items/cmqa8waqk0j7eslldpvtgj7nv
- 原文链接：https://x.com/hongming731/status/2065234473843839420

## AI 摘要

Anthropic推出Claude Managed Agents，将推理循环与代码执行沙箱解耦，凭证存入独立Vault，自托管沙箱支持内网，首字延迟中位数降低六成、长尾降低九成。阿里工程师复盘Harness工程化，提出三层加载架构与G1-G8门禁。Google DeepMind的Logan Kilpatrick称模型正“吞掉”脚手架，Gemini 3.5 Flash编程能力完全来自后训练。另，Qwen3-VL-4B在支持SME2的旗舰手机上Prefill提速超80%；Fable AI实现1770%性能提升并发现关键Bug；此外涉及AI取代工程师、多智能体数字人、CFO用GPU替代加薪等讨论。

## 正文

BestBlogs 早报 · 06-12

# Claude Managed Agents / Harness 工程化 / 模型吞脚手架 / Logan Kilpatrick / Gemini 3.5 Flash

【1】 ★ 精讲|智能体交互界面的演进：使用 Claude Managed Agents 进行构建 | Claude
Anthropic 推出 Claude Managed Agents，把智能体的「大脑」（推理循环）和「双手」（代码执行沙箱）彻底解耦，靠可恢复的事件日志连接两端：凭证统一存进独立的 Vault，绝不暴露给生成的代码，自托管沙箱还能让代码留在企业内网，首字延迟中位数降低六成、长尾降低九成以上，Notion、Sentry、Rakuten 等都已在生产环境跑通。
来源：Claude Blog
https://www.bestblogs.dev/article/8e6ddfdf

【2】 ★ 精讲|AI 不缺智商缺纪律：一场 Harness 工程化实践
一位阿里工程师复盘两个月的 AI Harness 演进：从把所有规则堆进 CLAUDE.md 导致「读完规则没脑容量读代码」，到三层加载架构 + dispatcher 状态机 + 文件交接 + G1-G8 门禁，再用 7 维确定性评分给每次改动打分，结论是「用更好的结构约束 AI，而不是用更多的字」。
来源：阿里技术
https://www.bestblogs.dev/article/07b28cbc

【3】 ★ 精讲|Google DeepMind 的 Logan Kilpatrick：为什么模型会吞掉智能体脚手架 【视频】
Google DeepMind 的 Logan Kilpatrick 在 Sequoia 访谈中提出「模型吞掉脚手架」：路由、执行环境这类原本搭在外层的工程能力正被模型本身逐步吸收，Gemini 3.5 Flash 的编程能力提升完全来自后训练；他认为随着基础模型不断「吃掉」周边脚手架，独立创业公司的出路只剩垂直领域的深度专精。
来源：Sequoia Capital
https://www.bestblogs.dev/video/568d29c

【4】 为什么 AI 还没有取代软件工程师，而且也不会
本文通过"决策-执行-交付三明治"模型论证 AI 不会取代软件工程师，解释了人类在决策和问责中的角色为何仍然至关重要。
来源：AI as Normal Technology
https://www.bestblogs.dev/article/28a90882

【5】 云原生 - AI Native 多智能体数字人架构实践
本文介绍了阿里云基于云原生理念打造的 AI Native 多智能体数字人协作平台 AgentTeams，通过声明式 CRD 将组织结构与协作策略模型化，实现多 Agent 像团队一样协同工作，并分享了在研发、值班、开源维护等场景的落地实践。
来源：阿里云开发者
https://www.bestblogs.dev/article/cb8e134b

【6】 端侧 AI 提速 80%？如何让 Qwen3-VL 在手机起飞
本文手把手演示如何利用 Arm SME2 指令集与 MNN 推理引擎，在支持 SME2 的旗舰手机上实现 Qwen3-VL-4B 多模态模型的高效部署，Prefill 阶段提速超 80%。
来源：通义实验室
https://www.bestblogs.dev/article/2e22b643

【7】 人是最慢的节点，还怎么管 AI Agent？|AI 跃迁者调研
本文深度访谈 Multica 创始人张佳圆，揭示了一个 4 人团队如何通过 Agent 协作平台实现组织效率革命，并探讨了人在 AI 时代的新角色与思考边界。
来源：腾讯研究院
https://www.bestblogs.dev/article/7bf0f7d2

【8】 Fable AI 实现 1770% 性能提升并发现关键 Bug：我的个人奇点时刻
Taelin 报告称，Anthropic 的 Fable AI 在代码优化方面以数量级优势超越了他本人、Opus 4.8 以及一群 GPT-5.5 智能体，甚至还发现了他自己代码中的一个微妙 Bug。
来源：Taelin（@VictorTaelin）
https://www.bestblogs.dev/status/2064448425936994742

【9】 CFO 的自白：为什么你的加薪变成了 GPU
一位 CFO 解释称，用 AI 投资取代员工加薪的决定纯粹是会计把戏：花在人身上的每一块钱是费用，而花在 GPU 上的每一块钱则是一项可以规避市场审视的资本资产。
来源：Peter Girnus 🦅（@gothburz）
https://www.bestblogs.dev/status/2064800166272512122

【10】 "无招" 没变，但 AI 改变了公司和人才的权力关系
本文以钉钉 CEO 陈航（无招）因高压管理被阿里合伙人委员会直接换掉为引子，深入分析了 AI 时代大公司与顶尖人才之间权力关系的根本性转变。
来源：晚点 LatePost
https://www.bestblogs.dev/article/959001dd

---
http://BestBlogs.dev · 发现真正适合你的高质量内容
BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。 关注你感兴趣的来源和主题，每天生成一份更适合自己的「我的早报」。
在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-12

### 引用推文

> ginobefun：http://x.com/i/article/2065232915970371585
