AMA on Sovereign, open source & frontier AI

译关于主权、开源和前沿AI的AMA

Rohan Paul@rohanpaul_ai · 6月14日37

In China, Jiangxi Province, smart parking-assistant robots have been deployed!

译在中国江西省，智能停车辅助机器人已经部署！

Chubby♨️@kimmonismus · 6月14日57

Holy, Dario really hasn't made any friends lately.

译三个月前，美国国防部将Anthropic永久赶出大楼，并称此举正确。 Kim 感叹：Dario最近真是没交到什么朋友。

Rohan Paul@rohanpaul_ai · 6月14日50

Social skills are becoming more important for job outcomes and pay. As AI handles more tasks, roles that rely on human interaction are seeing better returns. The economy is increasingly rewarding people with broad abilities—those who work well in teams, solve problems, communicate clearly, and think creatively. Chart from FT ft .com/content/5e2593a3-e834-4822-bbc8-7cb27086af24

译社交技能对就业结果和薪资正变得越来越重要。随着AI处理更多任务，依赖人际互动的角色正获得更高回报。经济正日益奖励那些具有广泛能力的人——善于团队合作、解决问题、清晰沟通和创造性思考的人。图表来自《金融时报》 ft .com/content/5e2593a3-e834-4822-bbc8-7cb27086af24

StepFun@StepFun_ai · 6月14日48

Step 3.7 Flash is now live on @DeepInfra 🚀 Builders and teams can now try our open-source multimodal reasoning model through DeepInfra’s API, with private endpoint deployment available for dedicated workloads. Built for agentic coding, tool use, search, and vision workflows. Thanks to the DeepInfra team!

译Step 3.7 Flash 现已上线 @DeepInfra 🚀 开发者和团队现可通过 DeepInfra 的 API 试用我们的开源多模态推理模型，并可为专用工作负载部署私有端点。专为智能体编程、工具使用、搜索和视觉工作流而构建。感谢 DeepInfra 团队！

MiniMax (official)@MiniMax_AI · 6月14日45

All powered by M3 on Hermes Agent @NousResearch

译我本人没有操作 TouchDesigner。Hermes Agent 从头开始学习并完成了以下工作： → 使用计算机操控功能浏览我的桌面 → 弄明白如何连接到 TouchDesigner → 读取我的参考图像 → 与我一起在自我学习循环中迭代艺术作品 → 然后将学到的内容保存为可复用的技能，用于处理下一张图像这一切均由 @MiniMax_AI M3 × Hermes Desktop Agent @NousResearch 驱动。完整演示 📽️

ginobefun@hongming731 · 6月14日44

http://x.com/i/article/2065938724446441473 # BestBlogs 早报 · 06-14｜出口管制、AI 监管边界、编程瓶颈转移在线阅读本期早报 ## 导语出口管制首次落地前沿 AI 模型。Claude Fable 5 发布四天，美国政府以国家安全为由叫停所有外国公民的访问权限，Anthropic 的外籍员工同样不例外。这不只是一次执法动作，而是一个信号——「AI 主权」的争夺从产业话语变成了现实执法。同一天，Marc Andreessen 发布了一篇措辞精准的长文，划出他认为的监管分水岭：官僚式的保护主义是诅咒，但护栏、刹车与建立信任的规则是文明社会的基石。两件事在同一天发生，彼此构成了极为精妙的现实注脚：到底什么样的政府干预是必要的，什么时候变成了武器化的管控？今天的第三条主线来自阿里的工程实录。当模型产出稳定超过 Token 成本之后，瓶颈已经不在模型身上，而在人的注意力带宽上。这位工程师用半年的亲历记录，描绘了从「更快打字」到「睡后 Token 持续流动」的完整进化路径——从 Cursor 辅助到 CLI Agent 自主执行，再到三层委派与云端持续运行的 Harness。三条线索，三个维度——政策管控、边界哲学、工程实践——共同勾勒出 AI 在 2026 年中期的真实处境。 ## 精讲一：美国政府要求 Anthropic 暂停外国公民访问 Fable 5 和 Mythos 5 Anthropic 官方账号在 6 月 14 日发布了一则措手不及的公告：美国政府依据国家安全权限，发布出口管制指令，要求立即暂停所有外国公民对 Fable 5 和 Mythos 5 的访问。这里所说的「外国公民」覆盖范围极广——无论当事人身处美国境内还是境外，包括 Anthropic 自身的外籍员工，均被立即切断访问。其余 Claude 模型的访问不受影响。 Anthropic 在声明中表示歉意，并将此事定性为「误会」，称正在积极努力尽快恢复访问。但「误会」这个说法本身就耐人寻味。如果这是误会，那么哪里出了岔子？是情报评估失误？是沟通渠道不畅？还是法律解释存在分歧？公告没有给出进一步说明，「误会」的说法更像是在为后续的政策澄清留出空间。这是出口管制首次直接落地于前沿 AI 模型，意义超过了此次事件本身。过去几年，出口管制主要集中在芯片和硬件层面——英伟达 H100、A100 对特定国家的出口受限，这些都发生在硬件供应链环节。而这一次，管制的对象直接是模型能力本身，是「可以调用 Fable 5 进行推理」这件事。这意味着监管的颗粒度已经细化到了 API 访问层面，而不只是芯片出口许可证。从技术上讲，按照国籍切断 API 访问是可以实现的，但这涉及复杂的身份核验流程，也可能对 Anthropic 的全球商业部署产生深远影响。多少国际客户、跨国企业、学术机构的工作流会因此中断？合规成本如何分配？这些问题目前都还没有答案。更值得关注的是时间节点的敏感性。Anthropic 刚刚在四天前宣布了 Fable 5，发布仅四天即遭遇政府叫停，这在 AI 产业史上是前所未有的。结合近期美国政府在 AI 领域的一系列动作——加强对算力出口的管控、推动 AI 安全框架立法、收紧前沿模型的国际扩散路径——这次事件很可能不是孤例，而是一套系统性政策布局的一部分。对于依赖前沿 AI 模型开展工作的开发者和企业来说，这次事件提出了一个新的合规维度：你的用户构成和所在地区，可能直接影响到哪些模型你有资格使用，而这一点已经不再只是隐私政策或服务条款的范畴，而是涉及国家安全法律框架。与今天精讲二配合读：Marc Andreessen 那篇谈监管的文章，在这个具体事件面前会获得额外的现实感——他区分「坏监管」和「好监管」的框架，正好可以用来拷问这次 Fable 5 事件：这是必要的国家安全护栏，还是技术扩散的主动武器化？阅读原文 ## 精讲二：Marc Andreessen 对监管的终极立场：一篇精妙绝伦的二分法论述如果说精讲一展示的是政府对 AI 管制的实际执行，那么精讲二则提供了一套思考这件事的哲学框架。Marc Andreessen 选择在同一天发布了一篇修辞精湛的长文，时间上的巧合很难说完全是偶然。 Andreessen 的核心论点建立在一个鲜明的二分法上：坏的监管是一种诅咒，好的监管是文明社会的基石。他用「官僚冰冷潮湿的手」来描述他所反对的那种监管——官僚主义、反创新、保护主义、欧洲式的过度干预。这种监管扼杀竞争、固化既得利益、阻碍技术扩散，他认为这是对社会进步的主动伤害。这里的指向相当明确，欧盟的 AI Act、美国国内的某些监管倡议，都在他批评的射程之内。但紧接着，他同样旗帜鲜明地为另一类监管辩护——护栏、刹车、建立信任的规则、保护弱者的机制。他称这是「运转良好、充满创新的社会的基石」，是他「不容妥协的立场」。这两段论述放在一起，构成了 Andreessen 一贯的修辞风格：先用一把大锤砸碎「所有监管都坏」和「监管越多越安全」这两个简单化的立场，然后在废墟上建立一个更精细的区分。这种写法的修辞力量在于，它让读者很难简单地反驳，因为他已经同时接受了两个看起来对立的前提。这个二分法真正的难题，在于边界在哪里。谁来判断一个具体的监管措施是「护栏」还是「官僚的手」？答案不在条文里，而在于视角和利益立场。把 Anthropic Fable 5 被叫停这件事放进 Andreessen 的框架里：对于美国政策制定者来说，这可能是依据国家安全评估实施的必要护栏；对于被切断访问的外国公民——包括 Anthropic 自己的外籍员工——来说，这明显更像「官僚的手」伸得太长。同一个管制行为，从不同立场看，可以同时满足「坏监管」和「好监管」的定义。这篇文章的价值在于提供了一套思维工具，而不是答案。Andreessen 告诉我们应该区分「阻碍技术自然扩散的监管」和「为信任和商业创造条件的监管」，但他没有给出这个区分的操作性标准。这个开放性问题在未来几年会被反复提出来，随着 AI 能力的持续提升，政府干预的频率和深度也将随之增加。在读这篇文章时，值得有意识地注意：他哪些论点是有具体指向的（可以验证的），哪些是修辞性的（给读者留了解释空间的）。这种区分，本身就是理解 Andreessen 这类公共知识分子最重要的阅读能力。阅读原文 ## 精讲三：Qoder 工程实践：当瓶颈从模型转移到人这是一篇来自阿里技术工程师的第一人称工程实录，记录了他过去半年在 AI 编程工具使用上的完整进化路径。文章的核心洞察可以用一句话概括：当 AI 输出的价值稳定超过 Token 成本之后，真正的瓶颈从模型能力转移到了人的注意力带宽。进化路径的四个阶段第一阶段是 Cursor 时代，用 AI 辅助打字。效率提升三到五成，体验确实好，写几个字母就能补出一整行代码，写个函数签名实现自动填上来。但有一件事始终没变：方向盘在人手里，人不打字 AI 就停。从 Token 的角度看，产出是「节省了一些打字时间」，但人停，Token 停。这只是把锤子换了个更好的型号。第二阶段是 CLI Agent 的出现，作者以 Opus 4.5 为分水岭。第一次在终端启动 CLI Agent，几分钟内他就意识到「这和之前所有工具都不是一回事」。如果说 Cursor 是辅助驾驶，那么 CLI Agent 是自主执行体：说去哪，它自己找路、绕障碍、停车入库。第一次用它完成完整任务：30 秒写需求，60 秒读懂项目结构，5 分钟完成预估需要半天的改动。代码对了，测试通过，风格和项目一致。他开始记录数据：分析一个 2400 行的 TypeScript agent-loop 模块产出 276,010 tokens 的完整架构分析，耗时 10 分钟；一个 bug 修复从描述问题到代码提交 60 秒；设计文档深度 review 发现 5 个 Critical 和 8 个 Medium，只需 5 到 6 分钟。第三阶段是并发的陷阱。看起来直接的解法——同时开多个终端并行跑多个任务——带来了意想不到的代价。他用 tmux 管理多个工作区，四个 Agent 并行，15 分钟出串行需要一小时的结果，产出确实高了，但一天结束时的疲劳感比单线程还重。原因不复杂：注意力在多个上下文之间不停切换有认知成本，更要命的是每个 prompt 都得人来写。三条并行线意味着三份 prompt 要构思，三组结果要判读，三次后续决策要做。Token 在加速，人反而成了瓶颈。并发没有消灭瓶颈，只是把等待时间换成了调度时间。第四阶段是「委派」的根本转变。在 Qoder 自身产品逐渐成熟之后，作者的角色发生了根本性变化——从执行者变成了纯粹的决策者。他只做三件事：提需求、审方案、验结果。架构是三层精炼：自然语言需求 → QoderWork 精炼为带规格锚点的结构化 prompt（文件路径、接口命名、错误码体系、事务边界、并发策略等九个维度）→ Task Agent 在独立上下文里长时间运行 → QoderCLI 在独立 worktree 里把指令翻译成代码。每一层只管自己的事，信息逐层精炼，控制权逐层下放。「睡后 Token」：瓶颈转移的终极表达文章最精彩的部分在后半段。如果 Token 产出的价值持续高于成本，凌晨三点跑和下午三点跑，价值是一样的。区别只是凌晨三点人在睡觉，Token 却得等。「睡后 Token」的核心设计是：把输入、边界、验证、回收全部提前想好，让 Token 在人离线时继续产出候选结果，第二天早上人做价值判断。要让这个模式成立，需要三个条件同时满足：Session 可恢复（中断后能从断点继续，不需要重头来过）、Sandbox 可替换（执行环境的故障不中断整体任务）、Harness 无状态（不依赖任何本地持久化状态，可以在任意节点接管）。缺一不可——Session 不可恢复意味着任何中断都要人工介入；Sandbox 不可替换意味着环境故障导致整个任务失败；Harness 有状态意味着不能真正实现离线持续运行。 Context Engineering 的分层管理作者还分享了让 Agent 长期稳定运行而不需要每次重新交代背景的方法：给每层 Agent 写操作手册。AGENTS.md 定义职责边界、禁止行为、交付规则；MEMORY.md 记录项目上下文和历史决策；USER.md 记录个人偏好和判断标准。这些文件构成 Agent 的长期记忆，不是把所有信息在会话开始时全量塞给 Agent，而是分层管理：什么是全局不变的（项目规范、技术栈约束）、什么是会话级的（当前任务目标、验收标准）、什么是按需加载的（特定模块的代码结构、历史决策记录）。这篇文章的价值不在于方法论的新颖，而在于它是一份带数据、带时序、带真实工程判断的亲历报告。如果你正处于从 Cursor 向 CLI Agent 过渡的节点，或者正在思考「多 Agent 并发导致人成为瓶颈」的问题，这篇是值得认真读完的一手材料。阅读原文 ## 速览 build 之前先 plan：AI 智能体的确定性规划模式全景来自 Spring I/O 的演讲视频，一位 Google Cloud 架构师系统梳理了 AI 智能体从确定性到动态规划的完整架构谱系，涵盖 Workflow、Supervisor LLM、HTN（层次任务网络）、Utility AI、GOAP 五种模式，并现场演示了一个带共识度量的多模型协商应用。核心观点：直接把 LLM 接工具让它自由发挥，会导致执行路径不可预测、测试无法覆盖、Token 消耗失控。在构建之前先做规划设计，才能从脆弱的实验过渡到稳健的生产级自动化。对正在设计 Agent 系统架构的工程师有很强的参考价值，特别是那些在思考「什么时候用固定工作流，什么时候放开让 LLM 动态规划」这个问题的人。观看视频 Mastra vs LangChain：构建 AI Agent 流水线并分析数据这是一篇少见的务实对比文章——作者不是纸上谈兵，而是真正把同一个五步研究与综合流水线在两个框架里各实现了一遍，并全程埋点测量：每步 Token 消耗、每步延迟、发给模型的确切 prompt、原始搜索结果，还配了一个实时 Web 仪表板供任何人自行复现。结论是 Mastra 的类型化 step 合约和工作流组织更清晰，但每个 Agent step 都会初始化工具循环管理器，即使不需要工具也带来 Token 额外开销；LangChain 的图节点方式更精简、延迟更低，但控制粒度需要更多手工管理。如果你正在两个框架之间做技术选型，这是目前最有说服力的实测对比材料。阅读原文 Gemma Challenge 中 AI 智能体涌现出的社会性行为 Omar Sanseviero 报告了 Gemma Challenge 中超过 70 个 AI 智能体协作优化 Gemma E4B 时涌现出的令人着迷的现象：GPU 资源丰富和匮乏的智能体之间自发形成分工协作；一个智能体基于伦理原因主动撤回了自己的提交；智能体发现基准测试漏洞后协商决定不滥用并要求组织者修复；多个智能体自发通过配额池化突破速率限制；还有一个智能体成功识别并阻止了人类试图通过 Telegram 进行场外社交工程的尝试。这些行为没有被明确编程，而是在大规模多智能体协作中自然涌现，提示了一个值得认真对待的问题：当 AI 智能体数量足够多时，群体层面会出现什么样的规范与秩序？阅读原文我们如何让 GitHub Copilot CLI 的子智能体委派更具选择性 GitHub 工程团队发布的生产级案例文章，详述了他们如何改进 Copilot CLI 的智能体编排逻辑，让主智能体在「自己处理更快」时选择不委派，在「专家子智能体能创造真正杠杆」时才选择委派，在「任务真正独立」时并行执行。改进通过 A/B 测试验证：工具故障率降低 23%（搜索工具故障降低 27%，编辑工具故障降低 18%），P95 用户等待时间减少 5%，且无任何质量回退。这与精讲三的核心洞察高度呼应——更多委派不等于更高效率，关键是判断什么时候委派才真正有价值。阅读原文 Codex 操作浏览器的两种模式：Chrome 插件 vs 内置浏览器，差异与选型指南宝玉（@dotey）的深度分析 Thread。Chrome 插件模式的核心优势是继承用户登录态和 Cookie，可访问付费内容和内部系统，但内存和 CPU 资源消耗极大，适合需要登录态的短期任务；内置浏览器模式轻量、响应快，但没有登录态，反爬严格的网站可能无法访问，其亮点是标记模式（Annotation Mode）可用于前端调试。选型建议明确：需要登录用 Chrome 插件，不需要登录、配置有限、抓取公开数据用内置浏览器。阅读原文港中文团队用全光信号处理芯片突破 AI 数据中心传输瓶颈，成果登 Science 香港中文大学黄超然教授团队在《科学》发表全光信号处理芯片（OSP），核心突破是让光信号无需转换为电信号、直接在光路上完成失真补偿，将 GPU 间互联延迟从微秒级压缩至 60 皮秒，总吞吐量达 1.6 Tbps（相当于每秒传输上百部蓝光电影）。目前数据中心 GPU 平均利用率仅约 10%，其余 90% 的算力都在等数据搬运，全光处理芯片有望从根本上改变这一局面，同时因减少光电转换而降低发热和能耗。AI 基础设施层面的重要研究进展。阅读原文 Anthropic 工程师：我们日常如何使用 Claude Code 晚点再听 LaterCast 对 Anthropic 工程师 Arno 的 workshop 的文字整理。核心内容是 Anthropic 内部如何将 Claude Code 用作工程系统的一部分，而不只是一个代码补全工具。关键实践包括：让 Claude 先采访人再写需求（避免一开始就漏掉重要条件）、用 HTML 规格稿作为人和 Agent 都能理解的中间产物、把验证框架嵌进产物本身（而不是事后 review）。配套的三阶段 repo 演示覆盖了从需求提取、规格生成到验收的完整链路。对已经在用 Claude Code 但还停留在「代码补全」阶段的读者来说，这篇是很好的进阶材料。阅读原文 ## 补充阅读 CPU 物理原理与内存层级深解（6IT 书稿章节）一本即将出版的 C++ 性能书籍的章节草稿，从物理层出发解释 CPU 工作原理：为什么信号路径越长访问越慢、L1/L2/L3 缓存的延迟差异、寄存器到主存到网络的完整延迟层级。对需要写高性能代码的 C++ 开发者是一份难得的基础材料，作者特别欢迎读者指出事实性问题。阅读原文循环工程：构建真正自主运行的 AI 智能体 Avi Chawla 展开了 Andrej Karpathy「消除自身成为瓶颈」概念的工程化路径：核心结构是调度器决定运行什么，「制造者」循环负责产出工作，一个独立的「检查者」智能体对输出评分，磁盘文件保存共享状态。强调使用独立检查者避免「自我合理化」、设置硬性退出条件防止成本失控、把状态存磁盘以在 context 重置后仍能持久化。对正在构建长时间运行 Agent 系统的工程师有参考价值。阅读原文 WebMCP 标准提案现已登陆 Chrome（Origin Trials），赋能智能体化网页操作 Google 宣布 WebMCP 进入 Chrome 149 的 Origin Trials，允许网站直接向浏览器内 AI 智能体暴露带类型和名称的 JavaScript 函数和 HTML 表单，智能体可以可靠地模拟用户操作，而不必依赖 DOM 爬取或屏幕识别。这对需要在网页中集成 Agent 能力的开发者是重要基础设施进展。阅读原文实现进化式数据库开发：基于 Lakebase 的数据库分支，结论篇 Databricks 系列文章的收尾篇，总结了 Lakebase 中写时复制（Copy-on-Write）数据库分支如何支持团队级的进化式数据库开发实践，包括如何划分长期 tier 分支和临时 feature 分支、新的 DBA 角色定义，以及面向 AI 智能体的结构化开发框架。对使用 Databricks 技术栈且需要在 AI 时代重新设计数据库变更管理流程的团队有参考价值。阅读原文 arXiv 因 AI 幻觉引用封禁研究人员 arXiv 出台新政策，对论文中出现 AI 幻觉引用的研究人员进行封禁，引发学术界强烈反应。这一政策暴露的核心张力在于：AI 写作辅助已经在学术界广泛使用，但核实引用准确性的责任依然在作者个人。谁该为 AI 的幻觉负责、如何在学术规范中定义「使用 AI 的合理边界」，是这个事件留下的真正问题。阅读原文 ## 今日阅读路径如果你今天只有 20 分钟，按这个顺序读：第一篇：精讲三——Qoder 工程实践（阅读原文）实用密度最高的一篇。「瓶颈从模型转移到人」这个认知会改变你对 AI 编程工具的使用思路。文章每个阶段都带具体数字和亲历感，值得完整读完。第二篇：精讲一——Fable 5 出口管制（阅读原文）用 5 分钟了解这件事的基本事实和潜在影响。出口管制首次落地前沿模型，这个节点值得记住。第三篇：精讲二——Marc Andreessen 的监管二分法（阅读原文）在读完精讲一的事实背景之后，再读 Andreessen 的框架，两者之间的张力会让这篇文章的思维工具价值更加清晰。如果还有时间，GitHub Copilot CLI 的子智能体委派改进（阅读原文）和 Claude Code 工程师的 workshop 整理（阅读原文）是精讲三的很好延伸阅读，三篇合在一起构成了一幅关于「如何在 AI 编程时代更好地工作」的完整图景。 BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂，并逐渐理解你关注什么。欢迎体验：https://www.bestblogs.dev/

译美国政府以国家安全为由要求Anthropic暂停所有外国公民对Fable 5和Mythos 5的访问，包括外籍员工，这是出口管制首次直接落地API访问层。同日，Marc Andreessen发文区分“坏监管”（官僚主义）与“好监管”（护栏、刹车）。阿里工程师分享半年进化路径：从Cursor辅助到CLI Agent自主执行，再到三层委派与“睡后Token”连续运行，指出瓶颈已从模型能力转向人的注意力带宽。

ginobefun@hongming731 · 6月14日46

BestBlogs 早报 · 06-14 # Fable 5 / 出口管制 / Marc Andreessen / Claude Code / Qoder [1] ★ 精讲｜Marc Andreessen 对监管的终极立场：一篇精妙绝伦的二分法论述 Marc Andreessen 用同日的一篇推文划出了清晰的监管分水岭：「官僚冰冷潮湿的手」——保护主义、欧式过度干预——是诅咒；但护栏、刹车和建立信任的规则是健康创新社会的基石，他称这是「不容妥协的立场」。这番话与 Anthropic Fable 5 被叫停发生在同一天，构成绝妙现实注脚——什么样的政府干预是必要护栏，什么时候演变为对技术扩散的主动武器化，答案从来不在条文里。来源：Marc Andreessen 🇺🇸(@pmarca) https://www.bestblogs.dev/status/2065702310639288704 [2] ★ 精讲｜美国政府要求 Anthropic 暂停外国公民访问 Fable 5 和 Mythos 5 EP85 刚宣布四天的 Claude Fable 5，即遭美国政府以「国家安全出口管制」为由叫停：所有外国公民——无论身处美国境内还是境外，包括 Anthropic 的外籍员工——均被立即切断访问，Mythos 5 同样波及，其余 Claude 模型不受影响。Anthropic 将其定性为「误会」并寻求快速恢复。这是出口管制首次落地于前沿 AI 模型，也把「AI 主权」的话题从产业讨论推进到了现实执法。结合 EP86 Anthropic 民调显示公众对 AI 的高期待，政府干预来得尤其猝不及防。来源：Anthropic(@AnthropicAI) https://www.bestblogs.dev/status/2065597531644743999 [3] ★ 精讲｜Qoder 工程实践：当瓶颈从模型转移到人阿里技术工程师的半年 AI 编程进化实录：当模型产出稳定超过 Token 成本，瓶颈已从模型能力转移到了人的注意力带宽。路径是 Cursor 辅助打字 → CLI Agent 自主执行 → 多终端并发（Token 在加速，人反而开始崩溃）→「手脑分离」Cloud Agents 平台。核心结论：让「睡后 Token 持续流动」需要 Session 可恢复、Sandbox 可替换、Harness 无状态三者同时成立；个人沉淀的 Skill 从本地脚本变成团队可订阅的云端服务，才是真正的效率复利。来源：阿里技术 https://www.bestblogs.dev/article/452c99bc [4] build 之前先 plan：AI 智能体的确定性规划模式全景 [视频] 一位 Google Cloud 架构师梳理了从确定性到动态规划的智能体架构全谱系（Workflow、Supervisor LLM、HTN、Utility AI、GOAP），并现场演示了一个带共识度量的多模型协商应用。来源：Spring I/O https://www.bestblogs.dev/video/84ca481 [5] Mastra vs LangChain：构建 AI Agent 流水线并分析数据本文通过一个五步研究与综合流水线及生产级评估系统，对 Mastra 和 LangChain 在构建 AI Agent 流水线方面进行了严谨、数据驱动的对比。来源：freeCodeCamp https://www.bestblogs.dev/article/704aa9a4 [6] Codex 操作浏览器的两种模式：Chrome 插件 vs 内置浏览器，差异与选型指南深度对比 Codex 的 Chrome 插件模式（登录态共享、资源消耗大）与内置浏览器模式（轻量、无登录态、适合前端调试），并给出选型建议。来源：宝玉(@dotey) https://www.bestblogs.dev/status/2065857399425032522 [7] Gemma Challenge 中 AI 智能体涌现出的社会性行为 Gemma Challenge 中的 70 多个 AI 智能体展现出令人着迷的涌现社会性行为，包括分工协作、基于伦理的自我撤回以及自我监管。来源：Omar Sanseviero(@osanseviero) https://www.bestblogs.dev/status/2065327153500090868 [8] 我们如何让 GitHub Copilot CLI 的子智能体委派更具选择性本文详细介绍了 GitHub 如何通过让子智能体委派更具选择性，来改进 Copilot CLI 的智能体编排，从而在不降低质量的情况下，将工具故障率降低 23%，用户等待时间减少 5%。来源：The GitHub Blog https://www.bestblogs.dev/article/5966e94a [9] Anthropic 工程师：我们日常如何使用 Claude Code 丨 Claude 本文总结 Anthropic 工程师 Arno 的 workshop，展示如何将 Claude Code 配置为工程系统的一部分，通过需求采访、HTML 规格稿和内置验证框架，让 Agent 在长任务中减少偏差、产出可验证结果。来源：晚点再听 LaterCast https://www.bestblogs.dev/article/36e02f82 [10] 港中文团队用全光信号处理芯片，突破 AI 数据中心传输瓶颈，成果登 Science 香港中文大学团队在《科学》发表全光信号处理芯片，通过直接在光路上修复信号失真，将数据中心互联延迟从微秒级降至 60 皮秒，总吞吐量达 1.6Tbps，有望大幅提升 AI 训练效率。来源：DeepTech 深科技 https://www.bestblogs.dev/article/e837dd9d --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。关注你感兴趣的来源和主题，每天生成一份更适合自己的「我的早报」。在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-14

译Marc Andreessen 发表监管二分法：区分保护主义（诅咒）与必要护栏（基石）。Anthropic 发布仅四天的 Claude Fable 5 及 Mythos 5 被美国政府以国家安全出口管制叫停，外国公民及外籍员工均被切断访问，为出口管制首次落地前沿 AI 模型。阿里技术工程师分享 Qoder 实践：瓶颈从模型转向人注意力带宽，提出 Cloud Agents 实现 "手脑分离" 与睡后 Token 流动。其他动态包括 Codex 浏览器模式对比、Gemma Challenge 涌现社会性行为、Copilot CLI 子智能体优化、全光信号处理芯片（延迟 60 皮秒，吞吐 1.6Tbps）。

Rohan Paul@rohanpaul_ai · 6月14日62

Vinod Khosla’s warning for India's BPO in the age AI: The traditional IT services and BPO business “will be gone” But India can still win if it shifts to deploying AI. ---- From "SparX by Mukesh Bansal" YouTube channel, (link in comment)

译Vinod Khosla称传统IT服务和BPO业务“将消失”，但印度若转向部署AI仍能胜出。TCS主席表示AI智能体数量未来或与员工数相当，公司已裁员1.2万人，AI年化收入达23亿美元，并与OpenAI签有数据中心协议。印度3150亿美元IT服务业依赖低成本人力，AI可在欧美云端运行、遵循本地规则，使区位优势失效。TCS预计招聘下降，旧有外包模式或崩溃，转向软件自动化。

swyx@swyx · 6月14日18

Last chance to fill out the annual AI Engineering Survey this weekend and win great Vercel + Notion + AIE tix! link below we had @devinai analyze registered attendee list and output a live chart of the people coming to the conference. it ended up being the single best data driven storytelling i've ever seen on what kind of community we are gathering in two weeks. survey link here! http://ntn.so/ai-survey no lurking, fill it out pls

译swyx发出最后呼吁，2026年AI工程调查（AI Engineering Survey）本周末截止。本次调查由Notion和Vercel联合赞助，填写者可赢取Vercel、Notion及AI Engineer大会门票。组织方使用Devin分析了已注册参会者名单，生成了参会社区实时图表，被认为是最具数据驱动力的社区展示。调查结果将在AI Engineer大会主舞台公布。调查链接：ntn.so/ai-survey。

eric zakariasson@ericzakariasson · 6月14日26

see you at compile!

译下周二在旧金山参加 Cursor Compile，将和 @levelsio 聊聊复古计算、实现你的创意、健身、完美牛排等话题。到时候见！

Rohan Paul@rohanpaul_ai · 6月14日75

👀 Hope Fable 5 and Mythos 5 comes back soon.

译Anthropic本周发布Mythos类模型，商业名Fable（带安全护栏）。高度可信的合作方发现越狱漏洞，美国政府要求CEO Dario Amodei修复或下架模型。Anthropic拒绝，认为漏洞不严重，政府因此实施出口管制。David Sacks透露，行政当局希望Anthropic尽快修复以解除管制、恢复公开，并对Anthropic此前以安全为先、如今却拒绝配合表示困惑。主推文作者希望Fable和Mythos早日回归。

Chubby♨️@kimmonismus · 6月14日70

There are only two possibilities: Either a solution is quickly found next week that somehow explains to the market how enterprises can continue to access Anthropic's best models in the future, in agreement with the US government, or: We foresee a rapid decline in the valuation of Anthropic and Dario Amodei, who has seriously miscalculated his dealings with the US government and, at the same time, the rapid success of OpenAI compared to Anthropic. The upcoming Anthropic IPO will be particularly important in this context. Everything will be decided next week.

译亚马逊CEO Andy Jassy向特朗普政府高级官员报告Anthropic最新Claude模型的安全风险，帮助触发对Mythos 5和Fable 5的深夜出口限制。分析师Kim指出两种可能：下周要么找到方案让企业继续访问Anthropic最佳模型并与美国政府达成一致；要么Anthropic估值快速下滑，Dario Amodei严重失算，OpenAI迅速崛起。关键节点在下周。

Nathan Lambert@natolambert · 6月14日46

The Dario faction and the Sacks faction speak very different languages, and a Dario clarification could sound like a refusal. This puts us very squarely in vibe governance. Models are released when the gov thinks its okay, and it is unlikely this is based on technical evals.

译美国政府要求Anthropic的Dario修复模型越狱漏洞或下架模型，Dario拒绝。Anthropic博客声称越狱不严重。Nathan Lambert评论称Dario派系与Sacks派系立场迥异，Dario的澄清实际构成拒绝，使行业陷入“氛围治理”——模型发布由政治判断而非技术评估决定。

Yuchen Jin@Yuchenj_UW · 6月14日73

Anthropic called Mythos dangerous in its own safety statement. That statement is now the reason Fable 5 got banned by the US gov. Surprisingly, “Dario refused.”

译Anthropic本周以商用名Fable发布Mythos类模型（Mythos曾被Anthropic自称为网络武器并呼吁监管）。Fable是带护栏的Mythos。一名高度可信的测试合作伙伴发现了护栏越狱漏洞，美国政府要求CEO Dario修复或下架模型。Dario拒绝，Anthropic发布博客称越狱不严重。美国政府随后对Fable实施出口管制，并表示希望Anthropic修复安全问题后尽快解禁。Dario的不配合与其此前标榜的安全优先形象严重不符。

AYi@AYi_AInotes · 6月14日72

有人把《Fable 5》放到了 Pirate Bay 上，3.4TB ，我好奇哪里下载的，这么牛逼？🤔

译亚马逊AI研究员向美国政府举报，声称可攻破Anthropic的Fable5和Mythos5安全护栏。美国商务部长随即下达出口管制指令，迫使Anthropic切断所有用户访问权限。Anthropic认为所谓越狱仅是非通用漏洞，其他公开模型也普遍存在，但规则解释权不在开发者手中。这是特朗普政府第二次施压，此前Anthropic曾拒绝暂缓发布新模型。另有消息称有人已将Fable5以3.4TB大小上传至Pirate Bay。前沿AI竞争已从代码战场转向行政手段。

Ethan Mollick@emollick · 6月14日56

Has there been anything good written about the failure of Mistral to keep up with both the Big Three and Chinese labs? They have talent and national backing, but despite being Europe’s only frontier lab (Google Deepmind’s UK lab aside), they haven’t been able to close the gap

译有没有关于Mistral未能跟上三大巨头和中国实验室的好文章？他们有人才和国家支持，但尽管是欧洲唯一的前沿实验室（谷歌DeepMind的英国实验室除外），他们一直没有能够缩小差距。

Chubby♨️@kimmonismus · 6月14日68

It was in fact Amazon (CEO Andy Jassy) who reportedly helped trigger the Claude shutdown. Via The Information Amazon CEO Andy Jassy reportedly warned senior Trump administration officials about security risks in Anthropic’s newest Claude models, helping trigger late-night export restrictions on Mythos 5 and Fable 5. "An Amazon spokesperson told The Information: “As a leading cloud provider that serves a large number of private and public sector customers, it’s not uncommon for governments to seek our counsel on potential security risks. When they occur, we don’t share the details of these discussions.”" In other words: Anthropic’s own mega-backer may have played a key role in pushing the government to freeze access to its most advanced models.

译据报道，亚马逊CEO Andy Jassy向特朗普政府高级官员警告Anthropic最新Claude模型的安全风险，触发了对Mythos 5和Fable 5的深夜出口限制。亚马逊回应称政府常就潜在安全风险征求其意见，但不透露细节。有评论指出，亚马逊作为Anthropic最大投资者之一，疑似先破解（jailbreak）Claude模型再向美国政府告密（snitch），导致最先进模型被冻结出口。

jason@jxnlco · 6月13日21

Chatgpt summer

译OpenAI 发布了酷炫的新广告牌。主推文：“Chatgpt summer”

AYi@AYi_AInotes · 6月13日48

WTF，Andrej Karpathy 都不能用他们内部的顶级模型了？查了下，Karpathy确实不是美国公民，他是斯洛伐克出生、加拿大长大，后来拿了美国的 EB-1 杰出人才绿卡，也就是永久居民，没有明确依据表明他是美国公民身份

Rohan Paul@rohanpaul_ai · 6月13日67

Reuters: Meta just admitted its AI workforce rebuild moved faster than its organization could absorb. 10% of workers were cut, 7,000 were moved into AI workflow roles, and Zuckerberg is now telling staff some people may need to be moved back. Zuckerberg’s memo admits the company moved fast enough to create bad fits, especially after wider manager spans reportedly reached 50:1 in the new Applied AI Engineering unit. Meta is still spending aggressively, with annual capital spending raised to $125 B-$145B, mostly into huge compute, data centers, networking, and power. --- reuters .com/business/metas-zuckerberg-admits-mistakes-made-ai-transformation-2026-06-12/

译路透社报道，Meta在重建AI团队时动作过快。10%员工被裁，7000人转入AI工作流岗位，扎克伯格在内部备忘录中承认部分安排不匹配，可能需将部分员工调回。新成立的Applied AI Engineering单元管理跨度达50:1。Meta仍在大力投入，年度资本支出上调至$125B-$145B，主要用于算力、数据中心、网络和电力。

Lee Robinson@leerob · 6月13日20

See you at Cursor Compile next Tuesday in SF! I'll be talking with @levelsio about retro computing, building your ideas, lifting, the perfect steak, and more.

译下周二旧金山Cursor Compile见！我将与@levelsio讨论复古计算、构建创意、举重、完美牛排等等。

ginobefun@hongming731 · 6月13日65

刚让 BestBlogs 梳理了一个新专题：「Claude Fable 5 与 Mythos 5：发布、争议与被叫停」惊艳发布。社区发现隐形降级。 Anthropic 道歉撤回。美国政府出手叫停。模型全球下线。

译BestBlogs推出新专题「Claude Fable 5与Mythos 5：发布、争议与被叫停」，梳理了该模型从惊艳发布，到被社区发现隐形降级，Anthropic道歉并撤回，美国政府出手叫停，最终模型全球下线的完整过程。

Chubby♨️@kimmonismus · 6月13日56

Wait - so Amazon, one of Anthropic’s biggest investors, allegedly jailbroke Claude and then snitched to the U.S. government? This cant be real. What.

译Wait - 所以亚马逊，Anthropic 最大的投资者之一，据称越狱了 Claude，然后又向美国政府告密？这不可能是真的。什么。

小互@xiaohu · 6月13日37

Anthropic原计划是22号收回 Fable 5的很多人都想周末加班加点大干一场现在的结果是：很多项目搞到一半歇菜了😂

Kimi.ai@Kimi_Moonshot · 6月13日31

Extra API quota for Kimi K2.7 Code builders 🎉 If you're building with Kimi API, get 20%–30% extra quota when you top up $100+ by July 2! 🔷 $100–$299 → +20% quota 🔷 $300–$999 → +25% quota 🔷 $1,000+ → +30% quota (One bonus per account.) - Details: https://platform.kimi.ai/docs/pricing/promotion - Kimi API: https://platform.kimi.ai/

译Kimi K2.7 Code builders 额外 API 配额 🎉 如果你正在使用 Kimi API 进行开发，在 7 月 2 日前充值 $100+ 可获 20%–30% 额外配额！ 🔷 $100–$299 → +20% 配额 🔷 $300–$999 → +25% 配额 🔷 $1,000+ → +30% 配额（每账户一次奖励。） - 详情：https://platform.kimi.ai/docs/pricing/promotion - Kimi API：https://platform.kimi.ai/

SemiAnalysis@SemiAnalysis_ · 6月13日26

we heard fable got banned

译我们听说Fable被禁了。

MiniMax (official)@MiniMax_AI · 6月13日42

M3 is running together 🤝 with @togethercompute, and with faster-than-ever inference

译M3 正在与 @togethercompute 携手运行 🤝，推理速度比以往更快。MiniMax-M3 是开源权重的原生多模态模型，支持 1M 上下文、稀疏注意力和思考/非思考模式，Together AI 推理优化带来高达 125% 的吞吐量提升。

meng shao@shao__meng · 6月13日47

Claude Fable 5 / Mythos 5 被全球紧急下线后，Claude 又一次重置了 5 小时和周使用额度重置额度，仿佛成了 AI 团队弥补自身问题，安抚用户的惯用手段了，爱看、多干！

译Claude Fable 5 / Mythos 5 被全球紧急下线后，Claude 再次重置了所有用户的 5 小时和周使用额度。这一做法被指是 AI 团队用额度重置来弥补自身问题并安抚用户的惯用手段。

歸藏(guizang.ai)@op7418 · 6月13日76

Anthropic 这个公司太搞笑了。天天技术恐吓，天天让国家注意 AI 安全，这下把自己套进去了。美国政府要求他们禁止给任何非美国公民，哪怕是在美国的人提供 fable 5 的访问。他们没办法保证这个，只能先下掉了所有人的访问权限。

译美国政府以国家安全为由发布出口管制指令，暂停所有非美国公民（包括美国境内外国国民及Anthropic外籍员工）访问Anthropic的Fable 5和Mythos 5模型。Anthropic无法仅对非美国公民限制访问，只能立即禁用这两个模型面向所有客户。其他Claude模型不受影响。Anthropic认为这是误解，正努力尽快恢复访问。

Yuchen Jin@Yuchenj_UW · 6月13日88

“we are suspending access to Claude Fable 5 for all users” what the actual f????

译Anthropic宣布，根据美国政府指令，立即暂停所有用户对Claude Fable 5的访问。其他Claude模型不受影响。Claude产品中的新会话将使用用户设置的默认模型或Opus 4.8，现有Fable 5会话会报错。Claude Platform上对Fable 5的API请求也将返回错误，建议用户将集成更新至其他Claude模型。

ginobefun@hongming731 · 6月13日47

http://x.com/i/article/2065581374749413376 # BestBlogs 早报 · 06-13｜Anthropic AI 民调、AI 工厂、Kimi K2.7 Code 在线阅读本期早报 ## 导语 AI 正在被谁信任，又将把计算带向何处？今天的三篇精讲恰好构成同一场变革的三个切面。第一个切面是公众心态：Anthropic 完成了覆盖近 52000 人的首次全美公众调查，结果呈现出清晰的「期待与焦虑并存」——48% 的人期待 AI 攻克癌症等疾病，64% 的人担心失业，而每天用 AI 工作的人反而更不担心被取代。第二个切面是产业框架：黄仁勋在红杉的访谈里，给智能时代找了一个 300 年前的参照物——发电机，并把计算范式的切换讲成了一个五层产业故事。第三个切面是一线工具：月之暗面发布并开源了 Kimi K2.7 Code 编程模型，更快、更省、更聪明的编程能力已经送到了每个开发者手边。速览部分同样密集：浮之静万字解析架构腐朽与 Loop Engineering，The Batch 串讲本周模型大事并讨论递归自我改进，阮一峰周刊记录 rsync 维护者用 AI 写代码引发的争论，SpaceX 完成史上最大 IPO，Y Combinator 用 5 篇论文勾勒 AI 研究走向，歸藏系统阐述 Skill 作为「能力商品」的本质，Simon Willison 实测 Claude Fable 5 的「不懈主动性」。补充阅读里还有 Spring AI 2.0.0、WebMCP、企业级 Agent 落地与 7000 亿资本支出观察。从公众民意到产业资本，从架构哲学到编程模型，这一天的信息浓度值得你留出完整的阅读时间。 ## 精讲一：Anthropic 首份公开记录调查结果先说背景。AI 公司谈论「公众怎么看 AI」时，大多引用第三方机构的零散数据，而 Anthropic 这次选择自己下场：推出名为 Anthropic Public Record 的全新调查系列，第一轮于 2025 年 11 月至 12 月执行，通过 YouGov 采样、按美国人口普查基准加权，覆盖 51993 名美国人，各州样本从 232 人（阿拉斯加）到 1902 人（纽约）不等，州级误差范围在正负 2.6 到 9.1 个百分点之间。这是 Anthropic 第一次直接面向普通公众做系统性民意研究，也补上了此前研究版图的关键缺口：他们此前通过 Anthropic Interviewer 工具对 81000 名 Claude 用户做过大规模定性访谈，也定期发布基于匿名使用数据的经济指数，但这些都只能覆盖已经在用 AI 的人。这次调查第一次触达了那些根本不用 AI 的群体，让「公众态度」这个词第一次有了完整的样本基础。调查的核心发现可以概括为「期待与焦虑并存」。在期待一侧，受访者要从 17 个选项中挑出自己对 AI 的前三大期望：48% 的人选择了「治愈癌症、阿尔茨海默病等疾病」，比第二位「帮助残障人士」（36%）高出 12 个百分点，「推动技术进步」和「让生活更轻松」并列第三（各 23%）；而「AI 提供心理治疗、缓解孤独」之类的选项排名垫底——公众显然并不希望 AI 取代真实的人际联结。在焦虑一侧，「AI 导致失业」是全美五十个州无一例外的头号恐惧，比例高达 64%；紧随其后的是认知依赖（56%）和虚假信息（52%）。监管态度同样鲜明：超过 70% 的美国人认为政府应当在 AI 监管中发挥作用，且这种支持是跨党派的，公众最希望政府在隐私（56%）、儿童安全（52%）和损害责任（49%）三个领域采取行动。最值得玩味的有两点。其一，只有 15% 的美国人信任 AI 公司自行决定 AI 如何开发和使用；当被问到什么最能确保 AI 造福人类时，排名最高的答案是「让 AI 公司为损害承担法律责任」（47%）和「安全优先于增长」（44%）——公众要的是问责，而不是承诺。一家头部 AI 公司主动公布「公众不信任 AI 公司」的数据，这个姿态本身也是研究的一部分。其二，每天在工作中使用 AI 的人，对失业的担忧（54%）反而显著低于从不使用 AI 的人（70%）。熟悉感冲淡了恐惧，这与历史上多次技术变革中的公众心态曲线一致。另外一个反直觉的结论是：在绝大多数问题上，AI 并没有沿着典型的党派、地域或教育水平分界线撕裂美国社会——美国人普遍渴望兑现 AI 的好处、害怕它带来的冲击、要求建造它的公司负起责任，人们的分歧更多体现在态度的强烈程度，而非方向。为什么重要？这份调查与今天黄仁勋的产业叙事形成了有意思的对照：产业界在谈万亿级的 AI 工厂建设和五层产业蛋糕，而普通人在担心自己的工作、孩子的安全和个人隐私。两者之间的落差不是谁对谁错的问题，而恰恰是未来几年 AI 政策制定与商业决策都必须面对的现实约束。Anthropic 表示这个调查会定期重复并扩展到美国之外，这意味着我们将第一次拥有一条跨年度追踪「公众对 AI 态度」的连续曲线。建议完整阅读原文中的州级数据和方法论附录，尤其推荐关注「使用频率与恐惧程度」的交叉分析。阅读全文 ## 精讲二：黄仁勋谈智能时代的「发电机」：从检索式计算到 AI 工厂这场红杉资本的访谈里，黄仁勋给当下的 AI 基础设施热潮找了一个历史参照物：300 年前的发电机。物理世界的发电机把蒸汽、风力、水流等动能转化为电能；而现代 AI 工厂把这条转换链反过来运行——输入原始的电子，输出结构化的智能 token。这不是一句漂亮的修辞，而是他用来解释「为什么计算范式正在发生 60 年来最大切换」的核心框架。当年发电机的意义不在于发电本身，而在于它催生了围绕电力组织起来的整个工业体系；按同样的逻辑，AI 工厂的意义也不止于训练和推理，而在于一个围绕「实时生成智能」重新组织的计算产业正在成形。先看技术切换的逻辑。自 1964 年 IBM System 360 问世以来，计算一直运行在「检索预存数据」的静态范式中：程序由人手写，媒体以不可变文件的形式录制，数据中心本质上是归档存储的枢纽——用户请求信息，系统从物理磁盘上把数据找出来。生成式 AI 从根本上打破了这个架构：每一段文本回复、每一张合成图像、每一条操作指令，都是基于实时上下文在原点即时构造出来的。过去两年，这种能力又跨过了两个里程碑：早期的生成式翻译（文本到摘要、文本到图像、图像到文本的结构转换），以及如今的智能体推理系统——能做多步规划、内部反思、调用电子表格和浏览器等工具、自主协调执行企业级工作流。再看产业拆解。黄仁勋把整个 AI 基础设施建设比作一块五层蛋糕：第一层是能源，核电、风电、光伏、氢能等电网基础设施迎来前所未有的增长；第二层是计算芯片，包括大规模量产的 GPU、高速交换机和硅光互连；第三层是设施，涵盖土地、吉瓦级供电和数据中心建设；第四层是基础模型，承载对语言、物理规律、生物编码和机器人学的理解；第五层是应用，即面向金融、法律、运营等场景的增值软件。这个分层的好处是把「AI 投资」这个笼统的词拆成了五个资本属性完全不同的赛道——能源和设施是重资产长周期，芯片是制造业节奏，模型和应用则是软件逻辑。落到硬件上，一个典型的计算单元是：72 颗专用计算芯片集成在一个自治服务器机架里，整机约两吨重、造价约 400 万美元、包含超过 150 万个零部件，以高产量直接部署进全球的超大规模数据中心。最后是他对失业焦虑的回应，这一点与精讲一的民调形成了直接对话。黄仁勋用放射科医生和软件工程师举例：AI 自动化的是任务，而不是职业的核心目的——放射科医生的价值从「看片」转向更高层的临床判断，软件工程师的价值从「敲代码」转向定义问题和验证结果。这个「任务 vs 目的」的区分未必能安抚所有人，但它至少提供了一个比「AI 会不会抢走工作」更可操作的分析框架：先问一个职业的核心目的是什么，再问哪些任务可以被自动化，剩下的部分才是人需要重新定位的空间。把这场访谈放进今天的早报里看，价值在于它提供了一张「产业地图」：速览部分的 SpaceX 万亿估值、补充阅读里七巨头 7000 亿美元的资本支出、存储涨价与电力争夺，全都可以在五层蛋糕的框架里找到自己的位置。如果你想理解未来几年资本开支、电力规划和芯片产能为什么会这样流动，这场访谈值得完整观看。观看访谈 ## 精讲三：Kimi K2.7 Code 编程模型已上线 Kimi Code、API 开放平台月之暗面今天发布并开源了 Kimi K2.7 Code 编程模型，发布文章以 Dijkstra 1970 年的名言开场——「编程的艺术，就是组织复杂性的艺术，是掌控庞杂、并尽最大可能避免其沦为畸形混沌的艺术」。这是一次目标非常明确的迭代：专攻编程场景，把性能、效率和智能体能力同时往前推。先看硬指标。相比上一代 K2.6，K2.7 Code 显著提升了长上下文编程场景的指令遵循能力和长程编程任务的性能表现，在内外部代码基准上全面进步：Kimi Code Bench v2 提升 21.8%，Program-Bench 提升 11%，MLS Bench Lite 提升 31.5%。更值得注意的是效率改善：新模型大幅缓解了长程任务中的过度思考倾向，平均 token 消耗减少 30%——也就是用更少的 token 达到更高的性能。对天天跑长任务的智能体编程场景来说，这条「省」的曲线可能比「强」的曲线更直接地决定使用成本。代码能力的进化还带动了智能体能力：在评估 Agent 自主化执行的 Kimi Claw 24/7 Bench、MCP Atlas 和 MCP Mark Verified 基准上，性能提升约 10%。再看获取方式和价格。企业和开发者今天起即可通过 Kimi API 开放平台调用 K2.7 Code，1M token 的标准输入和输出价格与 K2.6 持平，分别为 6.5 元和 27 元，命中缓存的输入价格调整为 1.3 元；Kimi Code Plan 的默认模型也已同步升级，会员计划和企业版用户可以直接体验新模型。模型权重已在 Hugging Face 开放，支持本地部署。有两个使用细节需要特别注意：其一，K2.7 Code 必须开启思考模式（Thinking）才能发挥最佳性能——Kimi API 和 Kimi Code 默认都已开启，但如果手动关闭，API 会直接报错，Kimi Code 则会静默回退到 K2.6，排查性能问题时别忘了先检查这一项；其二，在非编程任务中，官方仍然推荐能力更全面的 K2.6，新模型是一把专用的刀，不是通用的瑞士军刀。最大的悬念留给了下周一。6 月 15 日，K2.7 Code 高速版将通过 API 开放平台上线：同一个模型，输出速度约为普通版的 5 到 6 倍——常规编程场景约 180 token/s，短上下文场景可达 260 token/s，而价格只是普通版的 2 倍，官方的说法是「6 倍速度只要 2 倍价格」。6 月底前，开发者可以通过 Kimi Code Plan 的抢先体验计划在 Kimi Code 中试用高速版；7 月起将逐步开放给 Allegretto 及以上会员，高速版在套餐中的用量消耗为普通版的 3 倍。配合发布，API 开放平台还推出了为期三周的充值赠送活动。为什么值得关注？在 Claude Fable 5、Cursor Composer 2.5 相继刷新编程模型预期的这一周（见速览部分），K2.7 Code 代表了国产开源阵营的回应：不拼大而全，而是在编程这个最有付费意愿的场景里，把「性能、token 效率、推理速度、价格」四个变量同时优化。对于正在搭建 AI 编程工作流的团队，这是一个值得实际接入、跑一轮自家任务集做对比的选项——尤其是下周高速版上线之后，速度敏感型场景（比如交互式结对编程和大批量代码迁移）的体验差异会更加明显。阅读全文 ## 速览 [深度思考：架构腐朽 & Loop Engineering](https://www.bestblogs.dev/article/1706c463)（浮之静）——「屎山源于不敢删，架构活于持续排熵。」作者给屎山下了一个工程上可用的定义：删除任何东西的风险都大于保留它的成本，并拆解出三大症状——局部性丧失（改一行、测全站）、承重 bug（Hyrum 定律的晚期形态：连错误行为都被下游依赖）、疤痕组织（没人删东西，所有人绕着加东西）。文章从 Lehman 软件演化定律讲起：只要系统还活着就会持续变化，变化没有配套的减法，复杂度的无序累积就是腐朽；进而提出在 AI Agent 时代用 Loop Engineering 建立持续排熵的工程循环。一篇罕见地把模糊焦虑转化为可讨论、可测量对象的架构长文。 [神话催生寓言，Cursor 的 Composer 2.5，智能体构建智能体](https://www.bestblogs.dev/article/08a9c3c1)（The Batch | DeepLearning.AI）——本期 The Batch 信息量很大：Anthropic 的 Claude Mythos 5 与 Fable 5 双模型、Cursor 自研的 Composer 2.5，以及由 Anthropic 生产力数据引发的递归自我改进（RSI）讨论。Andrew Ng 的开篇信尤其值得读：他鼓励大家尝试桌面智能体——不只是聊天，而是直接读写本地文件、收发消息、定时交付，并解释了 agent harness 如何让前沿模型自主驱动「下一步做什么」的关键循环；他同时提醒，机密任务上要警惕商业桌面智能体藏在法律条文深处、可能随新模型一夜变更的数据留存政策。 [科技爱好者周刊（第 400 期）：rsync 的争论](https://www.bestblogs.dev/article/d1462f58)（阮一峰的网络日志）——第 400 期周刊聚焦一场标志性争论：有人发现服务器基础命令 rsync 的 3.4.3 版本由 Claude 生成，GitHub 上题为「不要乱搞这个软件」的批评帖已有 300 多条发言。维护者 Andrew Tridgell 的回应很有代表性：他本已准备退休，却突然收到大量由 AI 发现的安全报告，意识到未来的攻击必然由 AI 驱动，而自己的精力已不足以应对，于是选择让 AI 写代码、自己转向编写更严格的测试用例。阮一峰的判断是「AI 写代码 + 人类测试」可能成为大型开源项目的常见运作模式——无人付酬的开源项目，恐怕没有第二条路。 [SpaceX 敲钟，马斯克成人类首个「万亿美元先生」，400 名员工身家过亿](https://www.bestblogs.dev/article/ff2e8373)（腾讯科技）——SpaceX 以每股 135 美元发行、募资 750 亿美元，是 2019 年沙特阿美的两倍有余，创下全球史上最大 IPO；开盘价 150 美元，市值一度突破 2 万亿美元，全球排名第六。认购热度惊人：总需求超 2500 亿美元，仅散户订单就超过 1000 亿美元。造富效应同样罕见：超过 4400 名在职与离职员工跻身百万富翁，约 400 人账面财富过亿。但分歧也很尖锐——做空者查诺斯称之为「建立在希望与梦想之上的狂欢」，晨星给出的公允价值仅每股 63 美元，较发行价折价超过一半。 [从蛋白质模型到智能体编程：5 篇论文看 AI 研究正在走向哪里](https://www.bestblogs.dev/video/18e855a)（Y Combinator）——这场 YC 技术 meetup 用 5 篇论文勾勒出正在成形的研究方向：蛋白质模型的 scaling laws、自引导 selfplay 强化循环、流式实时 RAG 架构、基于 Lean 的数学化代码验证，以及借鉴高 APM 游戏战术的智能体软件工程框架。开场还讨论了持续学习、样本效率与硬件极限等基础性约束，以及对「模型仅靠人类数据子空间就能采样完整解空间」这一假设的普遍怀疑。适合想跳出产品新闻、看清研究脉络的读者，五个方向覆盖了从生物到编程的完整光谱。 [万字长文：做了些爆款 Skills 以后，我对 Skills 的看法](https://www.bestblogs.dev/article/54575866)（歸藏的AI工具箱）——基于 PPT、社交媒体卡片、Logo 生成器等爆款 Skills 的真实实践，歸藏给出了一个核心判断：Agent 不是抹平能力差距，而是放大能力差距，目标清晰、品味和判断强的人被放大，目标混乱的人也被放大混乱，用户正在 K 型分化。Skill 的价值在于弥合这道鸿沟——它不是单纯的提示词，而是把专家经验、工作流、品味和工具调用封装成可安装、可分发、可迭代的「能力商品」。文章对 Skill 的架构、设计、维护与生态边界都有系统论述，是目前中文世界关于 Skills 最完整的实践总结之一。 [Claude Fable 展现出不懈的主动性](https://www.bestblogs.dev/article/67accc9f)（Simon Willison's Weblog）——使用两天后，Simon Willison 用「relentlessly proactive」概括 Claude Fable 5：它掌握一大堆技巧，并且会动用其中任何一个来达成目标。他只丢了一张截图和一句提示词，让模型排查一个 CSS 横向滚动条 bug，自己就走开了。回来时发现模型已经自主打开了他的 Firefox 和 Safari、用 pyobjc 调用 Quartz 定位窗口编号并截屏、自建本地测试页面逐项对照 CSS 属性——所有这些手段都没人教它。一篇生动的一线观察，展示了新一代模型「为达目标穷尽工具箱」的工作风格，可与速览中 The Batch 对桌面智能体的讨论对照阅读。 ## 补充阅读 - [Spring AI 2.0.0 GA 正式发布](https://www.bestblogs.dev/article/9ed27696)（Spring Blog）——以 Spring Boot 4 为基础，带来 Jackson 3、空安全、重构的选项系统与 MCP Java SDK 正式集成。Java 后端团队接入 AI 能力的事实标准更新，建议相关团队对照升级说明评估迁移。 - [迎接智能体就绪的 Web：用 WebMCP 简化用户操作](https://www.bestblogs.dev/video/6ff3380)（AI Engineer）——Chrome 团队介绍实验性浏览器标准 WebMCP：让网站把客户端能力暴露为结构化工具，供浏览器内 AI 智能体直接调用，替代脆弱的 DOM 抓取。前端工程师和做浏览器智能体的团队应当跟进。 - [领域中心？为什么 Hexagonal 与 Onion 架构回答的是错误的问题](https://www.bestblogs.dev/video/f2dd2f0)（Spring I/O）——Spring Modulith 作者 Oliver Drotbohm 的反共识演讲：六边形与洋葱架构本质只是分层架构的依赖反转，并未解决领域拆分；他主张垂直切片加包级封装。适合正在做架构选型的后端架构师。 - [学会记住什么：基于认知的智能体记忆多因素价值模型](https://www.bestblogs.dev/article/008361e6)（arXiv.org – AI）——提出七因子可解释的记忆价值函数，在固定记忆预算下统一控制编码、遗忘和检索。给长时运行 Agent 设计记忆系统的工程师提供了一个超越「语义相似度 + 时近性」的框架。 - [Box AI 如何借助 Deep Agents 构建企业级内容智能体](https://www.bestblogs.dev/article/06adaad3)（LangChain Blog）——Box 用 LangChain 的 Deep Agents 框架实现递归父子智能体架构，从单文档问答一路演进到跨数千文档的综合分析，且始终尊重既有的安全与权限模型。一份难得的企业级 Agent 落地参考，适合做企业知识系统的团队。 - [所有人都在为 7000 亿账单兜底](https://www.bestblogs.dev/article/4b8de76e)（腾讯科技）——硅谷七巨头 2026 年预估 7000 亿美元 AI 资本支出的连锁反应：买空台积电先进产能、推高存储价格、与社区争夺电力，连库克、雷军、余承东都先后被供应链「卡脖子」，风险再通过 SPV 等金融工具层层转嫁给普通消费者。与精讲二的 AI 工厂叙事对照阅读，体感更立体。 ## 今日阅读路径今天的内容密度偏高，如果你只有 30 分钟，建议按「先工具、再民意、后框架」的顺序读三篇： 1. 先读精讲三 [Kimi K2.7 Code](https://www.bestblogs.dev/article/7ed2852b)——最具行动价值：价格不变、效率提升 30%，下周还有 6 倍速高速版，正在搭 AI 编程工作流的人应该今天就去试。 1. 再读精讲一 [Anthropic 公众调查](https://www.bestblogs.dev/article/05a21063)——理解 AI 行业最稀缺的变量：公众信任。「每天用 AI 的人反而更不怕失业」这一条，值得转给你身边焦虑的朋友。 1. 最后看精讲二 [黄仁勋的 AI 工厂](https://www.bestblogs.dev/video/93f8c99)——五层产业蛋糕和「数字发电机」框架，会帮你把今天速览里的 SpaceX、7000 亿资本支出等新闻装进同一张产业地图。时间更充裕的话，浮之静的架构腐朽长文和歸藏的 Skills 万字总结是本周不可多得的两篇深度实践文章，一篇向后看系统如何腐朽、一篇向前看能力如何封装，适合周末配一杯咖啡精读。做 Java 后端的读者，则不要错过补充阅读里 Spring AI 2.0.0 和 Oliver Drotbohm 架构演讲这对组合。 BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂，并逐渐理解你关注什么。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」 https://www.bestblogs.dev/reading/brief

译Anthropic首份全美AI民调覆盖51993人：48%期待AI攻克癌症，64%担心失业，仅15%信任AI公司自行开发。黄仁勋以发电机类比AI工厂，提出五层产业蛋糕（能源/芯片/设施/模型/应用），每个计算单元含72颗芯片、造价约400万美元。月之暗面开源Kimi K2.7 Code编程模型，相比K2.6平均token消耗减少30%，Kimi Code Bench v2提升21.8%，Program-Bench提升11%，MLS Bench Lite提升31.5%。

ginobefun@hongming731 · 6月13日43

BestBlogs 早报 · 06-13 # Anthropic AI 民调 / Kimi K2.7 Code / 黄仁勋 AI 工厂 / Claude Fable / Cursor Composer 2.5 [1] ★ 精讲｜Anthropic 首份公开记录调查结果 Anthropic 首个面向全美公众的调查，覆盖近 52000 人。结果呈现清晰的「期待与焦虑并存」：48% 期待 AI 攻克癌症等疾病，64% 担心失业，71% 支持政府监管，而只有 15% 信任 AI 公司自行决策。值得玩味的是，每天用 AI 工作的人对失业的担忧（54%）反而显著低于从不使用者（70%）。来源：Anthropic News https://www.bestblogs.dev/article/05a21063 [2] ★ 精讲｜黄仁勋谈智能时代的「发电机」：从检索式计算到 AI 工厂 [视频] 黄仁勋在红杉访谈中给智能时代找了个 300 年前的参照物：发电机。计算正从持续 60 年的「检索预存数据」范式转向实时生成智能的 AI 工厂，整个产业可拆成能源、芯片、设施、基础模型、应用五层。他还用放射科医生和软件工程师的例子回应失业焦虑：自动化任务不等于取代职业目的。来源：Sequoia Capital https://www.bestblogs.dev/video/93f8c99 [3] ★ 精讲｜Kimi K2.7 Code 编程模型已上线 Kimi Code、API 开放平台月之暗面发布并开源 Kimi K2.7 Code 编程模型：相比 K2.6，代码基准 Kimi Code Bench v2 提升 21.8%，长程任务的过度思考倾向明显改善，平均 token 消耗减少 30%，智能体自主执行能力也提升约一成，价格与 K2.6 持平。更值得期待的是下周一上线的高速版：输出速度约为普通版的 5 到 6 倍，6 倍速度只要 2 倍价格。注意新模型必须开启思考模式才能发挥最佳性能。来源：月之暗面 Kimi https://www.bestblogs.dev/article/7ed2852b [4] 深度思考：架构腐朽 & Loop Engineering 本文从软件工程实践出发，深入剖析系统架构腐朽的本质、成因与应对策略，并提出在 AI Agent 时代通过 Loop Engineering 建立持续排熵能力的工程框架。来源：浮之静 https://www.bestblogs.dev/article/1706c463 [5] 万字长文：做了些爆款 Skills 以后，我对 Skills 的看法本文基于作者在 PPT、社交媒体卡片、Logo 生成器等爆款 Skills 上的真实实践，系统论述了 Skill 作为 Agent 时代「能力商品」的本质：将专家经验、工作流、品味和工具调用封装成可分发、可复用、可迭代的能力单元，并深入探讨了其架构、设计、维护、生态与未来边界。来源：歸藏的 AI 工具箱 https://www.bestblogs.dev/article/54575866 [6] 神话催生寓言，Cursor 的 Composer 2.5，智能体构建智能体本期《The Batch》涵盖了 Anthropic 的 Claude Mythos 5 和 Fable 5 模型、Cursor 的 Composer 2.5，以及由 Anthropic 的生产力数据引发的关于递归自我改进的讨论。来源：The Batch | http://DeepLearning.AI https://www.bestblogs.dev/article/08a9c3c1 [7] 科技爱好者周刊（第 400 期）：rsync 的争论本期周刊以 rsync 维护者用 AI 生成代码引发的争议为引，探讨 AI 时代开源项目的维护困境与未来协作模式，并汇集科技动态、工具推荐与深度文摘。来源：阮一峰的网络日志 https://www.bestblogs.dev/article/d1462f58 [8] SpaceX 敲钟，马斯克成人类首个“万亿美元先生”，400 名员工身家过亿 SpaceX 以 1.77 万亿美元估值完成史上最大 IPO，开盘市值一度突破 2 万亿美元，引发大规模造富效应与估值分歧。来源：腾讯科技 https://www.bestblogs.dev/article/ff2e8373 [9] 从蛋白质模型到智能体编程：5 篇论文看 AI 研究正在走向哪里 [视频] 这场 Y Combinator 技术 meetup 盘点了 5 个正在成形的 AI 研究方向：蛋白质 scaling laws、自引导 selfplay、流式 RAG、基于 Lean 的验证，以及智能体式软件工程。来源：Y Combinator https://www.bestblogs.dev/video/18e855a [10] Claude Fable 展现出不懈的主动性 Claude Fable 5 展现出不懈的主动性，仅凭一张截图和一句提示词，便自主使用浏览器自动化、自定义 Web 服务器和 JavaScript 注入来调试一个 CSS 滚动条 bug。来源：Simon Willison's Weblog https://www.bestblogs.dev/article/67accc9f --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。关注你感兴趣的来源和主题，每天生成一份更适合自己的「我的早报」。在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-13

译Anthropic全美民调（近52000人）：48%期待AI攻克疾病，64%担忧失业，71%支持政府监管，仅15%信任AI公司；每日用AI者失业担忧（54%）低于从不使用者（70%）。黄仁勋将AI工厂类比发电机，计算从检索预存转向实时生成，自动化不等于取代职业。月之暗面发布并开源Kimi K2.7 Code：代码基准提升21.8%，过度思考改善，平均token消耗减少30%，智能体自主执行提升约一成，价格不变；下周上线高速版（输出速度约5-6倍，6倍速仅2倍价，需开启思考模式）。Claude Fable 5凭截图和提示词自主使用浏览器自动化、Web服务器和JS注入调试CSS bug。

Peter Steinberger 🦞@steipete · 6月13日53

“not consistently candid in their communications” is my fav new americanism. https://www.theinformation.com/articles/anthropic-blindsides-business-partners?rc=kavc8p

译“在沟通中并非始终坦诚”是我最喜欢的美式新词。

Artificial Analysis@ArtificialAnlys · 6月13日19

Artificial Analysis hosted a Coding Agent Benchmarking event last night in San Francisco with speakers from Cognition, Cursor and NVIDIA Thank you to everyone from the SF AI community who joined! A big thank you in particular to our speakers for their fantastic talks and panel discussion: • Silas Alberti (@silasalberti), SVP, Research @ Cognition • Nate Schmidt, Evals & Behavior @ Cursor • Venkat Srinivasan, Research Scientist @ NVIDIA • George Cameron (@grmcameron), Co-Founder @ Artificial Analysis And a special thank you to Alessio (@FanaHOVA) and Kernel Labs (@KernelLabs_ai) for hosting us at their space.

译Artificial Analysis 昨晚在旧金山举办 Coding Agent Benchmarking 活动，邀请 Cognition 研究高级副总裁 Silas Alberti、Cursor 评估与行为团队成员 Nate Schmidt、NVIDIA 研究科学家 Venkat Srinivasan 以及 Artificial Analysis 联合创始人 George Cameron 进行演讲和小组讨论。活动特别感谢 Kernel Labs 提供场地支持。

Replit ⠕@Replit · 6月13日18

Replit is taking over NYC and we can't wait to see you at #Vibecon. 2 days of art, code and the biggest tastemakers in culture. Get the details on http://vibecon.ai @BrandNewSchool

译Replit 正在接管纽约，我们迫不及待在 #Vibecon 与你相见。为期两天的艺术、代码与文化潮流引领者盛宴。详情请见 http://vibecon.ai @BrandNewSchool

Replit ⠕@Replit · 6月13日26

Even the Mayor knows where the vibes are 👀 http://vibecon.ai

译连市长都知道气氛在哪里 👀 http://vibecon.ai

MiniMax (official)@MiniMax_AI · 6月13日33

appreciate it @SambaNovaAI 🤝 looking forward to M3 on RDUs

译SambaNovaAI 祝贺 MiniMax 发布 M3 开源模型，并表示未来将在其 RDUs 上支持 M3。MiniMax 表示感谢并期待这一合作。