Elvis Saravia(DAIR.AI)耗时6个月构建自有的 agent orchestrator(编排器),具备编排、路由、动态工件/工作流、验证器、agent 后端切换、自动化、技能及 MCP 工具等功能。这些能力在本周的 Fable 事件中成为最佳防御。他年初即主张“拥有自己的 agent orchestrator”,反对者认为维护成本高且不可持续,但他认为锁定特定工具或模型供应商损失更大。通过挖掘 agent 会话递归构建和测试新想法(包括自主循环、持续学习/记忆系统),他已无法回到仅提供固定功能的供应商。他强调必须控制成本、决策和上下文管理,否则无法进入递归自我改进 AI 领域。
上周五收盘后,美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限,理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称,对任何模型权重的出口禁令都是长期负面政策,且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧,并暴露了前沿AI公司与政府间的紧张关系。
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》Welcome to the AGI era of AI governance It's a one-way door and we weren't ready for it. https://www.interconnects.ai/p/...
Threading the needle in this post of anthropic has done some bad things for AI governance & the discourse but the action...
http://x.com/i/article/2065582894790365184
白宫周五做出的AI监管决定被指偏袒OpenAI、亚马逊等企业,同时对Anthropic施压不足24小时,缺乏透明度和事实依据。Gary Marcus、Dean W Ball及卡托研究所Kevin Frazier等专家指出,这种由少数人闭门快速决策的做法带有腐败嫌疑,可能促使其他国家加速发展“主权AI”甚至中国AI,并导致美国人才流失。Anthropic声明称政府应在法定程序中基于技术事实阻止不安全部署,而非当前方式。Marcus呼吁建立独立机构负责AI监管,确保公平、清晰、基于证据的执行。
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》保罗·格雷厄姆发表文章《如何赚十亿美金》,基于21年创业孵化经验(见证30位亿万富翁),指出核心在于月增长率与持续时间——月增15%保持5年可翻4384倍,月入1万美元的生意5年后月入4400万美元,创始人自然身家十亿。高增长源于做出好到用户主动推荐的产品,最佳创业点子来自自己做且觉得酷的东西。PG最后调侃Claude做不到,因为它没朋友和欲望。
How to Earn a Billion Dollars: https://paulgraham.com/earn.html
Gabriel Weinberg 发文反驳“AI 已被所有人用于所有任务”的流行说法,指出 AI 的实际普及度和使用场景远低于社交媒体所渲染的程度。该帖在 Hacker News 获得 116 个点赞,反映社区对 AI 过度宣传的反思。
推文澄清了Siri AI并非在Google Gemini基础上简单封装。苹果并未直接复制Gemini代码,而是从Gemini获得许可,将其作为“教师模型”来训练自己的专有AI模型Apple Foundation Models (AFM)。Siri AI的核心模型和底层架构完全由苹果自主设计与实现,因此是苹果自有的AI产品,而非Gemini的衍生品。
Siri AI is NOT Google Gemini Everyone is saying iOS 27 just slapped an Apple Sticker on Gemini YOU COULD NOT BE MORE WRO...
微软CEO Satya Nadella认为,AI驱动的平台转变首次实现人与数字系统间的认知循环。企业需同时构建人力资本(知识、判断、关系)与token资本(自有的AI能力),且人力资本不会贬值,反而随token资本增长而增值。真正的机会在于建立人力资本与token资本复合增长的学习循环——企业应能替换通用模型而不丢失已内化的专家知识,通过私有评估和强化学习让模型从内部真实轨迹中持续提升。他警告,若所有价值被少数模型吞噬,将重演全球化空心化悲剧,呼吁构建前沿生态系统,让每家企业、行业和国家拥有自己的学习循环。
同一事件,精选展示《Satya Nadella 谈微软 Build 大会主旨演讲》Calling it now: if this turns out to be true, he won't remain Anthropic CEO for much longer. However, Anthropic denies i...
Paul Graham 在其个人网站 (paulgraham.com) 发表文章《How to Earn a Billion Dollars》,该文在 Hacker News 上获得 113 点热度。
微软 CEO 萨蒂亚·纳德拉在《纽约时报》播客中表示,AI 发展可能导致部分岗位被取代,但也蕴含巨大机遇。他提出 AI 不能只靠少数前沿模型或头部公司驱动,必须构建让整个经济体系都能使用的生态系统。纳德拉自称是“Token 最大化者”,但强调 Token 的边际成本必须匹配实际价值,前沿模型不应解决非前沿问题。谈到 AGI 时,他承认编程等闭环任务进展显著,但 AI 并非人类的最后一项技术发明。
小米新媒体高级工程师 @小米_邹師傅 今日再发文谈大模型,称过去一年国内大模型行业最令他兴奋的是开始靠作品说话——开源代码放GitHub、论文挂arXiv、模型让开发者使用。他认为大模型的核心评委只有开发者,而非媒体或榜单。他期望赛道竞争回归技术本身,比拼代码质量、推理速度和开源贡献,而不是比嗓门或预算。同时澄清上述为个人观点,不代表公司立场,并希望大模型成为“一方净土”,让研发人员专注开发。
Vinod Khosla's warning for India's BPO in the age AI: The traditional IT services and BPO business "will be gone" But In...
Vinod Khosla 不看好“AI 副驾驶”模式。他认为人类会妨碍 AI 副驾驶的发挥,导致效率降低并阻碍真正变革。会计师、程序员等员工因担心失业而抵触工具,不会正确使用。因此,他更倾向于构建能独立完成整个岗位工作的 AI,例如完全替代软件工程师的 AI。他预计到 2030 年,大多数此类岗位将由纯 AI 工人而非“人类+副驾驶”承担。
这是prompt engineering 101。 Fable 5的真正实力来自Mythos-class底层权重,海量新训练数据,外加复杂agent架构,不是prompt copy就能继承的。 泄露prompt与老模型顶多cosplay出味...
Anthropic CEO Dario Amodei透露内部模型Mythos有上千漏洞,能黑银行、窃取国家机密;预言AI一到五年内砍掉一半入门级白领工作;称Claude已被美军用于对伊朗战争,涉及女校150人死亡拷问;解释离开OpenAI因信任崩塌;回怼黄仁勋末日营销指控;给出文明崩溃概率10%-25%。
模型能力是根本,Harness层相对容易补齐且无需过多垂直领域。Claude Design将很快合并至Claude Desktop。未来模型能力足够时,Codex会在Codex App以Plugin集成Codex Design。针对开源Open Design方案,若使用Claude Code的模型能否达到类似工程能力?这是该讨论中提出的问题。
@dotey 模型能力与Harness是相辅相成的。 宝玉这篇对这两个的解释太通透了。另外,宝玉怎么看开源的Open Design之类的?如果他用上了Claude Code的模型,是否也能达到类似的工程能力呢?
在2026中国汽车重庆论坛上,小鹏集团副总裁余鹏指出物理AI时代已到来,汽车智能的本质根基在于底盘,而非仅停留在智能座舱。小鹏去年7月发布“太极AI底盘”,具备AI智能识别减速带、颠簸路段、路面凹凸、障碍物以及6D防晕车功能共5项AI底盘能力。小鹏未来将持续加大原生AI架构研发投入。
建立统一设计系统,Agent 遵循规范;设计师不再调像素,用文字指令指挥 Agent;方向与验收仍由人把关。引用指出并非所有情况都适合用 Claude Design 描述精确调整。
@FanVancoo @dotey 你说的对。 绝大部分时候设计师还是需要对字型字号,图形颜色做精确调整的。不是什么都适合用claude design码字描述
有什么与 AI Agent 交互的习惯,你一旦开始后就再也回不去的? 我先来一个 -- 先让 Agent 把 coding plan 写出来,反复确认后,汇总一个 task 列表,最后再编程,同时把 task 标记已完成
Reuters: India's biggest private employer TCS's Chairman AI agents could become as numerous as TCS employees. The Chairm...
长期运行编码智能体核心从提示转向控制系统。Elvis Saravia在DAIR.AI Academy session中详解Claude Code的/goal模式:人类指定最终状态、成功证据、约束与预算,目标作为“合同”而非长提示。评估器成为第一类组件——明确任务用确定性检查(测试、lint、基准),模糊任务用智能体评估器(判断报告、UI设计),两者结合降低幻觉。验证器定义信任边界:外部检查(测试套件、类型检查、浏览器运行、截图对比)提供不可绕过的证据。
"The Admin asked Dario to fix the jailbreak or de-deploy the model. Dario refused. - In their blog post, Anthropic defen...
Anthropic推出Claude Design,可用一句话生成高精度可交互原型。网友问为何OpenAI的Codex没有类似产品?关键在模型层差距。Agent分Harness(产品层)和模型层,Harness非门槛(已有开源baoyu-design可复现),真正壁垒是Claude Opus 4.8同时具备UI/UX设计和系统架构设计能力,先定义数据结构、状态管理和交互逻辑再交付完整原型。而GPT-5.5生成的交互效果差。产出物为React/CSS/JSON代码。
OpenRouter 发布 Fusion API,号称“市场上最智能的复合模型”,能以一半的价格达到 Fable 级别的智能。主推文作者 Elvis Saravia 借此观点指出,模型智能与人类专业知识的组合具有惊人的复合效应,不同模型各有独特优势,而非通用大模型能一统天下。工程团队应将“组合调用不同模型”作为战略方向,尤其在前沿模型选择性开放的趋势下,理解如何协同利用它们将是巨大的解锁。
Introducing the Fusion API, the smartest compound model in the market. Fusion achieves Fable-level intelligence at half ...