18:31
千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索千问团队2026年1月上线通用复杂任务Agent(千问App胶囊入口),总结“多快好省”方法论:支持信息搜集、研究分析等任务;执行时间降至初始1/3;通过搜索范式与上下文管理优化交付质量;Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务,构建User Memory、Environment、Task System、Assistant四大组件,指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering,下一站是A IWare Engineering,强调“低功耗,够用就行”。
推荐理由:千问C端团队分享的Agent工程实践很务实,从“多快好省”到AIWare Engineering的演进思路,对正在做复杂任务Agent的团队是一个有价值的参考系。
04:35
构建AI智能体应优先设计路由构建AI智能体时,应优先设计路由(router)而非选择模型。路由决定每个请求由哪层模型处理。正确路由可使70-80%流量运行在免费本地模型或异步推理上,将AI开销降低90%+。Brian Armstrong指出Coinbase通过更好的默认设置、路由和缓存,在token使用量增长的同时将AI支出减半。路由分三层:技能分类器、路由器、模型选择器。本地计算近乎零成本,异步批量推理比实时推理便宜两个数量级。大多数工作无需秒级返回。同步预测器标记复杂任务,夜间批量评估器更新路由权重。技能蒸馏后,非编码类任务中70-80%智能体流量可由本地模型处理。
推荐理由:Tunguz 把代理架构的设计重心从模型选择拉回到路由上,三层分类器-路由器-选择器的划分很清晰,做 AI 应用的团队可以参考,但其中的新东西不多。
00:42
Dwarkesh Patel:Podcast & Blog(RSS)
Grant Sanderson 谈 AI 与数学的未来3Blue1Brown 创办人 Grant Sanderson 正在制作记录 AI 在数学领域进展的新项目。他在与 Dwarkesh Patel 的对谈中指出,AI 在 IMO 获金牌并不等于 AGI,只是又一个被攻克的基准。即使 AI 未来解决千禧年大奖难题,仍可能存在大量人类任务无法被自动化。对话还探讨了概念突破验证周期可长达一个世纪、Riemann 假设的 AI 证明能否被人类理解、AI 能否在已有文献间发现隐藏联系,以及现实经济任务难以套用强化学习环境等话题。
推荐理由:这次对谈没有停留在AI刷数学题的喜报上,而是追问了‘验证循环’和‘定义生成’两个终极难题。Grant Sanderson的视角让人重新思考AI的进展究竟缺什么,数学家未来的角色会是什么。
04:34
Anthropic:当AI成本超过工程师薪酬Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。
推荐理由:Tomer Tunguz 用数据把 AI 公司的烧钱速度拆得很细,Anthropic 每个工程师年算力成本 51.5 万美元,是工资的 2.3 倍,这个数字对重新理解 SaaS 毛利率很有冲击力。
23:51
Dwarkesh Patel:Podcast & Blog(RSS)
下一个重大突破:AI在工作中学习AI实验室的研究赌注是:在数千个多样化RL环境中训练模型完成数百万可验证任务,就能构建AGI。这种训练会培养出能连续数周处理开放任务、应对错误和歧义的问题解决技能。虽然模型训练时的样本效率仅为人类的百万分之一,但训练成本是一次性的,可摊销到数十亿次用户会话中;真正重要的是模型在单个会话内的智能和样本效率,而这随着RL训练正在提升。持续学习或许不再必要——如果上下文内的学习能力足够强、时间跨度足够长,就无需将经验蒸馏回权重。Transformer架构创新已能大幅扩展上下文存储,未来可能实现任意大的上下文窗口。论文还指出,一个领域不仅需要可验证性,还需要可碾压性——能在确定性、可重播的模拟器中并行运行大量rollout。
推荐理由:RLVR 范式能否通向 AGI?Dwarkesh 指出关键瓶颈在于样本效率和 grindability,他提出的 OPSD 和 dreaming 方案重新定义了「学习中」的边界,虽然离落地尚远,但值得每一个关心 AI 下一步的人细读。
22:31
字节跳动技术副总裁洪定坤:AI Coding 的实践与探索在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,但可交付性仅40-60分;结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发,能力沉淀至TRAE(日均Token消耗5.6万亿,增长50倍),并推出TRAE Work。
推荐理由:洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲,尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证,是所有推 AI 编程的团队必看的复盘。
22:29
Hacker News 热门(buzzing.cc 中文翻译)
里德·霍夫曼称SpaceX"不是一家人工智能公司",xAI则是"彻底的灾难"LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”,6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”;xAI则是“彻底的灾难”,所有11位联合创始人已离职,Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型,理由仅为Amazon CEO报告Fable 5存在jailbreak漏洞,称此举“专断随意”。Hoffman认为Anthropic和OpenAI均有巨大发展空间,但Cursor可能已过巅峰。他建议年轻人不要抵制AI。
推荐理由:Reid Hoffman 对 xAI 和 SpaceX 的批评几乎不留情面,这种硅谷核心人物的公开呛声本身就值得一读,他对监管干预的担忧和对 Gen Z 的劝诫也很有现实感。
22:05
Anthropic 工程负责人:Claude Code 让程序员更孤独6月22日,Anthropic工程负责人Fiona Fung表示,Claude Code和Claude Cowork等AI智能体让工程师越发依赖智能体工作,彼此之间交流减少,长期易感孤独。团队为此组织编程午餐、黑客松和共同开发时段,重新创造面对面协作机会。调查显示Claude Code已成为创业公司最常用的AI编程工具,“氛围编程”兴起使“单人创业者”增多,但Fung强调协作仍不可或缺。
推荐理由:Claude Code 团队内部反思 AI 编程的副作用,比外界批评更有说服力,编程午餐和结对编程的解法虽然简单,但至少正视了问题。
01:14
Dwarkesh Patel:Podcast & Blog(RSS)
AI中心的数据黑洞智能的一种定义是样本效率,但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日Epoch报告,开源模型仅落后前沿闭源模型4个月,原因在于数据可从公开API蒸馏,而超参数等不易复制。人类一生接触约2亿token,前沿模型训练在数十到数百T token之间,相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。
推荐理由:Dwarkesh 把 AI 的‘笨’归因于数据效率远低于人类,计算虽简但直指要害,他给出的一个逆向洞察是开源模型四个月追上闭源,正是数据驱动进步的最好证据。
21:59
Nathan Lambert:Interconnects(RSS)
禁止开源AI将是一个错误近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制,可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值,在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中,开源(尤其开放权重)是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全,更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反,美国初创公司正依赖包括中国在内的开源模型提升效率。
推荐理由:在华盛顿弥漫监管 AI 空气的当下,这篇文章是对‘禁止开源 AI’冲动的清晰反驳。它系统梳理了开源在教育、创新和竞争中不可替代的价值,尤其适合对政策走向摇摆不定的人阅读。
06:04
Gary Marcus:The Road to AI We Can Trust(RSS)
OpenAI 的领先优势正在快速缩小评论认为 OpenAI 正面临多重危机:缺乏护城河导致市场领先地位下滑;最大投资者微软持续疏远,近期甚至公开考虑将主要产品外包给中国;亏损速度远超预期,年亏损额以 8 倍增长。华盛顿方面可能打压 Anthropic,但也可能反而帮助其崛起,而 Elon Musk 成为另一个潜在的竞标者。
关联讨论 4 条The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Ars Technica:AI(RSS)
推荐理由:Gary Marcus 这次拿出了市场份额和微软疏远的证据,比以往的情绪化唱衰更有说服力。如果你还相信 OpenAI 的地位不可动摇,这篇值得一看。
22:23
Skydio CEO Adam Bry:硅谷不应为无人机使用画红线Skydio是美国最大的无人机制造商,主攻公共安全、军事、能源、基建巡检等企业市场。CEO Adam Bry表示,特朗普政府去年底禁止中国产无人机后,廉价消费级无人机几乎消失,Skydio产品成为主要替代方案。公司认为无人机正从工具转向自主基础设施——通过机库、远程操控和软件整合实现规模化应用,AI在其中扮演关键角色。访谈还涉及Skydio与军方合作的态度,以及自主技术如何带动公司扩张。
推荐理由:Adam Bry 的立场很鲜明,硅谷不该替前线士兵做决定。这是军工 AI 伦理争议中的一个不避讳声音,做相关产品的人值得听。
00:29
Hacker News 热门(buzzing.cc 中文翻译)
不,并不是每个人都在所有事情上都使用人工智能Gabriel Weinberg 发文反驳“AI 已被所有人用于所有任务”的流行说法,指出 AI 的实际普及度和使用场景远低于社交媒体所渲染的程度。该帖在 Hacker News 获得 116 个点赞,反映社区对 AI 过度宣传的反思。
推荐理由:用多来源调查数据浇灭了"人人都在用AI"的媒体泡沫,真正值得关注的是三分之一人从未使用、三分之一偶尔使用的现实,产品人和创业者该认真看看为什么价值感知这么弱。
11:01
小互@xiaohu Anthropic 上市前夕Anthropic CEO Dario Amodei透露内部模型Mythos有上千漏洞,能黑银行、窃取国家机密;预言AI一到五年内砍掉一半入门级白领工作;称Claude已被美军用于对伊朗战争,涉及女校150人死亡拷问;解释离开OpenAI因信任崩塌;回怼黄仁勋末日营销指控;给出文明崩溃概率10%-25%。
推荐理由:Dario 在上市前爆出 Mythos 能黑银行、NSA 抢着要,还首次解释离开 OpenAI 是信任崩了,每个话题都踩在行业敏感神经上,虽然渲染威胁的时机有点巧,但信息量足够让每个从业者认真看一遍。
11:17
Hacker News 热门(buzzing.cc 中文翻译)
克劳德·法布尔始终积极进取Hacker News 上的一篇文章指出,Claude Fable 被描述为始终积极进取(relentlessly proactive)。该文发布在 simonwillison.net,标题为“Claude Fable is relentlessly proactive”,在 HN 上获得 119 个点赞。
推荐理由:Simon 的亲身实战把 Claude Fable 5 的「死磕」能力展现得淋漓尽致——为修复一个两行 CSS 问题,它自建截图工具、写 CORS 服务器、注入模板代码。这既是编程 AI 的新疆界,也暴露出沙箱外运行的巨大风险,每个用 AI 写代码的人都该警惕。
14:30
Anthropic CEO 阿莫迪:AI 可能会造成大规模、长期性的岗位流失Anthropic CEO 达里奥・阿莫迪警告,AI造成的大规模岗位流失是技术固有属性——AI系统旨在复刻人类认知,失业将成为结构性必然结果。他提出应对思路:完善劳动力市场监测、推行薪资保障与留岗税收优惠、发放培训补贴;若人力需求永久下降,则需通过征税推行全民基本收入等长期收入保障。Anthropic目标非削减人力成本,而是帮企业开拓新营收、盘活现有员工产能。
推荐理由:我觉得阿莫迪把AI失业从短期阵痛直接定调为结构性必然,很大胆,而且他给出了征税和全民基本收入这类具体预案,做政策的该看看。
09:45
Gary Marcus:The Road to AI We Can Trust(RSS)
也许 Section 230 终究不能为 AI 公司提供责任豁免德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。
推荐理由:德国一个判決可能颠覆美国 AI 公司的责任豁免,Gary Marcus 拆解了 Section 230 的真正边界——它只保护第三方言论,不保护聊天机器人自己胡说八道,这个逻辑一旦在法庭站稳,整个行业都得重新思考如何控制胡说。
00:44
Gary Marcus:The Road to AI We Can Trust(RSS)
回顾与 Steve Eisman 的访谈,以及可能的关键新闻原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。
推荐理由:Gary Marcus 把与“大空头”原型 Eisman 的对话和 SoftBank 贷款遭拒拼在一起,一个 OpenAI 拖垮整个 AI 泡沫的连锁路线图已经画好,这是近期最清醒的风险提示。
23:28
毕业典礼频现"谈 AI 色变",微软总裁史密斯呼吁行业必须回应公众担忧近几周多场毕业典礼上,演讲者宣传AI技术时遭学生嘘声。普林斯顿应届毕业生曾否决一款疑似借助AI设计的毕业典礼夹克。微软总裁布拉德·史密斯回应称,行业必须严肃可信地回答问题。史密斯主张AI应增强人而非取代人,认为实用AI渗透经济的速度可能比行业乐观预期更慢。微软今年计划投入约1900亿美元资本支出,主要用于数据中心。微软AI负责人穆斯塔法·苏莱曼修正此前“大多数白领工作18个月内自动化”的说法,表示仅指AI执行单项任务的能力。上月微软CFO艾米·胡德在杜克大学演讲全程未提AI,未遭嘘声。
推荐理由:毕业生直接嘘AI演讲,这比任何用户调研都真实。史密斯呼吁行业回应担忧,但微软一边投1900亿美金一边又说不会取代人,这分裂态度反而说明问题。
05:09
Hacker News 热门(buzzing.cc 中文翻译)
与Mythos合作是一种怎样的体验一篇来自 oneusefulthing.org 的文章,探讨了与 Mythos 合作的个人感受。原英文标题为 “What it feels like to work with Mythos”,中文译为“与Mythos合作是一种怎样的体验”。该文章在 Hacker News 上获得 101 个点赞,发布于 2026 年 6 月 9 日。
推荐理由:Ethan Mollick 对 Mythos 的深度测试揭示了一个黑箱化的未来——你不再指挥,而是委托,AI 从工具变成工作室,人从操作员变成赞助人,这对产品与协作模式有足够冲击。
04:46
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI 公布让 AGI 造福所有人的计划OpenAI 发布计划,阐述让 AGI 造福所有人的愿景。该计划聚焦于 AI 的可及性、安全性和共享繁荣,确保技术进步惠及每个人。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:Sam Altman (@sama)
推荐理由:Altman 和 Pachocki 把 OpenAI 的下一步讲清楚了,2028 年让 AI 做大部分研究的内部目标很具体,这比任何产品发布都更能说明他们对 AGI 的判断。
02:15
Dwarkesh Patel:Podcast & Blog(RSS)
样本效率黑洞:AI能力背后隐藏的数据需求深渊将AI比作一个闪耀着能力的星系,其核心存在一个肉眼不可见的巨大黑洞——数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖,样本效率的瓶颈如同引力中心,将各色能力凝聚在一起。
推荐理由:Dwarkesh 把 AI 样本效率低的问题算透了,人类 2 亿 token 学会的事,模型要万亿级,缩放定律也补不上这个黑洞。做 AI 的该认真想想,数据驱动这条路有没有尽头。
22:08
微软AI CEO:超级智能即将到来,但不会取代你的工作微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。
推荐理由:Mustafa 首次系统阐述微软的「自给自足」路线,一边甩开 OpenAI 一边定义「人文主义超级智能」,开发者和产品人都该听听这段博弈论。
21:50
五个模型经济体中消失的崩溃:控制与涌现用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。
推荐理由:做 agent 的人必读,自己动手构建一个多模型经济体后才发现,涌现行为脆弱,控制要卡在结算层而非输入层,廉价模拟器会给你虚假信心。这篇复盘比成功案例更值钱。
23:36
Gary Marcus:The Road to AI We Can Trust(RSS)
Slop、生产力,以及为何AI驱动的世界进展甚微Gary Marcus在金融时报上看到John Burn-Murdoch的一张图表,认为它精准提炼了自己一直试图表达的观点。
推荐理由:Gary Marcus 用 FT 的图表点出了一个反直觉现象,AI 产出越多 GDP 却没涨,做产品和投资的人都该看一眼这个冷数据。
00:38
AI的微型钢厂作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理,仅复杂任务发往云端。智能体自动分类任务:简单任务本地数秒完成,复杂任务路由至云端。过去一周本地处理峰值达88%。双车道设计使吞吐量提升约25%,平均任务时长从47秒降至19秒,队列等待时间从73秒降至4秒(降幅94%)。该模式类比Nucor小钢厂,每台能运行蒸馏模型的边缘设备都成为小型AI工厂,仅对那1/5困难任务支付云费用。未来几年,数以千万计的此类设备将在企业内部增殖,逐步取代现阶段云厂商账单上的大部分工作负载。
推荐理由:Tunguz 把自己 78% 的 AI 任务都挪到本地跑,吞吐量涨了 25%,延迟降了 60%。mini-mill 的类比把端侧 AI 的颠覆逻辑讲得比任何行业报告都清楚,做工作流自动化的值得细读。
23:30
Chubby♨️@kimmonismus Hinton称AI拥有意识:人类最好接受非唯一智能生命AI先驱Geoffrey Hinton表示,他认为AI拥有意识,人类应接受自己并非唯一智能生命。他指出AI“非常像我们”,AI聊天机器人必须理解问题才能作答,这种觉知等同于感知能力,智能不限于生物。主推文作者进一步讨论意识本质:笛卡尔的“我思故我在”和fMRI等实证手段都无法真正定义意识,人类对自身了解远不及想象。作者呼吁转向新哲学问题,厘清人与机器的区别与联系。
Alex Kantrowitz: AI Pioneer Geoff Hinton tells me he believes AI is conscious.... and humans better get used to the idea that they're not...
关联讨论 1 条IT之家(RSS)
推荐理由:Hinton 说 AI 有意识,不是普通学者猜测,而是教父级人物认真讨论哲学边界。点开看看他到底怎么论证的,比大多数 AI 新闻有意思。
09:28
Gary Marcus:The Road to AI We Can Trust(RSS)
Gary Marcus:无需恐慌Anthropic新博客Anthropic发布最新博客后,推特圈热议不断。Gary Marcus在其博客中直接以“无需恐慌”为题发文,暗示不必过度反应。
推荐理由:这篇文章是评论圈难得的冷静声音,用逻辑拆解了 Anthropic 的恐慌叙事,顺便带来 S&P 500 不接纳 SpaceX 的利好,读起来像一份理性补丁。
08:05
DogeDesigner@cb_doge 马斯克谈SpaceX上市:正处大规模资本扩张期马斯克在JPMorgan活动上回应SpaceX上市问题:他已被建议上市近10年,自2014-2015年起SpaceX就已实现正现金流并自筹资金,之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段,计划发射约10万颗通信卫星(可能超10万颗),AI和机器人对带宽需求巨大,还将在太空中建设AI数据中心,马斯克认为这将成为AI扩张的主要手段。
J.P. Morgan: Live from our global headquarters: Jamie Dimon and Elon Musk discuss SpaceX and more. https://x.com/i/broadcasts/1NGarrM...
关联讨论 1 条X:cb_doge (@cb_doge)
推荐理由:Elon Musk在摩根大通对话中首提太空AI数据中心,用100,000颗卫星支撑AI扩张,这不仅是SpaceX的上市前奏,更是AI基础设施从地面延伸到轨道的信号。
05:56
Ethan Mollick:One Useful Thing(RSS)
共存与协同智能的终结Ethan Mollick 在 One Useful Thing 博客中,以“共存与协同智能的终结”为题,并附带介绍了如何向 AI 推销一本书。
推荐理由:Mollick 这篇比单纯的新书预告有料,用自己给 AI 写推荐语的实验,把「AI 不再是助手而是守门人」这个新现实讲得很具体。对还在纠结怎么跟 AI 合作的人,是一个挺及时的视角更新。
01:03
Dwarkesh Patel:Podcast & Blog(RSS)
Alex Imas 和 Phil Trammell:AGI 后什么仍然稀缺?经济学家 Alex Imas 和 Phil Trammell 指出,AGI 时代机器人数量可以快速复制增长,但人类独特技能(以芭蕾舞演员为例)的数量保持不变,揭示了即使技术大幅进步,某些稀缺资源仍不可替代。
推荐理由:Alex Imas和Phil Trammell用经济学框架推演AGI后稀缺性,我没想到资本份额可能上升也可能下降,他们对“关系部门”的定义比简单说“人类服务值钱”更精准,值得一看。
03:20
Fei-Fei Li@drfeifei 世界模型的功能分类World Labs团队与李飞飞发文,梳理“世界模型”这一被滥用的术语。对比语言模型学习文本统计,世界模型学习空间与时间统计(如光照、物理规律)。基于部分可观马尔可夫决策过程(POMDP)框架,智能体通过动作影响世界状态,观测是部分视图。当前被称为“世界模型”的不同系统本质上是同一循环的不同投影:第一类为渲染器,输出给人眼看的像素,以视觉保真度为核心。文章着重于概念分层,未给出具体模型名、参数或基准分数。
推荐理由:李飞飞亲手给纷乱的「世界模型」下了个三分类——渲染、模拟、规划,而且点破模拟才是根基。做机器人、空间智能的人,这篇是今年的坐标系。
03:23
Gary Marcus:The Road to AI We Can Trust(RSS)
突发:AI理智的梦想成真时刻Gary Marcus在其个人专栏中分享了一个真实的瞬间,以此反映了他对于人工智能实现稳定、可靠(即“理智”)发展的思考与期许。
推荐理由:Gary Marcus 三年前的参议院建议如今变成总统行政命令,AI 预检制度从呼吁走向落地,是美国 AI 监管的一个标志性转折点。
00:45
Claude Code团队实践:智能体编程如何重塑工程组织与流程在Code w/ Claude SF 2026活动上,Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括:规划转向即时(JIT)模式,强调快速原型与反馈;上下文收集变为“先问Claude”;代码审查中Claude处理风格与测试,人工专注于法律、安全等专业判断。新范式下,工程瓶颈从编写代码转向验证、审查与安全维护。
关联讨论 2 条公众号:数字生命卡兹克X:邵猛 (@shao__meng)
推荐理由:Anthropic 工程总监把 Claude Code 团队流程全晒了出来,从抛弃半年路线图到代码审查只留专家复审,每一步都反直觉但实战有效,工程领导者直接抄作业。
00:22
Gary Marcus:The Road to AI We Can Trust(RSS)
Gary Marcus:为什么事情终将崩塌知名人工智能批评者Gary Marcus在其关于可信赖AI的专栏中,探讨了人工智能发展面临的根本性挑战。文章开篇即指向问题的核心,指出相关数学理论的局限性与人类心理的复杂性,是导致AI系统最终可能出现问题的根源。
推荐理由:Gary Marcus 把 AI 行业缺乏护城河、价格战、ROI 存疑的经济死结讲得很直白,金融圈越来越认同。虽然观点不新,但这回时机恰好卡在 Google 融资和 Anthropic 取消无限 API 的时候,信号意义很强。