Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念:开发者需要深入理解代码,才能在与编码智能体(coding agents)的协作中保持主动参与,避免因认知债务(cognitive debt)导致无法有效推进项目。他认为,缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。
Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念:开发者需要深入理解代码,才能在与编码智能体(coding agents)的协作中保持主动参与,避免因认知债务(cognitive debt)导致无法有效推进项目。他认为,缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。
Anthropic 将 Claude Code 的系统提示词削减了 80%。技术员工 Tariq Shihipar 指出,新 Fable 5 模型(Mythos 类)不再需要更多指令和示例,过多的示例反而会限制模型的想象力。Anthropic 转而通过上下文而非硬性规则来引导模型。这一变化分阶段发生:早期模型需要短提示词配合大量示例,随后提示词随模型理解能力提升而变长,如今又再度缩短。
7月2日晚,小鹏MONA L03首秀后,何小鹏称中国智能辅助驾驶在效果和法规制定上均领先全球。联合国ADS GTR法规覆盖L2至L5,其中L2全面性条款意味着今年12月中国现有的L2智能辅助驾驶可在全球使用。何小鹏曾在今年全国两会建议从L2跳过L3直接进入L4、L5,他相信未来3到5年内不仅能看到L4落地,甚至能看到L5在所有场景安全通行,速度超出想象。
数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。
联想集团副总裁、联想中国首席战略官阿不力克木·阿不力米提表示,无论中国还是海外市场,AI算力需求还有很大空间,没有出现算力过剩。他指出,面向个人消费者的C端领域,成熟且具市场头部地位的AI产品数量有限;面向企业级应用的B端市场,商业化落地潜力尚未充分释放。同时,他警示当前AI产业链存在供给侧话语权过强现象,导致上下游供需循环失衡。近期有消息称Meta计划出售算力,引发了市场对算力过剩的担忧。
千问团队2026年1月上线通用复杂任务Agent(千问App胶囊入口),总结“多快好省”方法论:支持信息搜集、研究分析等任务;执行时间降至初始1/3;通过搜索范式与上下文管理优化交付质量;Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务,构建User Memory、Environment、Task System、Assistant四大组件,指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering,下一站是A IWare Engineering,强调“低功耗,够用就行”。
优必选 CEO 周剑在6月30日的2026年度全球发布会上表示,未来5到20年内机器人将替代人类劳动力,现在20多岁的年轻人20年后可能无工可做。他认为从事枯燥工作的人应“露出幸福的微笑”,因为这种时光不会太长。周剑此前称机器人首先替代招工难、环境困难的岗位,未来人类应转向艺术、哲学等创新性工作。人形机器人可弥补产业人口缺失并降低制造业成本,若中国不用,10-20年后制造业优势将丧失。
Dwarkesh Patel举办的AI征文比赛评选出三位获奖者。第一名Jassi Pannu主张OpenAI基金会应投入数十亿美元终结空气传播疾病,利用AI加速自主生物学发现,可带来超1万亿美元年GDP增长并消除灾难性流行病风险。第二名Ege Erdil建议AI供应链外的国家通过强产权、低资本税和开放监管政策抓住增长机会。第三名Michael Li类比香港地铁商业模式,提出AI实验室可通过收购互补性资产盈利。
构建AI智能体时,应优先设计路由(router)而非选择模型。路由决定每个请求由哪层模型处理。正确路由可使70-80%流量运行在免费本地模型或异步推理上,将AI开销降低90%+。Brian Armstrong指出Coinbase通过更好的默认设置、路由和缓存,在token使用量增长的同时将AI支出减半。路由分三层:技能分类器、路由器、模型选择器。本地计算近乎零成本,异步批量推理比实时推理便宜两个数量级。大多数工作无需秒级返回。同步预测器标记复杂任务,夜间批量评估器更新路由权重。技能蒸馏后,非编码类任务中70-80%智能体流量可由本地模型处理。
扎克伯格认为 AI 不必然造成大规模失业,关键在于企业应优先发展“个人超级智能”赋能个体,而非将所有知识工作自动化。他影射 Anthropic、OpenAI,强调劳动者生产力提升速度须超过企业自动化速度,就业岗位才可能增加。Meta 已投入数十亿美元调整 AI 战略,他称之为“重启”。对于 Meta 生成式 AI 进展,他坦言仍有提升空间,超级智能实验室成立不足一年,模型进展超预期,但他认为“原本可以做得更好”。
对 87 家上市 SaaS 及平台公司的分析显示,2026 年只有基础设施与开发工具(一年涨幅 68.5%)和安全(一年涨幅 17.6%)两个板块增长为正,其余三个板块均下跌。市场正在买入 AI 基础设施,卖出按席位定价的应用层。
前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)一个名为“AI指南针”的政治指南针风格测验通过29道关于AI和AI伦理的是非题,将参与者匹配到30种原型之一。作者本人在首次回答后被归类为“The Garage Tinkerer”。该测验以单页React应用实现,利用<script type="text/babel">脚本标签绕过构建步骤。
3Blue1Brown 创办人 Grant Sanderson 正在制作记录 AI 在数学领域进展的新项目。他在与 Dwarkesh Patel 的对谈中指出,AI 在 IMO 获金牌并不等于 AGI,只是又一个被攻克的基准。即使 AI 未来解决千禧年大奖难题,仍可能存在大量人类任务无法被自动化。对话还探讨了概念突破验证周期可长达一个世纪、Riemann 假设的 AI 证明能否被人类理解、AI 能否在已有文献间发现隐藏联系,以及现实经济任务难以套用强化学习环境等话题。
优必选 CEO 周剑透露,公司已确立工业、商用、家庭机器人三线并行布局,一半精力投入工业与商用市场,另一半投入家庭陪伴赛道。工业机器人已成营收支柱,批量落地海内外车企与制造工厂,他预测 2026 年人形机器人营收将超整体收入 80%。同日,优必选推出“优世界”U1 系列全尺寸超仿生人形机器人,分男款(183cm/42kg)与女款(168cm/35.2kg),搭载 88 个高自由度关节、Wi-Fi 连接,续航 2-4 小时,内置养成系情感大模型,支持加密存储记忆和多维度外观定制。价格方面,U1 Ultra 男款 99 万元、女款 88 万元,U1 Pro 16.98 万元,U1 Lite 11.98 万元(前 5000 名用户可享 1 万抵 2 万权益)。
谷歌前工程负责人休·威廉姆斯借助Anthropic的编程助手Claude Code,开发出可正常运行的搜索引擎Zettair,为150万个维基百科条目建立索引。该引擎支持搜索自动补全、关键词摘要片段、相关搜索推荐、热门话题榜单以及AI生成的内容摘要。威廉姆斯未手动编写一行代码,但底层检索框架源自其21世纪初参与研发的信息检索系统。他认为,Claude Code只有在深厚专业技术功底的配合下才能发挥最佳效果,经验丰富的工程师永远是最出色的“指导者”。
在2026年度全球发布会上,优必选创始人周剑指出,机器人将替代手机成为AI最核心的交互终端,用户用自然语言下达指令即可获得服务与情感陪护,交互方式从手动变为口述,奠定机器人在家庭的终端入口地位。同日,优必选宣布超仿生人形机器人优世界U1系列订单已突破1万台,力争今年交付。该机器人主打情感陪伴,分男女两款,各搭载88个高自由度运动关节。作为对比,2025年全年优必选全尺寸具身智能人形机器人总销量为1079台。
Claude Code 负责人鲍里斯·切尔尼认为工程、产品和设计正逐渐融合。他将其团队成员分为五类:原型设计者、构建者、清理者、增长者和维护者,许多成员身兼多职。健康团队需具备全部五种能力,未来产品岗位可能不再按专业领域区分。Figma CEO 迪伦·菲尔德也认同传统职位边界正在消失,部分企业已弃用“管理者”称谓。切尔尼强调角色会随时间和项目改变,且 Claude 能在不同程度上协助所有类型工作。
hyperscript 0.9.91版本出现回归:表达式fetch \{% url 'trade:get_symbol_data' %}?symbol=${symbol}\ as JSON中as JSON被错误地当作表达式转换而非fetch修饰符。作者用Claude快速定位根因——重构时提取的parseURLOrExpression()方法让fetch后接完整表达式,导致as被表达式消费。Claude提出两个修复方案:第一个仅支持字面字符串,无法处理fetch $url as JSON;第二个引入noConversions标志,增加不必要的上下文敏感性。作者最终利用hyperscript已有的“follows”机制简洁解决问题。案例展示了AI在问题分析上的高效与在设计优雅修复上的局限,印证了“巫师学徒”陷阱。
Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。
OpenAI Codex 项目负责人安布罗西诺称,设计比代码更难量化评判,训练模型区分优劣设计比验证代码编译更繁琐。Figma 首席执行官菲尔德指出,AI 模型基于数据分布训练,产出通常平庸。格莱美提名音乐人巴斯强调,引导 AI 创作离不开人类审美判断。目前 AI 在创意设计领域主要作为提速工具,无法独立产出成熟成品。
Meta 等公司将员工 token 用量纳入绩效评估,导致出现让两个 AI 智能体全程对话刷量的浪费行为。几个月后,随着 OpenAI 和 Anthropic 提高 API 定价、削减订阅额度,各团队撤回无限 token 消耗政策。然而,AI 能力进入新阶段:过去长时间无监督运行会因模型幻觉积累“复合错误”,现在更多 token 投入反而带来“复合正确性”——耗费越多 token 越可能获得正确结果,代币最大化以新理由重生。
Jon Udell 反对“human in the loop”的表述,认为它将权威让渡给机器。他主张翻转叙事——人类本就主导工作循环,现在应主动招募 AI 智能体加入团队。智能体辅助的开发过程不应是“输入提示词、输出功能”的黑箱,而是人类邀请智能体协作的开放循环。
美国AI产业受中国追赶引发价格战,token价格趋近于零,利润微薄,Anthropic和OpenAI的万亿IPO难以实现,数据中心巨额投资难回收。当前范式有三个根本缺陷:暴力训练全互联网成本高昂且效率低下;系统不可靠,长期无法维持溢价;基础方法易复制,导致价格战与负利润率。另有人认为,整个AI竞赛方向可能被误解,美国不应只追求最便宜的LLM,而应开发更适合科学与医学的AI新形态。
软银CEO孙正义在股东大会上批评马斯克的轨道数据中心构想,认为其成本高、周期长,而AI竞赛未来几年比十年后的可能性更重要。SpaceX目前占据全球发射市场80-90%份额,主要依赖Starlink业务;建设需要每隔几年更换卫星的轨道数据中心将为SpaceX带来更多发射业务。同期,芯片公司Groq完成6.5亿美元融资,OpenAI推进定制芯片计划。
OpenAI倾向于推迟IPO至明年,因估值不及预期且零售投资者兴趣不足。SpaceX一周跌11.74%,Nvidia近一月跌超8%,Oracle跌22%,CoreWeave跌4%,Microsoft跌10%,SoftBank跌12%,Cerebras跌32%。美国AI政策混乱遭广泛批评,中国模型快速崛起。作者认为大语言模型正商品化。
Timothy B. Lee 反驳“LLM 无需技能、没有学习曲线”的观点,将其类比为认为管理者没有学习曲线——因为员工会完全服从指令。他强调,使用 LLM 同样需要技能和经验积累。
AI行业正投入数亿美元影响当前美国大选周期。科技记者Molly White推出新项目Tech Influence Watch,追踪AI和加密货币公司用于左右选举的巨额资金。这是《Blood in the Machine》播客首期节目,聚焦AI产业政治影响力的膨胀,并探讨数据中心抗议、硅谷工会组织等议题。
应用层公司创立时通常没有护城河。护城河分两种:先发护城河(技术差异、专有数据集、新颖架构,多见于基础设施层)和滞后护城河(规模经济、品牌、渠道关系,需长期积累)。Salesforce 凭借销售能力、品牌和十年先发优势胜过技术更好的 Siebel;Snowflake 以存储计算分离架构赢得先发护城河,再建设滞后护城河。基于 7 Powers 框架,规模经济、品牌和转换成本天然是滞后的。应用层创业公司可以坦诚回答:我们正在建造护城河。
AI实验室的研究赌注是:在数千个多样化RL环境中训练模型完成数百万可验证任务,就能构建AGI。这种训练会培养出能连续数周处理开放任务、应对错误和歧义的问题解决技能。虽然模型训练时的样本效率仅为人类的百万分之一,但训练成本是一次性的,可摊销到数十亿次用户会话中;真正重要的是模型在单个会话内的智能和样本效率,而这随着RL训练正在提升。持续学习或许不再必要——如果上下文内的学习能力足够强、时间跨度足够长,就无需将经验蒸馏回权重。Transformer架构创新已能大幅扩展上下文存储,未来可能实现任意大的上下文窗口。论文还指出,一个领域不仅需要可验证性,还需要可碾压性——能在确定性、可重播的模拟器中并行运行大量rollout。
Anthropic 联合创始人 Jack Clark 称,公司不再招聘初级工程师,因为 Claude 承担了过去需要大型团队才能完成的实验扩展工作,企业转而更看重“资深直觉”的回报。Clark 警告,当其他行业也效仿这一模式时,AI 在放大顶级专家产出的同时自动化入门级岗位,可能导致 GDP 增长伴随经济衰退级别的失业率飙升,而各国政府对此毫无准备。
比尔·盖茨在《今夜秀》中表示,运动员是第四个不会被AI替代的职业,因为没人想看电脑打棒球。此前他在3月采访中认为生物学家、能源工作者和程序员在短期内也难以被AI取代。微软研究院报告指出,在AI时代有40个职业面临消失风险,包括客服代表、口译员、技术撰稿人、编辑、网页开发人员等。
Gary Marcus 昨日提出新术语 Generative AI Fizzle™,认为生成式AI行业估值过高,投资者对 hype 与利润的落差失去热情。LLM 已商品化,价格战激烈,提供商盈利艰难。昨日一款新的中国开源模型发布,可能进一步冲击美国 LLM 公司。多数 AI 股票本月显著下跌,泡沫可能不会突然破裂,而是缓慢消退。
洛杉矶舞者兼 DJ Matt Steffanina 在 Suno 博客访谈中分享创作历程。他自学街舞,拥有超 3000 万粉丝和 50 亿观看量,曾为 Taylor Swift、Jason Derulo 编舞,并创办线上舞蹈教学平台 DNCR Academy。过去他靠他人音乐积累数十亿播放却未拥有资产;现在借助 Suno 在数分钟内将音乐创意变为现实。他认为 Suno 和 Hooks 让创作回归趣味,鼓励舞者自己创作音乐。
纽约钢琴家兼作曲家 Eric Christian 在访谈中分享了他将 Suno 整合进创作流程的方式。他把刚写好的循环旋律输入 Suno,几秒内就能听到完整的管弦乐效果,而传统管弦乐模拟需要数小时。尽管他的作品均为钢琴独奏曲,但他一直以交响化视角构思音乐。至今他已售出超过 10 万份乐谱,用户遍布 200 个国家。他坚信音乐的基础在于纸上的记谱而非录音,Suno 让他在不依赖大型管弦乐团的前提下快速判定旋律是否真正成立。
英伟达CEO黄仁勋在年度股东大会上表示,人工智能代表计算模式的根本性转变,从检索存储转向生成智能。Token是智能的基本单位,在“AI工厂”中被制造,计算能力越强,生成的Token越多,收益越丰厚。AI基础设施建设周期将长达数十年,类比电网、交通系统和互联网,有望成为人类历史上规模最大的基建项目。AI智能体正在加速投资,因为AI首次能胜任实质性工作并创造真实经济价值。
亚马逊云科技CEO马特·加曼认为,AI导致大规模失业的末日论被夸大。他指出约一半白领岗位可能因AI改变,但“改变”不等于“消失”,就像Excel重塑而非消灭工作。AI已催生新职业,初级员工因学习意愿强仍受重视。亚马逊今年计划全球招聘超1.1万名软件开发实习生和初级工程师。加曼强调,愿意学习新技能的劳动者仍能保住工作,适应能力可能比具体技能更重要。
谷歌前 CEO 埃里克·施密特在今年 5 月 SCSP 国家竞争力 AI 博览会的炉边谈话中表示,限制 AI 芯片进入中国的政策已开始失效,中国已通过较弱的 AI 硬件(如华为昇腾芯片)和软件方法造出顶级 AI 模型。施密特称不喜欢中国大力推广开源 AI 技术,认为这些技术不受美国或任何方控制。他援引最新分析称,中美 AI 差距已从一年前的 1~2 年缩短至不到 6 个月。
面壁智能联合创始人兼CEO李大海在MBBF Top Talk Summit上指出,端侧智能是AI迈向物理世界的必经之路,未来2至3年将迎来能力跃升与场景迁移两大重构。端侧智能需满足实时响应、隐私安全、离线可用三大约束,搭载面壁量产级多模态模型的智能座舱已实现不依赖云端的“感知-记忆-推理-执行”闭环。他强调端云协同是规模化落地的关键,近期推出的MiniCPM5-1B模型以两百分之一参数规模逼近两年前GPT-4o水平,证明小模型可承载高密度智能。
MWC26上海期间,智元联合创始人彭志辉指出,AI从数字世界走进物理世界是下一阶段核心命题,具身智能体将在物理世界长期在线完成感知、决策、执行闭环。他强调未来Token最大消耗群体将是物理世界的具身机器人,资本不再只为Demo买单,行业必须在真实场景落地商业价值。他用XYZ曲线划分产业周期:X曲线为开发尝鲜期(以表演为主),Y曲线为部署成长期(大规模落地真实场景),Z曲线为部署普及期(预计5年左右迎来GPT时刻)。