本周AI行业迎来密集发布与战略转向。模型层面,Anthropic推出Claude Fable 5和Mythos 5,在多项基准上达到SOTA;Google发布Gemma 4 12B无编码器多模态模型;小米MiMo实现1T模型超1000 tokens/s推理速度;苹果推出第三代AFM模型。产品方面,OpenAI加速向超级应用转型,ChatGPT新增图表生成功能,并计划到2028年由AI主导研究;Runway发布Aleph 2.0编辑模型;微信AI开启内测。行业动态上,OpenAI提交IPO草案并宣布进入第三发展阶段,同时与特朗普政府讨论公共财富基金入股方案;苹果WWDC 2026聚焦AI战略,但Siri AI因DMA在欧盟延迟上线。工具生态持续繁荣,Claude Code、Codex等编程智能体获得多项增强,Hivemind推出持续学习功能。整体趋势显示,AI正从对话式交互向自主智能体、超级应用和物理世界渗透,同时安全、监管与经济影响讨论升温。
本周多家机构发布新一代模型,在性能、速度和效率上实现显著突破。Anthropic推出Claude Fable 5和Mythos 5,在软件工程、科研等基准上达到SOTA,并大幅降价。Google DeepMind发布Gemma 4 12B,采用无编码器统一架构,性能接近26B MoE模型但内存减半。小米MiMo联合TileRT实现1T参数模型超1000 tokens/s推理速度,通过FP4混合量化与并行推测解码达成。苹果推出第三代AFM模型,覆盖设备端到云端。Cohere发布North Mini Code,30B MoE模型在编码基准上超越同类。
OpenAI本周动作频频,标志着从聊天机器人向超级应用和Agent平台的战略转型。公司计划对ChatGPT进行最大规模改版,整合编程、图像生成及第三方应用,高管称“聊天已死”。同时,OpenAI向SEC机密提交S-1草案,启动IPO进程。CEO奥尔特曼宣布进入第三发展阶段,目标包括打造自动化AI研究员、推动经济提速,并计划到2028年由AI主导大量研究。此外,OpenAI与特朗普政府探讨通过公共财富基金让政府入股AI初创公司,并启动Economic Research Exchange研究AI经济影响。
AI智能体从对话式交互向自主执行和持续学习演进。Claude Code迎来GA一周年,回顾验证与自动模式;Hivemind推出面向编程智能体的持续学习功能,可收集轨迹并转化为可复用技能。OpenRouter发布Advisor工具,让小模型在关键时刻咨询强模型以平衡成本与质量。Harness-1作为20B检索子智能体,通过强化学习在有状态搜索框架中训练,性能超越开源同类。Kimi Code升级,新增视频理解与权威数据源集成。微信AI开启内测,提供自动与开发两种接入模式。NotebookLM重大升级,引入智能体能力与高级推理。
苹果在内部秘密会议后决定将AI作为核心战略,相关进展在WWDC 2026上公布。公司发布第三代Apple Foundation Models,与Google合作定制,覆盖设备端到云端。Apple Intelligence将强大AI能力融入iPhone、iPad和Mac日常体验。然而,受欧盟《数字市场法案》影响,Siri AI在欧盟将随iOS 27和iPadOS 27延迟上线。此外,苹果推出Core AI框架,为开发者提供底层支持。
AI正加速渗透垂直行业,带来实际效率提升。生数科技与华策影视合作共建AI视听创制中心,探索AI虚拟制作与实拍结合。日本农民用ChatGPT和Codex解决农场实际问题,涵盖病害识别、远程控制等8个场景。Pakistan Notice Helper利用轻量模型帮助用户识别可疑消息,提升本地安全。Perplexity与哈佛研究表明,自主智能体比传统搜索快87%、成本低94%。Anthropic研究指出,生物学数据基础设施碎片化阻碍AI智能体应用,确定性检索工具是关键。