6月25日

17:07

X.PIN@thexpin

GLM-5.2 开源发布：百万上下文逼近 Claude Opus 4.8 和 GPT-5.5，美国公司收紧 AI 预算

中国公司 z.AI 以 MIT 许可证开源 GLM-5.2 模型，拥有百万 token 上下文窗口，基于华为昇腾芯片训练，性能接近 Claude Opus 4.8 和 GPT-5.5。与此同时，Amazon、Meta、Uber 等美国公司因工程师过度消耗 token 而开始限制 AI 预算（Uber 每员工上限 1500 美元），推动开源模型需求。GLM 团队源自学术项目，长期适配国产芯片；DeepSeek 投入 28 亿美元，共同成为“Tokenmaxxing”趋势的替代方案。

Anthropic DeepSeek 开源生态推理

15:44

🚨 AI News | TestingCatalog@testingcatalog

OpenAI 推出新版本 GPT-5.5 Instant，号称是使用最多的模型。新版本能更好地理解问题意图并调整回答，更可靠地处理复杂约束，同时让购物和本地推荐更实用、更连贯。该模型已向付费用户推送，明天起免费用户也将陆续获得。

OpenAI: We have a new version of GPT-5.5 Instant for you, and it's much more fun to talk to. Our most-used model is now better a...

OpenAI 推理模型发布

14:07

Artificial Intelligence News（RSS）

OpenAI Jalapeño芯片背后的成本逻辑

OpenAI与Broadcom合作开发的ASIC芯片Jalapeño专为大语言模型推理设计，旨在降低对Nvidia硬件的依赖。OpenAI提供架构，Broadcom负责硅工程，TSMC制造，Celestica构建板卡系统。早期样品已运行未发布的GPT-5.3-Codex-Spark模型，达到目标频率和功耗。芯片集成Broadcom Tomahawk网络硅，通过最小化数据移动提高实际利用率。去年ChatGPT成本84亿美元，今年预计达140亿美元，周用户9亿。公司未来八年承诺约1.4万亿美元计算投入，年收入250亿美元。

OpenAI 产品更新推理部署/工程

13:12

HuggingFace Daily Papers（社区热门论文）

V-Zero：无需答案标签的对比证据门控用于细粒度视觉推理

多模态大语言模型（MLLM）进行细粒度视觉推理时，传统方法依赖强化学习或大规模标注推理轨迹，成本高昂。V-Zero提出无需标注文本答案标签的框架，通过将问题相关区域裁剪与负视觉视图配对，评估学生模型采样轨迹，并门控细粒度token级知识蒸馏，引入轨迹级判别能力。在多个视觉推理基准上，V-Zero持续提升细粒度视觉推理性能并保持强泛化能力，训练速度比监督微调方法快5倍以上，比强化学习基线快10倍以上。代码和数据集将开源。

多模态推理论文/研究

12:23

Yuchen Jin@Yuchenj_UW

我没意识到Denny Zhou--曾领导Gemini推理团队--已在4个月前离开Google，加入Meta的TBD Lab。最近很多人离开了Google。我仍在等待Gemini在编码方面赶上。是时候让Sergey启动Code Red了。

Google Meta 推理行业动态

11:12

HuggingFace Daily Papers（社区热门论文）

精选70

Causal-rCM：自回归视频扩散蒸馏的统一教师强制与自强制开源方案

Causal-rCM将扩散蒸馏框架rCM扩展至自回归视频扩散，提出教师强制(TF)与自强制(SF)互补训练范式，并发布统一开源算法与基础设施。通过自定义掩码FlashAttention-2 JVP内核，首次实现基于教师强制的连续时间一致性模型(sCM/MeanFlow)用于自回归视频扩散，收敛速度比离散时间版本快10倍。蒸馏后的2步因果Wan2.1-1.3B模型在仅1或2步采样下取得VBench-T2V分数84.63，仅使用合成数据即达到帧级和块级流式视频生成SOTA。该方法还应用于Cosmos 3全模态世界基础模型，实现动作条件生成的交互式世界模型。

arXiv 推理视频论文/研究

推荐理由：把自回归视频扩散蒸馏到1-2步采样，VBench冲到84.63，这个配方让实时视频生成和交互世界模型从论文走进了工程落地，做视频产品的该看。