Fable 5 is back - and now there’s video proof. Not just showing up in the model selector. People are actually using the model again. We are so back.

译Fable 5 回来了——现在有视频证据。不只是出现在模型选择器中。人们真的又开始使用这个模型了。我们回来了。

Alibaba Cloud@alibaba_cloud · 7天前37

Securing AI Agents on Alibaba Cloud: The Constraint Infra ️ Solve Agent chaos with a robust governance layer: ✅ Dynamic Control: Hot-update Prompts/rules via Nacos. ✅ Granular Governance: Token limits & multi-agent security. ✅ Proven in Prod: StarOps SRE Agent runs high-risk tasks safely within these boundaries. ✅ Self-Evolving: Rules iterate via AgentLoop data flywheel. Build safer, smarter Agents! 🚀 https://int.alibabacloud.com/m/1000414834/ #AI #AlibabaCloud #Nacos #Higress #StarOps #AgentLoop

译阿里云发布面向AI智能体的约束基础设施（Constraint Infra），提供治理层解决Agent混乱问题。核心能力包括：通过Nacos热更新提示词与规则实现动态控制；支持token限制及多智能体安全的细粒度治理；已在生产环境验证，StarOps SRE智能体在该边界内安全运行高风险任务；通过AgentLoop数据飞轮驱动规则自我进化。

PixVerse@PixVerse_ · 7天前30

A better way to make virtual livestreams feel interactive. Let the audience choose a look, switch the character in seconds, and post the result as a short video. RT + Follow + Reply = Free Access + 150 credits in DMs.

译让虚拟直播更具互动性的更好方式。让观众选择外观，几秒内切换角色，并将结果发布为短视频。转发 + 关注 + 回复 = 免费使用 + 150 积分（私信发放）。

Chubby♨️@kimmonismus · 7天前29

This began as a short film concept that felt unrealistic to produce with traditional tools. My initial thoughts were incredibly vague, but I tried out the new Vibe Create workflow on the Dreamina Octo web platform and the final output came out really good. Here is the final piece:

译这最初是一个用传统工具制作起来不现实的短片构思。我最初的想法非常模糊，但在Dreamina Octo网页平台上尝试了新的Vibe Create工作流，最终输出效果非常好。以下是最终成片：

Alibaba Cloud@alibaba_cloud · 7天前50

Another exciting milestone for #HappyHorse 1.1! #Fal has joined the growing ecosystem, bringing advanced #AIVideo creation to creators everywhere; unlocking richer storytelling, native audio, and greater creative control.

译Happy Horse 1.1 的又一个激动人心的里程碑！ #Fal 加入了不断壮大的生态系统，为创作者带来先进的 #AIVideo 创作；解锁更丰富的叙事、原生音频和更强的创作控制。

Alibaba Cloud@alibaba_cloud · 7天前49

More ways to create. More ways to inspire. It's fantastic to see #Picsart making #HappyHorse 1.1 available to creators, expanding new opportunities for visual storytelling and video generation.

译更多创作方式。更多灵感来源。很高兴看到#Picsart将#HappyHorse 1.1提供给创作者，扩展了视觉叙事和视频生成的新机会。

Alibaba Cloud@alibaba_cloud · 7天前39

Stop shooting. Start creating with #HappyHorse 1.1. Produce captivating brand and commerce videos with intelligent storytelling, expressive motion, refined details, and immersive sound experiences. Built for creators who want speed without compromising quality. Launch Offer: Save 40% https://int.alibabacloud.com/m/1000414698/ #HappyHorse #AlibabaCloud #ModelStudio #GenerativeAI

译停止拍摄。用 #HappyHorse 1.1 开始创作。打造引人入胜的品牌与电商视频，具备智能叙事、富有表现力的动作、精细细节和沉浸式音效体验。专为追求速度又不愿牺牲质量的创作者打造。首发优惠：节省 40% https://int.alibabacloud.com/m/1000414698/ #HappyHorse #阿里云 #ModelStudio #生成式AI

向阳乔木@vista8 · 7天前49

谷歌六月参考AK的LLM wiki思路推出了一个规范：Open Knowledge Format 核心思路：用一组 Markdown ，加 YAML frontmatter，把知识变成可读、可版本控制、可被 Agent 直接消费的文件包。让Codex读取这篇文章，它把codex做过的项目整理成了OKF格式，添加到系统记忆索引中。文章见评论区

译谷歌于六月推出Open Knowledge Format（OKF）规范，参考AK的LLM wiki思路。核心是用Markdown加YAML frontmatter将知识组织为可读、可版本控制、可直接被AI智能体（Agent）消费的文件包。示例中，Codex读取该文章后，将自身做过的项目整理为OKF格式并添加到系统记忆索引中。文章见评论区。

Alibaba Cloud@alibaba_cloud · 6月25日36

One dress. Three occasions. Zero compromise on consistency. With HappyHorse 1.1, transform a single product into multiple lifestyle narratives while preserving subject identity, styling details, and visual coherence across every scene. Perfect for fashion brands looking to scale creative production without reshoots. Limited Launch Offer: 40% OFF via API https://int.alibabacloud.com/m/1000414698/ #HappyHorse #AlibabaCloud #ModelStudio #GenerativeAI

译一件连衣裙。三个场合。零妥协的一致性。借助 HappyHorse 1.1，将单一产品转化为多个生活方式叙事，同时保持主体身份、造型细节和跨场景的视觉连贯性。适合希望在不重拍的情况下扩大创意生产的时尚品牌。限时发布优惠：通过 API 享 40% 折扣 https://int.alibabacloud.com/m/1000414698/ #HappyHorse #阿里云 #ModelStudio #生成式AI

AYi@AYi_AInotes · 6月25日71

卧槽这个必须分享，一个开源工具，让你用免费 API 密钥池跑出企业级路由的效果，等于是零成本撸10亿+免费LLM Token，要把把付费网关干碎的节奏，对比一下：高容量令牌和企业路由，0，原理很简单，它是个路由框架，不是卖 API 的，你需要自己去各厂商申请免费密钥，然后填进配置，工具自动帮你做负载均衡和自动故障切换， 30 秒能跑起来：克隆仓库，配好密钥，把应用指向本地端点，完事，免费额度用满、用稳，不用自己写回退逻辑，项目几周前刚发布，现在入坑还能直接给作者提改进意见， GitHub 链接放评论区 👇 有用的记得给仓库加星。

译一款开源路由框架（非API售卖），让用户自行申请各厂商免费API密钥，通过配置实现自动负载均衡与故障切换，从而零成本使用10亿+免费LLM Token。操作极简：克隆仓库、填入密钥、将应用指向本地端点，30秒即可运行，无需手写回退逻辑。项目几周前刚发布，作者开放改进建议，GitHub链接见评论。

Alibaba Cloud@alibaba_cloud · 6月25日25

Sunflowers in the Wind The adult world is exhausting. Old Zhou, a taxi driver of twenty years, had grown numb to it all — the bridges, the sea breeze, the city lights. He was ready to quit. Then a little girl got in. She didn't rush him. She simply gazed at everything — the bridge, the park wind, the river clouds, the purple evening sky — savoring it all like a quiet goodbye. It was her last look at the world she loved, before surgery. Innocent yet brave. Gentle yet determined. In that moment, Old Zhou realized: the ordinary life we've grown tired of is the tenderness others desperately wish to keep. One sunflower. Two hearts healed. The next morning, light fell over a field of flowers. Old Zhou drove on — rekindled. Ordinary life, gently lit again by warmth and hope. Happyhorse CPP Qingshan Yingling studio × Happyhorse short film “Sunflower” 🌻 HappyHorse 1.1 is now available! HorsePower AI Cinema Awards Global Competition now open! More info can click: https://int.alibabacloud.com/m/1000412436/

译阿里云发布 HappyHorse 1.1 版本，同时启动 HorsePower AI Cinema Awards 全球竞赛。短片《向日葵》作为宣传内容，讲述了出租车司机老周与重病小女孩之间的温情故事，展现该平台在情感叙事与 AI 创意生成方面的能力。

Berryxia.AI@berryxia · 6月25日74

PaddleOCR的PP-OCRv6终于上Hugging Face了。这次不只是精度又提升，还一次性加了transformers和ONNX Runtime两个后端。意味着你现在可以用更统一的API，在不同推理框架之间无缝切换，而不用改太多代码。 PaddleOCR一直以来都是工业界用得最多的开源OCR方案之一，这次上HF + 多后端支持，等于把门槛又拉低了一大截。尤其是想在transformers生态里直接用高性能OCR的人，这次可以直接上手了。从之前的Unlimited-OCR到这次PP-OCRv6，国内团队在长文档和实用OCR方向上确实在持续迭代，而且越来越注重工程可用性。地址见评论区👇

译PaddleOCR 的 PP-OCRv6（对应 PaddleOCR 3.7）正式上线 HuggingFace，精度进一步提升，并新增 transformers 和 ONNX Runtime 两个推理后端。用户可通过统一 API 在不同后端之间无缝切换，无需大幅修改代码。PP-OCRv6 是工业界广泛使用的开源 OCR 方案，此次上架 HF 并支持多后端，降低了工程接入门槛，尤其利好希望在 transformers 生态中直接使用高性能 OCR 的开发者。

ginobefun@hongming731 · 6月25日43

http://x.com/i/article/2069928325951401985 # BestBlogs 早报 · 06-25｜OpenAI 联手 Broadcom 出芯片，Anthropic 谈人机协作，阿里代码评审 CLI 揽星 5k 在线阅读本期早报 BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」。 ## 导语今天的三条精讲分别站在 AI 全栈竞争的三个不同层面：芯片、协作模式、代码质量。 OpenAI 与 Broadcom 联手把推理芯片的研发周期压缩到九个月，AI 行业的竞争正卷入硬件层。 Anthropic 罕见公开内部协作经验，给「人类与多智能体共享工作台」这种新协作模式立了规矩。另一边，阿里把验证两年的代码评审 CLI 开源即揽星 5k，提醒我们 AI 写代码和 AI 审代码远不是同一种能力。三条精讲合在一起看，正好勾勒出一条完整的链路：底层算力越来越便宜，协作方式从单人变成多人多智能体，但生产出来的代码质量仍需要专门工具来兜底，每一层都在同步进化，缺一不可。速览部分还覆盖了 Flutter 渲染机制、Gemini 3.5 Flash 的计算机操作能力、Qwen 的语言世界模型、Cisco 零日漏洞复盘、智能体记忆构建方法，以及一段 Gemini 对抗 DeepSeek 的幕后故事；补充阅读部分则提供了围绕今天三条精讲的更多一线信源和延伸视角。 ## ★ 精讲一：OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片背景：过去两年，AI 行业的竞争主线一直是模型能力和应用层产品，芯片更多被当作「买来的基础设施」。OpenAI 这次直接下探到芯片设计层，和 Broadcom（NASDAQ: AVGO）联合发布了 Jalapeño——OpenAI 第一款定制 LLM 推理芯片，也是双方多代计算平台合作的第一颗芯片。芯片由 Broadcom 总裁兼 CEO Hock Tan、总裁 Charlie Kawwas 当面交付给 OpenAI CEO Sam Altman 和总裁 Greg Brockman，象征意义大于一次普通的供应商发布会。关键事实：Jalapeño 从设计到流片仅用九个月，团队称这是高性能芯片史上最快的 ASIC 研发周期之一，而这个研发过程本身就由 OpenAI 自家模型加速完成——形成了「用模型设计芯片，再用芯片跑模型」的闭环。芯片围绕 OpenAI 对 LLM 推理需求的深度理解从零设计，设计阶段就充分参考了模型路线图、推理 kernel、服务系统和产品需求，并联合 Broadcom、Celestica 在芯片实现、板级与机柜系统集成、高性能网络、可扩展生产系统等环节实现工业化落地。工程样片已经在实验室以量产目标频率和功耗运行真实负载，包括 GPT‑5.3‑Codex‑Spark。早期测试显示，Jalapeño 的能效比（performance per watt）显著优于当前最先进水平，详细技术报告将在未来几个月公布。架构层面的核心思路是减少数据搬运、平衡计算/内存/网络资源，让实际利用率更接近理论峰值；Broadcom 的芯片实现能力和包括 Tomahawk 网络芯片在内的网络技术，则负责把这套平台真正落地到大规模生产环境，并计划从 2026 年起与 Microsoft 等数据中心伙伴一起以吉瓦级规模部署。OpenAI 硬件项目负责人 Richard Ho 提到，团队围绕对前沿模型最重要的 kernel、内存搬运、网络和服务模式优化架构，让 Jalapeño 在执行最重要的负载时能更接近硬件理论极限；Broadcom CEO Hock Tan 则把这次合作定义为面向未来十年 AI 物理基础设施扩张的「多代路线图的开端」。为什么重要：这标志着 OpenAI 的全栈战略从「模型 + 产品」正式下探到「芯片」这一层，构建出「模型反哺芯片设计、芯片支撑更便宜推理」的飞轮。Brockman 把这称为「计算驱动的经济」——通过自己设计更多层级的技术栈，用更高效率提供更多智能，让先进 AI 的访问成本持续走低，并能被用于解决更重要的问题。对于依赖云端推理成本的开发者和企业来说，这条芯片自研路线如果跑通，意味着未来几年大模型调用价格还有进一步下降空间；而对芯片产业来说，OpenAI 以「模型公司」身份亲自下场定制芯片，本身也是对英伟达等传统芯片供应商话语权的一次结构性挑战。与今日其他精讲的关系：如果说精讲一是 AI 竞争卷入硬件层的信号，精讲三里阿里开源的代码评审 CLI 则提醒我们，硬件红利最终还是要靠软件工程能力消化——芯片更快不代表代码质量自动变好，AI 写代码与 AI 审代码仍是两种需要分别打磨的能力。阅读建议：如果你关注 AI 基础设施和芯片产业链，这篇官方发布值得通读，重点看架构设计思路和量产时间线；如果只关心应用层，知道「推理成本可能继续下降」这一个结论即可，不必深究芯片实现细节。详见：OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 ## ★ 精讲二：Anthropic 关于构建高效人机协作团队的经验 | Claude 背景：过去和 AI 协作基本是「一人对一个聊天窗口」的单机模式——一个人面对一个智能体完成单点任务。随着智能体能处理编码、研究、财务分析这类复杂长周期工作，使用形态也在变化，但本质上仍是「单人」体验。Claude Tag 这类工具的发布打破了这个边界：人类和智能体现在可以共处同一个工作空间，为团队共同目标协作，工作形态从「单机游戏」变成了「多人游戏」——人类团队设定策略，Claude 执行具体工作。关键事实：Anthropic 在文章中把能与多个不同人类同时协作的 AI 模型称为「多智能体（multiplayer agents）」。这类智能体需要三项基础能力：持久记忆（记住目标并据此调整执行）、不绑定个人的独立身份凭证（在安全可预期的边界内运作）、对组织信息的持续广泛访问权限（理解组织运作方式并据此行动）。文中举了一个具体场景：人类团队和智能体在 Slack 同一个频道里一起分析数据集，智能体能跟进对话上下文、调用工具、给出分析结果，整个过程就像团队里多了一名常驻成员，而不是临时被叫来回答一个问题就消失的助手。但 Anthropic 强调，光有技术基础还不够，团队还需要建立新的工作方式和共同规范，文章总结了四条经验：信息默认公开（团队内部尽量公开透明，因为智能体只能从可搜索的文本——Slack、代码、文档、会议记录——构建对世界的理解，私聊和口头沟通对智能体而言「不存在」，与其逐条决定哪份文档能给智能体看，不如直接设定工作空间级别的安全边界，让信息在边界内对人和智能体一视同仁地流动）；人和智能体各有清晰角色分工，避免责任边界模糊导致互相甩锅或重复劳动；由人类设定北极星目标，智能体负责执行细节，团队设定战略方向，Claude 执行具体工作，这种分工让人类可以专注在更高层的判断上；按可验证程度逐步放权，而不是一开始就给智能体完全自主权——风险越低、越容易验证结果的任务，越适合早期放权，高风险决策仍需人类把关。为什么重要：这是 Anthropic 少见的公开内部协作实践，相当于把「团队级智能体协作」这件事从概念阶段直接给出了一套可复制的治理框架。对正在把 AI 智能体引入团队协作流程的公司来说，这四条经验提供了具体的边界设计参考，而不只是停留在「智能体很强大」的宏观叙事，也回应了很多团队在引入智能体协作时最容易卡住的两个问题——信息要不要全量开放给智能体、放权节奏怎么把控。与今日其他精讲的关系：精讲一讲的是 AI 全栈竞争卷入硬件层，精讲二则是软件协作范式的进化——两者共同指向同一个趋势：AI 正在从「被使用的工具」变成「被设计进组织结构里的协作者」，无论是芯片层还是团队协作层，都需要重新设计底层架构来适配这种变化。阅读建议：如果你的团队已经或准备让多个智能体参与协作流程，这四条经验值得逐条对照自己的实践，尤其是「信息默认公开」和「按可验证程度放权」这两条最容易在落地时被简化掉；如果只是单人使用 AI 工具，可以重点看「信息默认公开」这一条，它对个人知识管理同样有参考价值。详见：Anthropic 关于构建高效人机协作团队的经验 | Claude ## ★ 精讲三：阿里开源 Open Code Review：一周揽下 5k star，更专业的代码评审 CLI 背景：AI 每天生成的代码量已经远超人工评审的承载上限——以前一天 review 几百行,现在动辄几千甚至几万行，代码评审正在成为研发效率新的质量瓶颈。Open Code Review 的前身是阿里集团内部官方 AI 代码评审助手，过去两年在内部服务了数万开发者、识别了数百万个代码缺陷，经过大规模生产验证后被孵化为开源项目，向社区开放。关键事实：文章直接点出了用通用 Agent（比如 Claude Code + Skills）做代码评审的三个常见痛点：覆盖不全（变更较大时 Agent 倾向于「偷懒」，选择性评审部分文件，导致遗漏）、位置漂移（报告的问题与实际代码位置经常对不上，出现行号或文件偏移）、效果不稳定（纯自然语言驱动的 Skills 难以调试，评审质量因提示词的细微差异大幅波动）。这些问题的根源在于纯语言驱动的架构缺乏对评审流程的强约束。Open Code Review 的解法是「确定性工程 + Agent」混合架构：精准的文件筛选（明确哪些文件需要评审、哪些应当过滤，确保重要改动一个不漏）、智能文件打包（把关联文件归并为同一评审单元，每个包作为独立 subagent 任务，上下文互相隔离，超大变更场景下更稳定也天然支持并发）、精细化规则匹配（针对不同文件特征匹配对应评审规则，用模板引擎而非语言模型保证规则匹配的稳定性和可预期性）、外挂的定位与反思组件（独立的评论定位模块和反思模块，系统性提升 AI 反馈的位置准确性和内容准确性），这些「不能出错」的环节全部交给工程逻辑负责的强约束环节；Agent 只负责动态决策和上下文召回这类真正需要推理的部分，包括场景化提示词调优和场景化工具集沉淀。阿里内部数据显示：月活用户 2 万、累计执行 370 万次真实评审任务、用户采纳率超过 30%、有效 AI 评论占比全集团范围内近 80%、评论位置准确率超过 97%。基于 50 个热门开源仓库、200 个真实 PR、覆盖 10 种编程语言、80+ 资深工程师交叉标注的开源评测集显示：Open Code Review 各模型组合准确率在 25%–38% 之间，远高于 Claude Code 的 7%–16%（以 Claude-4.6-Opus 为例，OCR 产出 889 条评论命中 301 个真实问题，准确率 33.90%；Claude Code 产出 5980 条评论命中 435 个真实问题，准确率仅 7.23%）；但 Claude Code 在召回率上更具优势，CC + Claude-4.6-Opus 以 28.90% 的召回率位居所有组合之首，比 OCR 最优组合多发现约 45% 的真实问题，CC + Qwen3.7-Max 和 CC + GLM-5.1 的召回率同样超过 OCR 多数组合，这对安全审计这类「宁可多查、不可遗漏」的场景仍有不可替代的价值。综合 F1 指标，Open Code Review 在准确率与召回率之间取得了更均衡的表现（最优 25.10% vs Claude Code 最优 14.13%），资源消耗也更低（Token 消耗 352K–743K，耗时 1–6 分钟，远低于 Claude Code 的 2,062K–5,664K Token、5–14 分钟）。文章还指出一个有意思的现象：更新的 Claude-4.8-Opus 在两个工具上都表现出「更精确但更保守」的特征，准确率最高但召回率明显低于上一代 Claude-4.6-Opus，说明模型代际升级不一定带来评审效果的全面提升。为什么重要：这组对比数据揭示了一个容易被忽视的事实——AI 写代码与 AI 审代码是两种截然不同的能力，即便是最强的编码 Agent，也需要专业的评审 Agent 来兜底。Open Code Review 团队甚至用 Claude Code 从零以 Go 语言重写了这个开源项目本身，再用 Open Code Review 反过来评审每一次变更，106 次代码变更中累计发现 145 个有效问题，涵盖严重 Bug、安全问题、错误处理不当、命名错误、代码重复、性能问题等多种类型，这个「自证」过程本身就是对工具能力的真实验证。与今日其他精讲的关系：精讲一和精讲二分别讲了 AI 在硬件层和团队协作层的进化，精讲三则把视角拉回最基础的软件工程环节——再快的芯片、再高效的人机协作，最终生产出来的代码质量仍然需要专门的工程化方案去把关，这是当前通用 Agent 普遍存在的短板。阅读建议：如果你的团队已经在用 AI 大量生成代码，这篇文章里「确定性工程 + Agent」的架构思路和评测数据值得细读，尤其是文件打包和定位反思组件的设计可以直接借鉴；如果只是想知道结论，记住一句话即可——通用 Agent 评审代码目前还不如专门工具准，但召回更全，两者可以搭配使用。详见：阿里开源 Open Code Review：一周揽下 5k star，更专业的代码评审 CLI ## 速览 [说好的艺术家呢？—— AI 时代，内容工业的三次死亡与创作者的重生](https://www.bestblogs.dev/podcast/e1238ff) 这是「屠龙之术」作者在 AEIS-AI 娱乐内容产业峰会上一场 40 分钟演讲的录制版本，围绕当前 AI 多模态领域的发展现状展开。文章深入剖析了 AI 如何从素材生产、生产流程、版权归属三个层面接连冲击传统内容工业，并指出创作者唯有放弃旧有的生产者身份、构建全新的价值愿景，依靠人类独有的直觉、品味与信任关系，才能在技术碾压之下实现真正的「重生」，而不是在旧赛道里继续被替代。演讲本身带有明显的行业一线视角，时间线里穿插了多个具体案例，适合从业者对照自己所在的细分赛道判断冲击程度和应对节奏。 [Flutter 底层渲染解析：BuildContext 与 Element Tree 详解](https://www.bestblogs.dev/article/c7c34649) 文章从一句常见的报错「Looking up a deactivated widget's ancestor is unsafe」讲起，深入剖析 Flutter 内部的三棵树结构——Widget Tree、Element Tree、RenderObject Tree——以及 BuildContext 究竟是什么、setState 调用之后框架内部到底发生了什么。比起照搬 Stack Overflow 答案，这篇文章更适合想真正理解 Flutter 渲染原理、从根上修复上下文相关错误的开发者。 [在 Gemini 3.5 Flash 中推出计算机操作功能](https://www.bestblogs.dev/article/16a75c47) Google 宣布计算机操作（computer use）现已成为 Gemini 3.5 Flash 的内置工具，此前这项能力只在独立的 Gemini 2.5 computer use 模型中提供。Gemini 在函数调用和搜索/地图等内置工具调用上本就表现不错，这次原生整合计算机操作能力之后，开发者可以直接用主力 Flash 模型构建能与浏览器、移动端、桌面环境交互的智能体，不再需要额外接入专门模型，开发链路更简洁。 [Qwen-AgentWorld 开源：让 Agent 学会“先预测，再行动”](https://www.bestblogs.dev/article/8810d85f) 通义实验室开源了 Qwen-AgentWorld，号称首个原生语言世界模型——核心思路是让 Agent 不再只在真实环境里反复试错（搭建沙箱成本高、危险操作可能直接搞崩环境），而是先学会「预测环境会发生什么」。环境建模从继续预训练阶段就作为训练目标，贯穿 CPT、SFT、RL 全流程，而不是对通用大语言模型的事后适配；单一模型同时覆盖 MCP、Search、Terminal、SWE 等文本类环境与 Web、OS、Android 等 GUI 类环境，实现跨领域知识迁移，在 AgentWorldBench 上超过了 GPT-5.4 等前沿模型。文章还展示了可控模拟和跨任务泛化两种应用范式，适合关注 Agent 训练方法论演进的读者。 [Cisco SD-WAN 管理器零日漏洞遭利用获取 Root 权限全过程](https://www.bestblogs.dev/article/bcfc7fba) Mandiant 详细复盘了一起真实攻击事件：威胁行为者在拿到某服务商的 SD-WAN 基础设施初始访问权限后，利用 Cisco Catalyst SD-WAN Manager 中的零日权限提升漏洞 CVE-2026-20245，通过文件上传功能缺乏校验的缺陷，把一个受限的管理员账号一路提权到 root 权限。拿到 root 之后，攻击者并未止步于横向移动，而是进行了大量针对性的反取证清理，试图抹去入侵痕迹，这也增加了事后溯源的难度。这篇分析对安全团队理解真实世界的零日利用链条、文件上传类漏洞的危害边界以及事后取证排查很有参考价值，建议运维和安全团队结合自己的 SD-WAN 部署情况核对补丁状态。 [如何为 AI 智能体构建记忆](https://www.bestblogs.dev/article/35c6d909) LangChain 这篇文章给出了一套构建智能体记忆的结构化方法：通过「捕获、分析、更新」三步循环的闭环，让智能体能从之前的交互中学习，避免用户每次都要重复纠正同样的问题。文章还结合 LangSmith 讲解了具体的可观测性、记忆引擎和上下文管理实现方式，适合正在给自己的 Agent 加记忆能力的开发者参考落地细节。 [40 天不睡、5 人死磕：DeepMind 主管爆料 Gemini 大战 DeepSeek 内幕](https://www.bestblogs.dev/article/87f785ef) 这篇编译自 Gemini 预训练主管 Vlad Feinberg 的播客访谈，讲述了 Gemini 2.0 Flash 背后只有 5 个人的团队、在硅谷和巴黎两地 24 小时倒班、连续 40 天不眠不休训练模型的真实故事，揭开了「顶尖实验室天天搞颠覆性算法」这种想象背后更朴素的工程真相——团队真正的日常是调整编译器和超参数、解决显存溢出、把微调任务硬塞进一堆老旧 TPU 卡里。文章还谈到预训练研究、量化、推理协同设计，以及程序员在 AI 时代应该往哪个方向转型，对关心大模型训练一线工作方式、想了解「干脏活」式工程贡献如何被认可的读者很有意思。 ## 补充阅读 [GitHub - BrightbeamAI/chap：协作人机交互协议（CHAP）](https://www.bestblogs.dev/article/c077a653)：一个开放协议，专门用于规范人类与 AI 智能体之间结构化、可审计的协作，把人工覆写行为记录为结构化数据，方便追溯决策过程和持续改进提示词，适合关注人机协作协议标准化的读者。 [从表单到 Agent：得物社区活动搭建的 AI 实践之路](https://www.bestblogs.dev/article/16cf7e6c)：得物技术团队分享了把社区活动搭建流程从「填表单」逐步演进到「AI 驱动 + 人工确认」两阶段 Agent 架构的实践过程，包含关键的取舍和架构设计细节，适合做内部工具 Agent 化改造的团队参考。 [超越 CLEAN 与 MVP：在 Android 中构建离线优先的响应式数据层](https://www.bestblogs.dev/article/4f0d0408)：介绍了响应式数据层架构（RDLA），通过强制分离公共 API 数据定义与私有实现数据源，解决响应式 UI 框架与移动端存储限制之间的矛盾，重点是离线优先和去耦同步，适合 Android 架构方向的工程师。 [Greg Brockman 宣布 OpenAI 推出全新 LLM 推理芯片 Jalapeño](https://www.bestblogs.dev/status/2069809298612621629)：OpenAI 总裁本人发布 Jalapeño 推理芯片的第一时间动态，可以作为精讲一官方公告的一线信源补充。 [OpenAI 发布首款 AI 芯片：Jalapeño](https://www.bestblogs.dev/status/2069770172802773292)：OpenAI 官方账号同步发布的芯片公告，与上面 Brockman 的个人动态相互印证，适合想看官方第一反应的读者。 [阿里重磅开源！Open Code Review：一周 5k star，为你的代码保驾护航](https://www.bestblogs.dev/article/ea5f8bff)：另一篇视角介绍 Open Code Review 开源始末，公开了更多评测数据细节和具体使用方式，适合看完精讲三还想了解上手步骤的读者。 ## 今日阅读路径如果今天时间有限，建议按这个顺序读： 1. 精讲三 · Open Code Review —— 信息密度最高，「AI 写代码 vs AI 审代码」的结论对几乎所有用 AI 编程的团队都有直接参考价值。 1. 精讲一 · OpenAI 与 Broadcom 推理芯片 —— 了解 AI 行业竞争正在卷入硬件层这个大趋势，判断未来推理成本走向。 1. 精讲二 · Anthropic 人机协作经验 —— 如果你的团队已经或即将引入多智能体协作，这四条经验能帮你少踩一些治理上的坑。其余内容可以按兴趣挑选：关注移动端开发看 Flutter 渲染解析，关注 Agent 工程看 Qwen-AgentWorld 和智能体记忆构建，关注安全看 Cisco 零日漏洞复盘，关注行业幕后故事看 Gemini 对抗 DeepSeek 那篇。 BestBlogs 是 AI 驱动的私人阅读助手，帮助你发现真正适合你的高质量内容，欢迎体验。

译OpenAI与Broadcom发布首款定制LLM推理芯片Jalapeño，九个月流片，工程样片已跑GPT‑5.3‑Codex‑Spark，能效比显著领先，计划2026年吉瓦级部署。Anthropic公开多智能体协作经验，提出需持久记忆、独立凭证、广泛信息访问，总结信息公开、角色分工、人类定目标、按可验证程度放权四条规范。阿里开源内部代码评审CLI——Open Code Review，一周5k星，采用“确定性工程+Agent”混合架构解决覆盖不全、位置漂移、效果不稳定问题。

🚨 AI News | TestingCatalog@testingcatalog · 6月25日60

Google Flow Agent can now use Google Maps Street View grounding to generate images and videos. Only works with US locations at this moment. > "Your Google Flow Agent can now generate images and videos grounded in Google Maps Street View, giving your scenes real-world details and accuracy, whether you are placing characters in a local scene, stylizing a city landmark, or reimagining your favorite neighborhood." > "To use the feature, enable Agent mode and use a named location or a street address in your prompt. This feature is available globally, but currently only for US locations."

译Google Flow Agent 新增 Google Maps Street View 实景锚定功能，支持根据用户提示中的地名或街道地址，为图片和视频生成提供真实世界细节。用户需启用 Agent 模式并在提示词中包含具体地点。目前该功能仅限美国街景位置可用。

elvis@omarsar0 · 6月25日43

This is a cool release from Google. I've started to rely a lot on computer use for agentic loops/long-running tasks, and I'm in need of more capable computer use models while keeping costs low. Not sure about efficiency of Gemini 3.5 Flash, but I appreciate alternatives.

译这是 Google 的一次酷发布。我开始在智能体循环/长时间运行任务中大量依赖计算机使用，并且需要更强大的计算机使用模型，同时保持低成本。不确定 Gemini 3.5 Flash 的效率如何，但我感谢有替代方案。

Perplexity@perplexity_ai · 6月25日65

Introducing Computer for Counsel. Computer now connects the research databases, document tools, and matter-management systems lawyers use every day. Pull citable sources from @midpageAI, @LegalZoom, @Docusign, @netdocuments, and more. Available for all Pro and Max subscribers.

译推出 Computer for Counsel。 Computer 现在连接了律师日常使用的研究数据库、文档工具和案件管理系统。可从中提取可引用来源：@midpageAI、@LegalZoom、@Docusign、@netdocuments 等。所有 Pro 和 Max 订阅用户均可使用。

🚨 AI News | TestingCatalog@testingcatalog · 6月25日66

Google released Computer Use capability for Gemini 3.5 Flash, scoring 78.4 on OSWorld-Verified. > Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks.

译Google 为 Gemini 3.5 Flash 新增 Computer Use 能力，作为内置工具支持智能体计算机操作任务。该模型在 OSWorld-Verified 基准上取得 78.4 分，为谷歌迄今最佳性能。Computer Use 可跨浏览器、移动和桌面环境推理与执行，自动化工单提交等工作流程。

ViggleAI@ViggleAI · 6月25日60

New game alert: 🎮 VIGGLE SURVIVOR IS LIVE 🎮 Upload your character → stack upgrades → fight endless waves → survive as long as possible. any character. any build. one mission: survive. Try now: https://viggle.ai/games/app/

译新游戏提示： 🎮 VIGGLE SURVIVOR 现已上线 🎮 上传你的角色 → 堆叠升级 → 迎战无尽波次 → 尽可能久地存活。任何角色。任何搭配。一个任务：生存。现在尝试：https://viggle.ai/games/app/

Rohan Paul@rohanpaul_ai · 6月25日48

This is so cool. Tetsuwan is building a browser-based cloud biology lab. Because, AI can now generate hypotheses faster than wet labs can test them - So with Tetsuwan, the researcher uploads or describes a protocol, adds variables like samples, volumes, concentrations, treatments, and instrument settings, and ResearchOS turns that into an editable experiment specification. - That specification is then compiled into a robot-executable automation script; Tetsuwan also says its PDL and VDL languages capture the procedure and variable context, while Ariadne turns the finalized syntax into robot instructions. - Before the run, the user can review and simulate the protocol, then the cloud lab executes it without the researcher physically entering the lab. Software became powerful because instructions could be copied, inspected, rerun, and improved without depending on the hand of the person executing them. Wet-lab biology has never fully had that luxury, but now things are changing.

译AI 生成假设的速度已超过湿实验室验证能力。Tetsuwan 构建了浏览器端云生物学平台：研究者上传或描述实验协议，添加样本、体积、浓度、处理条件、仪器设置等变量，ResearchOS 将其转化为可编辑的实验规范，再编译为机器人可执行脚本（PDL/VDL 语言捕获流程与变量上下文，Ariadne 转为机器人指令）。用户可远程审查与模拟，随后云实验室自动执行，无需进入物理实验室。平台经两年试点验证，今年晚些时候将上线首项服务，聚焦蛋白质设计功能筛选。

Tibo@thsottiaux · 6月25日65

Spicy

译OpenAI 设计并制造了其首款 AI 芯片：Jalapeño。该芯片由 OpenAI 从零设计，与 Broadcom 合作量产，专为支撑 ChatGPT、Codex、API 及未来智能体产品的大语言模型工作负载而打造。芯片是 AI 经济的基础，自研芯片扩展了 OpenAI 从产品到模型再到基础设施的全栈平台，将助力扩展智能、服务更多人、并扩大 AI 的可及性。主推文：「劲爆。」

🚨 AI News | TestingCatalog@testingcatalog · 6月25日66

ClickUp has launched Brain², a complete relaunch of ClickUp Brain, making it a more context-aware AI coworker that can act across the entire workspace. > Users can run all of the best frontier models under the same subscription > All models offer a full company context > Brain picks the best model for each step and can switch mid-task > With full access to tasks, docs, and connected apps The second brain for our org 👀

译ClickUp 发布 Brain²，完全重造其 AI 大脑，使其成为可跨整个工作区行动的上下文感知 AI 同事。用户可在同一订阅下运行所有前沿模型，所有模型具备全公司上下文。Brain 可为每一步自动选择最佳模型，并能在任务中切换。引用显示，团队已接近 5:1 智能体与人员比例，采用 token 节省策略，并利用流程挖掘智能体处理每天约 10 万条活动项。Brain² 会基于实时上下文和用户反馈动态重写系统提示，实现个性化 AI。

AYi@AYi_AInotes · 6月25日51

宇树科技是真敢要价啊，花$4900买个能跳街舞翻跟头的的机器人😂

Luma@LumaLabsAI · 6月25日64

Luma Connectors is live. Your tools come in. Your work goes further. Plug Airtable, Dropbox, Google Drive into Luma. Pull files into any board, on demand. Try it → http://lumalabs.ai/app

译Luma Connectors 已上线。你的工具接入，你的工作走得更远。将 Airtable、Dropbox、Google Drive 接入 Luma。按需拉取文件到任意看板。试试看 → http://lumalabs.ai/app

Rohan Paul@rohanpaul_ai · 6月25日64

Genspark just launched Genspark Design. Turns rough prompts into editable UI, posters, videos, HTML animations, and working code through Claude Opus 4.7. The point is that it treats design as a reusable system, not a one-off image, so logos, colors, typography, spacing, and components can be saved once and applied across new assets. the most useful idea here the is layered output, where text, images, backgrounds, and components stay separate, so users can revise the design itself instead of asking the model to regenerate everything. One prompt or brief can become a UI prototype, social kit, landing page, animation, or video, while keeping the parts editable rather than flattened into a pretty dead end.

译Genspark 推出 Genspark Design，由 Claude Opus 4.7 驱动。用户可将粗糙提示词转化为可编辑的 UI 原型、海报、视频、HTML 动画和工作代码。设计作为可复用系统，支持保存 Logo、颜色、字体、间距和组件并跨资产应用。核心是分层输出：文本、图像、背景、组件保持分离，用户可直接修改设计本身，无需要求模型重新生成。支持上传 Figma 文件或保存设计，一键生成可交付代码（基于 Genspark Code），无需设计背景即可使用。

Berryxia.AI@berryxia · 6月25日57

兄弟们，Google 现在只能玩别人玩剩下的了！能成吗？ Google Gemini桌面版要直接入侵macOS了。新功能“Speak to Window”让你在任意窗口按住fn键，对着Gemini说话就能让它帮你写邮件、写文档、生成图片，而且是直接在你当前的应用里操作。另一个“Magic Pointer”则允许你圈选屏幕上任意信息，然后让Gemini理解上下文并执行编辑、总结或创建任务。这已经不是简单的聊天工具了，把Gemini变成系统级的上下文感知助手。它能看到你正在看的任何窗口内容，并根据你的语音指令直接行动。 Google这次明显在加速把大模型推向桌面操作系统层，试图和Apple Intelligence、以及各种第三方agent工具抢占工作流入口。

译Google Gemini桌面版新增两大功能：Speak to Window允许用户在任意窗口按住fn键语音指挥Gemini写邮件、写文档、生成图片，操作在当前应用内完成；Magic Pointer可圈选屏幕信息，让Gemini理解上下文后执行编辑、总结或创建任务。目标是把Gemini变成系统级上下文感知助手，抢占工作流入口。

xAI@xai · 6月25日47

Use the official @MongoDB plugin in Grok Build to query data, optimize indexes, and manage databases.

译在 Grok Build 中使用官方 @MongoDB 插件来查询数据、优化索引和管理数据库。

Greg Brockman@gdb · 6月25日64

Introducing Jalapeño — designed from scratch for LLM inference over nine months, accelerated by our models. Perf per watt looking incredible.

译OpenAI 联合 Greg Brockman 正式推出其首款 AI 芯片 Jalapeño，专为大语言模型推理任务从头设计，历时九个月。芯片已与 Broadcom 合作投入量产，将加速 ChatGPT、Codex、API 及未来智能体产品。Jalapeño 利用 OpenAI 自身模型进行加速，官方称其每瓦性能“令人难以置信”。这标志着 OpenAI 从产品到模型再到基础设施的全栈平台扩展，旨在规模化智能并扩大 AI 可及性。

🚨 AI News | TestingCatalog@testingcatalog · 6月25日31

As a part of the "Speak to Window" feature, Gemini desktop app will also get a "Magic Pointer", showcased earlier by Google. > Give Gemini the full picture: Help Gemini understand your goals from anywhere on your screen. Just highlight info in any open window, then tell Gemini what to edit, summarise or create.

译Gemini 桌面应用（macOS）将新增两项功能：一是 "Magic Pointer"，用户可高亮任意窗口中的信息并指示 Gemini 编辑、总结或创建内容；二是 "Speak to Window" 语音听写功能，按住 fn 键即可用语音让 Gemini 起草邮件、撰写文档、生成图像等，无需切换应用。

elvis@omarsar0 · 6月24日48

Obsessed with our new /learn skill. It's my favorite way of learning and researching topics. The agent creates a learning plan and a learning hub (artifact) that adjusts per learner needs and progress.

译沉迷于我们新的 /learn 技能。这是我最喜欢的学习和研究主题的方式。该智能体创建学习计划和学习中心（artifact），根据学习者的需求和进度进行调整。

Rohan Paul@rohanpaul_ai · 6月24日65

OpenAI rolls out its 1st chip through a Broadcom tie-up as part of its “build the full stack” push. Jalapeño is an ASIC, so it is less flexible than an Nvidia GPU, but can be cheaper and faster when the workload is known very well. They say "the architecture reduces data movement and balances compute, memory, and networking resources to achieve realized utilization much closer to theoretical peak performance." Overall better performance per watt. Jalapeño also signals OpenAI’s shift from buying compute to shaping the whole stack: models, software, servers, networks, and now silicon. There was a 9-month tape-out, means OpenAI and Broadcom finalized the chip design and moved it to manufacturing unusually fast for advanced AI silicon. OpenAI says its own models helped speed up parts of the design work.

译OpenAI与Broadcom合作推出首款自研AI芯片Jalapeño（ASIC），专为ChatGPT、Codex、API及未来AI智能体产品的LLM工作负载设计。在已知工作负载下，Jalapeño比NVIDIA GPU更便宜、更快，通过减少数据移动、均衡计算/内存/网络资源实现更接近理论峰值的实际利用率，能效更优。该芯片从设计到流片仅用9个月，OpenAI自己的模型加速了部分设计工作。这标志着OpenAI从购买算力转向构建完整堆栈（模型、软件、服务器、网络、芯片）的战略转变。

Runway@runwayml · 6月24日57

New in Runway, you can now localize ads. One image in, any language out. Input a single ad and get a version for every market. All with a single click.

译Runway 新功能，现可本地化广告。一张图片输入，任意语言输出。输入单一广告，即可获得适用于每个市场的版本。全部一键完成。

AYi@AYi_AInotes · 6月24日61

所有人都以为OpenAI的护城河是AI大模型，今天他们证明了，真正的胜负手在硅片里。和博通合作，九个月从设计到流片，首款自研AI芯片Jalapeño，专门面向大模型推理。不做训练，只负责用户对话时的响应计算，每瓦性能，明显优于当前最先进水平。有几个反常识的结论跟大家分享，第一个反常识，为什么先切推理，不做更酷的训练芯片。训练是一次性烧钱，烧完就结束，推理是每天几亿用户持续消耗，是真正的成本大头。把推理成本打下来三成到五成，规模上来就是天文数字的利润，这其实是最务实的商业选择。第二个反常识，九个月流片意味着什么，传统高性能芯片，两到三年才是正常设计周期。他们用大模型，辅助设计跑大模型的芯片。 AI造AI硬件的自循环一旦跑通，整个半导体的迭代速度，都会被彻底改写。最本质的战略意图是 OpenAI不想再当英伟达的超级客户了，他们要走全栈路线，从硅片到模型到产品全部自控，说白了谁掌握底层算力，谁就掌握定价权和利润空间。模型权重很重要，算力的话语权同样致命。以前是人类造硬件，硬件跑AI，以后是AI辅助人类造更好的硬件，硬件再跑出更强的AI，这个自增强的循环，才是真正的奇点序章。

译OpenAI与博通合作，九个月内完成首款自研AI芯片Jalapeño的设计到流片。该芯片专为大语言模型推理场景打造，用于ChatGPT、Codex、API及未来智能体产品，每瓦性能优于当前最先进水平。推理成本可降低30%–50%，为日常持续消耗大头。传统芯片设计周期2–3年，Jalapeño通过AI辅助设计跑通“AI造AI硬件”自循环。OpenAI意图走全栈路线，摆脱对英伟达依赖，掌握底层算力定价权。

🚨 AI News | TestingCatalog@testingcatalog · 6月24日32

GOOGLE 🔥: Gemini desktop app for macOS will get a new voice dictation feature called "Speak to Window" that works with any other app. > Create with just your voice: Meet Speak to Window. Hold the fn key in any open window and tell Gemini what you need. Watch it draft emails, write docs, and create images right where you're working. Gemini Voice Keyboard 👀

译GOOGLE 🔥: Gemini 桌面应用（macOS）将新增名为 "Speak to Window" 的语音听写功能，可在任意其他应用中使用。

OpenRouter@OpenRouter · 6月24日65

Introducing a new, dedicated Image API, including typed dynamic capabilities. Unified access to 30+ image gen models from 8 providers: Google, OpenAI, Black Forest Labs, Recraft, ByteDance, Sourceful, Microsoft, and xAI Plus, a new solution to image API heterogeneity👇

译推出全新专用图像 API，包含类型化动态能力。统一访问来自8家提供商的30+图像生成模型：Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft 和 xAI。此外，还提供针对图像 API 异构性的新方案👇

Chubby♨️@kimmonismus · 6月24日55

Absolutely insane: "Jalapeño was co-developed from initial design to manufacturing tape-out in just nine months, and the custom AI accelerator program represents what we believe to be the fastest ASIC development cycle ever achieved in high-performance advanced semiconductors." ChatGPT helped design the chip so they could reach 9 months of developement cycle "If AI can help engineers design better chips faster, it can lower the cost of compute across the industry and help democratize access to advanced AI."

译OpenAI 推出首款自研 AI 芯片 Jalapeño，专为 LLM 推理从零设计。从初始设计到流片仅用 9 个月，ChatGPT 参与了芯片设计，堪称高性能先进半导体领域最快的 ASIC 开发周期。该芯片由 Broadcom 和 Celestica 代工，针对 ChatGPT、Codex、API 及未来 Agent 产品的实际负载优化。早期样片已在实验室达到目标频率和功耗，成功运行 GPT-5.3-Codex-Spark 等 ML 负载；性能功耗比显著优于当前 SOTA，详细基准后续公布。部署计划于 2026 年底启动，战略上旨在减少对外部 GPU 依赖，加强对算力经济的控制。

小互@xiaohu · 6月24日48

字节跳动几乎是在所有AI领域都达到了临界点刚试了下他们新的 AI 音乐模型 SeedMusic 1.0 Preview 一句话生成了一首完整的歌曲，而且速度还很快，大概2-3分钟，效果还真是挺不错的... 提示词：来一首古风歌曲，但是有着现代流行音乐的节奏感，能让人朗朗上口，关于爱情的歌曲

译字节跳动推出 SeedMusic 1.0 Preview AI 音乐模型，用户只需一句话提示词即可生成完整歌曲，生成速度约 2-3 分钟。示例提示词为“来一首古风歌曲，但是有着现代流行音乐的节奏感，能让人朗朗上口，关于爱情的歌曲”，效果不错。该模型属于字节跳动在 AI 领域的布局之一。

meng shao@shao__meng · 6月24日66

OpenAI 发布首款自研推理芯片 Jalapeño OpenAI 联合 Broadcom（和 Celestica）从零设计了一款专为 LLM 推理优化的加速器 Jalapeño，9 个月完成流片，宣称能效显著优于当前 SOTA，计划 2026 年底起以吉瓦级规模部署——这是 OpenAI 把"全栈"延伸到芯片层的标志性一步。为什么 OpenAI 要造芯片？官方用了 "full-stack advantage"（全栈优势）和一个飞轮模型来论证：更好的基础设施 → 更高算力效率 → 更好的训练与推理 → 更强模型 → 更好产品 → 更多使用与收入 → 再投入下一代基础设施。逻辑上是把芯片作为飞轮的最底层杠杆：只有自己掌握芯片架构，才能让内核、内存、网络、调度、产品体验围绕同一目标协同优化。这与 Google（TPU）、Amazon（Trainium/Inferentia）、Meta（MTIA）走的是同一条垂直整合路径——前沿 AI 公司自研推理芯片已成行业共识。对 OpenAI 而言，还有一个直接的商业落点：推理是 AI 触达用户的环节。每一点成本、速度、可靠性的改善，都会直接转化为更快的 ChatGPT 回答、能多走几步的 Codex 任务、更便宜的 API、以及高峰期更稳的访问。

译OpenAI 联合 Broadcom 与 Celestica 从零设计首款自研推理芯片 Jalapeño，9 个月完成流片，专为 LLM 推理优化，能效优于当前 SOTA。计划 2026 年底起以吉瓦级规模部署，用于 ChatGPT、Codex、API 及未来智能体产品。OpenAI 称这是“全栈优势”关键环节，通过自研芯片构建飞轮：更好基础设施→更高算力效率→更好训练与推理→更强模型→更好产品→更多使用与收入→再投入。推理芯片直接改善成本、速度与可靠性，是 AI 触达用户的环节。

🚨 AI News | TestingCatalog@testingcatalog · 6月24日58

OpenAI 🤝 Broadcom OpenAI announced its first AI chip, designed and produced in a partnership with Broadcom. > New SOTA in performance per watt. > OpenAI models were used to accelerate its development. > Will be deployed at gigawatt scale over multiple generations. OpenAI is full stack now 👀

译OpenAI与Broadcom合作推出首款AI芯片Jalapeño，专为ChatGPT、Codex、API及未来Agent产品等大语言模型工作负载设计。该芯片在能效上实现新SOTA，开发过程使用OpenAI模型加速，计划以千兆瓦规模多代部署。此举标志着OpenAI从产品到模型再到基础设施的全栈化。

Chubby♨️@kimmonismus · 6月24日60

OpenAI just unveiled Jalapeño, its first custom AI chip designed from scratch for LLM inference- It is OpenAI moving deeper into the full stack: chips, kernels, memory, networking, racks, scheduling, deployment and product experience. OpenAI has learned from Cerebras-deal what is valuable in specialized inference hardware and is now attempting to translate that lesson into its own controllable platform. Built with Broadcom and Celestica, Jalapeño is optimized around the workloads OpenAI actually runs across ChatGPT, Codex, the API and future agentic products. Early samples are already running ML workloads in the lab at target frequency and power, including GPT-5.3-Codex-Spark. OpenAI says performance per watt should be substantially better than current state of the art, with detailed benchmarks coming later! The strategic angle is obvious: less dependence on external GPUs, more control over compute economics, and a stronger flywheel between models, products, revenue and infrastructure. Deployment is planned to start by the end of 2026.

译OpenAI 推出其首款自研 AI 芯片 Jalapeño，与 Broadcom 和 Celestica 合作构建，针对 ChatGPT、Codex、API 及未来智能体产品的工作负载优化。早期样品已在实验室以目标频率和功耗运行 ML 工作负载，包括 GPT-5.3-Codex-Spark。OpenAI 称每瓦性能显著优于当前最先进水平，详细基准稍后公布。部署计划于 2026 年底启动。此举旨在减少对外部 GPU 的依赖，增强对计算经济的控制，并强化模型、产品、收入与基础设施之间的飞轮效应。

OpenAI@OpenAI · 6月24日63

We’ve designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production with @Broadcom, Jalapeño is purpose-built for the LLM workloads powering ChatGPT, Codex, the API, and future agentic products. Chips are foundational to the AI economy. Building our own expands our full-stack platform from products to models to infrastructure, and will help us scale intelligence, serve more people, and expand access to AI.

译我们设计并制造了首款 AI 芯片：Jalapeño。由 OpenAI 从零设计，并与 @Broadcom 合作投入生产，Jalapeño 专为支撑 ChatGPT、Codex、API 及未来智能体产品的 LLM 工作负载而打造。芯片是 AI 经济的基础。自建芯片扩展了我们从产品到模型再到基础设施的全栈平台，并将助力我们扩展智能、服务更多人、扩大 AI 的普及。