5月27日

02:11

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选70

Anthropic通过三重机制控制Claude智能体的部署风险，包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面：通过沙箱、虚拟机和网络出口控制限制智能体运行环境；利用系统提示词和模型训练引导其行为；以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例，阐述了不同产品如何设计对应的隔离架构。

智能体 Anthropic 安全/对齐部署/工程

推荐理由：Anthropic 这次没画饼，实打实把 Claude 三款产品两年来的安全坑和架构演变全摊开讲了，从沙箱逃逸到钓鱼攻击，做 agent 的人读一遍能少踩很多坑。

01:00

Xiaomi MiMo@XiaomiMiMo

MiMo-V2.5系列API价格永久降低99%，同步推出新Token计划

MiMo-V2.5系列API价格宣布永久性大幅降低，最高降幅达99%，并统一了所有上下文长度的定价。同时，Token计划升级，用户支付同等价格可获得的可用Token数量增加了5至8倍，计费规则更简单透明。作为对现有用户的回馈，当前所有Token计划额度将被完全重置。MiMo-V2.5-TTS功能限时免费。这些改进源于整个MiMo技术栈的持续推理优化和系统服务效率提升，详细技术博客后续发布。

行业动态部署/工程

00:15

公众号：小米 MiMo

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

MiMo-V2.5 系列 API 永久降价，新定价最高降幅达 99%，不再区分上下文窗口长度，于北京时间 5 月 27 日 0 点生效。Token Plan 计费优化，用量提升至原来 5-8 倍，计费规则更清晰。百万亿 Token 创造者激励计划提前收官，100T Tokens 已全部发放。现有 Token Plan 用户额度于 5 月 27 日 0 点全量重置，按新规则执行。推理优化基于 SGLang HiCache 支持 SWA，KV Cache 搬运量降至近 1/7，可缓存 token 数量提升至近 5 倍。

产品更新推理部署/工程

00:10

Replit ⠕@Replit

在 Replit 上为你的应用添加登录有两种方式： → Replit Auth：零配置，用户使用其 Replit 账户登录 → Clerk Auth：你自己的品牌化登录，开发/生产环境均只需一个提示词。文档和视频见下方 👇 文档：https://docs.replit.com/learn/projects-and-artifacts/auth#auth

产品更新部署/工程

00:01

Hacker News 热门（buzzing.cc 中文翻译）

与前沿实验室相比，外包加本地AI的方案很快将更具成本效益

一项分析指出，通过将任务外包给第三方并结合本地部署的大语言模型（LocalAI），企业或很快能在成本效益上超越仅依赖前沿实验室（如 OpenAI 或 Anthropic）的方案。该观点预测了 AI 服务交付模式的转变。

现象/趋势部署/工程

00:00

Deedy@deedydas

OpenRouter现在每年服务1.5千万亿token！这个token处理量是： - Google API的15-30% - OpenAI的20-40% - 超过Microsoft Azure Foundry的50% 这比我们一年前投资时大了15倍。自2月完成这轮13亿美元融资以来，收入已经翻倍！

OpenAI 行业动态部署/工程

5月26日

23:01

François Chollet@fchollet

开发者生产力难以管理。

Ed Zitron: Uber's COO has said that it's getting "harder to justify" its AI costs because there was no way to show a link between A...

行业动态部署/工程

22:31

Chubby♨️@kimmonismus

Uber在4个月内消耗34亿美元AI预算，微软正全公司范围取消Claude Code许可证，根本原因在于请求与模型之间缺乏路由层。Merge Gateway推出的"构建你自己的路由器"功能，允许团队根据自定义基准测试，将每个请求路由到最适合的模型。正如引用推文所指出的，团队常追逐所谓"最佳"新模型并频繁重新集成，但根本不存在通用的"最佳"模型，只有适合特定产品、用户和用例的模型。该功能由@merge_api提供，前200位评论用户可获得100美元额度。

Shensi Ding: Introducing Merge Gateway - Build Your Own Router. You're three sprints into your coding assistant. You pick the most hy...

MCP/工具产品更新部署/工程

22:27

Emad@EMostaque

本推文认为，人们低估了AI模型发展中"工程规模化"相较于"突破性研究"的重要性。Cursor以远低于大厂的成本运营并追赶上了Anthropic/OpenAI的模型，印证了这一趋势。引用中，xAI的Elon Musk回应称其AI会很棒，并指出xAI仅成立3年，年龄只有Anthropic的一半、OpenAI的四分之一，他誓言将继续努力，并期待3年后的竞争格局。

Elon Musk: What you say is true, but nonetheless our AI will be great. Whether it is the best remains to be seen, but I will never ...

Anthropic OpenAI 大佬观点部署/工程

22:18

OpenRouter@OpenRouter

同事件精选69

今天我们宣布完成由@CapitalGVC领投的1.13亿美元B轮融资。过去6个月，随着AI从实验快速转向生产，OpenRouter的周处理量从5万亿增长到25万亿token。我们对未来充满期待。

行业动态部署/工程

同一事件，精选展示《OpenRouter 获得1.13亿美元B轮融资》

推荐理由：AI路由的头部玩家拿到1.13亿美金，每周调用量从5T涨到25T，这不是PR数字，是AI从实验走向生产的真信号。

20:12

公众号：百度智能云（文心）

百度伐谋2.0赋能排产排程，产能提升20%

百度伐谋2.0产业决策智能体落地排产场景，业务人员用自然语言描述优先级和现场变化（如设备故障、工人请假），系统自动将约束转化为优化模型并迭代求解，将顾问数小时的建模压缩到对话内完成。每次纠偏实时调整方案，隐性经验被结构化沉淀为企业可复用模型。在日均数百订单、十几条产线的大型家具制造企业中，产能提升20%。

智能体教程/实践部署/工程

18:28

X.PIN@thexpin

华为AI芯片：绕过制程限制的扩展路径

华为将不依赖更小制程节点，通过封装与架构创新来扩展其昇腾AI芯片。根据何庭波的论文，华为计划在2025年至2030年间，通过Chiplets、2.5D扇出封装和3D堆叠技术，推进其昇腾SuperPoD系列，具体产品包括2025年的910C、2026年的950及后续的990。约2030年，Ascend 990将引入LogicFolding技术，目标是到2035年实现100倍的集成度跃升。

端侧论文/研究部署/工程

16:00

Alibaba Cloud@alibaba_cloud

AI Key Frames - 直击 Qwen 直播现场。最大的模型不会赢得 AI 竞赛--最快的系统才会。Fireworks AI 工程副总裁云锦解释了为何推理已成为真正的战场，以及云端如何为智能体时代而重建。步入 AI 原生浪潮。 🚀 敬请关注：https://int.alibabacloud.com/m/1000413447/

推理行业动态部署/工程

15:11

IT之家（RSS）

映众推出 NVIDIA MGX 4U GPU 服务器：第六代英特尔至强平台，8 块 RTX Pro 6000 Blackwell

产品更新部署/工程

14:18

AYi@AYi_AInotes

小白零基础教程：Grok Build安装使用指南（专为非技术型SuperGrok及X Premium+用户制作）

这是一条面向非技术用户的 Grok Build 安装与使用教程视频。教程演示了如何通过一行命令快速安装 Grok Build，并展示了如何用它创建真实可用的网站。其核心功能包括：利用 Grok Imagine 自动生成图片与视频，以及支持在多个文件夹中同时运行不同的项目。在使用过程中，Grok 会自动执行所需命令，无需用户具备任何编程经验。该教程由原作者 Daniel_Farinax 制作，以解答朋友们的疑问，并获得了马斯克的转发认可。

Dan: Beginner video: How to install & use Grok Build (made for non-technical SuperGrok and X Premium+ users) I got so many qu...

教程/实践编码部署/工程

11:11

IT之家（RSS）

思特威与紫光展锐合作开发 MicroLED 光互连方案

思特威与紫光展锐达成战略合作，将结合思特威的光电技术与紫光展锐的高速 SerDes 等核心技术，联合研发新一代 MicroLED CPO 光互连解决方案。该方案采用并行架构，单位传输能耗可降至铜缆方案的 5%，旨在解决传统光互连成本高、集成度低、功耗高的痛点。合作目标是为 AI 数据中心算力集群、智能汽车、工业机器人等场景提供高带宽、低功耗的国产化核心方案。

行业动态部署/工程

11:11

IT之家（RSS）

消息称英特尔加码玻璃基板，新墨西哥州工厂瞄准全球首座量产基地

英特尔计划将新墨西哥州里奥兰乔工厂改造为全球首个玻璃基板量产基地，以推进先进封装技术。相比传统有机基板，玻璃基板更平整、不易翘曲，可提升封装密度与芯片互连能力。该工厂占地218英亩，自1980年启用，2021年后转向先进封装，现已成为美国最先进的一体化封装设施，同时也在为外部客户制造硅光子产品。从产能布局看，该工厂比钱德勒的试产线更接近规模化量产。

行业动态部署/工程

11:11

IT之家（RSS）

Perplexity 开源内部安全扫描工具 Bumblebee，助力行业应对软件供应链投毒

开源/仓库部署/工程