6月3日

05:21

SemiAnalysis@SemiAnalysis_

Cerebras做到了业界认为不可能的事：将整个46，225mm2晶圆制成单芯片。如此大面积的硅片缺陷不可避免，因此他们内置了冗余，并采用定制的逐批次光罩来绕过每个不良核心，最终实现了接近100%的可用晶圆率。结果：单片硅片上集成了90万个核心和44GB SRAM，无需封装，无片外跳转。他们并未止步于此，目前正在探索将DRAM晶圆通过混合键合堆叠在上方，以获得更快的更多内存。（1/4） 🧵

产品更新部署/工程

04:55

MiniMax (official)@MiniMax_AI

@togethercompute 团队对 MiniMax M3 生产部署的精彩深度解析。 M3 凭借其 1M 上下文、原生多模态和 MiniMax Sparse Attention，需要在分页解码、索引评分和多模态预处理方面进行大量工作才能实现高效运行。这就是前沿合作的样子🤝。

Together AI: http://x.com/i/article/2061891247762026496

行业动态部署/工程

04:46

Rohan Paul@rohanpaul_ai

Satya Nadella 谈微软 Fairwater 数据中心：一个 AI 超级工厂

在微软 Build 2026 主题演讲中，Satya Nadella 介绍了 Fairwater 数据中心，这是一个为 AI 设计的“超级工厂”。其核心是垂直设计的双层 AI 数据中心架构，允许在三维空间内密集部署机架，在保持 GPU 间低延迟、高带宽网络连接的前提下，实现更高的计算密度，使整个集群更像一台大型 AI 机器。另一大亮点是其极高的冷却效率：冷却系统只需填充一次，实际运行中水耗几乎为零，其年度总用水量约等于一家餐厅的日用水量。这是微软构建“前沿智能生态系统”硬件基础的一部分。

Satya Nadella: Great to be back at Microsoft Build today. For us, it is not about any one piece of technology or even the platform. It ...

Microsoft 产品更新部署/工程

04:09

IT之家（RSS）

从端侧到云端统一加速：英伟达、微软展示 AI 智能体完整部署栈，Fairwater 工厂提前上线

在 Build 2026 上，英伟达与微软展示了覆盖端侧到云端的统一 AI 智能体部署栈。端侧发布了提供 1 petaflop AI 算力与最高 128GB 统一内存的 RTX Spark，以及搭载 GB300 芯片、可本地运行最高万亿参数模型的 DGX Station for Windows。云端，Nemotron 3 Ultra 推理模型上线微软 Foundry，Claude 模型也已在 Azure 的 GB300 系统中原生运行。数据层，微软 Fabric Data Warehouse 内置的 NVIDIA 加速计算使 SQL 执行速度最高提升至 CPU 基线的 6 倍。此外，微软位于威斯康星州的 Fairwater AI 工厂提前上线，并已完成对下一代 NVIDIA Vera Rubin 平台的验证，其推理吞吐量提升最高达 10 倍。

智能体 Microsoft 产品更新端侧

03:56

Replit ⠕@Replit

精选70

宣布与 @Microsoft 的新合作组织现在可以在 Replit 中构建内部工具、工作流或数据仪表板，并直接发布到 Microsoft Fabric，内置安全、身份验证和治理功能。

Microsoft 产品更新部署/工程

推荐理由：对同时用 Replit 和 Microsoft Fabric 的企业来说，这个集成省了一步繁琐的部署工作，把内部工具开发到上线的链路压短了一截，但如果你没用过 Fabric 就不会有感知。

03:09

IT之家（RSS）

微软升级 Windows 365：支持开发者预配置环境、企业级 AI 智能体，新增 32 vCPU 与 GPU 型云电脑

微软在 Build 2026 大会上宣布对 Windows 365 进行重大更新。此次更新推出了预装 VS Code、Git 等工具的 Windows 11 Developer Configuration Image（公开预览版），以加快开发者环境部署。新增 32 vCPU 和 GPU Select 套餐，满足高性能计算与图形工作负载需求。同时，正式发布 Windows 365 for Agents 平台，为企业 AI 智能体提供安全、可管理的专属 Cloud PC 运行环境。此外，Azure Compute Gallery 支持现已可用，Windows 365 Frontline 更名为 Windows 365 Flex。

Microsoft 产品更新部署/工程

03:08

TechCrunch：AI（RSS）

微软发布开源框架 Adaptive Spec-driven Scoring：支持用文本描述创建 AI 评估测试

微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试，用于模型评估与回归测试。

Microsoft 产品更新安全/对齐部署/工程

02:54

ClaudeDevs@ClaudeDevs

精选77

我们为 Claude Platform 添加了一个 CLI，使每个 API 端点都可以从你的终端运行。调用 Messages API，启动 Claude 托管智能体，并将结果直接管道传输到你的 shell。 ant CLI 被使用 claude-api 技能的编码智能体（Claude Code）很好地理解。

Anthropic MCP/工具产品更新部署/工程

推荐理由：Ant CLI 把 Claude Platform 的所有 API 端点都弄进了终端，配合 Claude Code 用很顺手，做 Agent 或脚本开发的可以直接上手玩。

02:34

Tibo@thsottiaux

Codex 日常工作使用中新增大量实用功能。如果你使用商业计划，现在可以托管和分享网站，我们推出了大幅改进的插件和技能以适应广泛的角色，并且你可以在文档、幻灯片、表格等中通过视觉注释向你的智能体提供反馈。

OpenAI 产品更新编码部署/工程

02:23

Peter Steinberger 🦞@steipete

很荣幸与微软合作，将 OpenClaw 带入企业！

OpenClaw🦞: "You can run OpenClaw inside your company now." Annoucing our work with @Microsoft to bring OpenClaw to the Microsoft an...

Microsoft 产品更新部署/工程

02:09

IT之家（RSS）

微软为 AI 智能体划清安全边界，为 Win11 发布 MXC SDK

微软在 Build 2026 大会上正式推出 Microsoft Execution Containers（MXC）SDK 早期预览版，旨在为 Windows 及 WSL 上的 AI 智能体提供策略驱动的安全执行环境。该 SDK 提供进程隔离（适用于轻量级编码智能体）和会话隔离（将智能体环境与人类桌面完全隔离）两种核心模式。其未来路线图包括 Micro-VM、Linux 容器以及云端的 Windows 365 for Agents。目前，OpenClaw、NVIDIA OpenShell 等工具已支持集成。同时，微软宣布其多模型智能体扫描工具 MDASH 集成至 Microsoft Defender。

Microsoft 产品更新安全/对齐部署/工程

02:04

OpenClaw🦞@openclaw

精选69

"你现在可以在公司内部运行 OpenClaw 了。" 宣布我们与 @Microsoft 的合作，将 OpenClaw 带入微软和 Windows 生态系统。Claws 现在可以在企业环境中安全运行。

智能体 Microsoft 产品更新部署/工程

关联讨论 1 条

推荐理由：OpenClaw 和微软的合作，让企业终于能在自家 Windows 环境里跑这个 AI Agent，对看重合规与安全的团队来说，这比功能更新更实在。

01:21

SemiAnalysis@SemiAnalysis_

AI服务器定制化浪潮下，ODM厂商迎来新机遇

超大规模云服务商引入多样化的GPU、XPU和CPU芯片，导致AI服务器机架和板卡设计更加多元化。为满足不同客户需求，ODM厂商需要扩大设计团队规模，并增加组装与测试产能。这为ODM提供了接触新客户、拓展客户群的良机。随着AI服务器设计日趋定制化，早期介入与客户信任将成为赢得长期业务的关键。

行业动态部署/工程

01:08

IT之家（RSS）

微软发布"开发者优化版"Win11，进一步拥抱 Linux 并推出 WSL 容器

微软在 Build 2026 开发者大会上发布了面向开发者的 Windows 11 体验优化。核心更新包括将 WSL 容器内置到系统中，提供原生创建和操作 Linux 容器的方式。同时推出了基于 Rust 的 Coreutils for Windows，实现跨平台命令行工具兼容。微软还发布了实验性的 Intelligent Terminal 智能终端。在端侧 AI 方面，推出了更小更快的小语言模型 Aion 1.0 Instruct（将开源）以及 140 亿参数、上下文长度 32K 的 Aion 1.0 Plan 推理模型。硬件上发布了搭载 NVIDIA RTX Spark 的 Surface RTX Spark Dev Box，以及可本地运行 1 万亿参数模型的 DGX Station for Windows。

Microsoft 产品更新安全/对齐端侧

00:45

Claude：Blog（网页）

精选74

Claude Code团队实践：智能体编程如何重塑工程组织与流程

在Code w/ Claude SF 2026活动上，Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括：规划转向即时（JIT）模式，强调快速原型与反馈；上下文收集变为“先问Claude”；代码审查中Claude处理风格与测试，人工专注于法律、安全等专业判断。新范式下，工程瓶颈从编写代码转向验证、审查与安全维护。

Anthropic 大佬观点现象/趋势部署/工程

关联讨论 2 条

推荐理由：Anthropic 工程总监把 Claude Code 团队流程全晒了出来，从抛弃半年路线图到代码审查只留专家复审，每一步都反直觉但实战有效，工程领导者直接抄作业。

00:33

OpenAI@OpenAI

同事件精选70

构建应用从未如此简单。通过 Sites，Codex 可以将你的工作、想法和计划转化为一个交互式网站或应用，你的团队可以通过一个 URL 进行探索、使用和分享。该功能将首先向 Business 和 Enterprise 计划推出，之后会更广泛地扩展。

OpenAI 产品更新部署/工程

同一事件，精选展示《Codex 赋能每一种角色、工具和工作流》

推荐理由：Codex Sites 让应用构建门槛降到「描述即生成」，对企业团队快速验证想法是实打实的效率提升，但只开放 Business/Enterprise 意味着个人开发者还得等等。

00:29

OpenRouter@OpenRouter

精选68

⚡ 新增服务商：DigitalOcean 的 AI-Native Cloud 现已在 OpenRouter 上线。提供高性能推理，覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一（数据来自 @ArtificialAnlys）。查看其数据并试用模型：https://openrouter.ai/provider/digitalocean

DeepSeek 产品更新推理部署/工程

推荐理由：OpenRouter 新上线的 DigitalOcean 推理服务，把 DeepSeek V3.2 的延迟压到了全场最低，比官方还快，做实时应用的值得立刻切过去试一下。

00:16

Chubby♨️@kimmonismus

Kombai 2.0 被定位为首个AI设计工程师，旨在融合设计与工程。该工具允许用户在画布内直接生成动画素材，跳过了传统图像生成的中间环节，并能将设计变更同步回代码库。其目标是打破设计和工程分属不同工作流的旧模式，服务于一个设计师能交付代码、工程师寻求无缝集成、所有人都想构建优秀用户体验的新世界。

Dipanjan Dey: Introducing Kombai 2.0 - the first AI design engineer. We keep hearing that AGI is almost here. Still, we're stuck with ...

产品更新编码部署/工程

00:13

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选70

Codex 赋能每一种角色、工具和工作流

OpenAI 的 Codex 新增了插件、站点和注释等功能。这些新功能旨在帮助分析师、营销人员、设计师、投资者等各类团队，利用 AI 完成更多工作。Codex 进一步拓展其作为 AI 编码工具的应用场景，以支持更广泛的角色、集成更多工具并优化现有工作流。

MCP/工具 OpenAI 产品更新部署/工程

关联讨论 5 条

推荐理由：Codex不再只是开发者工具，六个角色插件和Sites功能把AI带进了营销、销售、投资等日常流，非技术团队可以直接上手，这是大企业AI落地的实用一步。

00:08

IT之家（RSS）

孙正义时隔 26 年再成亚洲首富，个人净资产达 1004 亿美元

福布斯实时富豪榜数据显示，软银创始人孙正义个人净资产升至1004亿美元，时隔26年再次成为亚洲首富。这主要源于其近期在法国宣布投资750亿欧元建设AI数据中心，以及软银对OpenAI的累计投资已超640亿美元并持有约13%股权。软银市值近期达49.30万亿日元，超越丰田，成为日本市值最高的公司。同时，软银2025财年归母净利润达5508亿日元，同比增4.7%，创历史新高。

OpenAI 行业动态部署/工程

6月2日

22:51

OpenBMB@OpenBMB

🎉 好消息！MiniCPM-o 4.5 已正式合并至 vLLM-Omni！👏 💡 目前，它支持单工非流式使用--这是未来发展的坚实第一步。 🚀 旅程继续！我们将与出色的开源社区一起，继续推进下一步的双工流式功能集成。敬请期待更强大、更无缝的交互体验。敬请关注！💪 http://github.com/vllm-project/vllm-omni/pull/4067 http://huggingface.co/openbmb/MiniCPM-o-4_5

产品更新开源/仓库部署/工程

22:44

Rohan Paul@rohanpaul_ai

AI驱动预测最便宜安全AWS Spot实例舰队

该研究提出了一种AI驱动的服务，用于在启动前预测最便宜且安全的AWS Spot实例舰队。该服务通过时间感知模型学习AWS创建舰队的模式，并估算9个区域的舰队组合与成本，向用户返回排序后的区域选项。测试显示，在最多1500 vCPU的舰队上，预测结果与AWS完全匹配的比例达92.78%，整体准确率为99.79%，且所有推荐舰队均被AWS接受。关键发现是选择最佳区域比在单个区域内调整策略更重要，潜在成本节省最高可达64%。

数据/训练论文/研究部署/工程

22:21

OpenBMB@OpenBMB

精选67

MiniCPM-V 4.6 现已完全支持 vLLM v0.22.0！无需自定义分支，无需额外编译。只需拉取预构建包即可运行。非常感谢 @vllm_project 的顺畅集成！ 🤝 🤗 http://huggingface.co/openbmb/MiniCPM-V-4.6

产品更新部署/工程

推荐理由：MiniCPM-V 4.6 现在 vLLM 原生支持，不用自己折腾编译和环境了，做多模态部署的可以无痛接入，国产端侧模型生态又往前走了一步。