http://x.com/i/article/2061891247762026496
在微软 Build 2026 主题演讲中,Satya Nadella 介绍了 Fairwater 数据中心,这是一个为 AI 设计的“超级工厂”。其核心是垂直设计的双层 AI 数据中心架构,允许在三维空间内密集部署机架,在保持 GPU 间低延迟、高带宽网络连接的前提下,实现更高的计算密度,使整个集群更像一台大型 AI 机器。另一大亮点是其极高的冷却效率:冷却系统只需填充一次,实际运行中水耗几乎为零,其年度总用水量约等于一家餐厅的日用水量。这是微软构建“前沿智能生态系统”硬件基础的一部分。
Great to be back at Microsoft Build today. For us, it is not about any one piece of technology or even the platform. It ...
在 Build 2026 上,英伟达与微软展示了覆盖端侧到云端的统一 AI 智能体部署栈。端侧发布了提供 1 petaflop AI 算力与最高 128GB 统一内存的 RTX Spark,以及搭载 GB300 芯片、可本地运行最高万亿参数模型的 DGX Station for Windows。云端,Nemotron 3 Ultra 推理模型上线微软 Foundry,Claude 模型也已在 Azure 的 GB300 系统中原生运行。数据层,微软 Fabric Data Warehouse 内置的 NVIDIA 加速计算使 SQL 执行速度最高提升至 CPU 基线的 6 倍。此外,微软位于威斯康星州的 Fairwater AI 工厂提前上线,并已完成对下一代 NVIDIA Vera Rubin 平台的验证,其推理吞吐量提升最高达 10 倍。
微软在 Build 2026 大会上宣布对 Windows 365 进行重大更新。此次更新推出了预装 VS Code、Git 等工具的 Windows 11 Developer Configuration Image(公开预览版),以加快开发者环境部署。新增 32 vCPU 和 GPU Select 套餐,满足高性能计算与图形工作负载需求。同时,正式发布 Windows 365 for Agents 平台,为企业 AI 智能体提供安全、可管理的专属 Cloud PC 运行环境。此外,Azure Compute Gallery 支持现已可用,Windows 365 Frontline 更名为 Windows 365 Flex。
微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试,用于模型评估与回归测试。
"You can run OpenClaw inside your company now." Annoucing our work with @Microsoft to bring OpenClaw to the Microsoft an...
微软在 Build 2026 大会上正式推出 Microsoft Execution Containers(MXC)SDK 早期预览版,旨在为 Windows 及 WSL 上的 AI 智能体提供策略驱动的安全执行环境。该 SDK 提供进程隔离(适用于轻量级编码智能体)和会话隔离(将智能体环境与人类桌面完全隔离)两种核心模式。其未来路线图包括 Micro-VM、Linux 容器以及云端的 Windows 365 for Agents。目前,OpenClaw、NVIDIA OpenShell 等工具已支持集成。同时,微软宣布其多模型智能体扫描工具 MDASH 集成至 Microsoft Defender。
超大规模云服务商引入多样化的GPU、XPU和CPU芯片,导致AI服务器机架和板卡设计更加多元化。为满足不同客户需求,ODM厂商需要扩大设计团队规模,并增加组装与测试产能。这为ODM提供了接触新客户、拓展客户群的良机。随着AI服务器设计日趋定制化,早期介入与客户信任将成为赢得长期业务的关键。
微软在 Build 2026 开发者大会上发布了面向开发者的 Windows 11 体验优化。核心更新包括将 WSL 容器内置到系统中,提供原生创建和操作 Linux 容器的方式。同时推出了基于 Rust 的 Coreutils for Windows,实现跨平台命令行工具兼容。微软还发布了实验性的 Intelligent Terminal 智能终端。在端侧 AI 方面,推出了更小更快的小语言模型 Aion 1.0 Instruct(将开源)以及 140 亿参数、上下文长度 32K 的 Aion 1.0 Plan 推理模型。硬件上发布了搭载 NVIDIA RTX Spark 的 Surface RTX Spark Dev Box,以及可本地运行 1 万亿参数模型的 DGX Station for Windows。
在Code w/ Claude SF 2026活动上,Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括:规划转向即时(JIT)模式,强调快速原型与反馈;上下文收集变为“先问Claude”;代码审查中Claude处理风格与测试,人工专注于法律、安全等专业判断。新范式下,工程瓶颈从编写代码转向验证、审查与安全维护。
关联讨论 2 条公众号:数字生命卡兹克X:邵猛 (@shao__meng)Introducing Kombai 2.0 - the first AI design engineer. We keep hearing that AGI is almost here. Still, we're stuck with ...
OpenAI 的 Codex 新增了插件、站点和注释等功能。这些新功能旨在帮助分析师、营销人员、设计师、投资者等各类团队,利用 AI 完成更多工作。Codex 进一步拓展其作为 AI 编码工具的应用场景,以支持更广泛的角色、集成更多工具并优化现有工作流。
关联讨论 5 条X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)IT之家(RSS)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)福布斯实时富豪榜数据显示,软银创始人孙正义个人净资产升至1004亿美元,时隔26年再次成为亚洲首富。这主要源于其近期在法国宣布投资750亿欧元建设AI数据中心,以及软银对OpenAI的累计投资已超640亿美元并持有约13%股权。软银市值近期达49.30万亿日元,超越丰田,成为日本市值最高的公司。同时,软银2025财年归母净利润达5508亿日元,同比增4.7%,创历史新高。
该研究提出了一种AI驱动的服务,用于在启动前预测最便宜且安全的AWS Spot实例舰队。该服务通过时间感知模型学习AWS创建舰队的模式,并估算9个区域的舰队组合与成本,向用户返回排序后的区域选项。测试显示,在最多1500 vCPU的舰队上,预测结果与AWS完全匹配的比例达92.78%,整体准确率为99.79%,且所有推荐舰队均被AWS接受。关键发现是选择最佳区域比在单个区域内调整策略更重要,潜在成本节省最高可达64%。
联发科宣布其下一代芯片将独家采用英特尔的 EMIB-T 先进封装技术,取代台积电的 CoWoS 方案。该项目计划于 2026 年第四季度流片,并在 2027 年第四季度进入量产。EMIB-T 技术通过嵌入式硅桥连接组件,旨在降低制造复杂度和成本。英特尔为该工艺设定了 98% 的良率目标,当前验证良率约为 90%。谷歌的下一代 TPU 也在评估采用 EMIB-T。
由中国移动联合产业合作伙伴自主设计的全球首条S+C+L三波段超低损多芯光缆线路在山东青岛建成开通。该线路创新采用四芯光纤结构,实测每公里传输损耗仅0.189dB,纤芯间串扰低于-40dB/100km。技术突破将超低损耗特性从C、L波段拓展至S波段,实现三波段并行传输,单芯带宽提升近50%,单条光纤容量达到传统光纤的5倍以上,可满足AI智算等需求,标志着我国空分复用光纤技术商用化取得关键进展。
2026年美加墨世界杯将部署多项AI技术。阿迪达斯官方用球“Trionda”内置500Hz传感器芯片,每秒采集500次数据,与高速摄像机协同构建三维模型。国际足联将为1248名球员建立AI数字分身,通过3D扫描生成虚拟形象以辅助争议判罚。赛事还将首次推出裁判第一视角直播,并推出Football AI Pro知识助手,可解析逾2000项关键指标。
英伟达宣布其面向智能体AI工厂的下一代超级计算平台NVIDIA Vera Rubin已进入全面量产。作为该平台核心网络组件的Spectrum-X以太网硅光技术也已同步量产,这是全球首款采用光电一体封装(CPO)的以太网交换机。该技术采用200Gb/s SerDes,相比传统网络,能效提升5倍,AI整体正常运行时间提升5倍,部署时间加快1.3倍。Vera Rubin是英伟达第三代旗舰AI架构,其NVL72机柜可实现最高260 TB/s的互连带宽,智能体吞吐量较上一代提升10倍,生产规模扩大2倍。该平台正式出货预计于2026年秋季启动。
在台北电脑展期间,英伟达CEO黄仁勋公开称赞数据中心芯片公司美满电子(Marvell),称其网络和连接芯片对AI基础设施至关重要,并认为美满将成为“下一家万亿美元公司”。受此影响,美满股价在美股盘前大涨25%,其今年以来的累计涨幅已超过158%。此外,英伟达此前已承诺向美满投资20亿美元。
Alphabet正筹集800亿美元以扩展其AI基础设施,其中包含沃伦·巴菲特旗下伯克希尔·哈撒韦提供的100亿美元私人投资。该公司预计2026年资本支出将达到1900亿美元,并表示该数字未来只会继续增长。
技嘉在台北电脑展推出“AI TOP”桌面生态系统,包含三款AI台式整机。其中AI TOP 100 B850工作站采用AMD锐龙9 9950X处理器和128GB DDR5内存,最高可选配RTX 5090 32GB或AMD Radeon AI PRO 32GB显卡,声称至高可运行405B参数大语言模型。AI TOP 100 Z890搭载英特尔酷睿Ultra 9 285K处理器、128GB DDR5内存及RTX 5090显卡。旗舰级AI TOP 500 TRX50则配备24核48线程的AMD锐龙Threadripper PRO 7965WX处理器及最高768GB DDR5内存。
Ling-2.6-flash-base 是蚂蚁 inclusionAI 发布的基础模型,采用闪速规模 MoE 与混合线性注意力架构(7:1 融合 Lightning Attention 与 MLA),总参数量约 104B、激活约 7.4B。模型从 Ling-2.0 检查点改造而来,经约 9.6T token 的迁移预训练、继续预训练和中段训练,上下文窗口从 4K 扩展至 256K。在知识、推理、数学、代码和长上下文基准上相比前代均有提升(如 MMLU 84.13,GSM8K 91.89)。该模型面向研究用途开放,支持继续预训练、微调和蒸馏,未经聊天对齐。
Alphabet to raise $80B from share sales to fund AI spending splurge, Berkshire to invest $10B Very bullish news, as it s...
腾讯云智能体开发平台宣布,自2026年6月3日起下调DeepSeek-V4系列模型的调用价格,其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%,缓存命中价格降幅高达97.5%;DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。DeepSeek-V4系列模型发布于2026年4月,采用混合专家架构,总参数达1.6万亿,支持100万Token上下文长度。本次降价是在DeepSeek官方此前已调价基础上的平台层面调整。
Groq 正在进行新一轮融资。根据Zach Be在Substack发布于2026年6月2日的文章探讨,HN上有101个点赞。
Alphabet计划通过包括承销股票、可转换优先股、Berkshire的100亿美元私募配售以及一个400亿美元的市场发售计划在内的多种方式,募集高达800亿美元资金,主要用于AI基础设施投资。市场将此举视为强烈看涨信号,表明AI发展的关键瓶颈已从需求侧转向计算供给。Berkshire的投资被视为对“耐心资本”的背书,此事件也标志着行业投资逻辑正从追求软件式回报转向对铁路、电网和晶圆厂等瓶颈基础设施的重资产竞争。
JetBrains 发布开源模型 Mellum2。该模型为 12B 参数的 MoE 架构,在 10.6 万亿个 token 上训练,采用 Apache 2.0 许可,专为多模型 AI 流水线中的快速、专用任务设计。
OpenAI通过Amazon Bedrock提供GPT-5.5、GPT-5.4和Codex模型,价格与OpenAI自有平台一致。这些模型可在商业和政府AWS区域运行,但目前使用范围仅限于美国,用量将计入现有AWS合同。
OpenRouter 发布5月更新,推出语音与转录API、模型融合(Model Fusion)功能,并为平台添加了私有模型和企业工作区管控能力。此次更新共上线20个新模型,其中包括 Gemini 3.5 Flash 和 Claude Opus 4.8。
关联讨论 1 条OpenRouter:Announcements(RSS)My talk from AIE Europe is up! Come learn the lessons I learned while shipping real production AI systems. https://www.y...