6月6日

18:31

Chubby♨️@kimmonismus

xAI/SpaceX 正逐渐成为一家 AI 基础设施供应商，可能成为前沿 AI 计算最重要的"新超大规模商"之一。 Grok 不错，但它的用户群仍然相对较小。从这个意义上说，将 Colossus 重新用于出租算力是一个明智之举；该领域的利润率高达 30% 以上。

大佬观点部署/工程

17:17

IT之家（RSS）

SpaceX IPO获约1500亿美元认购，两倍超额认购

据知情人士消息，SpaceX IPO已吸引约1500亿美元认购需求，约为计划募资750亿美元的两倍。目前仍处路演早期，预计下周定价。路演材料强调其火箭发射业务的独特性——过去三年全球大部分轨道载荷由SpaceX完成，以及Starlink的增长实力。SpaceX还称AI业务对应市场机会可达23万亿美元，并自认是唯一能利用太空建设AI算力的公司，以弥补美国发电量和计算能力缺口。

行业动态部署/工程

17:10

凡人小北@frxiaobei

AI使用率是古德哈特定律的又一个经典例子。评估任何一件事情都需要指标，在没有一个更有衡量价值的指标的情况下，大家都选择了一个没那么坏的指标。

Gergely Orosz: "My company did layoffs a few weeks ago. The main metric for productivity is AI usage (% of PRs with AI assistance) and ...

现象/趋势部署/工程

16:17

IT之家（RSS）

英伟达 Rubin 机架内存配置被误读，美光市值蒸发逾 1000 亿美元

SemiAnalysis 简报预估英伟达 Rubin NVL72 的 SOCAMM 容量从 55TB 降至 28TB，每处理器配 768GB（96GB 模块），美光股价盘中跌超 10%，市值蒸发超 1000 亿美元。市场误读“初始配置下调”：主因是 2026 年 LPDDR5X 供应紧张，且 SOCAMM2 模块可拆卸升级（可换 192GB/256GB）。每颗 Rubin GPU 搭载 288GB HBM4（72 颗共 20.7TB）保持不变。

行业动态部署/工程

12:06

Simon Willison 博客

Simon Willison 发布 micropython-wasm：基于 WebAssembly 的 Python 沙箱执行方案

Simon Willison 发布 alpha 包 micropython-wasm，用于在 Python 应用中安全执行代码。该包将 MicroPython 编译为 WebAssembly，通过 wasmtime 库运行，实现内存和 CPU 限制、严格的文件与网络访问控制，并支持主机函数交互。它可作为 Datasette Agent 的沙箱插件 datasette-agent-micropython。

开源/仓库部署/工程

10:25

小互@xiaohu

Google每月9.2亿美元向SpaceX购买算力

SpaceX公布文件显示，Google与其签订协议，从2026年10月至2029年6月，每月支付9.2亿美元购买算力，具体包括约110,000个NVIDIA GPU、CPU、内存及其他组件。此前Anthropic也已向SpaceX每月支付12.5亿美元购买算力。两项协议合计每年带来约260亿美元收入。

Google 行业动态部署/工程

09:07

Claude Code：GitHub Releases（RSS）

同事件精选64

Claude Code v2.1.166 发布

Claude Code v2.1.166 新增 fallbackModel 设置，最多配置三个后备模型在主模型过载或不可用时按序尝试；--fallback-model 现也适用于交互会话。deny rule 中工具名位置支持 glob 模式（"*"拒绝所有工具），未知工具名启动时警告。跨会话消息中继不再携带用户权限，接收方拒绝被中继的权限请求。MAX_THINKING_TOKENS=0、--thinking disabled 及逐模型 thinking 开关可禁用默认开启思考的模型（仅 Claude API，第三方不变）。API 返回非预期不可重试错误时，在后备模型上重试一次。修复了图像处理失败、远程会话卡死、JetBrains IDE 终端闪烁、Kitty 键盘协议下 Shift+非 ASCII 字符丢失、PowerShell 命令验证挂起、macOS 后台进程孤儿化等问题。

智能体 Anthropic 产品更新部署/工程

同一事件，精选展示《Claude Code v2.1.163 发布》

推荐理由：Claude Code 重度用户该升级了，fallbackModel 让你设三个备用模型防止高峰期罢工，跨会话安全加固也让自动模式更敢放任跑了。

09:03

SemiAnalysis@SemiAnalysis_

@makora_ai 的顺序蒙特卡洛推测解码将多个草案 token 并行保持存活，而不是回退失败的匹配。

推理论文/研究部署/工程

08:16

IT之家（RSS）

月付 9.2 亿美元：谷歌租赁马斯克 SpaceX 的 AI 算力，约 11 万英伟达 GPU、CPU 等

谷歌与 SpaceX 达成云计算合作，自 2026 年 10 月起至 2029 年 6 月，每月向 SpaceX 支付 9.2 亿美元（约 62.46 亿元人民币），租用至少 11 万张英伟达 GPU 及 CPU 等芯片对应的计算能力，用于训练和推理 AI 等高密度场景。该合作既缓解谷歌算力供应紧张与扩容周期压力，也为 SpaceX 的人工智能业务新增重要收入来源，为其 IPO 提供叙事筹码。

Google 行业动态部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

CHIAR-Former：明暗注意力--在黑暗中分配计算

CHIAR-Former 是一种 4 层混合 Transformer，根据每个 token 的谱熵将其路由至 DCT 谱混合或全自注意力（RBF 核混合在消融中被拒绝）。仅含 DCT+注意力的变体在 WikiText-103 上获得 Val PPL 36.54，相比全注意力基线（PPL 66.62）提升 45%，同时减少 62.5% 注意力 FLOPs。在 WikiText-2、IMDB 情感分类和 ListOps 上的评估表明，模型在大规模自然文本中因 token 多样性受益，而全注意力在小数据集和合成任务中仍占优势。

arXiv 推理论文/研究部署/工程

06:57

MarkTechPost（RSS）

Qualcomm AI Hub实战教程：使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署

该教程演示如何配置Qualcomm AI Hub Models，运行MobileNet-V2推理与YOLOv7目标检测，并在真实设备上完成模型编译。

教程/实践端侧部署/工程

06:47

Hugging Face：Blog（RSS）

精选74

用Qwen2.5-3B构建多智能体经济体：工程报告

开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体，每个智能体独立运行，通过vLLM部署在Modal，以Gradio为交互窗口。3B模型在100%调用中输出有效JSON，但经济判断能力弱。通过设计稀缺性（食物品种限制、易腐坏、冬季燃料危机）和优化提示词（禁止买入自产物品、给出示例）提升决策质量。15轮模拟中，蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。

智能体 Hugging Face 教程/实践部署/工程

推荐理由：我觉得这是近期最诚实的小模型工程复盘，把为什么不换大模型、怎么靠提示修正推理、怎样设计系统稀缺性讲透了，比看十篇论文有实操价值。

05:29

Rohan Paul@rohanpaul_ai

SpaceX获Anthropic与Google月付21.7亿美元GPU算力，Alphabet持股回报近百倍

Anthropic此前承诺每月向SpaceX支付12.5亿美元GPU算力。Google新披露的云服务协议每月再付9.2亿美元（年化约110亿美元），两家AI实验室合计月付21.7亿美元，年化营收达260亿美元。Alphabet于2015年以约9亿美元入股SpaceX约7%，当前SpaceX目标IPO估值1.75万亿美元，其6.11%股份对应约1070亿美元，投资回报约97-119倍。业务转向显示AI算力正成为战略商品。

Rohan Paul: SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...

Anthropic Google 行业动态部署/工程

关联讨论 1 条

04:59

Rohan Paul@rohanpaul_ai

精选77

SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元（约合每年 110 亿美元），用于 xAI 数据中心的计算能力。这再次表明，AI 算力正成为一种战略性商品，就像发射能力或能源一样，而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司，可能会在其原有业务之外获得巨大的杠杆优势。

Google xAI 行业动态部署/工程

关联讨论 1 条

推荐理由：谷歌每月斥资9.2亿美元租用xAI算力，这已经不只是一份商业合同，而是AI基础设施的定价锚点。算力正在变成战略资源，做云的和做芯片的都该重新估算自己的位置。

04:23

Emad@EMostaque

SpaceX作为最大neocloud，其AI云收入年运行率已达260亿美元，与Google Cloud和AWS相当，正逼近Azure（370亿美元）。据SpaceX修订的S-1文件披露，其与谷歌签署大额协议：2026年10月至2029年6月每月9.2亿美元，双方可提前90天通知终止。Emad Mostaque指出，这一交易规模相当于CoreWeave的整个收入。

Shaun Maguire: SpaceX just quietly amended its S-1 announcing another mega deal $920M/month from Google from October 2026 through June ...

Google 大佬观点部署/工程

04:13

Microsoft Research@MSFTResearch

微软Project Mosaic：micro-LED光学互连技术

微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic，这是微软剑桥研究院的实验性光学互连技术，采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母，证明概念具备实时响应能力。

Microsoft 论文/研究部署/工程

02:30

Chubby♨️@kimmonismus

Gemma 4 QAT 模型发布：本地设备内存需求低至 1GB

Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型，专为本地 / 设备端优化。通过量化感知训练减少内存占用，同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存，纯文本版本甚至低于 1GB，使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。

DeepMind Google 模型发布端侧

01:40

Replit ⠕@Replit

Luca 构建了 Grid，将 12 个不同的 Google Drive 集中到一个中心。借助 Replit，他只需 10 分钟就将一个提示词变成了 AI 驱动的员工中心。现在，团队成员可以询问从座位图到费用政策的任何问题。 Always Be Building.

产品更新部署/工程

01:12

Google Developers Blog（RSS）

精选75

Google Colab CLI 发布

Google 推出 Colab 命令行界面（CLI），允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时，实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本，并检索工件日志或模型（如微调后的 Gemma 3 适配器）。工具可直接集成到标准终端环境，可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。

Google MCP/工具产品更新部署/工程

关联讨论 1 条

推荐理由：对于习惯在 Colab 上薅免费 GPU 的开发者，这个 CLI 把本地开发、远程跑训练这套流程的摩擦降到了几乎为零，而且直接对接 AI agent，实验自动化往前迈了一大步。

01:10

Replit ⠕@Replit

同事件精选68

你试过新的 Replit Canvas 了吗？ - 用 AI 创建美观的 UI 设计 - 使用 GPT-Image 2 & Seedance 生成素材 - 几分钟内将你的设计转化为可发布的应用

OpenAI 产品更新图像生成部署/工程

同一事件，精选展示《Replit Canvas：智能体设计工具发布》

推荐理由：Replit Canvas 把 GPT-Image 2 和 Seedance 直接嵌进 UI 设计流程，让不会画图的开发者也能几分钟出一个看得过去的 App 原型，对非设计师的独立开发者是实打实的效率提升。

00:50

Epoch AI@EpochAIResearch

精选76

AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度，与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%，推动整个计算基础设施占 GDP 比重达到约 1.5%。

行业动态部署/工程

推荐理由：Epoch AI 直接把 AI 算力投资算进了 GDP，占比从 0.4% 窜到 0.8%，翻倍速度超过多数实体产业，这已经不是技术新闻，是宏观分析师必须盯的指标了。

6月5日

23:15

IT之家（RSS）

同事件精选73

苹果新版 Siri 不会被宣传为完成品，内部将其标记为"Beta"版

苹果新版Siri被内部标记为“Beta”版，不会作为完成品宣传；可能设置等待清单供用户尝试。iOS 27细节：通知到达重新设计，通知中心手势移至左上角；“查找”应用视觉重设计；照片“清理”功能改进；大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini，并使用谷歌的NVIDIA Blackwell B200集群处理。

Google 行业动态语音部署/工程

同一事件，精选展示《受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》

推荐理由：古尔曼这料把苹果的策略摊开了，Siri不再死守自研，用谷歌Gemini加英伟达芯片，对追求隐私的苹果是转折点，但标Beta也说明离成熟还远。

22:30

Cloudflare Blog

精选71

你的AI账单失控了。Cloudflare现在可以解决这个问题。

Cloudflare AI Gateway新增实时消费限制功能，防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成，企业可以使用基于身份的预算和策略管理AI使用成本。

产品更新部署/工程

推荐理由：Cloudflare AI Gateway 新加的实时花费限制，直接掐住 token 账单失控的命门，对重度依赖多模型的团队来说，这比任何新模型发布都更实在。

22:15

IT之家（RSS）

华为云联合20余家模型厂商发布"百模千态，云聚共赢"生态合作计划

华为云在INSPIRE创想者大会上联合智谱、DeepSeek、MiniMax、Kimi等20余家厂商发布“百模千态，云聚共赢”计划，共建系统化商业生态。同时推出Agentic Infra新范式及四大新品：AICS灵衢智算集群支持10万卡级规模、总算力200EFLOPS、Token生成时延低于10毫秒、千卡吞吐500万Tokens/秒、可用性99.95%；AMS记忆存储方案实现PB级记忆空间并支持KV Cache分层池化；CCE VolcanoNext通智一体化调度引擎提升资源利用率超30%；AgentSphere羽量级沙箱实现100毫秒级启动与每分钟十万级批创能力。

智能体产品更新部署/工程

20:01

Artificial Intelligence News（RSS）

C3 AI 智能体将帮助 Shell 实现预测性维护自动化

壳牌（Shell）将利用 C3 AI 的智能体（agents），从基础异常检测转向全自动预测性维护。目前壳牌已在上下游运营中使用 C3 AI Reliability Suite 监控超过 30,000 个关键设备，未来将借助 AI 智能体进一步自动化维护流程。

智能体行业动态部署/工程

19:27

MarkTechPost（RSS）

Microsoft Fara 教程：在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体

一篇实践指南，介绍如何在 Google Colab 中运行 Microsoft Fara，使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。

智能体 Microsoft 教程/实践部署/工程

19:27

MarkTechPost（RSS）

NVIDIA AI 发布 Dynamo Snapshot：基于 CRIU 的 Kubernetes AI 推理快速启动系统

NVIDIA Dynamo Snapshot 使用 CRIU 和 cuda-checkpoint 工具，在 Kubernetes 上对 vLLM 推理工作节点进行检查点和恢复，实现快速启动。

开源/仓库推理部署/工程

19:22

公众号：腾讯混元

精选62

腾讯混元提出Stem稀疏注意力算法，被ICML 2026收录

Stem算法通过Token位置衰减（TPD）和输出感知度量（OAM）两项创新，仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化，支持FP8量化与vLLM的Paged KV Cache，在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速，在8K至256K序列长度上表现一致。

开源生态推理论文/研究部署/工程

推荐理由：把稀疏注意力从一刀切升级成按信息流分配预算，算子在Hopper上把理论加速几乎无损转化，3.6倍首字延迟下降不是灌水——做长上下文应用的值得照着开源代码试。

18:15

IT之家（RSS）

消息称LG将引进1万块英伟达Blackwell GPU，为其迄今最大规模

LG集团将引进1万块英伟达Blackwell架构GPU，用于其人工智能转型（AX）计划。这是该集团有史以来最大规模的单次英伟达GPU采购，整体投资预计达数万亿韩元。LG人工智能研究院正持续开发EXAONE系列大语言模型；LG电子推进人形机器人商业化；LG U+作为韩国三大电信运营商之一，也是重要AI云服务供应商。英伟达CEO黄仁勋今日会见了LG集团会长具光谟。

行业动态部署/工程

18:15

IT之家（RSS）

视觉内容社交平台 Pinterest 为 AI 服务导入亚马逊 AWS Trainium 芯片

Pinterest 宣布大幅扩展与 AWS 的合作，计划在 2031 年前投入 40 亿美元，扩大对 AWS 定制芯片（包括 CPU 和 AI ASIC）的使用。目前约 1/3 的计算基础设施已运行在 AWS Graviton 系列 Arm CPU 上，未来还将利用 AWS Trainium 托管和运行 LLM / VLM 模型，支持个性化视觉搜索和 AI 辅助发现。首席技术官 Matt Madrigal 表示，深化合作将加速 AI 创新，提升用户体验和广告主效果。

推理行业动态部署/工程

17:48

HuggingFace Daily Papers（社区热门论文）

SigmaScale：基于SVD低秩分解与学习缩放矩阵的LLM压缩方法

SigmaScale通过学习辅助缩放矩阵S改进基于截断SVD的大语言模型压缩。该方法在激活感知压缩损失下优化两组向量，定义对角行和列缩放变换。学习缩放降低了权重矩阵的有效内在秩（有效秩熵减少），且降低幅度与压缩损失强相关。在Llama 3.1 8B Instruct和Qwen3-8B上的实验表明，SigmaScale在困惑度和零样本基准上与当前最先进SVD压缩方法竞争力相当，在特定任务上表现出优势，成为降低LLM推理计算成本的有效选项。

推理论文/研究部署/工程

15:15

IT之家（RSS）

Meta 借鉴特斯拉，在帐篷里建造数据中心

Meta 在俄亥俄州新奥尔巴尼外搭建 6 座“快速部署结构”帐篷，每座约 11600 平方米，用于容纳数吉瓦级数据中心，建设周期缩短一半。此举借鉴特斯拉 Model 3 量产时的做法，供电则依赖附近 200 兆瓦模块化燃气轮机，思路来自 xAI。Meta 计划数据中心等资本支出最多达 1450 亿美元，股价今年下跌 5%。其最新 AI 模型 Muse Spark 已开发完成，但依赖的 API 多次延期。

Meta 数据/训练行业动态部署/工程

14:22

Alibaba Cloud@alibaba_cloud

阿里云发布SkillClaw与Nacos的Agent技能进化循环

阿里云推出SkillClaw与Nacos结合，构建AI智能体技能进化流水线。关键特性：自动从真实对话中提取经验并封装为可复用技能（Skill）；Nacos负责集中化版本管理、审核与审计；打破本地孤岛，实现团队安全共享与分发；形成完整的"生成-治理-分发"持续进化闭环。目标是将个人洞察转化为团队的AI资产。

智能体产品更新部署/工程

14:22

Alibaba Cloud@alibaba_cloud

🧑🏻💻Meta-Archit Software Technology Limited 正在重新定义团队的工作方式--由阿里云 AI 和 QoderWork 驱动。从数据分析到精美演示文稿只需几分钟。从代码到测试和快速迭代。AI 真正融入你的工作流，而不是反过来。 🔗查看 QoderWork 能为你的团队带来什么 →https://alidocs.dingtalk.com/notable/share/form/v01MAeqxebaRpE8xO8j_5sVCvvv_2TCYzWh?source=link

行业动态部署/工程

14:22

Alibaba Cloud@alibaba_cloud

精选76

PolarDB-X Zero 上线了！无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。原生 HNSW 向量索引--内置兼容 MySQL 的引擎。关系型 + 语义搜索--一条 SQL 语句。 AI 智能体就绪--MCP 协议、AI IDE 兼容（Cursor、Claude、Qoder、Qodex 等）立即尝试：https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB

MCP/工具产品更新部署/工程

推荐理由：PolarDB-X Zero 把分布式数据库、向量索引和 MCP 协议打包成一行 API，30 秒就能跑一个 AI Agent 可用的混合搜索后端，做 agent 开发的可以试一下。

14:19

AYi@AYi_AInotes

开源AI内容创作系统：AI同事自动接力

作者开源了一套AI内容创作系统，在Helio平台搭建“选题侦察官”“资料研究员”“改写分发官”等AI同事组成的战队。AI通过@自动接力完成每日信源扫描、资料调研、多平台（X/小红书/公众号）改写分发等流程，作者仅需决定选题和终稿。每位AI配有完整的开源系统提示词，可直接抄搭。系统还具备活动流水记录和每日Dream自我修正能力，让AI记住用户纠正，不再需要重复喂背景。

智能体教程/实践部署/工程

13:07

DogeDesigner@cb_doge

马斯克在JP摩根炉边谈话宣布SpaceX将因星链和轨道AI数据中心建设而上市

马斯克在JP摩根炉边谈话中宣布，SpaceX因需部署超10万颗下一代星链卫星及建设轨道AI数据中心，将推进IPO。Starship全复用使发射成本降至仅燃料费，V3目标约100吨，V4超200吨，未来可达每小时一次发射。Starlink V3带宽提升约100倍，延迟减半，卫星如小巴大小，仅Starship可一次发射约50颗。轨道AI数据中心利用太空太阳能，通过激光连接星链。月球将率先建设基础设施，电磁炮可发射AI计算载荷，年功率超1000太瓦。SpaceX同时推进自有芯片（Terafab），轨道平台开放给NVIDIA、Google等芯片，并推出Starshield国家安全服务。