据知情人士消息,SpaceX IPO已吸引约1500亿美元认购需求,约为计划募资750亿美元的两倍。目前仍处路演早期,预计下周定价。路演材料强调其火箭发射业务的独特性——过去三年全球大部分轨道载荷由SpaceX完成,以及Starlink的增长实力。SpaceX还称AI业务对应市场机会可达23万亿美元,并自认是唯一能利用太空建设AI算力的公司,以弥补美国发电量和计算能力缺口。
"My company did layoffs a few weeks ago. The main metric for productivity is AI usage (% of PRs with AI assistance) and ...
SemiAnalysis 简报预估英伟达 Rubin NVL72 的 SOCAMM 容量从 55TB 降至 28TB,每处理器配 768GB(96GB 模块),美光股价盘中跌超 10%,市值蒸发超 1000 亿美元。市场误读“初始配置下调”:主因是 2026 年 LPDDR5X 供应紧张,且 SOCAMM2 模块可拆卸升级(可换 192GB/256GB)。每颗 Rubin GPU 搭载 288GB HBM4(72 颗共 20.7TB)保持不变。
Simon Willison 发布 alpha 包 micropython-wasm,用于在 Python 应用中安全执行代码。该包将 MicroPython 编译为 WebAssembly,通过 wasmtime 库运行,实现内存和 CPU 限制、严格的文件与网络访问控制,并支持主机函数交互。它可作为 Datasette Agent 的沙箱插件 datasette-agent-micropython。
SpaceX公布文件显示,Google与其签订协议,从2026年10月至2029年6月,每月支付9.2亿美元购买算力,具体包括约110,000个NVIDIA GPU、CPU、内存及其他组件。此前Anthropic也已向SpaceX每月支付12.5亿美元购买算力。两项协议合计每年带来约260亿美元收入。
Claude Code v2.1.166 新增 fallbackModel 设置,最多配置三个后备模型在主模型过载或不可用时按序尝试;--fallback-model 现也适用于交互会话。deny rule 中工具名位置支持 glob 模式("*"拒绝所有工具),未知工具名启动时警告。跨会话消息中继不再携带用户权限,接收方拒绝被中继的权限请求。MAX_THINKING_TOKENS=0、--thinking disabled 及逐模型 thinking 开关可禁用默认开启思考的模型(仅 Claude API,第三方不变)。API 返回非预期不可重试错误时,在后备模型上重试一次。修复了图像处理失败、远程会话卡死、JetBrains IDE 终端闪烁、Kitty 键盘协议下 Shift+非 ASCII 字符丢失、PowerShell 命令验证挂起、macOS 后台进程孤儿化等问题。
同一事件,精选展示《Claude Code v2.1.163 发布》谷歌与 SpaceX 达成云计算合作,自 2026 年 10 月起至 2029 年 6 月,每月向 SpaceX 支付 9.2 亿美元(约 62.46 亿元人民币),租用至少 11 万张英伟达 GPU 及 CPU 等芯片对应的计算能力,用于训练和推理 AI 等高密度场景。该合作既缓解谷歌算力供应紧张与扩容周期压力,也为 SpaceX 的人工智能业务新增重要收入来源,为其 IPO 提供叙事筹码。
CHIAR-Former 是一种 4 层混合 Transformer,根据每个 token 的谱熵将其路由至 DCT 谱混合或全自注意力(RBF 核混合在消融中被拒绝)。仅含 DCT+注意力的变体在 WikiText-103 上获得 Val PPL 36.54,相比全注意力基线(PPL 66.62)提升 45%,同时减少 62.5% 注意力 FLOPs。在 WikiText-2、IMDB 情感分类和 ListOps 上的评估表明,模型在大规模自然文本中因 token 多样性受益,而全注意力在小数据集和合成任务中仍占优势。
该教程演示如何配置Qualcomm AI Hub Models,运行MobileNet-V2推理与YOLOv7目标检测,并在真实设备上完成模型编译。
开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。
Anthropic此前承诺每月向SpaceX支付12.5亿美元GPU算力。Google新披露的云服务协议每月再付9.2亿美元(年化约110亿美元),两家AI实验室合计月付21.7亿美元,年化营收达260亿美元。Alphabet于2015年以约9亿美元入股SpaceX约7%,当前SpaceX目标IPO估值1.75万亿美元,其6.11%股份对应约1070亿美元,投资回报约97-119倍。业务转向显示AI算力正成为战略商品。
SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)SpaceX just quietly amended its S-1 announcing another mega deal $920M/month from Google from October 2026 through June ...
微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic,这是微软剑桥研究院的实验性光学互连技术,采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母,证明概念具备实时响应能力。
Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。
Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。
关联讨论 1 条MarkTechPost(RSS)苹果新版Siri被内部标记为“Beta”版,不会作为完成品宣传;可能设置等待清单供用户尝试。iOS 27细节:通知到达重新设计,通知中心手势移至左上角;“查找”应用视觉重设计;照片“清理”功能改进;大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini,并使用谷歌的NVIDIA Blackwell B200集群处理。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》Cloudflare AI Gateway新增实时消费限制功能,防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成,企业可以使用基于身份的预算和策略管理AI使用成本。
华为云在INSPIRE创想者大会上联合智谱、DeepSeek、MiniMax、Kimi等20余家厂商发布“百模千态,云聚共赢”计划,共建系统化商业生态。同时推出Agentic Infra新范式及四大新品:AICS灵衢智算集群支持10万卡级规模、总算力200EFLOPS、Token生成时延低于10毫秒、千卡吞吐500万Tokens/秒、可用性99.95%;AMS记忆存储方案实现PB级记忆空间并支持KV Cache分层池化;CCE VolcanoNext通智一体化调度引擎提升资源利用率超30%;AgentSphere羽量级沙箱实现100毫秒级启动与每分钟十万级批创能力。
壳牌(Shell)将利用 C3 AI 的智能体(agents),从基础异常检测转向全自动预测性维护。目前壳牌已在上下游运营中使用 C3 AI Reliability Suite 监控超过 30,000 个关键设备,未来将借助 AI 智能体进一步自动化维护流程。
一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。
NVIDIA Dynamo Snapshot 使用 CRIU 和 cuda-checkpoint 工具,在 Kubernetes 上对 vLLM 推理工作节点进行检查点和恢复,实现快速启动。
Stem算法通过Token位置衰减(TPD)和输出感知度量(OAM)两项创新,仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化,支持FP8量化与vLLM的Paged KV Cache,在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速,在8K至256K序列长度上表现一致。
LG集团将引进1万块英伟达Blackwell架构GPU,用于其人工智能转型(AX)计划。这是该集团有史以来最大规模的单次英伟达GPU采购,整体投资预计达数万亿韩元。LG人工智能研究院正持续开发EXAONE系列大语言模型;LG电子推进人形机器人商业化;LG U+作为韩国三大电信运营商之一,也是重要AI云服务供应商。英伟达CEO黄仁勋今日会见了LG集团会长具光谟。
Pinterest 宣布大幅扩展与 AWS 的合作,计划在 2031 年前投入 40 亿美元,扩大对 AWS 定制芯片(包括 CPU 和 AI ASIC)的使用。目前约 1/3 的计算基础设施已运行在 AWS Graviton 系列 Arm CPU 上,未来还将利用 AWS Trainium 托管和运行 LLM / VLM 模型,支持个性化视觉搜索和 AI 辅助发现。首席技术官 Matt Madrigal 表示,深化合作将加速 AI 创新,提升用户体验和广告主效果。
SigmaScale通过学习辅助缩放矩阵S改进基于截断SVD的大语言模型压缩。该方法在激活感知压缩损失下优化两组向量,定义对角行和列缩放变换。学习缩放降低了权重矩阵的有效内在秩(有效秩熵减少),且降低幅度与压缩损失强相关。在Llama 3.1 8B Instruct和Qwen3-8B上的实验表明,SigmaScale在困惑度和零样本基准上与当前最先进SVD压缩方法竞争力相当,在特定任务上表现出优势,成为降低LLM推理计算成本的有效选项。
Meta 在俄亥俄州新奥尔巴尼外搭建 6 座“快速部署结构”帐篷,每座约 11600 平方米,用于容纳数吉瓦级数据中心,建设周期缩短一半。此举借鉴特斯拉 Model 3 量产时的做法,供电则依赖附近 200 兆瓦模块化燃气轮机,思路来自 xAI。Meta 计划数据中心等资本支出最多达 1450 亿美元,股价今年下跌 5%。其最新 AI 模型 Muse Spark 已开发完成,但依赖的 API 多次延期。
阿里云推出SkillClaw与Nacos结合,构建AI智能体技能进化流水线。关键特性:自动从真实对话中提取经验并封装为可复用技能(Skill);Nacos负责集中化版本管理、审核与审计;打破本地孤岛,实现团队安全共享与分发;形成完整的"生成-治理-分发"持续进化闭环。目标是将个人洞察转化为团队的AI资产。
作者开源了一套AI内容创作系统,在Helio平台搭建“选题侦察官”“资料研究员”“改写分发官”等AI同事组成的战队。AI通过@自动接力完成每日信源扫描、资料调研、多平台(X/小红书/公众号)改写分发等流程,作者仅需决定选题和终稿。每位AI配有完整的开源系统提示词,可直接抄搭。系统还具备活动流水记录和每日Dream自我修正能力,让AI记住用户纠正,不再需要重复喂背景。
马斯克在JP摩根炉边谈话中宣布,SpaceX因需部署超10万颗下一代星链卫星及建设轨道AI数据中心,将推进IPO。Starship全复用使发射成本降至仅燃料费,V3目标约100吨,V4超200吨,未来可达每小时一次发射。Starlink V3带宽提升约100倍,延迟减半,卫星如小巴大小,仅Starship可一次发射约50颗。轨道AI数据中心利用太空太阳能,通过激光连接星链。月球将率先建设基础设施,电磁炮可发射AI计算载荷,年功率超1000太瓦。SpaceX同时推进自有芯片(Terafab),轨道平台开放给NVIDIA、Google等芯片,并推出Starshield国家安全服务。
关联讨论 1 条X:cb_doge (@cb_doge)一项系统研究探讨 Transformer 注意力机制中是否必须使用三个独立的投影(Query、Key、Value)。通过分析多种 QKV 变体结构,论文对「三投影」这一设计选择进行了系统性评估。