xAI与Anthropic在算力运用上呈现出镜像困境。xAI虽拥有全球顶尖的GPU集群,但其模型计算利用率仅约11%,凸显出将硬件转化为有效算力的挑战。相反,Anthropic面临需求远超供给的局面:其Claude收入年化已超300亿美元,百万美元级企业客户在两个月内从500家激增至1000家以上,新增的算力被立即转化为更高的使用限额和收入。这场竞赛的关键已非单纯比拼集群规模,而在于“算力消化效率”——即谁能最快速地将原始计算资源转化为可盈利的产品能力。稀缺资源正从GPU硬件本身,转向这种高效的转化能力。
SenseNova-U1开源了一项8步蒸馏LoRA技术,将扩散模型的生成步骤从100步压缩至8步,使GPU推理时间从23秒大幅缩短至2秒,速度提升达11倍。该技术同时完整支持ComfyUI,并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化,引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论。
🚀SenseNova-U1 Update🚀 ⚡Open-source an 8-step distilled LoRA: 100 NFE → 8 NFE, cutting GPU inference from 23s to 2s 🧩C...
Elon Musk揭示了xAI在孟菲斯建设超算集群时遭遇的严峻电力挑战。为供应约11万块GB300 GPU,团队不得不协调数十台燃气轮机,因许可问题将发电厂迁至密西西比州,并铺设高压输电线路。实际电力需求远超GPU功耗,在孟菲斯极端夏季,冷却系统峰值功耗增加约40%,冗余维护还需20-25%的额外容量,最终需要约330兆瓦的实际发电量。这凸显了前沿AI数据中心的真正瓶颈并非芯片,而是稳定、大规模的电力供应与管理能力。
Elon Musk explains the "series of miracles" xAI had to achieve to bring one gigawatt of power online for its supercomput...
一位自称AI基础设施领域的顶尖专家以激烈言辞回应网络上的行业分析。他宣称自己拥有顶尖的硅片拆解分析能力、超过300次确认的FLOPS/watt与MFU计算经验,并精通KV缓存大小调整等技术。该专家表示,将动用包括NCCL调试日志、NVIDIA DCGM与AMD设备指标导出器遥测数据以及sglang性能分析追踪在内的全部工具,来彻底驳斥关于GB200 NVL72等产品的错误观点,并特别点名批评了关于推理成本的“自作聪明”的LinkedIn帖子。
Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话,将每个会话记录与代理系统提示并行发送给模型,以生成包含任务、行动、问题和评估的摘要,并给出0-100的质量评分。同时,直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后,另一个模型调用会读取所有摘要和统计信息,生成跨会话洞察,包括重复错误、使用模式、效率异常点和成功案例,并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载,所有数值均基于原始事件数据计算,仅文本描述和分类来自模型生成。
刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊! OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。 完全不用联网、不用交月费,还支持131K超长上下文。 日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。 非常适合公司的一些部门使用啊! 以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。 模型直达👉 https://huggingface.co/manjunathshiva/gpt-oss-20b-tq3
A new GPT model just dropped for Apple Silicon. The gpt-oss-20b-tq3 is a 20B parameter MoE text generator, optimized wit...
Anthropic的AI产品Claude本季度增长高达80倍,远超10倍的预期,导致算力严重短缺并出现用户限流与排队。为应对需求爆炸,CEO Dario Amodei紧急签署多项大规模算力协议:与亚马逊达成1000亿美元十年AWS协议,获取新一代Trainium芯片及高达5吉瓦的容量;与博通和谷歌合作开发定制TPU芯片;SpaceX更是将其孟菲斯Colossus 1数据中心的全部22万张NVIDIA GPU开放给Anthropic,并计划共同开发吉瓦级的轨道AI计算能力。这些举措凸显AI需求已远超当前基础设施的扩建速度,全球算力竞赛正在加速。
The most in demand AI product in the world just ran out of compute because it grew 80x in a single quarter (Save this). ...
AI API中转站的核心盈利模式并非依赖微小的token差价,而是瞄准高消耗企业的巨大支出规模及其优化潜力。以法律合同审查产品为例,每日处理数千万tokens,按官方定价年成本可达8.1万美元。通过应用Prompt Caching和Batch处理等优化技术,有效输入成本可大幅降低,年成本能压缩至2.2-3.2万美元。巨大的成本优化空间解释了该赛道激烈竞争乃至价格战的现象。
http://x.com/i/article/2051958484304891904
There is a lot of news about compute being the bottleneck for AI. There is less visibility into the engineering it takes...
马斯克仅用一句“GB300是最好的AI计算机”,便揭示了AI竞争核心已从模型转向算力。他通过SpaceX将旗下全球最大的GB300集群Colossus 1(拥有超22万块顶级GPU)全部容量开放给Anthropic使用,使两大顶尖实验室共享同一计算平台。此举不仅彰显了NVIDIA硬件的统治地位,更展现了马斯克构建的完整商业闭环:自建集群、开放变现、再投资扩建,并规划未来将数据中心送入太空以突破能源与散热限制。这标志着他正从AI参与者转变为算力规则的制定者。
The GB300 is the best AI computer
SpaceX 与 Anthropic 就 Colossus 超算集群达成合作,将 Colossus 1 出租给后者以扩展 Claude 的推理部署能力。此次合作源于埃隆·马斯克与 Anthropic 高层深入接触后,对其安全文化及团队责任感的认可。马斯克评估认为团队具备高度能力与自我批判精神,无人触发其“邪恶探测器”,Claude 很可能对人类有益。合作的关键背景是 xAI 已将训练工作迁移至 Colossus 2,从而释放了 Colossus 1 的算力资源。
Same here. By way of background for those who care, I spent a lot of time last week with senior members of the Anthropic...
Two frontier labs. One accelerated computing platform. Congrats to @SpaceX and @AnthropicAI on the new compute partnersh...
多路径可靠连接(MRC)是一种新型RDMA传输协议,由NVIDIA、微软和OpenAI联合推出,并与AMD、博通和英特尔合作。该协议首先在NVIDIA Spectrum-X以太网硬件上得到验证和优化。MRC的核心创新是改变连接方式,允许单个RDMA数据流利用多条网络路径传输AI训练流量,而非强制每个GPU连接走单一固定路由。RDMA技术使GPU能以极少CPU帮助移动数据,这对于数千GPU在训练中不断交换模型更新至关重要。当网络出现拥塞、链路故障或交换机过载时,流量可自动绕行,无需软件层面修复,从而避免单一不良路径拖慢整个计算集群,保障大规模AI训练任务的高效进行。
Anthropic与SpaceX达成协议,将全面接管原为Grok建造的Colossus 1超算集群。该集群拥有300兆瓦算力和超过22万张顶级NVIDIA GPU。此举使Claude立即获得巨大算力,用户已享受到速率限制提升等服务红利。对马斯克而言,闲置算力得以变现并为SpaceX IPO增添收入;对Anthropic而言,这使其无需等待其他公司的新集群,直接提升了竞争力。双方还计划共同开发太空数据中心,以突破地球的电价、散热等物理限制。此次交易加剧了AI算力竞争,同时降低了企业部署门槛,使普通开发者受益。
Our agreement with @SpaceX means we will use all the compute capacity at their Colossus 1 data center. This will give us...
Our agreement with @SpaceX means we will use all the compute capacity at their Colossus 1 data center. This will give us...
Our agreement with @SpaceX means we will use all the compute capacity at their Colossus 1 data center. This will give us...
Anthropic宣布与SpaceX建立合作伙伴关系,以显著提升其计算能力。公司将获得Colossus 1的全部容量,并在一个月内增加超过300兆瓦的电力及22万块以上NVIDIA GPU。此举直接导致Claude各项服务的用量上限大幅提高:Claude Code的5小时限制翻倍,Pro和Max版本取消高峰时段限制,Opus API的速率限制也急剧提升。其中,Opus API第四层级现已支持每分钟1000万输入令牌和80万输出令牌,表明其目标已转向处理大型智能体工作负载。Anthropic正在构建一个跨NVIDIA、AWS Trainium和Google TPU的多供应商计算堆栈。
We've agreed to a partnership with @SpaceX that will substantially increase our compute capacity. This, along with our o...
Every product team has a 30-line file in their codebase called pick_model.py. Nine if/else branches. Three retry decorat...
SpaceXAI and @AnthropicAI have also expressed interest in partnering to develop multiple gigawatts of orbital AI compute...
Anthropic宣布与SpaceX达成合作,获得原属xAI的超级计算机Colossus 1全部算力(规模超300兆瓦、22万张GPU),并因此同步调高了Claude Code和Claude API的使用限制。Claude Code用户滚动限额翻倍,高峰时段限速取消,Opus系列API速率限制也大幅上调。此次合作源于SpaceX收购xAI后,其训练重心已转向新一代Colossus 2。Anthropic还提及有意与SpaceX共同开发轨道AI算力。这是其近期系列千兆瓦级算力协议的一环,解决了此前瓶颈,故能放开使用限制。
We've agreed to a partnership with @SpaceX that will substantially increase our compute capacity. This, along with our o...
We've agreed to a partnership with @SpaceX that will substantially increase our compute capacity. This, along with our o...
Code with Claude is happening now! ▪︎ 9:00AM - Keynote ▪︎ 10:30AM - What's new in Claude Code ▪︎ 11:15AM - Building on C...
OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。
We've partnered with @AMD, @Broadcom, @Intel, @Microsoft, and @NVIDIA, to release Multipath Reliable Connection (MRC), a...
Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 npx skills add warpdotdev/oz-skills 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区,而非私有化,体现了开放精神。项目 GitHub 仓库已开放,并鼓励社区贡献。
The Warp team uses a lot of Skills to speed up our workflow, so we open-sourced them. > npx skills add warpdotdev/oz-ski...
We've partnered with @AMD, @Broadcom, @Intel, @Microsoft, and @NVIDIA, to release Multipath Reliable Connection (MRC), a...
NVIDIA通过OCP开源了MRC协议,这是一种专为大规模AI训练集群设计的新型RDMA传输协议。其核心创新在于将单一连接分散到多条网络路径上,当某条路径出现故障或拥塞时,能在微秒级时间内通过硬件重路由流量,以解决前沿AI训练中日益严峻的网络瓶颈问题。该协议已应用于OpenAI的Blackwell集群,微软和Oracle也是其主要部署方。NVIDIA此举在表面推动更开放标准的同时,优先为自家Spectrum-X平台优化,实则强化了其全栈竞争优势,并将以太网技术推向传统上由InfiniBand主导的高性能计算领域。
Slack关闭大中华区服务导致历史数据面临丢失,促使人们反思在AI native时代是否仍需传统协作工具。近期涌现的AI原生工作空间普遍试图整合并取代Slack、Linear和Notion的组合功能。其中相对成熟的Tanka提供了团队沟通、内置智能体执行任务、调用团队上下文以及连接Google、Notion等外部工具的能力,并支持从Slack迁移。
NVIDIA与Span计划利用家庭未充分利用的电力容量,将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点,并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证,目标是从2027年起实现年容量超过1吉瓦的分布式算力网络,同时为参与家庭降低电费成本。