软银宣布在法国投资750亿欧元,旨在打造欧洲规模最大的AI算力设施。该计划旨在利用当地稳定廉价的核电。项目分阶段推进,第一阶段投资450亿欧元,目标是到2031年在法国北部-加来海峡大区建成3.1GW容量,随后再增加2GW,最终形成5GW的AI综合体。敦刻尔克是核心选址,施耐德电气预计参与建设AI基础设施及机器人制造中心。融资是潜在挑战,行业估算显示1GW的AI基础设施成本约为500亿美元,因此软银可能需要依赖大量项目债务和外部合作伙伴。
软银宣布在法国投资750亿欧元,旨在打造欧洲规模最大的AI算力设施。该计划旨在利用当地稳定廉价的核电。项目分阶段推进,第一阶段投资450亿欧元,目标是到2031年在法国北部-加来海峡大区建成3.1GW容量,随后再增加2GW,最终形成5GW的AI综合体。敦刻尔克是核心选址,施耐德电气预计参与建设AI基础设施及机器人制造中心。融资是潜在挑战,行业估算显示1GW的AI基础设施成本约为500亿美元,因此软银可能需要依赖大量项目债务和外部合作伙伴。
据《财富》报道,微软正构建一个“超级应用”,以统一其分散的Copilot产品。此举的背景是付费率低迷:在Microsoft 365近5亿席位中,仅约2000万(不到4.5%)付费使用Copilot。GitHub Copilot是例外,拥有470万付费用户,但正面临来自Cursor和Claude Code的竞争压力。核心疑问在于,产品分散是否是付费率低的主因,抑或单一界面本身难以驱动用户大规模付费。
小米MiMo-V2.5系列近期实现了API降价。其核心支撑是团队对推理系统进行了彻底的工程重构。模型基于Hybrid Sliding Window Attention架构,理论上可将KVCache存储压缩至全注意力模型的约1/7。为将此架构优势落地,团队重新设计了KVCache管理、层级缓存和prefix-cache tree,并深度优化了调度与Prefill/Decode流水线。经真实生产流量验证,有效KVCache容量提升了近5倍,服务端缓存命中率稳定在93%-95%。这些优化与MoE配置调优共同作用,显著降低了长上下文推理成本,从而支撑了本次降价。
Inference Optimizations Behind the MiMo-V2.5 Series API Price Reductions Read the full technical blog: https://mimo.xiao...
Nvidia, Microsoft, and Arm are all teasing Nvidia's new N1X laptop processors https://www.theverge.com/news/940275/nvidi...
When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and...
Every model provider should do it like this, their launch is well organised. It was trivial getting the model setup in f...
Meta正准备迄今规模最大的AI可穿戴设备推进,包括AI项链、更多AI眼镜以及企业服务“Wearables for Work”。其押注下一代AI交互界面不是聊天框,而是具备丰富传感器、能记住会议、总结对话、回答视觉问题并触发操作的AI助手设备。报道的销售目标宏大:2026年下半年销量目标1000万台,年底月活用户目标680万。软件层被视作关键,可将设备销售转化为持续性AI收入。此举背后的财务压力明显:Reality Labs在2026年第一季度录得40.3亿美元运营亏损,营收仅为4.02亿美元,因此Meta亟需将可穿戴设备发展成一个平台,而非又一条昂贵的硬件产品线。
由前 DeepMind 研究员创立的 AI 实验室 Inherent 完成了 5000 万美元的种子轮融资,由 Index Ventures 和 Radical 共同领投,NVIDIA 旗下风投部门 NVentures 参投。创始团队包括 Louis Kirsch、Edward Hughes 和 Tantum Collins。该公司旨在构建能够主动发现新知识的 AI 智能体,其核心理念是实现整个研究组织的“递归自我改进”,使 AI 成为人类研究中的协作伙伴。Inherent 被定位为一家公共利益公司,总部位于伦敦。
We're excited to introduce Inherent, a lab designed from scratch to build AI agents that discover new knowledge. The com...
高盛预测,到 2030 年,由 AI 智能体驱动的模型 token 月度消耗量将激增至 120 quadrillion,较当前增长约 24 倍。核心原因是智能体在完成单次用户请求时,需要进行多轮工具调用、结果检查与修正,导致其 token 消耗量可能达到普通问答的 10 倍甚至 50 倍以上。这一趋势引发了成本担忧,Uber 和 Microsoft 等公司已开始重新评估昂贵的智能体使用方案。报告同时指出,推理成本正以每年 60%-70% 的速度下降,智能体带来的生产力提升与潜在的 token 浪费正成为新的博弈焦点。
路透社报道称,字节跳动正开发自研数据中心CPU芯片,以支持TikTok规模的AI智能体运行。此举受Groq的“语言处理单元”启发,旨在应对当前服务器处理器短缺问题。公司正在测试Arm和RISC-V两种架构,以比较成熟商业设计与可控开放指令集。由于CPU价格季度性上涨10%-35%且供应链延迟,开发自研芯片已成为一项成本与供应链策略,旨在减少对受限外国AI硬件的依赖并降低单次查询推理成本。AI智能体的推理对CPU依赖远大于传统模型,因单个用户请求可能触发多个步骤。据报道,字节跳动可能依赖外部合作伙伴进行芯片设计与制造。
日本银行已获得OpenAI最新模型的早期访问权限,用于网络安全测试。据报道,该模型性能据称与竞争对手Anthropic的Claude Mythos相当。同时,日本三大银行预计将获得Anthropic Mythos的访问权限。这两款前沿AI模型被期望能帮助阻止新型网络攻击,因为它们在检测漏洞方面远优于早期模型。
推文转述一个传闻:有投资人声称Anthropic的Claude模型通过知识蒸馏(Distillation)使用了Kimi和Qwen的成果。作者对此表示质疑,最初怀疑是Cursor工具所为,但对方坚持是Claude的行为。推文提到目前似乎有更多证据支持这一说法,但整体语境表达了对传闻真实性的怀疑和事件本身的“魔幻”感。文中并未提供任何关于蒸馏过程、模型参数或性能提升的具体证据或数字。
Alibaba will become the official and exclusive partner for AI, Cloud Computing Services, and E-commerce of the UEFA Cham...
JUST IN: Anthropic's private valuation has officially surpassed $1,000,000,000,000.00.
Loud and clear. #MSBuild kicks off on June 2.
本期简报要点如下:Anthropic发布了Claude Opus 4.8模型,并宣布完成650亿美元融资,投后估值达到9650亿美元。KogAI展示了其在特定硬件上的性能:使用8块AMD MI300X GPU时处理速度达3000 tokens/s,使用8块NVIDIA H200 GPU时达2100 tokens/s(FP16精度,无推测解码),模型参数为20亿。此外,Datacurve推出了更具挑战性的编程基准测试DeepSWE,旨在更清晰地评估顶尖模型的性能差异。
根据麦肯锡报告,近五分之一的欧洲职业现已要求AI相关技能,这一比例是2023年的三倍多。增长最快的技能是AI流畅度,即在实际工作中应用、提示、管理和核查AI系统的能力。该技能的需求从2023年覆盖的190万员工跃升至2025年的940万,增长了5倍。相比之下,技术性AI技能需求仅增长1.7倍,表明欧洲对AI用户的需求远大于工程师。当前75%的需求集中在计算机、管理和商业金融领域,但已开始向物流、人力资源、合规及技术工种扩散。
Demand for AI-related skills is growing across the European workforce. MGI research shows the share of occupations requi...
NVIDIA 宣布将其四个开放模型系列(Cosmos、Isaac GR00T、Ising、Nemotron)迁移至 Linux 基金会的 OpenMDW-1.1 框架下。此举旨在解决当前开放模型因许可杂乱和附加限制导致的法律审查负担。OpenMDW 框架为模型权重、代码、文档和数据提供了统一的宽松许可证,使得开发者和企业从多次审查简化为一次。这符合 NVIDIA 以算力为核心的业务逻辑,能够促进更多人部署和微调其开放模型。
We're adopting the Linux Foundation's OpenMDW framework across our open model families. This helps make open model licen...
据报道,字节跳动正在开发基于 Groq LPU 架构的自研推理芯片。该架构将模型保存在片上 SRAM 中,跳过了受美国对华出口管制最严格限制的组件——高带宽内存。字节跳动的内存合作伙伴 InnoStar 在台积电的成熟制程节点进行生产,这些节点也处于管制之外。这一系列设计选择均旨在规避美国的限制,而正是同一架构,Nvidia 刚刚花费约200亿美元获得了其授权。
NEW: AI consultant reveals a client accidentally spent $500,000,000.00 in a single month after failing to set employee l...
I've joined the🦞@openclaw Foundation as Chief Architect! Excited to propel the future of agentic computing with @steipe...
@giordanorandone @OpenAI Nah. The only thing that caught us off guard was a bug we discovered last minute. And we decide...
Impressed by Anthropic's customer service. We paid for one year subscription for the team plan. Our org was disabled for...
作者分享使用小米赠送的模型token,对MiMo-2.5-Pro进行实测。其计划将该模型接入自己的AI智能体环境,专门评估其在实际调用场景下的表现,并表示将在后续分享测试结果。
SenseTime高管Lewis Fung表示,香港凭借先进基础设施、多模态基础模型和生态伙伴合作,有条件成为可信AI创新中心。他近日出席数码港与警方智能 policing 联合 AI 实验室启动活动,分享了AI在网络安全、公共安全与智慧城市方面的应用。SenseTime将继续与伙伴合作推动可信AI发展,打造更智慧安全的香港。