松下控股宣布未来三年投入约5000亿日元(约209.23亿元人民币),目标在截至2029年3月的三个财年内将AI基础设施相关业务销售额提升至约1.4万亿日元。社长楠见雄规表示,松下不直接开发AI,但为AI带来的变化提供支撑。其服务器蓄电池、电子零部件、电路板材料和储能系统是AI基础设施关键组成部分,部分此前因特斯拉电池减产而陷入困境的生产基地已改用于生产面向AI数据中心的电力系统。
松下控股宣布未来三年投入约5000亿日元(约209.23亿元人民币),目标在截至2029年3月的三个财年内将AI基础设施相关业务销售额提升至约1.4万亿日元。社长楠见雄规表示,松下不直接开发AI,但为AI带来的变化提供支撑。其服务器蓄电池、电子零部件、电路板材料和储能系统是AI基础设施关键组成部分,部分此前因特斯拉电池减产而陷入困境的生产基地已改用于生产面向AI数据中心的电力系统。
Linq 推出 iMessage Apps,允许开发者在 iMessage 对话中构建交互式迷你应用。用户无需离开聊天即可购物、玩游戏、订机票或支付,不再依赖外部链接跳转。技术实现基于新的 type: "imessage_app" 消息组件,通过 app 对象的 team_id 和 bundle_id 标识渲染扩展,layout 控制静态文本,interactive 标志决定是否显示实时交互卡片。已发送的卡片可通过 /messages/{id}/update 原地更新(仅支持 url、fallback_text、interactive、layout 等参数)。该功能仅限 iMessage 通道,无 SMS/RCS 回退,富交互渲染需接收方安装对应扩展。
针对欧洲石棉污染严重、传统取样送检成本高昂的问题,作者用 TI IWRL6432 BOOST 开发板和 ESP32 搭建了 FMCW 毫米波雷达原型。DSP 链通过混频、距离 FFT 和 MIMO 阵列角度估计,配合 Capon 波束成形获得材料密度谱,再输入 CNN 进行物料表面分类。天线部分用开源电磁仿真工具 openEMS 建模并模拟全链路,仿真结果与实测接近。项目因资金不足未完成,但展示了低成本非接触式石棉检测的可行路径。
AI芯片初创公司Etched近日披露,其芯片已由台积电成功制造,并已获得10亿美元合同订单。公司正与客户测试首批“前沿推理集群”系统,声称比竞品推理更快、成本更低、能效更高。Etched成立于2022年,累计融资8亿美元,最新一轮5亿美元于去年12月完成,投后估值50亿美元。投资者包括VentureTech Alliance、Jane Street等,天使投资人包括Andrej Karpathy、Geoffrey Hinton等。
Anthropic 发布 Claude Science,一款面向科研人员的 AI 工作台,整合数十个数据库、工具与软件包。研究人员可分析文献、执行多步骤分析、生成图表及起草论文。内置 60 多项预配置技能,覆盖基因组学、蛋白质组学与化学信息学;验证代理自动检查引用和计算结果。应用在 macOS 或 Linux 本地运行,通过 SSH 或 HPC 集群连接远程机器,仅向模型发送所需上下文。工作负载可从单 GPU 扩展至数百 GPU,并接入 Nvidia BioNeMo agent 工具包(含 Evo 2、Boltz-2、OpenFold3)。用户可保存自定义流程为可复用技能。Claude Science 以 beta 版面向 Pro、Max、Team 和 Enterprise 用户开放,Anthropic 为最多 50 个研究项目各提供最高 30,000 美元积分,申请截止 2026 年 7 月 15 日。
Agent Development Kit (ADK) for Go 2.0 发布,引入了一类基于图的工作流引擎,用于组合复杂多智能体应用。新版本内置人工参与循环(HITL)编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。统一执行模型后,单智能体应用与复杂图均运行在同一运行时上,简化了遥测与状态持久化。
AWS成立了一个10亿美元的AI前向部署工程师(FDE)新部门。该团队工程师将嵌入客户公司,部署定制化agent系统,注重快速响应和客户自给自足,帮助客户获得可持续的AI技能和工作流。FDE模式由Palantir开创。此前,OpenAI和Anthropic也分别推出了40亿美元和15亿美元的FDE合资企业。
中昊芯英发布新一代全自研 TPU 芯片「须臾」,单芯片混合精度浮点算力 896 TFLOPS,为上一代「刹那」3 倍;8-bit 推理算力 1792 TOPS。单卡功耗 600W,较传统芯片降低 50%。同步推出智算底座「泰则 2.0」,搭载两路 CPU 与 8 片 TPU,混合精度算力 7.168P,整机能耗为传统 GPU 服务器 80%。平台原生支持 PyTorch、vLLM、SGLang 等框架,已完成 Qwen、DeepSeek、GLM 等数十款大模型适配,满足政务、金融等行业安全合规要求。
异步流水线并行消除同步气泡,但梯度陈旧问题限制其应用。PipeDream-2BW调度保证恒定一步延迟,但业界认为该陈旧性下优化不稳定。本文通过实证分析推翻此假设,发现AdamW在一步延迟下退化,而Muon等优化器鲁棒性强。研究进一步提出优化器无关的误差反馈修正以缓解延迟影响。在10B参数模型上的实验表明,所提策略可缩小异步与同步训练的性能差距,展示大规模异步流水线并行的实用潜力。
AMD 公布 MoP 封装版 Versal Premium Gen 2 自适应 SoC,提供至高 32GB 集成 LPDDR5X 内存。MoP 封装可降低至多 60% PCB 面积,并将内存速率从 8533MT/s 提升至 9000MT/s,带宽增加 5.5%,同时简化 PCB 设计缩短上市时间。该产品支持 -40~+100℃ 工业温度,生命周期超 15 年。AMD 计划今年底出样,2027H2 量产出货。
AI Server、General Purpose Server与Edge AI需求升温,晶圆代工产能向AI倾斜。八英寸制程受惠于Power订单增量及台积电、三星减产,产能利用率与代工价格强势拉升。十二英寸成熟制程因台积电减产、Power IC订单强劲、AI排挤及原物料通膨,涨价氛围已形成,部分制程在2026年第二至第三季调涨5-10%,并意图2027年全面调涨。消费电子成本压力下客户协商暂缓2026年下半年涨价,但2027年价格调升仍难以避免。
萤火虫航天“蓝幽灵2号”任务计划2026年末发射,搭载自研奥库拉(Ocula)月球成像系统,英伟达Jetson边缘AI平台将首次在月球轨道运行。传统任务需回传海量原始数据,处理周期长达数周数月;奥库拉在轨运行AI算法,仅传回核心数据,大幅缩短延迟、降低通信成本。同期“埃尔特拉”轨道飞行器将环绕月球执行五年任务,全程搭载奥库拉系统。奥库拉可测绘着陆点、识别钛铁矿等矿物、监控月面动态及追踪空间飞行器。后续任务将升级技术并配套英伟达航天硬件。客户涵盖NASA、美国太空军及太空、矿业、能源企业。
Moondream 推理引擎 Photon 在 NVIDIA B200 上实现约 33ms 近实时 VLM 推理。其利用流水线解码技术,将 GPU 计算与 CPU 任务重叠,消除传统循环中 GPU 空闲等待的“GPU 气泡”,使解码吞吐量提升高达 35%。文章详述三种关键机制:乒乓缓存槽位避免缓冲冲突、前向计算与采样解耦实现受约束解码、以及已结束请求的清理流程(zombies)。
黑石计划未来3~5年在日本AI数据中心领域投资300亿美元,此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期,真正风险是算力短缺而非基建泡沫;谷歌、亚马逊是英伟达潜在挑战者。此外,黑石、阿波罗、博通本月9日成立AI XPV平台,目标2028年向OpenAI、Anthropic等提供超20GW算力,首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。
亚马逊与Anthropic达成新协议,在AWS上运行Anthropic模型时将按Token而非算力付费。由于自身Nova系列竞争力不足,亚马逊大量业务依赖Anthropic模型,包括Alexa购物助手、Kiro编程工具、Quick职场助手。新的收入分享方式为亚马逊支出增加了变量。其高级副总裁Peter DeSantis本月中旬表示,目标到明年推出前沿水平模型。
英伟达宣布,微软在 Microsoft Foundry 平台正式推出托管于 Azure 云服务的 Anthropic Claude 模型。硬件基于 NVIDIA GB300 NVL72 机架,采用 Quantum-X800 InfiniBand 互联。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,核心功能包括提示缓存和扩展思维,支持编程、代理式工作到复杂推理等用例。该服务原生集成 Azure 云控制功能,可将 Claude 模型接入 Azure 生态系统。英伟达还提供了智能体技能和安全智能体工作区参考设计。
Meta 在 ISCA 2026 大会发布自研 Vistara ASIC 方案,通过 CXL 2.0/1.1 规范的 PCIe Gen5 x16 接口将拆机 DDR4 内存桥接到新服务器。每台 MemServer 配备 768GB DDR5 和 256GB DDR4(3:1 配比),单个 ASIC 支持双通道 DDR4 最高 3200 MT/s、最大 256GB。该方案已在数百万台服务器中用于分离式机器学习推理、大数据处理等场景,可将推理服务器数量最多减少 25%,分布式缓存平均延迟降低 29%。
Atoms 是无代码平台,支持零基础设施、多智能体架构并即时连接 GPT 与 Gemini。Sim AI 是开源可视化 AI 智能体工作流工具,提供拖拽画布、80+ 集成及 MCP 支持,可云托管或 Docker 自部署。RAGFlow 是检索增强生成引擎,支持多格式文件建立知识库,连接 LLM(API 或 Ollama),具备检索质量验证。Transformer Lab 是免费开源本地 LLM 与扩散模型工作站,支持下载、对话、图像生成、微调(含 RLHF)、RAG 及嵌入计算。LLaMA-Factory 支持 100+ 模型及 SFT、PPO、DPO、LoRA、QLoRA 等训练方法。
形式化验证的成本和工具已进入可广泛使用阶段,AI消除了编写证明的最大障碍。与仅覆盖有限输入的测试不同,形式化验证通过验证语言(如Dafny、Lean、Rocq)编写属性和代码,由SMT求解器自动检查所有可达状态是否满足规范——例如权限系统的子集不变性,确保派生权限始终是父权限的子集。验证保证是绝对的:只要规范正确,代码在所有状态下都不会违反属性。过去编写证明需要博士级技能且工具缓慢,如今这一门槛正在降低。
Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude API)。即日起可用。
三星和SK海力士计划投资5180亿美元在韩国西南部新建四座内存晶圆厂,另投520亿美元建设HBM封装中心;SK、GS、Naver等企业将在2035年前投资3560亿美元建设AI数据中心。韩国科技巨头合计承诺超9000亿美元应对AI建设引发的全球内存芯片短缺(RAMageddon)。总统Jae Myung Lee称半导体、物理AI和AI数据中心是韩国下一工业时代三轴。三星另行公布十年投资约1.7万亿美元计划,包括光州新建晶圆厂和海南AI数据中心;SK集团宣布约1.4万亿美元中长期路线图,含扩充半导体产能和建设AI数据中心。
从今天起,Claude 模型在 Microsoft Foundry 上正式可用,托管于 Azure 环境,运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,通过 Messages API 调用,支持提示缓存和扩展思考。用户可选择推理处理位置,包括美国数据区域,由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制,并获得统一账单;符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。
数据中心液冷系统的冷却液若细菌滋生会导致堵塞,需停机数小时冲洗,单次损失达数百万美元。Omen AI 开发微型光谱仪,实时监测冷却液中的细菌生长,并检测铜、铬等磨损颗粒以预警泵体或密封件故障,替代传统送样检测。公司今日宣布完成 3100 万美元 A 轮融资,由 Nava Ventures 领投,CRV、Vanderbilt University、Mann+Hummel 等跟投。Omen AI 由 Zach Laberge 于 2024 年创立,已与十余家数据中心客户合作,包括使用 AMD 芯片的 AI 计算云公司 TensorWave。
RedKnot 将 KV Cache 沿注意力头维度拆解,通过头分类稀疏(局部头占 83.4%–96.8%)、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上,TTFT 最高加速 1.6–3.54×,单卡并发提升 4.7–7.8×,预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×,KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。
谷歌云将上线 SandboxAQ 的两款专业 AI 模型:AQCat 用于半导体制造、电池开发等场景,识别具有潜力的催化剂和材料候选物;AQPotency 用于药物发现,筛选最可能结合疾病靶点的分子。SandboxAQ 前身为 Alphabet 量子技术部门,已通过美国《芯片法案》获 5 亿美元拨款。CEO 表示生物制药是当前最大短期机遇,客户正利用该技术研究胶质母细胞瘤、前列腺癌、阿尔茨海默病、帕金森病和心血管疾病。
温网与IBM合作,在2026年赛事中推出两项AI功能。升级版Match Chat支持自然语言提问,基于watsonx Orchestrate和AI agent,利用实时数据、分析及历史表现生成对话式回复,部分回复包含照片和视频。2025年技术论文显示此前部署服务约100万用户,平均响应6.25秒。新功能Key Moments基于原有Likelihood to Win概率计算,识别影响比赛方向的关键回合(如长多拍、双误)并附AI分析,适用于男女单打。平台重构使用IBM Bob构建知识图谱,47分钟内提取约1.5万在线资产,将原需四到五名专家数月的工作量压缩至一名工程师四周完成。所有AI功能具备人工审核、可解释性和置信度评分等治理控制。
英伟达扩充 Space-1 项目团队,招聘系统软件首席架构师,负责开发首款太空计算系统 Space-1 的配套软件。Space-1 搭载 Vera Rubin AI 芯片平台,专为近地轨道航天任务设计,于今年 3 月 GTC 发布。该岗位要求航天领域 AI 基础设施经验,基础年薪区间 27.2 万至 43.125 万美元(约合 185.1 万至 293.4 万元人民币),另含股权激励。英伟达此前已发布轨道数据中心系统架构岗,此次招聘标志其从概念规划转入实体研发落地阶段。
在韩国政府支持下,三星和SK海力士计划投入5900亿美元扩大芯片产能,包括800万亿韩元新建四座工厂、81万亿韩元建封装中心,以及未来15年30万亿韩元用于研发下一代芯片。AI数据中心需求是主要驱动力。Jefferies预测,2026年Q3内存价格将上涨40%至50%,Q4再涨30%至40%,2027年继续上涨40%至45%,到2028年新产能仅上线15%至20%才可能缓解。两家公司合计控制全球近80%的高带宽内存芯片市场。内存涨价已推高消费电子产品成本,苹果已上调Mac和MacBook售价。
关联讨论 1 条Ars Technica:AI(RSS)xFusion 在 ISC 2026 推出从边缘到数据中心的四层 AI 硬件:边缘级 FusionXtation X3 8000 Gen2 支持 70B-200B 参数模型本地运行,8K 渲染快 70%、AI 性能提升 50%;工作组级 FusionXpark 可双机联合处理 405B 参数模型,数据隔离外部 API;企业级 TokenBox 单机承载 1.6 万亿参数模型,液冷噪音 35 分贝;数据中心级 FusionServer G6550 V8 配合液冷平台,单柜 240kW,PUE 1.06,采用石墨烯垫片和钻石冷板,FusionOne DFS 三节点 72 NVMe 阵列实现 200 GB/s 顺序读取、94.1% 存储利用率。
三星集团宣布在韩国本土合计投资2655万亿韩元(约11.69万亿元人民币),其中2030万亿韩元投向首都圈龙仁市和平泽市的半导体产业集群,重点布局AI半导体、机器人、电池及IT元器件材料;剩余625万亿韩元分散至湖南(425万亿)、忠清(140万亿)和岭南(60万亿)地区。具体项目包括:三星电子在光州备选建下一代半导体晶圆厂(400万亿)、在天安和温阳建HBM晶圆厂(56万亿);三星显示在牙山打造显示屏生产基地(67万亿);三星电机在世宗市建设AI服务器封装基板生产线;三星电子在龟尾建设人形机器人量产线与智能手机总装工厂。
据韩媒6月29日报道,三星电机正与美国云服务提供商就供应AI服务器用MLCC进行最后谈判,合同规模约5000亿韩元(22.02亿元)。业内预计MLCC同比涨价50-60%,高容产品或更高。同时,三星电机计划与日本住友化学成立玻璃基板合资公司,双方共投资5000亿韩元,三星电机持股过半并出资约3000亿韩元,工厂建于东宇精细化学平泽厂内,预计2028年初投产。2025年AI服务器高规格MLCC市场中,村田占45%、三星电机占40%份额。
6月29日,韩国气候环境部长官金成焕宣布将推出分地区差异化电价制度,并新设AI数据中心专属电价方案,以提升半导体与AI产业竞争力。配套供电保障规划包括:西南圈半导体集群630万千瓦供电、日供水65万吨;龙仁集群1500万千瓦供电、日供水150万吨;AI数据中心至2029年前供应超800万千瓦电力。金成焕将当下定义为“电力为王的AI时代”,称半导体与电力已成为国家核心竞争力两大支柱。
三星电子会长李在镕表示,AI 芯片需求激增导致公司产能不足,正考虑在韩国光州建设先进半导体封装工厂。此外,三星还计划在龟尾推进机器人投资、在仁川布局生物医药、在蔚山投资电池业务、在釜山投资半导体基板业务。三星持续扩大 HBM 市场投入,客户涵盖英伟达、AMD 及谷歌等 AI 企业。今年 5 月,三星已向客户提供最新 12 层 HBM4E 内存样品,加速下一代 AI 内存产品竞争。
SK 集团会长崔泰源 6 月 29 日宣布,计划到 2035 年建成 15GW AI 数据中心容量,作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元(约 4.4 万亿元人民币),未来 10 年保持年均 100 万亿韩元以上国内投资,旨在实现从出口传统商品向智能服务的转变,构建韩国智能市场。此外,SK 海力士将向韩国西南部投资 400 万亿韩元,半导体供应项目总投资达 1100 万亿韩元(约 4.84 万亿元人民币)。
北京太空算力创新中心今日在2026全球数字经济大会太空算力论坛上正式揭牌成立,落地海淀中关村。该中心采用“公司+联盟”双轮驱动模式,运营主体为北京天算星联科技有限公司,承担共性技术攻关(星载AI芯片、太空大模型等)、公共平台服务、标准制定与生态引领、成果转化与场景变现四类职能。此前4月业界首个“太空算力专业委员会”在京成立,该中心同步启动筹建。工信部副部长张云明表示将支持太空算力技术前瞻性研究,有序推动产业发展。
吉姆·凯勒6月25日受访回应Tenstorrent收购传闻,确认已与英特尔、高通CEO会面,希望达成重大合作,因其RISC-V CPU IP优秀。谈及对手Cerebras近期IPO,他表示不在意,并称将全面击败他们。Cerebras WSE-CS3系统可近1000 Tokens/s推理Kimi K2.6模型。另有一家超大规模云服务商正评估Tenstorrent AI IP,用于开发小型AI芯片。
芬兰财政部常务秘书Juha Majanen宣布,计划到2031年将公共部门改造为以AI为基础的模式。核心是为各级政府搭建共享AI平台,导入最强AI模型,目标生产力至少提升20%。此举旨在节省人力开支,为福利制度腾出预算。裁员将部分通过自然退休实现,仍有部分员工将被AI智能体取代。工会代表批评政府不应将AI作为裁员借口,警告可能削弱公共服务、加重员工压力。
由中国科学院计算机网络信息中心等单位联合研发的“异算方舟”国产计算系统软件生态全栈平台今日上线。平台底层搭载“九衍枢算法库”,汇集16款高性能计算工具,核心运算性能可实现十倍以上提速;代码转换大模型BoundX可自动适配多种国产算力环境,替代人工改写。平台实现算法、代码、应用全链条打通,解决国产算力下软件适配难、代码迁移难等痛点。
澳大利亚 Neocloud 服务商 Firmus 与 DayOne 合作,在印尼峇淡建设一座由 NVIDIA 芯片驱动的 360MW 液冷 AI 工厂。根据持续至 2034 年的战略合作,NVIDIA 将在明后两年交付覆盖 Grace Blackwell、Vera Rubin、Vera 的多代 GPU,总计 17 万颗。Firmus 预计合作前六年从承购协议中获得 250~300 亿美元收入。NVIDIA 也是 Firmus 今年四月股权融资的有条件参与方。