6月30日

23:02

IT之家（RSS）

单芯片混合精度浮点算力达 896TFLOPS，中昊芯英新一代 TPU 芯片「须臾」发布

中昊芯英发布新一代全自研 TPU 芯片「须臾」，单芯片混合精度浮点算力 896 TFLOPS，为上一代「刹那」3 倍；8-bit 推理算力 1792 TOPS。单卡功耗 600W，较传统芯片降低 50%。同步推出智算底座「泰则 2.0」，搭载两路 CPU 与 8 片 TPU，混合精度算力 7.168P，整机能耗为传统 GPU 服务器 80%。平台原生支持 PyTorch、vLLM、SGLang 等框架，已完成 Qwen、DeepSeek、GLM 等数十款大模型适配，满足政务、金融等行业安全合规要求。

产品更新推理部署/工程

22:35

elvis@omarsar0

Fireworks AI 推出 Serverless 2.0，通过三种服务层级解决 503 拒绝请求问题

Fireworks AI 推出 Serverless 2.0，通过同一 API 端点下的三种服务层级解决共享集群高负载时的 503 Service Overloaded 问题。Standard 为默认经济型；Priority 在拥塞时提供更强准入，价格更高；Fast 通过优化路径提升生成 token 吞吐量，适用于低延迟场景。推荐默认使用 Standard，遇到 503 时临时切换 Priority 30 分钟，随后自动回退。Priority 和 Fast 不可叠加。

产品更新推理部署/工程

22:34

SemiAnalysis@SemiAnalysis_

JetSpec 是一种投机解码方法，通过因果并行树草稿联合优化草稿成本与质量，采用并行草稿树和树因果验证。在 MATH-500 上实现 9.64x 端到端加速，开放聊天场景达 4.58x 加速，且保持无损。结合 CUDA graph 与内核优化，单块 B200 可实现约 1000 TPS。SemiAnalysis 期待其与推理引擎 vLLM/SGLang 的深度集成。

Hao AI Lab: Introducing JetSpec: we find speculative decoding can push LLM generation latency to extreme by co-optimizing drafting c...

推理论文/研究部署/工程

22:26

HuggingFace Daily Papers（社区热门论文）

一步梯度延迟并非大规模异步流水线并行LLM预训练的障碍

异步流水线并行消除同步气泡，但梯度陈旧问题限制其应用。PipeDream-2BW调度保证恒定一步延迟，但业界认为该陈旧性下优化不稳定。本文通过实证分析推翻此假设，发现AdamW在一步延迟下退化，而Muon等优化器鲁棒性强。研究进一步提出优化器无关的误差反馈修正以缓解延迟影响。在10B参数模型上的实验表明，所提策略可缩小异步与同步训练的性能差距，展示大规模异步流水线并行的实用潜力。

数据/训练论文/研究部署/工程

18:02

IT之家（RSS）

AMD 发布 MoP 封装版 Versal Premium Gen 2 自适应 SoC，集成内存

AMD 公布 MoP 封装版 Versal Premium Gen 2 自适应 SoC，提供至高 32GB 集成 LPDDR5X 内存。MoP 封装可降低至多 60% PCB 面积，并将内存速率从 8533MT/s 提升至 9000MT/s，带宽增加 5.5%，同时简化 PCB 设计缩短上市时间。该产品支持 -40~+100℃ 工业温度，生命周期超 15 年。AMD 计划今年底出样，2027H2 量产出货。

产品更新部署/工程

17:02

IT之家（RSS）

TrendForce：AI需求排挤产能，晶圆代工成熟制程涨价预计延伸至2027年

AI Server、General Purpose Server与Edge AI需求升温，晶圆代工产能向AI倾斜。八英寸制程受惠于Power订单增量及台积电、三星减产，产能利用率与代工价格强势拉升。十二英寸成熟制程因台积电减产、Power IC订单强劲、AI排挤及原物料通膨，涨价氛围已形成，部分制程在2026年第二至第三季调涨5-10%，并意图2027年全面调涨。消费电子成本压力下客户协商暂缓2026年下半年涨价，但2027年价格调升仍难以避免。

现象/趋势部署/工程

17:02

IT之家（RSS）

英伟达 Jetson 边缘 AI 平台将首次在月球轨道运行，实时分析探测数据

萤火虫航天“蓝幽灵2号”任务计划2026年末发射，搭载自研奥库拉（Ocula）月球成像系统，英伟达Jetson边缘AI平台将首次在月球轨道运行。传统任务需回传海量原始数据，处理周期长达数周数月；奥库拉在轨运行AI算法，仅传回核心数据，大幅缩短延迟、降低通信成本。同期“埃尔特拉”轨道飞行器将环绕月球执行五年任务，全程搭载奥库拉系统。奥库拉可测绘着陆点、识别钛铁矿等矿物、监控月面动态及追踪空间飞行器。后续任务将升级技术并配套英伟达航天硬件。客户涵盖NASA、美国太空军及太空、矿业、能源企业。

端侧行业动态部署/工程

16:37

Hacker News 热门（buzzing.cc 中文翻译）

Moondream Photon 通过流水线解码消除 GPU 气泡，提升 35% 吞吐量

Moondream 推理引擎 Photon 在 NVIDIA B200 上实现约 33ms 近实时 VLM 推理。其利用流水线解码技术，将 GPU 计算与 CPU 任务重叠，消除传统循环中 GPU 空闲等待的“GPU 气泡”，使解码吞吐量提升高达 35%。文章详述三种关键机制：乒乓缓存槽位避免缓冲冲突、前向计算与采样解耦实现受约束解码、以及已结束请求的清理流程（zombies）。

推理教程/实践部署/工程

16:02

IT之家（RSS）

精选70

黑石未来3~5年拟投300亿美元在日本建AI数据中心，联合成立AI XPV平台

黑石计划未来3~5年在日本AI数据中心领域投资300亿美元，此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期，真正风险是算力短缺而非基建泡沫；谷歌、亚马逊是英伟达潜在挑战者。此外，黑石、阿波罗、博通本月9日成立AI XPV平台，目标2028年向OpenAI、Anthropic等提供超20GW算力，首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。

Anthropic OpenAI 行业动态部署/工程

推荐理由：黑石300亿美元押注日本AI数据中心，加上此前AI XPV平台，算力基建竞赛进入新阶段，对于关注云计算和算力供需的人来说是个重要信号。

15:18

向阳乔木@vista8

腾讯开源ARGUS：万卡GPU集群监控方案

腾讯团队开源ARGUS方案，用于管理和监控超10,000块GPU的集群。大模型训练成本极高，万卡集群每天电费和折旧达数十万元。ARGUS解决的核心问题是在集群出问题时几分钟内定位原因。论文发现：万卡规模下，超70%训练中断由网络通信问题导致，而非GPU故障。ARGUS通过采集每GPU实时数据（计算负载、显存、网络带宽、通信延迟）进行关联分析，精准定位故障GPU或链路。

开源/仓库部署/工程

14:36

karminski-牙医@karminski3

SGLang DSpark实测：1.81倍加速，预测3个token

SGLang的DSpark在PR中放出实测数据，可预测3个token（数学类3.37，日常对话3，代码3.52）。1K长度prompt下加速比达1.81倍，8卡B200速度297 token/s（无DSpark为164 token/s）。单并发提升最高，超过8并发仅1.2‑1.3倍。TPOT仅2.9‑5.2ms，延迟可忽略。该PR（#29538）尚未合并。

开源/仓库推理部署/工程

12:02

IT之家（RSS）

消息称亚马逊 AWS 将按 Token 向 Anthropic 支付模型使用费

亚马逊与Anthropic达成新协议，在AWS上运行Anthropic模型时将按Token而非算力付费。由于自身Nova系列竞争力不足，亚马逊大量业务依赖Anthropic模型，包括Alexa购物助手、Kiro编程工具、Quick职场助手。新的收入分享方式为亚马逊支出增加了变量。其高级副总裁Peter DeSantis本月中旬表示，目标到明年推出前沿水平模型。

Anthropic 行业动态部署/工程

12:02

IT之家（RSS）

微软全面推出 Anthropic Claude 模型 Azure 云服务，基于英伟达 GB300

英伟达宣布，微软在 Microsoft Foundry 平台正式推出托管于 Azure 云服务的 Anthropic Claude 模型。硬件基于 NVIDIA GB300 NVL72 机架，采用 Quantum-X800 InfiniBand 互联。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5，核心功能包括提示缓存和扩展思维，支持编程、代理式工作到复杂推理等用例。该服务原生集成 Azure 云控制功能，可将 Claude 模型接入 Azure 生态系统。英伟达还提供了智能体技能和安全智能体工作区参考设计。

Anthropic Microsoft 产品更新推理

12:02

IT之家（RSS）

Meta 发布自研 Vistara 芯片，复用拆机 DDR4 内存搭配 DDR5 新服务器

Meta 在 ISCA 2026 大会发布自研 Vistara ASIC 方案，通过 CXL 2.0/1.1 规范的 PCIe Gen5 x16 接口将拆机 DDR4 内存桥接到新服务器。每台 MemServer 配备 768GB DDR5 和 256GB DDR4（3:1 配比），单个 ASIC 支持双通道 DDR4 最高 3200 MT/s、最大 256GB。该方案已在数百万台服务器中用于分离式机器学习推理、大数据处理等场景，可将推理服务器数量最多减少 25%，分布式缓存平均延迟降低 29%。

Meta 论文/研究部署/工程

11:36

小互@xiaohu

精选81

一个人管理5款产品，80%时间不写代码？Every的复利工程

媒体软件公司Every公开「复利工程」方法论，以单人工程团队维护5款产品。核心是四步循环：Plan→Work→Review→Compound，其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/，使AI下次自动避坑。工程师80%时间花在Plan和Review，仅20%用于写代码。配套开源插件支持Claude Code等，含26个专项agent、23条工作流命令、13项技能，可零配置使用。/workflows:review一次并发14个agent审查代码，/workflows:plan在ultrathink模式下可并发40多个研究agent。

智能体教程/实践编码部署/工程

推荐理由：Every把内部单人维护5款产品的方法论和插件开源了，14个AI同时审代码、40多个研究agent做计划，是目前公开的多agent并行工程里数字最具体的参考之一，做AI辅助开发的可以直接上手抄。

11:29

MarkTechPost（RSS）

Top 6 无代码 AI 工具速览（涵盖多智能体、可视化工作流、RAG 引擎、本地 LLM 工作站、微调框架）

Atoms 是无代码平台，支持零基础设施、多智能体架构并即时连接 GPT 与 Gemini。Sim AI 是开源可视化 AI 智能体工作流工具，提供拖拽画布、80+ 集成及 MCP 支持，可云托管或 Docker 自部署。RAGFlow 是检索增强生成引擎，支持多格式文件建立知识库，连接 LLM（API 或 Ollama），具备检索质量验证。Transformer Lab 是免费开源本地 LLM 与扩散模型工作站，支持下载、对话、图像生成、微调（含 RLHF）、RAG 及嵌入计算。LLaMA-Factory 支持 100+ 模型及 SFT、PPO、DPO、LoRA、QLoRA 等训练方法。

智能体教程/实践部署/工程

11:06

Hacker News 热门（buzzing.cc 中文翻译）

形式化验证：你能对软件做出哪些保证？

形式化验证的成本和工具已进入可广泛使用阶段，AI消除了编写证明的最大障碍。与仅覆盖有限输入的测试不同，形式化验证通过验证语言（如Dafny、Lean、Rocq）编写属性和代码，由SMT求解器自动检查所有可达状态是否满足规范——例如权限系统的子集不变性，确保派生权限始终是父权限的子集。验证保证是绝对的：只要规范正确，代码在所有状态下都不会违反属性。过去编写证明需要博士级技能且工具缓慢，如今这一门槛正在降低。

教程/实践部署/工程

08:26

ginobefun@hongming731

BestBlogs 早报：智能体落地两大卡点--验证回路与组织成熟度，Spotify、Block、Spring AI 各给解法

智能体进入大型工程组织面临验证回路与组织成熟度两大瓶颈。Spotify 架构师分享在2000万行monorepo中运行Claude Code的经验，强调标准化代码库与可靠的CI、测试、自动合并等验证基建是前提，内部平台Honk整合这些工具。Block 工程负责人指出九成工程师在用Goose和Claude Code但功能交付未加速，提出六阶段成熟度模型与AI champions项目（约50名champion各投入30%时间），通过AGENTS.md沉淀知识，三个月内AI生成代码占比提升69%。Spring I/O 2026则梳理Spring AI从LLM调用到生产级智能体生态的演进。三篇从技术基建、组织流程、框架产品化给出解法。

智能体 MCP/工具现象/趋势部署/工程

06:05

karminski-牙医@karminski3

DeepSeek DSpark：推测性解码技术详解

DeepSeek推出的DSpark是一种推测性解码技术，通过在Final RMSNorm后接入3层MTP微型Transformer堆叠，让大模型在输出前并行猜5个token，经置信度头剪裁后，送回大模型用prefill验证，正确则一次性吐出多个token。相比外挂小模型更高效，不降智，速度提升60%-85%。目前SGLang已有相关PR（#29538），DeepSeek已在HuggingFace发布多款DSpark魔改版小模型。

DeepSeek 推理教程/实践部署/工程

05:22

Claude：Blog（网页）

精选66

为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway，一个自托管控制平面，让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux，后端使用 PostgreSQL，提供企业级 SSO 登录（通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等）、集中策略管理、角色权限、路由（支持故障转移）以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据（除非配置使用 Claude API）。即日起可用。

Anthropic Google 产品更新编码

推荐理由：Claude Code企业版有了统一管理入口，SSO和成本控制是团队落地AI编程的关键，对CTO来说值得关注。

04:55

ClaudeDevs@ClaudeDevs

你现在可以在 Microsoft Foundry（托管于 Azure）上运行 Claude 模型。 Claude Opus 4.8 和 Claude Haiku 4.5 通过 Messages API 提供，支持 prompt caching、thinking 等功能。

Claude: Claude in Microsoft Foundry is now generally available, hosted on Azure. Azure customers get Claude Opus 4.8 and Claude ...

Anthropic Microsoft 行业动态部署/工程

02:26

TechCrunch：AI（RSS）

韩国科技巨头承诺超9000亿美元缓解AI内存芯片短缺"RAMageddon"

三星和SK海力士计划投资5180亿美元在韩国西南部新建四座内存晶圆厂，另投520亿美元建设HBM封装中心；SK、GS、Naver等企业将在2035年前投资3560亿美元建设AI数据中心。韩国科技巨头合计承诺超9000亿美元应对AI建设引发的全球内存芯片短缺（RAMageddon）。总统Jae Myung Lee称半导体、物理AI和AI数据中心是韩国下一工业时代三轴。三星另行公布十年投资约1.7万亿美元计划，包括光州新建晶圆厂和海南AI数据中心；SK集团宣布约1.4万亿美元中长期路线图，含扩充半导体产能和建设AI数据中心。

行业动态部署/工程

02:25

Claude@claudeai

Claude 现已在 Microsoft Foundry 中正式可用，托管于 Azure。 Azure 客户可获得 Claude Opus 4.8 和 Claude Haiku 4.5，并支持 Azure 身份验证、计费和承诺预留。

Anthropic Microsoft 产品更新部署/工程

02:22

Claude：Blog（网页）

精选64

Claude 在 Microsoft Foundry 正式可用

从今天起，Claude 模型在 Microsoft Foundry 上正式可用，托管于 Azure 环境，运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5，通过 Messages API 调用，支持提示缓存和扩展思考。用户可选择推理处理位置，包括美国数据区域，由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制，并获得统一账单；符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。

Anthropic Microsoft 产品更新部署/工程

推荐理由：Claude 正式登陆 Azure Foundry 企业版，对于看重数据主权和现有 Azure 合约的企业是个好消息，但本质上是一次渠道铺开而非能力突破。

6月29日

23:58

Nathan Lambert@natolambert

Together AI 月处理 400T tokens。

Vipul Ved Prakash: http://x.com/i/article/2071357845443153921

行业动态部署/工程

23:55

Google Blog：AI（RSS）

问AI专家：全栈AI到底是什么？

一位Google专家解释了全栈AI方法的含义，并指出这一方法长期以来一直是Google AI工作的基础。

Google 教程/实践部署/工程

21:25

TechCrunch：AI（RSS）

Omen AI 获 3100 万美元融资，用微型光谱仪实时监测数据中心液冷系统

数据中心液冷系统的冷却液若细菌滋生会导致堵塞，需停机数小时冲洗，单次损失达数百万美元。Omen AI 开发微型光谱仪，实时监测冷却液中的细菌生长，并检测铜、铬等磨损颗粒以预警泵体或密封件故障，替代传统送样检测。公司今日宣布完成 3100 万美元 A 轮融资，由 Nava Ventures 领投，CRV、Vanderbilt University、Mann+Hummel 等跟投。Omen AI 由 Zach Laberge 于 2024 年创立，已与十余家数据中心客户合作，包括使用 AMD 芯片的 AI 计算云公司 TensorWave。

行业动态部署/工程

19:10

公众号：小红书技术（dots.llm）

精选72

小红书 RedKnot 推理引擎：将 KV Cache 按注意力头拆解实现长文本加速

RedKnot 将 KV Cache 沿注意力头维度拆解，通过头分类稀疏（局部头占 83.4%–96.8%）、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上，TTFT 最高加速 1.6–3.54×，单卡并发提升 4.7–7.8×，预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×，KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。

arXiv GitHub 产品更新推理

推荐理由：小红书把 KV Cache 从 token 级拆成按头分家，这个思路让长文本推理的 TTFT 和并发都有数量级提升，开源出来对做推理引擎的同学是个福音。

19:01

IT之家（RSS）

谷歌云将提供用于科学研究的专业 AI 模型：可加速生物制药、材料科学和半导体制造等

谷歌云将上线 SandboxAQ 的两款专业 AI 模型：AQCat 用于半导体制造、电池开发等场景，识别具有潜力的催化剂和材料候选物；AQPotency 用于药物发现，筛选最可能结合疾病靶点的分子。SandboxAQ 前身为 Alphabet 量子技术部门，已通过美国《芯片法案》获 5 亿美元拨款。CEO 表示生物制药是当前最大短期机遇，客户正利用该技术研究胶质母细胞瘤、前列腺癌、阿尔茨海默病、帕金森病和心血管疾病。

Google 行业动态部署/工程

18:17

Artificial Intelligence News（RSS）

温网2026年赛事新增IBM AI实时观赛功能

温网与IBM合作，在2026年赛事中推出两项AI功能。升级版Match Chat支持自然语言提问，基于watsonx Orchestrate和AI agent，利用实时数据、分析及历史表现生成对话式回复，部分回复包含照片和视频。2025年技术论文显示此前部署服务约100万用户，平均响应6.25秒。新功能Key Moments基于原有Likelihood to Win概率计算，识别影响比赛方向的关键回合（如长多拍、双误）并附AI分析，适用于男女单打。平台重构使用IBM Bob构建知识图谱，47分钟内提取约1.5万在线资产，将原需四到五名专家数月的工作量压缩至一名工程师四周完成。所有AI功能具备人工审核、可解释性和置信度评分等治理控制。

产品更新部署/工程

18:01

IT之家（RSS）

英伟达加码太空算力，为 Space-1 系统招募首席软件架构师

英伟达扩充 Space-1 项目团队，招聘系统软件首席架构师，负责开发首款太空计算系统 Space-1 的配套软件。Space-1 搭载 Vera Rubin AI 芯片平台，专为近地轨道航天任务设计，于今年 3 月 GTC 发布。该岗位要求航天领域 AI 基础设施经验，基础年薪区间 27.2 万至 43.125 万美元（约合 185.1 万至 293.4 万元人民币），另含股权激励。英伟达此前已发布轨道数据中心系统架构岗，此次招聘标志其从概念规划转入实体研发落地阶段。

行业动态部署/工程

16:37

The Decoder：AI News（RSS）

精选72

三星和SK海力士计划投资5900亿美元扩产芯片，AI需求推高内存价格

在韩国政府支持下，三星和SK海力士计划投入5900亿美元扩大芯片产能，包括800万亿韩元新建四座工厂、81万亿韩元建封装中心，以及未来15年30万亿韩元用于研发下一代芯片。AI数据中心需求是主要驱动力。Jefferies预测，2026年Q3内存价格将上涨40%至50%，Q4再涨30%至40%，2027年继续上涨40%至45%，到2028年新产能仅上线15%至20%才可能缓解。两家公司合计控制全球近80%的高带宽内存芯片市场。内存涨价已推高消费电子产品成本，苹果已上调Mac和MacBook售价。

行业动态部署/工程

关联讨论 1 条

推荐理由：三星和SK海力士的5900亿美元投资计划加上内存价格至少涨到2028年的预测，表明AI基础设施的拉动远未到顶，做硬件采购和成本核算的人这一年都会很头疼。

16:17

Artificial Intelligence News（RSS）

xFusion 在 ISC 2026 推出四层可扩展企业 AI 硬件组合

xFusion 在 ISC 2026 推出从边缘到数据中心的四层 AI 硬件：边缘级 FusionXtation X3 8000 Gen2 支持 70B-200B 参数模型本地运行，8K 渲染快 70%、AI 性能提升 50%；工作组级 FusionXpark 可双机联合处理 405B 参数模型，数据隔离外部 API；企业级 TokenBox 单机承载 1.6 万亿参数模型，液冷噪音 35 分贝；数据中心级 FusionServer G6550 V8 配合液冷平台，单柜 240kW，PUE 1.06，采用石墨烯垫片和钻石冷板，FusionOne DFS 三节点 72 NVMe 阵列实现 200 GB/s 顺序读取、94.1% 存储利用率。

产品更新端侧部署/工程

16:01

IT之家（RSS）

三星宣布2655万亿韩元本土投资计划，重点布局半导体与AI

三星集团宣布在韩国本土合计投资2655万亿韩元（约11.69万亿元人民币），其中2030万亿韩元投向首都圈龙仁市和平泽市的半导体产业集群，重点布局AI半导体、机器人、电池及IT元器件材料；剩余625万亿韩元分散至湖南（425万亿）、忠清（140万亿）和岭南（60万亿）地区。具体项目包括：三星电子在光州备选建下一代半导体晶圆厂（400万亿）、在天安和温阳建HBM晶圆厂（56万亿）；三星显示在牙山打造显示屏生产基地（67万亿）；三星电机在世宗市建设AI服务器封装基板生产线；三星电子在龟尾建设人形机器人量产线与智能手机总装工厂。

行业动态部署/工程

15:01

IT之家（RSS）

消息称三星电机有望斩获5000亿韩元AI服务器MLCC大单，加码玻璃基板

据韩媒6月29日报道，三星电机正与美国云服务提供商就供应AI服务器用MLCC进行最后谈判，合同规模约5000亿韩元（22.02亿元）。业内预计MLCC同比涨价50-60%，高容产品或更高。同时，三星电机计划与日本住友化学成立玻璃基板合资公司，双方共投资5000亿韩元，三星电机持股过半并出资约3000亿韩元，工厂建于东宇精细化学平泽厂内，预计2028年初投产。2025年AI服务器高规格MLCC市场中，村田占45%、三星电机占40%份额。

行业动态部署/工程

15:01

IT之家（RSS）

韩国计划推出AI数据中心专属电价，提升产业竞争力

6月29日，韩国气候环境部长官金成焕宣布将推出分地区差异化电价制度，并新设AI数据中心专属电价方案，以提升半导体与AI产业竞争力。配套供电保障规划包括：西南圈半导体集群630万千瓦供电、日供水65万吨；龙仁集群1500万千瓦供电、日供水150万吨；AI数据中心至2029年前供应超800万千瓦电力。金成焕将当下定义为“电力为王的AI时代”，称半导体与电力已成为国家核心竞争力两大支柱。

政策/监管部署/工程

15:01

IT之家（RSS）

三星电子会长李在镕：公司产能已不足以满足 AI 市场需求，计划在韩国光州新建先进半导体封装工厂

三星电子会长李在镕表示，AI 芯片需求激增导致公司产能不足，正考虑在韩国光州建设先进半导体封装工厂。此外，三星还计划在龟尾推进机器人投资、在仁川布局生物医药、在蔚山投资电池业务、在釜山投资半导体基板业务。三星持续扩大 HBM 市场投入，客户涵盖英伟达、AMD 及谷歌等 AI 企业。今年 5 月，三星已向客户提供最新 12 层 HBM4E 内存样品，加速下一代 AI 内存产品竞争。

行业动态部署/工程

15:01

IT之家（RSS）

精选71

SK 集团会长崔泰源：到 2035 年建设 15GW AI 数据中心，总投资达 1000 万亿韩元

SK 集团会长崔泰源 6 月 29 日宣布，计划到 2035 年建成 15GW AI 数据中心容量，作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元（约 4.4 万亿元人民币），未来 10 年保持年均 100 万亿韩元以上国内投资，旨在实现从出口传统商品向智能服务的转变，构建韩国智能市场。此外，SK 海力士将向韩国西南部投资 400 万亿韩元，半导体供应项目总投资达 1100 万亿韩元（约 4.84 万亿元人民币）。

数据/训练行业动态部署/工程

推荐理由：SK 集团喊出 1000 万亿韩元建 AI 数据中心，数字唬人但周期长达十年，更像一种姿态宣示，真正改变算力市场格局还得看后续执行力和融资落地。

15:01

Alibaba Cloud@alibaba_cloud

我们很自豪地宣布，阿里云国际与NovaxAI @NovaxAi26 达成战略合作。通过将我们的全球云基础设施及AI进展与Novax AI的独特能力相结合，我们正助力AI公司实现更快、更稳定、更高效的全球增长。 #AlibabaCloud #NovaxAI #AIInnovation #YourAInnovationPlatform

行业动态部署/工程

13:27

宝玉@dotey

福特召回350名退休/离职资深工程师重新调教AI质检系统

福特过去三年召回350名退休/离职资深工程师（gray beard），负责带新人并重新调教未达预期的AI质检系统。整车工程副总裁Charles Poon承认曾错误认为引入AI就能产出高质量产品。效果立竿见影：福特时隔16年重返JD Power新车质量榜主流品牌第一（从第10升至第1），F-150、Super Duty、Mustang分别拿下品类冠军，预计今年节省约10亿美元质保和召回成本。福特未抛弃AI，正新增约10万项评估模拟更多路况。

TechCrunch: Ford rehires 'gray beard' engineers after AI falls short https://techcrunch.com/2026/06/28/ford-rehires-gray-beard-engin...

数据/训练行业动态部署/工程