AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月30日周二
23:02IT之家(RSS)46单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布
22:35elvis64Fireworks AI 推出 Serverless 2.0,通过三种服务层级解决 503 拒绝请求问题
22:34SemiAnalysis63JetSpec:因果并行树草稿投机解码方法
22:26HuggingFace Daily Papers(社区热门论文)51一步梯度延迟并非大规模异步流水线并行LLM预训练的障碍
18:02IT之家(RSS)40AMD 发布 MoP 封装版 Versal Premium Gen 2 自适应 SoC,集成内存
17:02IT之家(RSS)57TrendForce:AI需求排挤产能,晶圆代工成熟制程涨价预计延伸至2027年
17:02IT之家(RSS)43英伟达 Jetson 边缘 AI 平台将首次在月球轨道运行,实时分析探测数据
16:37Hacker News 热门(buzzing.cc 中文翻译)43Moondream Photon 通过流水线解码消除 GPU 气泡,提升 35% 吞吐量
16:02IT之家(RSS)70精选黑石未来3~5年拟投300亿美元在日本建AI数据中心,联合成立AI XPV平台
15:18向阳乔木64腾讯开源ARGUS:万卡GPU集群监控方案
14:36karminski-牙医60SGLang DSpark实测:1.81倍加速,预测3个token
12:02IT之家(RSS)55消息称亚马逊 AWS 将按 Token 向 Anthropic 支付模型使用费
12:02IT之家(RSS)54微软全面推出 Anthropic Claude 模型 Azure 云服务,基于英伟达 GB300
12:02IT之家(RSS)55Meta 发布自研 Vistara 芯片,复用拆机 DDR4 内存搭配 DDR5 新服务器
11:36小互81精选一个人管理5款产品,80%时间不写代码?Every的复利工程
11:29MarkTechPost(RSS)48Top 6 无代码 AI 工具速览(涵盖多智能体、可视化工作流、RAG 引擎、本地 LLM 工作站、微调框架)
11:06Hacker News 热门(buzzing.cc 中文翻译)48形式化验证:你能对软件做出哪些保证?
08:26ginobefun55BestBlogs 早报:智能体落地两大卡点--验证回路与组织成熟度,Spotify、Block、Spring AI 各给解法
06:05karminski-牙医57DeepSeek DSpark:推测性解码技术详解
05:22Claude:Blog(网页)66精选为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway
04:55ClaudeDevs53Claude Opus 4.8与Haiku 4.5登陆Azure Foundry
02:26TechCrunch:AI(RSS)69韩国科技巨头承诺超9000亿美元缓解AI内存芯片短缺"RAMageddon"
02:25Claude55Claude在Microsoft Foundry正式可用
02:22Claude:Blog(网页)64精选Claude 在 Microsoft Foundry 正式可用
6月29日周一
23:58Nathan Lambert50Together AI 月处理 400T tokens
23:55Google Blog:AI(RSS)39问AI专家:全栈AI到底是什么?
21:25TechCrunch:AI(RSS)50Omen AI 获 3100 万美元融资,用微型光谱仪实时监测数据中心液冷系统
19:10公众号:小红书技术(dots.llm)72精选小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速
19:01IT之家(RSS)47谷歌云将提供用于科学研究的专业 AI 模型:可加速生物制药、材料科学和半导体制造等
18:17Artificial Intelligence News(RSS)47温网2026年赛事新增IBM AI实时观赛功能
18:01IT之家(RSS)47英伟达加码太空算力,为 Space-1 系统招募首席软件架构师
16:37The Decoder:AI News(RSS)72精选三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推高内存价格
16:17Artificial Intelligence News(RSS)47xFusion 在 ISC 2026 推出四层可扩展企业 AI 硬件组合
16:01IT之家(RSS)58三星宣布2655万亿韩元本土投资计划,重点布局半导体与AI
15:01IT之家(RSS)39消息称三星电机有望斩获5000亿韩元AI服务器MLCC大单,加码玻璃基板
15:01IT之家(RSS)59韩国计划推出AI数据中心专属电价,提升产业竞争力
15:01IT之家(RSS)59三星电子会长李在镕:公司产能已不足以满足 AI 市场需求,计划在韩国光州新建先进半导体封装工厂
15:01IT之家(RSS)71精选SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元
15:01Alibaba Cloud43阿里云国际与NovaxAI宣布战略合作
13:27宝玉56福特召回350名退休/离职资深工程师重新调教AI质检系统
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月30日
23:02
IT之家(RSS)
46
单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布

中昊芯英发布新一代全自研 TPU 芯片「须臾」,单芯片混合精度浮点算力 896 TFLOPS,为上一代「刹那」3 倍;8-bit 推理算力 1792 TOPS。单卡功耗 600W,较传统芯片降低 50%。同步推出智算底座「泰则 2.0」,搭载两路 CPU 与 8 片 TPU,混合精度算力 7.168P,整机能耗为传统 GPU 服务器 80%。平台原生支持 PyTorch、vLLM、SGLang 等框架,已完成 Qwen、DeepSeek、GLM 等数十款大模型适配,满足政务、金融等行业安全合规要求。

产品更新推理部署/工程
22:35
elvis@omarsar0
64
Fireworks AI 推出 Serverless 2.0,通过三种服务层级解决 503 拒绝请求问题

Fireworks AI 推出 Serverless 2.0,通过同一 API 端点下的三种服务层级解决共享集群高负载时的 503 Service Overloaded 问题。Standard 为默认经济型;Priority 在拥塞时提供更强准入,价格更高;Fast 通过优化路径提升生成 token 吞吐量,适用于低延迟场景。推荐默认使用 Standard,遇到 503 时临时切换 Priority 30 分钟,随后自动回退。Priority 和 Fast 不可叠加。

产品更新推理部署/工程
22:34
SemiAnalysis@SemiAnalysis_
63
JetSpec 是一种投机解码方法,通过因果并行树草稿联合优化草稿成本与质量,采用并行草稿树和树因果验证。在 MATH-500 上实现 9.64x 端到端加速,开放聊天场景达 4.58x 加速,且保持无损。结合 CUDA graph 与内核优化,单块 B200 可实现约 1000 TPS。SemiAnalysis 期待其与推理引擎 vLLM/SGLang 的深度集成。

Hao AI Lab: Introducing JetSpec: we find speculative decoding can push LLM generation latency to extreme by co-optimizing drafting c...

推理论文/研究部署/工程
22:26
HuggingFace Daily Papers(社区热门论文)
51
一步梯度延迟并非大规模异步流水线并行LLM预训练的障碍

异步流水线并行消除同步气泡,但梯度陈旧问题限制其应用。PipeDream-2BW调度保证恒定一步延迟,但业界认为该陈旧性下优化不稳定。本文通过实证分析推翻此假设,发现AdamW在一步延迟下退化,而Muon等优化器鲁棒性强。研究进一步提出优化器无关的误差反馈修正以缓解延迟影响。在10B参数模型上的实验表明,所提策略可缩小异步与同步训练的性能差距,展示大规模异步流水线并行的实用潜力。

数据/训练论文/研究部署/工程
18:02
IT之家(RSS)
40
AMD 发布 MoP 封装版 Versal Premium Gen 2 自适应 SoC,集成内存

AMD 公布 MoP 封装版 Versal Premium Gen 2 自适应 SoC,提供至高 32GB 集成 LPDDR5X 内存。MoP 封装可降低至多 60% PCB 面积,并将内存速率从 8533MT/s 提升至 9000MT/s,带宽增加 5.5%,同时简化 PCB 设计缩短上市时间。该产品支持 -40~+100℃ 工业温度,生命周期超 15 年。AMD 计划今年底出样,2027H2 量产出货。

产品更新部署/工程
17:02
IT之家(RSS)
57
TrendForce:AI需求排挤产能,晶圆代工成熟制程涨价预计延伸至2027年

AI Server、General Purpose Server与Edge AI需求升温,晶圆代工产能向AI倾斜。八英寸制程受惠于Power订单增量及台积电、三星减产,产能利用率与代工价格强势拉升。十二英寸成熟制程因台积电减产、Power IC订单强劲、AI排挤及原物料通膨,涨价氛围已形成,部分制程在2026年第二至第三季调涨5-10%,并意图2027年全面调涨。消费电子成本压力下客户协商暂缓2026年下半年涨价,但2027年价格调升仍难以避免。

现象/趋势部署/工程
17:02
IT之家(RSS)
43
英伟达 Jetson 边缘 AI 平台将首次在月球轨道运行,实时分析探测数据

萤火虫航天“蓝幽灵2号”任务计划2026年末发射,搭载自研奥库拉(Ocula)月球成像系统,英伟达Jetson边缘AI平台将首次在月球轨道运行。传统任务需回传海量原始数据,处理周期长达数周数月;奥库拉在轨运行AI算法,仅传回核心数据,大幅缩短延迟、降低通信成本。同期“埃尔特拉”轨道飞行器将环绕月球执行五年任务,全程搭载奥库拉系统。奥库拉可测绘着陆点、识别钛铁矿等矿物、监控月面动态及追踪空间飞行器。后续任务将升级技术并配套英伟达航天硬件。客户涵盖NASA、美国太空军及太空、矿业、能源企业。

端侧行业动态部署/工程
16:37
Hacker News 热门(buzzing.cc 中文翻译)
43
Moondream Photon 通过流水线解码消除 GPU 气泡,提升 35% 吞吐量

Moondream 推理引擎 Photon 在 NVIDIA B200 上实现约 33ms 近实时 VLM 推理。其利用流水线解码技术,将 GPU 计算与 CPU 任务重叠,消除传统循环中 GPU 空闲等待的“GPU 气泡”,使解码吞吐量提升高达 35%。文章详述三种关键机制:乒乓缓存槽位避免缓冲冲突、前向计算与采样解耦实现受约束解码、以及已结束请求的清理流程(zombies)。

推理教程/实践部署/工程
16:02
IT之家(RSS)
精选70
黑石未来3~5年拟投300亿美元在日本建AI数据中心,联合成立AI XPV平台

黑石计划未来3~5年在日本AI数据中心领域投资300亿美元,此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期,真正风险是算力短缺而非基建泡沫;谷歌、亚马逊是英伟达潜在挑战者。此外,黑石、阿波罗、博通本月9日成立AI XPV平台,目标2028年向OpenAI、Anthropic等提供超20GW算力,首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。

AnthropicOpenAI行业动态部署/工程

推荐理由:黑石300亿美元押注日本AI数据中心,加上此前AI XPV平台,算力基建竞赛进入新阶段,对于关注云计算和算力供需的人来说是个重要信号。
15:18
向阳乔木@vista8
64
腾讯开源ARGUS:万卡GPU集群监控方案

腾讯团队开源ARGUS方案,用于管理和监控超10,000块GPU的集群。大模型训练成本极高,万卡集群每天电费和折旧达数十万元。ARGUS解决的核心问题是在集群出问题时几分钟内定位原因。论文发现:万卡规模下,超70%训练中断由网络通信问题导致,而非GPU故障。ARGUS通过采集每GPU实时数据(计算负载、显存、网络带宽、通信延迟)进行关联分析,精准定位故障GPU或链路。

开源/仓库部署/工程
14:36
karminski-牙医@karminski3
60
SGLang DSpark实测:1.81倍加速,预测3个token

SGLang的DSpark在PR中放出实测数据,可预测3个token(数学类3.37,日常对话3,代码3.52)。1K长度prompt下加速比达1.81倍,8卡B200速度297 token/s(无DSpark为164 token/s)。单并发提升最高,超过8并发仅1.2‑1.3倍。TPOT仅2.9‑5.2ms,延迟可忽略。该PR(#29538)尚未合并。

开源/仓库推理部署/工程
12:02
IT之家(RSS)
55
消息称亚马逊 AWS 将按 Token 向 Anthropic 支付模型使用费

亚马逊与Anthropic达成新协议,在AWS上运行Anthropic模型时将按Token而非算力付费。由于自身Nova系列竞争力不足,亚马逊大量业务依赖Anthropic模型,包括Alexa购物助手、Kiro编程工具、Quick职场助手。新的收入分享方式为亚马逊支出增加了变量。其高级副总裁Peter DeSantis本月中旬表示,目标到明年推出前沿水平模型。

Anthropic行业动态部署/工程
12:02
IT之家(RSS)
54
微软全面推出 Anthropic Claude 模型 Azure 云服务,基于英伟达 GB300

英伟达宣布,微软在 Microsoft Foundry 平台正式推出托管于 Azure 云服务的 Anthropic Claude 模型。硬件基于 NVIDIA GB300 NVL72 机架,采用 Quantum-X800 InfiniBand 互联。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,核心功能包括提示缓存和扩展思维,支持编程、代理式工作到复杂推理等用例。该服务原生集成 Azure 云控制功能,可将 Claude 模型接入 Azure 生态系统。英伟达还提供了智能体技能和安全智能体工作区参考设计。

AnthropicMicrosoft产品更新推理
12:02
IT之家(RSS)
55
Meta 发布自研 Vistara 芯片,复用拆机 DDR4 内存搭配 DDR5 新服务器

Meta 在 ISCA 2026 大会发布自研 Vistara ASIC 方案,通过 CXL 2.0/1.1 规范的 PCIe Gen5 x16 接口将拆机 DDR4 内存桥接到新服务器。每台 MemServer 配备 768GB DDR5 和 256GB DDR4(3:1 配比),单个 ASIC 支持双通道 DDR4 最高 3200 MT/s、最大 256GB。该方案已在数百万台服务器中用于分离式机器学习推理、大数据处理等场景,可将推理服务器数量最多减少 25%,分布式缓存平均延迟降低 29%。

Meta论文/研究部署/工程
11:36
小互@xiaohu
精选81
一个人管理5款产品,80%时间不写代码?Every的复利工程

媒体软件公司Every公开「复利工程」方法论,以单人工程团队维护5款产品。核心是四步循环:Plan→Work→Review→Compound,其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/,使AI下次自动避坑。工程师80%时间花在Plan和Review,仅20%用于写代码。配套开源插件支持Claude Code等,含26个专项agent、23条工作流命令、13项技能,可零配置使用。/workflows:review一次并发14个agent审查代码,/workflows:plan在ultrathink模式下可并发40多个研究agent。

智能体教程/实践编码部署/工程

推荐理由:Every把内部单人维护5款产品的方法论和插件开源了,14个AI同时审代码、40多个研究agent做计划,是目前公开的多agent并行工程里数字最具体的参考之一,做AI辅助开发的可以直接上手抄。
11:29
MarkTechPost(RSS)
48
Top 6 无代码 AI 工具速览(涵盖多智能体、可视化工作流、RAG 引擎、本地 LLM 工作站、微调框架)

Atoms 是无代码平台,支持零基础设施、多智能体架构并即时连接 GPT 与 Gemini。Sim AI 是开源可视化 AI 智能体工作流工具,提供拖拽画布、80+ 集成及 MCP 支持,可云托管或 Docker 自部署。RAGFlow 是检索增强生成引擎,支持多格式文件建立知识库,连接 LLM(API 或 Ollama),具备检索质量验证。Transformer Lab 是免费开源本地 LLM 与扩散模型工作站,支持下载、对话、图像生成、微调(含 RLHF)、RAG 及嵌入计算。LLaMA-Factory 支持 100+ 模型及 SFT、PPO、DPO、LoRA、QLoRA 等训练方法。

智能体教程/实践部署/工程
11:06
Hacker News 热门(buzzing.cc 中文翻译)
48
形式化验证:你能对软件做出哪些保证?

形式化验证的成本和工具已进入可广泛使用阶段,AI消除了编写证明的最大障碍。与仅覆盖有限输入的测试不同,形式化验证通过验证语言(如Dafny、Lean、Rocq)编写属性和代码,由SMT求解器自动检查所有可达状态是否满足规范——例如权限系统的子集不变性,确保派生权限始终是父权限的子集。验证保证是绝对的:只要规范正确,代码在所有状态下都不会违反属性。过去编写证明需要博士级技能且工具缓慢,如今这一门槛正在降低。

教程/实践部署/工程
08:26
ginobefun@hongming731
55
BestBlogs 早报:智能体落地两大卡点--验证回路与组织成熟度,Spotify、Block、Spring AI 各给解法

智能体进入大型工程组织面临验证回路与组织成熟度两大瓶颈。Spotify 架构师分享在2000万行monorepo中运行Claude Code的经验,强调标准化代码库与可靠的CI、测试、自动合并等验证基建是前提,内部平台Honk整合这些工具。Block 工程负责人指出九成工程师在用Goose和Claude Code但功能交付未加速,提出六阶段成熟度模型与AI champions项目(约50名champion各投入30%时间),通过AGENTS.md沉淀知识,三个月内AI生成代码占比提升69%。Spring I/O 2026则梳理Spring AI从LLM调用到生产级智能体生态的演进。三篇从技术基建、组织流程、框架产品化给出解法。

智能体MCP/工具现象/趋势部署/工程
06:05
karminski-牙医@karminski3
57
DeepSeek DSpark:推测性解码技术详解

DeepSeek推出的DSpark是一种推测性解码技术,通过在Final RMSNorm后接入3层MTP微型Transformer堆叠,让大模型在输出前并行猜5个token,经置信度头剪裁后,送回大模型用prefill验证,正确则一次性吐出多个token。相比外挂小模型更高效,不降智,速度提升60%-85%。目前SGLang已有相关PR(#29538),DeepSeek已在HuggingFace发布多款DSpark魔改版小模型。

DeepSeek推理教程/实践部署/工程
05:22
Claude:Blog(网页)
精选66
为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude API)。即日起可用。

AnthropicGoogle产品更新编码

推荐理由:Claude Code企业版有了统一管理入口,SSO和成本控制是团队落地AI编程的关键,对CTO来说值得关注。
04:55
ClaudeDevs@ClaudeDevs
53
你现在可以在 Microsoft Foundry(托管于 Azure)上运行 Claude 模型。 Claude Opus 4.8 和 Claude Haiku 4.5 通过 Messages API 提供,支持 prompt caching、thinking 等功能。

Claude: Claude in Microsoft Foundry is now generally available, hosted on Azure. Azure customers get Claude Opus 4.8 and Claude ...

AnthropicMicrosoft行业动态部署/工程
02:26
TechCrunch:AI(RSS)
69
韩国科技巨头承诺超9000亿美元缓解AI内存芯片短缺"RAMageddon"

三星和SK海力士计划投资5180亿美元在韩国西南部新建四座内存晶圆厂,另投520亿美元建设HBM封装中心;SK、GS、Naver等企业将在2035年前投资3560亿美元建设AI数据中心。韩国科技巨头合计承诺超9000亿美元应对AI建设引发的全球内存芯片短缺(RAMageddon)。总统Jae Myung Lee称半导体、物理AI和AI数据中心是韩国下一工业时代三轴。三星另行公布十年投资约1.7万亿美元计划,包括光州新建晶圆厂和海南AI数据中心;SK集团宣布约1.4万亿美元中长期路线图,含扩充半导体产能和建设AI数据中心。

行业动态部署/工程
02:25
Claude@claudeai
55
Claude 现已在 Microsoft Foundry 中正式可用,托管于 Azure。 Azure 客户可获得 Claude Opus 4.8 和 Claude Haiku 4.5,并支持 Azure 身份验证、计费和承诺预留。
AnthropicMicrosoft产品更新部署/工程
02:22
Claude:Blog(网页)
精选64
Claude 在 Microsoft Foundry 正式可用

从今天起,Claude 模型在 Microsoft Foundry 上正式可用,托管于 Azure 环境,运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,通过 Messages API 调用,支持提示缓存和扩展思考。用户可选择推理处理位置,包括美国数据区域,由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制,并获得统一账单;符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。

AnthropicMicrosoft产品更新部署/工程

推荐理由:Claude 正式登陆 Azure Foundry 企业版,对于看重数据主权和现有 Azure 合约的企业是个好消息,但本质上是一次渠道铺开而非能力突破。
6月29日
23:58
Nathan Lambert@natolambert
50
Together AI 月处理 400T tokens。

Vipul Ved Prakash: http://x.com/i/article/2071357845443153921

行业动态部署/工程
23:55
Google Blog:AI(RSS)
39
问AI专家:全栈AI到底是什么?

一位Google专家解释了全栈AI方法的含义,并指出这一方法长期以来一直是Google AI工作的基础。

Google教程/实践部署/工程
21:25
TechCrunch:AI(RSS)
50
Omen AI 获 3100 万美元融资,用微型光谱仪实时监测数据中心液冷系统

数据中心液冷系统的冷却液若细菌滋生会导致堵塞,需停机数小时冲洗,单次损失达数百万美元。Omen AI 开发微型光谱仪,实时监测冷却液中的细菌生长,并检测铜、铬等磨损颗粒以预警泵体或密封件故障,替代传统送样检测。公司今日宣布完成 3100 万美元 A 轮融资,由 Nava Ventures 领投,CRV、Vanderbilt University、Mann+Hummel 等跟投。Omen AI 由 Zach Laberge 于 2024 年创立,已与十余家数据中心客户合作,包括使用 AMD 芯片的 AI 计算云公司 TensorWave。

行业动态部署/工程
19:10
公众号:小红书技术(dots.llm)
精选72
小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速

RedKnot 将 KV Cache 沿注意力头维度拆解,通过头分类稀疏(局部头占 83.4%–96.8%)、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上,TTFT 最高加速 1.6–3.54×,单卡并发提升 4.7–7.8×,预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×,KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。

arXivGitHub产品更新推理

推荐理由:小红书把 KV Cache 从 token 级拆成按头分家,这个思路让长文本推理的 TTFT 和并发都有数量级提升,开源出来对做推理引擎的同学是个福音。
19:01
IT之家(RSS)
47
谷歌云将提供用于科学研究的专业 AI 模型:可加速生物制药、材料科学和半导体制造等

谷歌云将上线 SandboxAQ 的两款专业 AI 模型:AQCat 用于半导体制造、电池开发等场景,识别具有潜力的催化剂和材料候选物;AQPotency 用于药物发现,筛选最可能结合疾病靶点的分子。SandboxAQ 前身为 Alphabet 量子技术部门,已通过美国《芯片法案》获 5 亿美元拨款。CEO 表示生物制药是当前最大短期机遇,客户正利用该技术研究胶质母细胞瘤、前列腺癌、阿尔茨海默病、帕金森病和心血管疾病。

Google行业动态部署/工程
18:17
Artificial Intelligence News(RSS)
47
温网2026年赛事新增IBM AI实时观赛功能

温网与IBM合作,在2026年赛事中推出两项AI功能。升级版Match Chat支持自然语言提问,基于watsonx Orchestrate和AI agent,利用实时数据、分析及历史表现生成对话式回复,部分回复包含照片和视频。2025年技术论文显示此前部署服务约100万用户,平均响应6.25秒。新功能Key Moments基于原有Likelihood to Win概率计算,识别影响比赛方向的关键回合(如长多拍、双误)并附AI分析,适用于男女单打。平台重构使用IBM Bob构建知识图谱,47分钟内提取约1.5万在线资产,将原需四到五名专家数月的工作量压缩至一名工程师四周完成。所有AI功能具备人工审核、可解释性和置信度评分等治理控制。

产品更新部署/工程
18:01
IT之家(RSS)
47
英伟达加码太空算力,为 Space-1 系统招募首席软件架构师

英伟达扩充 Space-1 项目团队,招聘系统软件首席架构师,负责开发首款太空计算系统 Space-1 的配套软件。Space-1 搭载 Vera Rubin AI 芯片平台,专为近地轨道航天任务设计,于今年 3 月 GTC 发布。该岗位要求航天领域 AI 基础设施经验,基础年薪区间 27.2 万至 43.125 万美元(约合 185.1 万至 293.4 万元人民币),另含股权激励。英伟达此前已发布轨道数据中心系统架构岗,此次招聘标志其从概念规划转入实体研发落地阶段。

行业动态部署/工程
16:37
The Decoder:AI News(RSS)
精选72
三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推高内存价格

在韩国政府支持下,三星和SK海力士计划投入5900亿美元扩大芯片产能,包括800万亿韩元新建四座工厂、81万亿韩元建封装中心,以及未来15年30万亿韩元用于研发下一代芯片。AI数据中心需求是主要驱动力。Jefferies预测,2026年Q3内存价格将上涨40%至50%,Q4再涨30%至40%,2027年继续上涨40%至45%,到2028年新产能仅上线15%至20%才可能缓解。两家公司合计控制全球近80%的高带宽内存芯片市场。内存涨价已推高消费电子产品成本,苹果已上调Mac和MacBook售价。

行业动态部署/工程
关联讨论 1 条Ars Technica:AI(RSS)
推荐理由:三星和SK海力士的5900亿美元投资计划加上内存价格至少涨到2028年的预测,表明AI基础设施的拉动远未到顶,做硬件采购和成本核算的人这一年都会很头疼。
16:17
Artificial Intelligence News(RSS)
47
xFusion 在 ISC 2026 推出四层可扩展企业 AI 硬件组合

xFusion 在 ISC 2026 推出从边缘到数据中心的四层 AI 硬件:边缘级 FusionXtation X3 8000 Gen2 支持 70B-200B 参数模型本地运行,8K 渲染快 70%、AI 性能提升 50%;工作组级 FusionXpark 可双机联合处理 405B 参数模型,数据隔离外部 API;企业级 TokenBox 单机承载 1.6 万亿参数模型,液冷噪音 35 分贝;数据中心级 FusionServer G6550 V8 配合液冷平台,单柜 240kW,PUE 1.06,采用石墨烯垫片和钻石冷板,FusionOne DFS 三节点 72 NVMe 阵列实现 200 GB/s 顺序读取、94.1% 存储利用率。

产品更新端侧部署/工程
16:01
IT之家(RSS)
58
三星宣布2655万亿韩元本土投资计划,重点布局半导体与AI

三星集团宣布在韩国本土合计投资2655万亿韩元(约11.69万亿元人民币),其中2030万亿韩元投向首都圈龙仁市和平泽市的半导体产业集群,重点布局AI半导体、机器人、电池及IT元器件材料;剩余625万亿韩元分散至湖南(425万亿)、忠清(140万亿)和岭南(60万亿)地区。具体项目包括:三星电子在光州备选建下一代半导体晶圆厂(400万亿)、在天安和温阳建HBM晶圆厂(56万亿);三星显示在牙山打造显示屏生产基地(67万亿);三星电机在世宗市建设AI服务器封装基板生产线;三星电子在龟尾建设人形机器人量产线与智能手机总装工厂。

行业动态部署/工程
15:01
IT之家(RSS)
39
消息称三星电机有望斩获5000亿韩元AI服务器MLCC大单,加码玻璃基板

据韩媒6月29日报道,三星电机正与美国云服务提供商就供应AI服务器用MLCC进行最后谈判,合同规模约5000亿韩元(22.02亿元)。业内预计MLCC同比涨价50-60%,高容产品或更高。同时,三星电机计划与日本住友化学成立玻璃基板合资公司,双方共投资5000亿韩元,三星电机持股过半并出资约3000亿韩元,工厂建于东宇精细化学平泽厂内,预计2028年初投产。2025年AI服务器高规格MLCC市场中,村田占45%、三星电机占40%份额。

行业动态部署/工程
15:01
IT之家(RSS)
59
韩国计划推出AI数据中心专属电价,提升产业竞争力

6月29日,韩国气候环境部长官金成焕宣布将推出分地区差异化电价制度,并新设AI数据中心专属电价方案,以提升半导体与AI产业竞争力。配套供电保障规划包括:西南圈半导体集群630万千瓦供电、日供水65万吨;龙仁集群1500万千瓦供电、日供水150万吨;AI数据中心至2029年前供应超800万千瓦电力。金成焕将当下定义为“电力为王的AI时代”,称半导体与电力已成为国家核心竞争力两大支柱。

政策/监管部署/工程
15:01
IT之家(RSS)
59
三星电子会长李在镕:公司产能已不足以满足 AI 市场需求,计划在韩国光州新建先进半导体封装工厂

三星电子会长李在镕表示,AI 芯片需求激增导致公司产能不足,正考虑在韩国光州建设先进半导体封装工厂。此外,三星还计划在龟尾推进机器人投资、在仁川布局生物医药、在蔚山投资电池业务、在釜山投资半导体基板业务。三星持续扩大 HBM 市场投入,客户涵盖英伟达、AMD 及谷歌等 AI 企业。今年 5 月,三星已向客户提供最新 12 层 HBM4E 内存样品,加速下一代 AI 内存产品竞争。

行业动态部署/工程
15:01
IT之家(RSS)
精选71
SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元

SK 集团会长崔泰源 6 月 29 日宣布,计划到 2035 年建成 15GW AI 数据中心容量,作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元(约 4.4 万亿元人民币),未来 10 年保持年均 100 万亿韩元以上国内投资,旨在实现从出口传统商品向智能服务的转变,构建韩国智能市场。此外,SK 海力士将向韩国西南部投资 400 万亿韩元,半导体供应项目总投资达 1100 万亿韩元(约 4.84 万亿元人民币)。

数据/训练行业动态部署/工程

推荐理由:SK 集团喊出 1000 万亿韩元建 AI 数据中心,数字唬人但周期长达十年,更像一种姿态宣示,真正改变算力市场格局还得看后续执行力和融资落地。
15:01
Alibaba Cloud@alibaba_cloud
43
我们很自豪地宣布,阿里云国际与NovaxAI @NovaxAi26 达成战略合作。通过将我们的全球云基础设施及AI进展与Novax AI的独特能力相结合,我们正助力AI公司实现更快、更稳定、更高效的全球增长。 #AlibabaCloud #NovaxAI #AIInnovation #YourAInnovationPlatform
行业动态部署/工程
13:27
宝玉@dotey
56
福特召回350名退休/离职资深工程师重新调教AI质检系统

福特过去三年召回350名退休/离职资深工程师(gray beard),负责带新人并重新调教未达预期的AI质检系统。整车工程副总裁Charles Poon承认曾错误认为引入AI就能产出高质量产品。效果立竿见影:福特时隔16年重返JD Power新车质量榜主流品牌第一(从第10升至第1),F-150、Super Duty、Mustang分别拿下品类冠军,预计今年节省约10亿美元质保和召回成本。福特未抛弃AI,正新增约10万项评估模拟更多路况。

TechCrunch: Ford rehires 'gray beard' engineers after AI falls short https://techcrunch.com/2026/06/28/ford-rehires-gray-beard-engin...

数据/训练行业动态部署/工程
‹ 上一页
12345…50
下一页 ›