6月4日

22:12

IT之家（RSS）

撼与 Sparkle 展出首款 Arc Pro B70 单槽显卡，8 卡可组 256GB 显存工作站

撼与 Sparkle 在台北电脑展展示单槽 Intel Arc Pro B70 32GB 显卡，型号 Sparkle Intel Arc Pro B70 32 GB Blower 1S。该卡搭载完整 BMG-G31 GPU，配备 32 个 Xe2 核心与 32GB 显存，采用涡轮散热和单 16pin 供电，加速频率 2800 MHz。单槽设计使工作站可同时安装 8 块，总显存 256GB，支持本地运行参数超 2000 亿的 AI 大语言模型。相比双槽版（230W TGP），单槽版 TGP 降至 160W。售价尚未公布，预计近期上市。

产品更新端侧部署/工程

21:11

IT之家（RSS）

DeepX 将导入三星 LPDDR5X-PIM，2nm端侧AI芯片DX-M2售价低于50美元

韩国AI芯片企业DeepX首席执行官在2026 K-AI半导体成长论坛上表示，其80 TOPS算力的2nm端侧AI芯片DX-M2将搭配三星电子LPDDR5X-PIM存内计算解决方案，上市价格低于50美元。PIM技术将专用数据处理器集成到DRAM中，减少数据移动，提升AI加速器能效。后续DX-M3目标实现1000 TOPS算力，将使用JEDEC标准化的LPDDR6-PIM。

端侧行业动态

21:11

IT之家（RSS）

长安汽车自研大模型长安天枢获国家生成式 AI 备案审批，成为重庆首家

长安汽车今日宣布，其全栈自研的长安天枢大模型已通过国家网信办生成式人工智能服务备案审批，成为重庆首家通过国家级备案的车企。该大模型以语音、语言、视觉等多模态数据为特征，具备感知、理解、推理、生成等技术能力，后续将作为基座模型支撑天枢智能化产品研发体系。

端侧行业动态

19:11

IT之家（RSS）

华硕破晓 Ultra 评测：第三代酷睿 Ultra 处理器 + 双层 OLED 触控屏

华硕破晓 Ultra 于今年 3 月发布，搭载第三代酷睿 Ultra X7 358H 处理器和 Intel Arc B390 核显（12 个 Xe3 核心），配备 14 英寸 2.8K 120Hz 双层串联 OLED 触控屏，峰值亮度 1400nit。整机重 1.1kg、厚 10.9mm，内置 70Wh 电池并支持 90W PD 快充，32GB+1TB 版本售价 14999 元。游戏实测方面，1080P 低画质下《CS2》达 306 帧，《赛博朋克：2077》开启 XeSS 后达 100 帧，45W 功耗下噪音不超过 45 分贝。

端侧评测/基准

18:25

公众号：面壁智能（MiniCPM）

智能座舱卷到头了？这份白皮书给出了答案

多模态现象/趋势端侧

17:11

IT之家（RSS）

TrendForce：预估 2029 年 Arm 架构笔记本渗透率将达 34.2%

TrendForce集邦咨询报告称，当前AI笔记本仍缺大规模驱动换机产品。随着Nvidia在Computex发布RTX Spark平台及N1/N1X处理器，首次将CUDA生态延伸至Windows笔记本市场，AI笔记本渗透率预计从2025年19.3%升至2029年84.9%。其中Windows x86 AI笔记本2029年占整体约50.7%，Windows on Arm AI笔记本由2025年1.2%升至2029年11.5%。苹果M系列维持约17%市场占比。在Windows on Arm、苹果M系列及AI Chromebook推动下，2029年Arm架构笔记本渗透率预计达34.2%。

现象/趋势端侧

16:11

IT之家（RSS）

骁龙 ARM 版微软 Surface Laptop 8 规格曝光，全新"翡翠"配色亮相

微软计划于2026年6月16日发布基于ARM的Surface Laptop 8，搭载高通骁龙X2 Elite和X2 Plus芯片，最高80 TOPS AI性能，新增浅绿色“翡翠”配色，有望首次升级OLED屏。13.8英寸和15英寸版均采用PixelSense触摸屏，可选12核X2 Elite或10核X2 Plus（最高4.0 GHz），最高32GB LPDDR5X内存，512GB/1TB/2TB可更换SSD。13.8英寸版54Wh电池本地视频最长20小时，15英寸版66Wh最长19小时。ARM版本未提及隐私显示屏，与英特尔企业版不同。

Microsoft 端侧行业动态

15:11

IT之家（RSS）

OpenAI 硬件体验如何？CFO 弗里尔称"很自然，很喜欢"

OpenAI 正开发高度保密的 AI 硬件，由乔尼·艾夫主导。CFO 莎拉·弗里尔称试用后感觉“非常自然，非常让人喜欢”。设备不是耳机（弗里尔开玩笑），也不是手机（奥尔特曼明确）。弗里尔称赞设计带来直接身体感受，将人性带入设备。该设备将于今年年底发布，但此前 OpenAI 法律文件称交付不早于 2027 年 2 月。OpenAI 正以约 65 亿美元收购艾夫创办的 IO 公司，共同打造“AI 产品家族”。

OpenAI 端侧行业动态

14:51

MarkTechPost（RSS）

精选71

Meet OpenJarvis：一个本地优先的设备端个人AI智能体框架，支持工具、记忆与学习

Stanford 研究人员发布 OpenJarvis，一个完全在设备端运行推理、智能体、记忆与学习的开源框架。它将个人 AI 系统分解为五个可组合原语：Intelligence、Engine、Agents、Tools & Memory 和 Learning。该框架与最佳云端模型的性能差距在 3.2 points 以内，边际 API 成本降低约 800 倍。

智能体产品更新开源生态端侧

推荐理由：斯坦福这个框架把云端模型能力拉到本地，成本降了800倍，所有想做离线个人助理的开发者该试试看，开源实现比PPT有说服力。

14:11

IT之家（RSS）

红魔游戏平板 5 Pro 入网：9 英寸 185Hz 屏，骁龙 8 Elite Gen5，6 月发布

型号 NP06J 的红魔游戏平板 5 Pro 已入网，支持 80W 快充，预计 6 月发布。工程机配置 9 英寸 185Hz OLED 屏、骁龙 8 Elite Gen5、液冷循环散热系统、8300mAh± 电池，提供 12+256GB/16+512GB/16+1TB/24+1TB 存储，配备 RGB 灯和透明设计，内置豆包大模型。官方预告十大黑科技，包括超高刷游戏平板、全新发光材料、透明纯平设计、顶级触控芯片、PC 级散热材料、CUBE 擎天游戏引擎等。

产品更新端侧

12:11

IT之家（RSS）

谷歌 AI Edge Gallery 登陆 Mac，16GB 内存可运行 Gemma 4 12B 模型

谷歌 AI Edge Gallery 现已登陆 macOS，Mac 用户可在本地离线运行 Gemma AI 模型。该应用提供 5 个谷歌指令调优模型，其中 Gemma-4-12B-it 可在 16GB 内存 Mac 上处理文本、视觉和音频，具备代码能力，实现设备端智能体和多模态分析。AI Edge Gallery 完全离线、私密性高且速度快。同时，谷歌推出免费听写应用 Google AI Edge Eloquent，支持语音转文字、去除口误和轻度润色，全部在设备端完成，并支持不同写作风格和自定义词汇。

Google 产品更新多模态端侧

11:10

IT之家（RSS）

AMD 高管回应英伟达 RTX Spark 入局：欢迎竞争，自家 Strix Halo 系列足以应对

AMD 客户端业务高级副总裁拉胡尔·蒂库在 2026 台北国际电脑展上回应英伟达推出 RTX Spark 入局 AI PC 处理器市场，表示欢迎竞争，认为大容量本地内存对 AI 智能体工作负载至关重要。AMD 的 Strix Halo 及后续 Gorgon Halo 足以与 RTX Spark 竞争，Gorgon Halo 采用 Zen 5 CPU 和 RDNA 3.5 GPU，统一内存最高 192GB。软件生态方面，AMD 主推 ROCm，称 CUDA 的壁垒影响已较三年前下降，开发者迁移难度较低。

推理端侧行业动态

09:10

IT之家（RSS）

微软加速 Arm 生态补缺，用 AI 推进 Win11 原生应用适配

微软将在 2026 年 Build 开发者大会上展示如何利用 AI 智能体，帮助开发者将 x86 应用转换为 Windows on Arm 原生应用。目前原生 Arm 版本已占所有 Windows on Arm 用户应用使用时长的 90%，剩余缺口仍需依靠 Prism 仿真层运行。AI 智能体可承担重复代码处理、转换检查和兼容性验证等任务。

智能体 Microsoft 端侧行业动态

09:10

IT之家（RSS）

微软 Surface RTX Spark Dev Box 更详细规格曝光：约 1000 孔铝壳散热驾驭 AI 负载

微软 Surface RTX Spark Dev Box 是一款面向本地 AI 开发的紧凑型桌面设备，主打模型微调、本地推理和智能体式工作流。采用 NVIDIA Grace CPU（最高 20 Arm 核心）、Blackwell RTX GPU（6144 CUDA 核心），配备 128GB 统一内存，AI 算力最高 1 Petaflop，可本地运行 120B 参数模型，整机功耗 100W。一体式铝制外壳覆盖约 1000 个散热孔兼作散热器，预装 Visual Studio Code、GitHub Copilot、WSL 2、CUDA 支持等工具。

Microsoft 产品更新端侧

09:10

IT之家（RSS）

苹果 iOS 27 Siri 部分查询将经 Google Cloud 调用授权版 Gemini，使用 NVIDIA Blackwell B200 集群处理

科技媒体 The Information 报道，苹果 iOS 27 版 Siri 的部分用户查询将跳转至 Google Cloud，调用授权版 Gemini 模型，并由谷歌的 NVIDIA Blackwell B200 GPU 集群处理。Blackwell B200 基于 Blackwell 架构，面向大模型训练与推理。为降低云端隐私风险，苹果将启用英伟达机密计算（confidential compute）硬件级安全功能，在 GPU 处理数据时加密，保护 AI 模型在共享云环境中的机密性与完整性。

Google 安全/对齐推理端侧

08:10

IT之家（RSS）

豆包宣布将推出专业版，基础功能保持免费；阿里千问向第三方Agent全面开放

豆包声明，针对专业人群推出豆包专业版，基础功能（搜索问答、写作生图、语音和视频对话）保持免费。阿里千问向第三方Agent、Skill全面开放，瑞幸咖啡、肯德基、蜜雪冰城、东方航空为首批接入测试企业。DeepSeek首轮融资拟筹集500亿元，腾讯、宁德时代等参投，投后估值或达4000亿元。腾讯人士称微信AI智能体上线时间暂未定，取决于监管审批。苹果MacBook Neo开售三周出货110万台。

智能体 DeepSeek 端侧行业动态

07:10

IT之家（RSS）

微软 Surface Pro 第 12 版宣传图曝光：骁龙 X2 Elite 芯片、续航增 10%

科技媒体 WinFuture 曝光微软 Surface Pro 第 12 版宣传物料，预计本月发布。新机搭载高通骁龙 X2 Elite 处理器，顶配 13 英寸采用 12 核 Oryon ARM 芯片，NPU 算力最高 80 TOPS，可支撑 Copilot 本地 AI 任务。配备最高 32GB 内存和 1TB PCIe 4.0 SSD（支持更换）。续航方面本地视频播放最高 15.5 小时，较上一代提升 10%。外观沿用家族式设计，采用明亮 OLED 触控屏，提供黑、铂金、Dune（金色）三种配色，取消蓝色版本。完整规格与售价尚未公布。

Microsoft 产品更新端侧

03:22

Ars Technica：AI（RSS）

Google 新发布的 Gemma 4 12B 模型可在任何 16GB 内存笔记本电脑上运行

Gemma 4 12B 采用新的编码方案与 token 预测，实现了超越自身参数规模的性能表现。该模型专为在 16GB RAM 的笔记本电脑上本地运行而设计。

Google 多模态模型发布端侧

01:38

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选78

Gemma 4 12B：一种统一的、无需编码器的多模态模型

Gemma 4 12B 是 Google 发布的一款统一架构、无需独立视觉编码器的多模态大语言模型（LLM）。该模型直接处理图像与文本输入，无需传统视觉编码器，简化了多模态推理流程。基于 12B 参数规模，Gemma 4 12B 面向开发者工具生态开放。目前其具体 benchmark 分数、上下文窗口、价格及开源/API 可用性等细节尚未披露。

Google 多模态模型发布端侧

同一事件，精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》

推荐理由：我觉得Gemma 4 12B最大的变化不是参数大小，而是第一次在开源模型里把多模态直接交给LLM主干处理，没有单独的视觉编码器，这意味着本地多模态应用的延迟和内存占用都会大幅下降，对于在笔记本上做Agent的开发者，这是一个必试的版本。

00:42

HuggingFace Daily Papers（社区热门论文）

精选76

Ultralytics YOLO26：统一实时端到端视觉模型

Ultralytics YOLO26 采用双头设计实现原生无 NMS 的端到端推理，彻底移除 DFL，获得更轻检测头与无约束回归范围。训练结合混合 Muon-SGD 优化器 MuSGD、转向推理头的 Progressive Loss 及保证小物体正样本的 STAL 标签分配。支持检测、实例分割、姿态估计、定向检测和分类，提供 5 种尺度（n/s/m/l/x）及开放词汇扩展 YOLOE-26。全部尺度在 COCO 上达 40.9–57.5 mAP，T4 TensorRT 延迟 1.7–11.8 ms；YOLOE-26x 在 LVIS minival 文本提示下达 40.6 AP。代码已开源。

开源生态端侧论文/研究部署/工程

推荐理由：这次YOLO26把NMS和DFL都拿掉了，还把大模型训练的Muon优化器改成MuSGD，在COCO上的速度精度平衡比上一代强不少，做实时检测的应该拿来跑一跑。

00:07

Google Developers Blog（RSS）

在笔记本电脑上运行 Gemma 4 12B：借助 Google AI Edge 解锁本地智能体工作流

Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行，支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化，通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外，LiteRT-LM CLI 新增 serve 命令，可创建行业兼容的本地端点，驱动完全本地的 AI 工具和智能体。

智能体 Google 产品更新多模态

关联讨论 6 条

00:07

Google Developers Blog（RSS）

同事件精选78

Gemma 4 12B：开发者指南

Gemma 4 12B 是一款密集多模态模型，专为消费级设备上的高性能本地 AI 执行而设计。其采用新颖的无编码器架构，绕过传统视觉和音频编码器，将多模态数据直接输入大语言模型主干。

Google 多模态模型发布端侧

同一事件，精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》

推荐理由：Google 把多模态模型直接塞进消费级设备，靠的不再是缩水而是架构层面的创新。12B 放在本地跑，这次玩法变了。

6月3日

23:10

IT之家（RSS）

小米汽车：升级 HyperOS 1.16 版本后，YU7 Pro / Max / 长续航版均搭载 XLA 认知大模型

小米汽车升级 Xiaomi HyperOS 1.16 后，YU7 长续航版、Pro 版、Max 版均搭载小米 XLA 认知大模型，新增语音控车 Beta 和商场地库车位级领航功能。YU7 GT 可通过舒适模式或经济模式调节驾驶体验，前者动力平顺、悬架滤震，后者前电机脱开、后驱行驶以延长续航；晕车舒缓模式则优化动力、制动和能量回收，降低晕车发生率。后续将不断解锁更多新体验。

产品更新端侧

23:10

IT之家（RSS）

双 2.5G 网口：高通骁龙 8cx Gen3 迷你主板瑞莎 Dragon Q8B 亮相，104 美元起

瑞莎在深圳开发者活动日展出 Dragon Q8B 迷你主板，搭载 5nm 骁龙 8cx Gen3（SC8280XP），八核 Kryo CPU 最高 3.0 GHz，Adreno 690 GPU，AI 算力最高 29 TOPS，支持最高 32GB LPDDR4X 内存。板型 100mm×75mm，配备双 2.5GbE 网口、双 M.2 2280 NVMe 插槽（PCIe 3.0 x4+x2）、UFS 3.1、双 USB-C（DP 1.4b）、双 USB-A 3.2、HDMI 2.1、40 针 GPIO 等。4GB 版定价 149 美元，首发优惠 45 美元（约 104 美元），7 月 31 日上市。同期展出更小的 Dragon Q5E（QCS6690，6 TOPS）及两款与飞牛合作的高通平台 NAS（6 盘位全闪存、4 盘位）。

产品更新端侧

22:09

IT之家（RSS）

同事件精选73

月之暗面 Kimi Work Beta 版开启内测：面向知识工作者的通用型本地 Agent

月之暗面今日宣布，Kimi Work Beta 版随最新版 Mac 和 Windows 客户端开启内测。Kimi Work 是基于 Kimi Code 的通用型本地 Agent，支持安装使用技能、运行定时任务，并继承在线版的专业技能与数据库，内置可调用浏览器的 Kimi WebBridge。用户用自然语言描述目标即可自动拆解任务、并行执行并交付产物。支持 Agent 集群，最高可创建含 300 个子 Agent 的团队。官方透露，Kimi Work 自身由 Kimi Code 写成，工程师一周内完成客户端开发，累计产出超 5 万行有效代码，其中 92% 由 AI 自主生成。

智能体产品更新端侧编码

同一事件，精选展示《Kimi Work Beta版发布：面向知识工作者的本地Agent》

推荐理由：月之暗面把AI Agent搬到了本地，不是聊天窗口，而是直接操控你的电脑。92%的代码由AI自己写的自举能力，比功能本身更吓人。做办公自动化的同行该看看怎么被卷了。

22:09

IT之家（RSS）

上海海思一站式集成开发环境 HiSpark Studio 开源

上海海思 HiSpark Studio 正式在 GitCode 平台开源。该 IDE 基于 VS Code 扩展架构，集成工程管理、代码编辑、编译构建、烧录调试、图形化配置等全链路开发能力，支持智能设备、星闪（NearLink）、嵌入式 AI 开发。核心亮点包括 SDK 一键下载、一键编译与烧录、GDB 调试、图形化工具集（图片解压缩、视频首帧提取、3D 建模、蒙版工具）、系统配置工具、AI 模型处理（量化压缩、格式转换、一键部署验证）及远程开发模式。

开源/仓库端侧

17:09

IT之家（RSS）

微软 Win11 设置暗藏 AI 卸载选项，一键释放超 2.5GB 硬盘空间

微软在 Win11 实验预览版 26300.8553 中隐藏了 AI 模型卸载功能，用户可在设置页面直接移除 Phi Silica 等组件以释放硬盘空间。仅 Phi Silica 模型就占用超 2.59 GB。该模型是微软自研的小语言模型，通过设备本地 NPU 运行，支持文本摘要、重写和内容生成。此卸载选项适用于 Copilot+ PC，可按需移除不需要的 AI 组件。

产品更新端侧

16:09

IT之家（RSS）

消息称 OPPO 及 vivo 手持 Pocket 云台相机采用 2 亿像素 1/1.12" 大底主摄，或与哈苏 / 蔡司联名

OPPO 和 vivo 的手持 Pocket 云台相机将采用 200Mp 1/1.12" 大底主摄，有望与哈苏或蔡司联名，内置“旗舰级”芯片并支持生态互联。该产品预计今年第四季度发布，备货量预期在百万台左右。同时，荣耀的 Robot Phone 手机内置可折叠云台臂、200Mp 4DoF 云台主摄和端侧大模型，并与“阿莱”影像联名。华为、荣耀的手持云台相机产品也有立项，预计 2027 年发布。

端侧行业动态

15:47

公众号：面壁智能（MiniCPM）

AI构筑"新丝路"，面壁智能以端侧AI赋能"一带一路"数字合作

面壁智能CEO李大海近日在中吉媒体合作论坛上指出，中亚可成为数字丝绸之路智能枢纽，需提供低成本、可落地、可信赖的AI能力。公司自研MiniCPM系列大模型累计下载突破3000万次，已在汽车、智能手机等领域落地。面壁智能曾参与老挝国家大模型建设，打造的老挝语翻译模型在专业评测中超越GPT-4o，并训练融入本土文化的大模型，设计低成本多模型联合推理方案。李大海提出AI应成为普惠基础设施，合作需从概念转向实体落地。面壁智能已跑通“主权大模型”全链路技术路径，形成可全球复用的智能底座。

大佬观点开源生态端侧

15:09

IT之家（RSS）

磐镭 YO2 迷你主机发布：AI Max+ 395 处理器，128GB+2TB 存储，21999元

磐镭推出YO2迷你AI工作站主机，搭载AMD锐龙AI Max+ 395处理器，配备128GB LPDDR5X-8000内存与2TB SSD存储，定价21999元。主机尺寸为193×246×92毫米，重1850克，采用双涡轮风扇与三热管散热系统，支持160W峰值性能释放，具备Wi-Fi 7与蓝牙5.4，提供USB-C 40Gbps等丰富接口。

产品更新端侧

15:09

IT之家（RSS）

行业首个：荣耀 Magic8/500/X70 全系列已支持微信 A2A 助手能力

荣耀成为首个支持微信 A2A 助手能力的手机品牌。目前，荣耀 Magic8 系列、500 系列和 X70 的全系列机型均已支持该功能。用户需将荣耀 YOYO 智能体更新至 90.10.30.063 及以上版本，微信更新至 8.0.72 及以上版本，即可通过唤醒 YOYO 实现给微信好友发送消息、发起语音或视频通话。据悉，荣耀目前 50% 的活跃设备都已支持此能力。

MCP/工具端侧行业动态

15:09

IT之家（RSS）

瑞昱推出 PCIe 桥接扩充芯片 RTL9151AS 与端侧 AI 加速芯片 RTD2811

瑞昱半导体在 COMPUTEX 2026 展示的 RTL9151AS 与 RTD2811 两款芯片获得 Best Choice Award。RTL9151AS 是一款 PCIe 桥接扩充芯片，采用 PCIe Gen4 ×1 上行接口，下行可扩展出 1 个 2.5GbE 以太网口、7 个 USB (10Gbps) 和 4 个 SATA (6Gbps)，旨在以较少通道提供多样化扩展。RTD2811 是一款边缘端 AI 加速芯片，具备 20TOPS 算力的 NPU，支持 INT4/INT8/FP8 格式，可运行 CNN 与 Transformer 模型，并集成了 CPU 与 GPU，兼容 LPDDR 4X/5/5X 内存。

产品更新端侧

14:09

IT之家（RSS）

消息称全球首款机器人手机荣耀 Robot Phone 支持 C-Log、LUTs 等进阶影音创作功能，第三季度发布

消息称荣耀 Robot Phone 将于今年第三季度上市，定位为“全球首款机器人手机”，主打影音创作。其核心功能包括利用 AI 实现自动追踪主体与全自动运镜，提供大量预设模板。同时支持 C-Log、LUTs 等专业格式，并具备锁焦、锁白平衡、锁 AE 及锁运镜数据等能力。该机此前已宣布与电影摄影机厂商 ARRI 阿莱达成战略合作，其抗跌落性能已达旗舰水平，但防水能力仍有提升空间。

产品更新多模态端侧

11:09

IT之家（RSS）

微软为英伟达 RTX Spark 重塑 Windows 11 底层：改写 CPU 调度、优化 AI 内存负载

为适配英伟达 RTX Spark 芯片，微软正改造 Windows 11 底层能力。该芯片采用双 Die 设计，整合 20 核 Arm CPU、Blackwell RTX GPU（最多 6144 个 CUDA 核心）及统一内存，定位为 Windows on Arm 的 AI 超级芯片，可本地运行 120B 参数大语言模型，上下文窗口达 100 万 Token。为此，Windows 11 引入了工作负载配置调度以动态分配 CPU 核心算力，并优化了大内存页处理与 GPU 可访问内存的页面管理。同时，Prism 模拟器已针对该芯片微架构调优，以提升 x86 应用兼容性。

Microsoft 产品更新端侧部署/工程

10:09

IT之家（RSS）

微软定调 Win11：打造成 AI 应用和智能体开发平台

微软在 Build 2026 上宣布，Windows 11 将从带 AI 功能的桌面系统，转型为 AI 应用和智能体的开发平台。新举措包括引入 Microsoft Execution Containers 以安全管控智能体、提供本地模型 Aion 1.0 Instruct 和 Aion 1.0 Plan、并将 Windows AI 接口从 NPU 扩展至 GPU 和 CPU。目标是整合目前过于分散的 AI 开发工具链，为开发者提供覆盖开发、部署、监控到安全管理的统一工作流。

智能体 Microsoft 产品更新端侧

09:09

IT之家（RSS）

256-bit 大位宽 LPDDR，江波龙发布 AIDIMM、AILPBGA 内存方案

江波龙在COMPUTEX 2026上发布了两款端侧AI推理专用内存产品：插槽式的AIDIMM与焊接式的AILPBGA。两者均基于LPDDR5X，拥有256-bit大位宽，支持9600MT/s速率。AIDIMM尺寸为80mm×30mm，至高支持128GB容量。AILPBGA采用22mm×22mm的BGA1764封装，容量覆盖24~64GB，适用于紧凑型嵌入式场景。

产品更新端侧

09:09

IT之家（RSS）

Perplexity Computer 将升级混合AI调度：本地与云端模型自动拆分任务

Perplexity 计划于7月升级其自主AI智能体系统 Perplexity Computer，引入混合AI调度能力。该功能可根据场景和需求，自动将任务拆分至本地模型与云端前沿模型：涉及金融记录、健康信息等敏感数据的任务由设备上的小模型在本地处理；需要完整前沿能力的复杂任务则交由服务器处理。此举旨在免去用户手动选择“本地”或“云端”的步骤，并协调完成混合类型的真实任务。

智能体产品更新端侧

08:09

IT之家（RSS）

郭明錤：黄仁勋"重新发明 PC"口号与英伟达 RTX Spark 端侧 AI 智能体蓝图

天风国际分析师郭明錤评论称，英伟达 RTX Spark 的核心看点在于黄仁勋提出的“重新发明 PC”口号及端侧 AI 智能体工作流概念。该概念涵盖操作系统、云端与本地大语言模型切换等要素，但并非英伟达原创。他指出，RTX Spark 在未来 2 年内仍是笔记本电脑中的利基市场产品，目标人群是对端侧 AI 算力有需求的重度用户。要真正实现智能体工作流，需依赖 CUDA Toolkit 公开支持 Windows Arm64 及微软 Windows 本机 AI 智能体架构正式商用等软件生态支持。苹果在 WWDC 上对设备端 AI 智能体工作流的回应也将是另一观察重点。

智能体大佬观点端侧

04:09

IT之家（RSS）

从端侧到云端统一加速：英伟达、微软展示 AI 智能体完整部署栈，Fairwater 工厂提前上线

在 Build 2026 上，英伟达与微软展示了覆盖端侧到云端的统一 AI 智能体部署栈。端侧发布了提供 1 petaflop AI 算力与最高 128GB 统一内存的 RTX Spark，以及搭载 GB300 芯片、可本地运行最高万亿参数模型的 DGX Station for Windows。云端，Nemotron 3 Ultra 推理模型上线微软 Foundry，Claude 模型也已在 Azure 的 GB300 系统中原生运行。数据层，微软 Fabric Data Warehouse 内置的 NVIDIA 加速计算使 SQL 执行速度最高提升至 CPU 基线的 6 倍。此外，微软位于威斯康星州的 Fairwater AI 工厂提前上线，并已完成对下一代 NVIDIA Vera Rubin 平台的验证，其推理吞吐量提升最高达 10 倍。

智能体 Microsoft 产品更新端侧

03:45

The Verge：AI（RSS）

微软 Build 2026：七项最重要的发布

微软 Build 2026 发布会宣布了七项重要更新。硬件方面，推出了专为本地AI开发设计的 Surface RTX Spark Dev Box 迷你PC，搭载 Nvidia Arm 芯片与128G内存。软件层面，发布了始终在线的个人AI助手 Copilot Always On，并更新了 Windows Subsystem for Linux（WSL），后者将原生支持运行AI工具的 Linux GUI应用。此外，微软还更新了其自研的AI模型。

Microsoft 端侧行业动态