通义实验室发布教程,演示如何在 Android 手机上部署 MCP 感知服务器,使手机具备本地视觉与听觉分析能力。核心基于端侧 MNN 推理引擎和 Qwen3-VL 2B 模型(约 1.3GB),摄像头与麦克风采集的音视频在本地实时转化为结构化 JSON,再通过 MCP Tool 供 Claude Code 等云端 Agent 远程调用。整个过程不上传原始数据,仅传输语义提取结果。项目已开源,实测可识别红绿灯状态等场景。
通义实验室发布教程,演示如何在 Android 手机上部署 MCP 感知服务器,使手机具备本地视觉与听觉分析能力。核心基于端侧 MNN 推理引擎和 Qwen3-VL 2B 模型(约 1.3GB),摄像头与麦克风采集的音视频在本地实时转化为结构化 JSON,再通过 MCP Tool 供 Claude Code 等云端 Agent 远程调用。整个过程不上传原始数据,仅传输语义提取结果。项目已开源,实测可识别红绿灯状态等场景。
苹果iOS 27或将对Siri进行大改造,将其转变为类似ChatGPT的独立聊天App,并可能整合进灵动岛。核心变化是允许Siri接入ChatGPT、Gemini、Claude等多种外部AI模型。交互界面将变为“Search or Ask(搜索或提问)”,体验更偏向对话式。
智能体AI推理的设计空间横跨两个极端:云端大语言模型性能强大但成本高,设备端小语言模型更经济。混合多智能体系统结合设备端与云端模型,为平衡提供了可能,但也引入了任务准确性、经济成本与设备能耗三者紧密关联的复杂权衡。由于缺乏通用设计原则,此类混合方案多是基于特定领域做出的临时决策。本研究通过改造两种代表性的多智能体架构以适配混合推理,系统探讨了不同设计选择如何影响系统在性能、成本与能耗的Pareto前沿上的取舍。结果表明,小语言模型确实能从大语言模型的辅助中获益,但最优架构高度依赖具体任务,且更多的前沿计算并不总能带来更好的性能。
根据戴尔的 COMPUTEX 2026 资料,其即将发布搭载 NVIDIA "N1X" 芯片的 XPS 机型,相关内容预计于北京时间 6 月 1 日 11:00 解禁。联想近期也有搭载 "N1X" 的 YOGA 360 16 笔记本通过 3C 认证,这共同指向 NVIDIA 将在 COMPUTEX 2026 上正式发布这款 SoC。泄露信息显示,"N1X" 与 DGX Spark 上的 GB10 超级芯片同源,预计采用 20 核 Arm CPU 和 6144 CUDA GPU,并支持 256-bit LPDDR5x 内存。
LG UltraGear evo 39GX950B 国行版上市,为全球首款 39 英寸 5K2K OLED 显示器,首发价 8499 元。该产品采用 1500R 曲率的第四代 Tandem OLED 面板,峰值亮度 1500nits,支持 5120×2160 165Hz 与 2560×1080 330Hz 双模切换,色域覆盖 99.5% DCI-P3。它搭载“免 GPU”端侧 AI 超分辨率解决方案,并支持 AI 场景优化与音频技术。接口配备 HDMI 2.1、DisplayPort 2.1 及 USB-C 10Gbps 等。
惠普战 66 笔记本 AMD 版现已开售,搭载 AMD 锐龙 7 H 255 标压处理器和 24GB 内存,具备战 AI 应用和开发工具,至高可部署 140 亿参数本地大模型,售价 5899 元。
5月29日,新款乐道L60发布并开启预售,计划于6月11日正式上市。新车共进行106项升级,外观新增车顶激光雷达,尾标更换为乐道Logo。智能驾驶方面,搭载蔚来自研5nm车规级智驾芯片神玑NX9031及蔚来世界模型NMW架构;纯视觉版车型则继续采用英伟达Orin-X芯片。动力提供单电机与双电机两种规格,配备900V高压架构,并提供530km至740km等多种CLTC续航版本。
面壁智能联合清华大学、OpenBMB发布并开源两大数据集:Ultra-FineWeb-L3(超600B Tokens,中文200B+,为当前最大中文预训练合成数据集)和UltraData-SFT-2605(国内首个千万级同时含深思考与非思考标注的SFT数据集)。两者基于UltraData数据分级治理体系构建,在MiniCPM5-1B训练流程中得到完全验证,覆盖预训练退火到后训练SFT全链路。已上线UltraData网站与HuggingFace,免费开放。
关联讨论 1 条X:面壁智能 OpenBMB (@OpenBMB)为解决轻量级移动端GUI智能体在端到端规划上的不足,本文提出UI-KOBE框架。该框架通过自主探索移动应用,构建包含UI状态节点与转换边的应用知识图谱。运行时,轻量级智能体可利用该图谱作为外部引导,结合用户任务与当前屏幕截图,在多种候选动作中进行选择。此方法减轻了轻量级模型进行端到端规划的负担,使其能更有效地执行任务,并兼顾效率、可解释性与隐私保护。
PhoneWorld 提出了一种可重用流程,能将真实的手机 GUI 轨迹和截图转化为可控的智能体环境、可执行任务及自动验证器。该系统覆盖了 16 个领域的 34 款应用。实验表明,在固定训练预算下,用 PhoneWorld 数据替代部分基准数据,可同步提升四个评测基准的得分。研究还发现,增加 PhoneWorld 监督数据或扩大应用覆盖范围能进一步提升性能,这标志着从构建单一基准转向规模化供应智能体环境的范式转变。
微软有望与英伟达合作,推出搭载 NVIDIA N1 或 N1X 芯片的 Surface 笔记本电脑。该产品或将在 2026 台北国际电脑展上公布。微软当前的 Surface 产品线已收缩为 Laptop 与 Pro 两条主线。英伟达 N1/N1X 芯片据称在图形处理与驱动支持上更具优势,能强化本地 AI 负载能力。
华为鸿蒙开源了高性能GPU加速框架 SimpleGPULayer(SGL),以简化图像处理、AI推理、2D/3D渲染等场景的GPU调用。开发者无需处理底层设备初始化、显存管理等复杂细节,仅需几行代码(如示例中的3行C++代码)即可接入GPU加速。该框架提供C API和NAPI接口,方便集成到鸿蒙应用中。其图像处理能力已在悟空图像等应用中落地使用。
Oura 发布 Ring 5,称其为全球最小智能戒指,尺寸较 Ring 4 缩小 40%,宽度 6.09 毫米,厚度 2.28 毫米。产品重构了传感器与内部硬件以维持追踪能力,并新增 Health Radar(含夜间血压趋势与呼吸分析)、AI 生成健康建议、医疗记录导入及 GLP-1 追踪工具。起售价 399 美元,另需订阅服务(5.99 美元/月或 69.99 美元/年)。
Liquid AI 发布了 LFM2.5-8B-A1B 模型。这是一款混合专家架构模型,总参数量为 8.3B,每次推理仅激活其中的 1.5B 参数。该模型支持 128K 上下文窗口,具备推理和工具调用能力,可在消费级硬件上本地运行。
Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。由于模型规模庞大,本地处理可能无法完全实现,因此一个云端组件很可能是必然的选择。
零零科技发布哈浮 AQUA 飞行相机,定位为全球首款专为水上运动打造的 100% 防水飞行相机。基础套装零售价 8999 元,畅飞套装 9999 元。机身重量不足 250 克,具备 IP67 防尘防水能力,可抗 7 级大风,最高时速 40 公里。它配备 1/1.28 英寸 CMOS 传感器,支持录制 100 帧/秒的 4K 视频,并内置超过 15 种智能运镜模式(包括桨板、皮划艇、冲浪模式)及 SmoothCapture 稳定系统。该机支持正浮力,可在水面起降。
Google 在 I/O 大会上发布了新款 Coral Board,这是一款紧凑型单板计算机,专为设备端 AI 设计,可在本地运行 Gemma 3 模型。
比亚迪王朝系列首款搭载“迪迪虾”智能体系统的B级插混SUV宋Ultra DM-i上市。该系统是具备主动交互能力的AI智能体,支持通过自然语言进行内容推荐与服务预订。新车CLTC纯电续航最高310公里,综合续航达1845公里,亏电油耗为3.3L/100km。其长宽高为4850/1910/1670mm,轴距2840mm。共推出5款车型,售价12.99万至15.99万元,首次将310公里纯电续航的B级插混SUV带入13万元级市场。
联发科技发布天玑 7500 移动平台,这是首款应用 Arm C1 系列 CPU 内核的主流移动 SoC。芯片基于 4nm 制程,采用 4× Arm C1 Pro + 4× Arm C1 Nano 的 CPU 架构,配备 Arm Mali-G625 MC2 GPU 与 NPU 850(性能提升超 100%),支持 LPDDR5 内存和 UFS 3.1 闪存。其显示支持 144Hz 主屏与 120Hz 副屏,摄像头最高支持 200MP。官方称其在日常应用中能效提升 5~9%,游戏能效提升 4~7%,视频转码、文件传输与应用切换速率均有显著提升。
比亚迪发布“天神之眼”辅助驾驶系统四大升级。架构升级为“璇玑架构 2.0”,采用全栈自研中央大脑,系统时延低至8微秒,
慧荣发布面向AI推理与KV缓存优化的SSD主控SM2524XT。该芯片基于台积电6nm制程,采用DRAM-less架构,支持PCIe Gen5 ×4。其顺序读取速率达14GB/s,随机性能2500K IOPS,能效相较上代提升25%。
Rivian首席软件官Wassym Bensaid同时担任该公司与大众集团成立的合资公司RV Tech的联席CEO。这家合资公司源于大众近60亿美元投资,旨在为大众及其旗下品牌的未来电动汽车开发操作系统和电子架构。Rivian正准备交付基于新架构的更平价车型R2,并已在R1车型中推出了AI驱动的Rivian Assistant。Bensaid将此视为打造更具“智能体”特性车载软件平台的关键一步。
比亚迪发布中国首款 4nm 智驾芯片“璇玑 A3”,支持 L3、L4 自动驾驶。该芯片已开启规模化量产,三颗芯片总算力超 2100TOPS,结合自研算法优化后算力利用率提升 100%。比亚迪称其为全球唯一拥有芯片全流程制造能力的车企,目前已拥有超 7000 人的芯片研发团队。
高通发布面向入门级Windows笔记本的骁龙C处理器,首批设备将于今年晚些时候上市。该芯片定位300美元及以上市场,采用Kryo CPU核心,内置NPU但无法支持微软Copilot Plus功能。宏碁推出首款搭载该处理器的笔记本Aspire Go 15,高通也表示正与谷歌合作探索在Googlebooks设备上的应用。
Vertu 推出一款新折叠手机,基于开源项目 Hermes 构建,融合了 AI 智能体工作流、企业系统集成和超高端奢华材质。该设备定价 6,880 美元起。
比亚迪董事长王传福宣布,天神之眼自动驾驶版(L3 / L4)将首搭超千线激光雷达、闪拍摄像头和双远红外摄像头。他强调电动化上半场看电池,智能化下半场看芯片,并指出比亚迪是国内首个造出车规级IGBT和SiC功率芯片的企业。
5月21日,2026世界无人机大会上,美团宣布“城市低空物流航网”正式常态化运营,并发布第四代无人机长程索降版M-Drone 4L Winch、智能接驳机场M-Port 3和无人机云枢M-DaaS 3。M-Drone 4L可在-20℃至50℃、大雨、中雪及6级大风下稳定飞行,覆盖国内97%以上城市场景;M-Port 3占地仅1.4平方米,可极简部署;M-DaaS 3能在100毫秒内对异常状况判断,配合三级安全保障体系,已安全完成超90万单配送。同时启动授权服务商招募,首批签约10家,覆盖浙江、湖南、广西等省份,场景从餐饮外卖拓展至医疗、工业等领域。
百度搭子DuMate是一款PC端办公AI智能体,能看见用户屏幕、操作软件、处理文件。零门槛安装,不需配置环境;本地优先处理,数据不出设备,复杂任务自动调度上云。支持Word/Excel/PPT输出,内置百度搜索、深度研究等Skills生态。用户下载后可通过邀请码分享好友,双方各得2000积分。
雷神推出三款基于 AMD “Zen 5” 处理器的 AI 迷你工作站主机。旗舰型号 AI Master D7000 搭载锐龙 AI 9 HX 470 处理器与 128GB DDR5 内存;中端 D5000 配备上代锐龙 AI 9 HX 370 处理器及 64GB 内存;D3000 则采用锐龙 AI 9 H 365 处理器。三款机型均标配 1TB SSD。
雷神发布了三款AI笔记本。专业级AI Master M7000基于AMD锐龙AI Max+ 395处理器,至高配128GB内存,支持aiDaptiv+技术,其64GB内存版本可流畅运行GPT-OSS-120B模型,到手价19999元。全能型AI Master M6000配备AMD锐龙9 9850HX与NVIDIA GeForce RTX 5070 Ti,支持aiDaptiv+,32GB内存版本到手价18499元。轻薄本aibook 14 Air Carbon重量1kg,搭载AMD锐龙AI 9 H 365处理器,32GB内存版本可本地运行35B MoE模型,到手价9999元。
全新吉利星愿纯电小车上市,提供310km、410km、480km三种续航版本共6款车型,限时权益价6.18万元起至9.18万元。新车搭载Flyme Auto 2.0智能座舱与千里浩瀚H3辅助驾驶系统,支持CarPlay互联、高速高架NOA及全场景自动泊车等功能。车身尺寸为4135×1805×1570mm,轴距2650mm,全系标配宁德时代电芯,提供三种电池容量与两种电机功率选择。