据鸿蒙智行近日披露,华为途灵平台自2023年11月推出已完成三轮结构性技术升级,技术成果已应用于智界S7、问界M9(2023年)、尊界S800、享界S9/S9T(2025年)以及全新问界M9、尊界S800 Grand Design(2026年)。该平台让底盘具备感知与思考能力,实现“看-想-动”。余承东在5月全新问界M9发布会上表示,全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计,为L3时代做好准备。
据鸿蒙智行近日披露,华为途灵平台自2023年11月推出已完成三轮结构性技术升级,技术成果已应用于智界S7、问界M9(2023年)、尊界S800、享界S9/S9T(2025年)以及全新问界M9、尊界S800 Grand Design(2026年)。该平台让底盘具备感知与思考能力,实现“看-想-动”。余承东在5月全新问界M9发布会上表示,全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计,为L3时代做好准备。
6月28日,法拉第未来在芝加哥Automate展会上推出“全美首款工业级轮臂机器人”Faber系列(U/T/S三款),应用于工业上下料与物流转运等场景。同时发布全新Futurist人形机器人标准版:身高173cm、重55kg(减重14%)、全身31自由度、膝关节峰值扭矩320N·m、1152Wh双电池续航6小时(上代3倍),支持7×24小时商用部署,定价89900美元(约61.2万元)。Ultra版年内发布,搭载Jetson Thor芯片,支持自主充电,面向高强度场景。
智元今日宣布第15000台通用具身机器人精灵G2正式量产下线。该机器人搭载NVIDIA Jetson Thor芯片,配备19自由度灵巧手、3D触觉感知、高精度力控双臂及5自由度腰腿全向底盘,引入真机RL工具链。支持多人连续语音对话与知识库问答,采用双电池热插拔换电,配备360环视鱼眼和前后双激光雷达实现主动避障,并优化超视距遥操作。可覆盖工业作业、巡检巡逻、安检引导、讲解导览、家庭服务等场景。
深圳开鸿数字产业发展有限公司 CEO 王成录宣布,全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式完整捐献至开放原子开源基金会,专属一级根社区同步启动运营。该系统 1.0 版本于 2025 年 4 月发布,今年 5 月升级至 2.0 版本。2.0 版本具备积木式框架、混合部署、自研 M-DDS 分布式通信、硬件能力及算法共享、AI 原生及中间件生态兼容等核心能力,其中本体间音视频时延低至 4 毫秒,应用迁移成本降低 80%。
一项前馈式3D场景重建框架,直接从无姿态多视图图像将场景分解为实例结构化3D token组。每组包含一个捕获实体级身份的实例token和多个编码局部几何与外观的锚点token,解码为一组3D高斯。通过可微渲染联合重建与分割监督学习,无需3D标注。该模型在类无关实例分割上超越逐场景优化基线,在新视图合成上具有竞争力。token组可直接实现实例级场景编辑(移除、平移、插入对象)以及高效开放词汇3D实例检索,检索复杂度随实例数而非基元数增长。
研究提出A2World,一个多视图交互基础扩散世界模型。通过在大规模机器人操作数据上预训练,学习将动作驱动的视觉演变建模为可迁移的动力学先验。预训练权重可适配两类模型:A2World-sim作为任务/场景专用模拟器,用于策略评估与假设分析;A2World-policy作为视频-动作联合预测模型,在视觉和指令条件下预测动作。实验表明,该预训练能为模拟器中心和策略中心的机器人学习提供可迁移的动力学先验。
特斯拉就2023年11月一起FSD模式致行人死亡事故达成和解,事故中一辆Model Y撞击了下车疏导交通的71岁行人,和解条款未披露。特斯拉面临约145亿美元相关诉讼。联邦调查仍在进行:NHTSA于2024年10月启动评估,2026年3月升级为工程分析,覆盖约320万辆FSD车辆。NHTSA指出FSD在低能见度时存在缺陷,未检测影响摄像头的路况且未给驾驶员足够反应时间。特斯拉称已更新摄像头和软件。此外,NHTSA于2025年10月对FSD启动另一项调查。
京东在欧洲推出 JoyRobocare 机器人维修服务,已在英国贝德福德和德国杜伊斯堡建立维修中心,提供“机器人救护车”上门服务,覆盖英国、德国、法国、荷兰等国主要城市。该服务针对具身智能机器人和四足机器人,提供上门送货、调试配置及使用辅导,使机器人无需跨国返厂即可解决大部分故障,降低售后成本。京东已与部分机器人企业合作全球供应链物流,并计划未来5年培养10万名工程师,覆盖机器人及智能家居维修。
市场监管总局正加快智能体、具身智能、世界模型等前沿技术标准制定,同步推进算力基础设施、高质量数据集等底座类标准,并推动企业智能化成熟度评估等重点标准出台。通过优化全流程压缩研制周期,对前沿赛道推行敏捷标准化。近日,《人工智能智能体互联》系列国家标准(7部分)发布,旨在解决智能体通信接口不统一、身份管理缺失等问题。
优必选 Cruzr Y1 轮式工业人形机器人在 OPPO 技术发布会首秀,演示料箱拆垛、码垛流程。机器人搭载地瓜 S100P 和 S600 系列国产算力芯片,配备 360° 全向轮与垂直升降模组,可在狭窄车间穿梭;手臂采用一体化谐波关节模组,集成抱闸制动与力矩传感器。配备高容量锂电池,满载续航 4 小时以上,支持自动充电和快速换电,实现 24 小时轮班作业。官方称开放全套 SDK、视觉识别、手臂运动控制开发接口与多机调度平台,可对接工厂系统进行二次开发。
在 MWC26 上海人形机器人点球大战中,中国移动灵犀 CM-H2-A 从 8 支战队胜出夺冠,并包揽金手套、金靴、最佳庆祝等奖项。其基于 ROS2 搭建足球主控系统,融合激光雷达、广角相机和深度相机,通过端侧量化与 TensorRT 推理实现毫秒级感知延迟。进攻时自主完成导航、追球、精对位、射门;守门时依足球轨迹调整站位并设防抖阈值。依托“灵枢全身运控系统”复刻推射、抽射、捅射等踢球姿态,兼顾动态平衡与射门精度。
小鹏机器人中心近日新设九个二级部门,包括产品部、具身系统工程部、通用基座部(虚拟)、品牌营销部、操控及安全开发部、具身智能部、数据闭环部、产品矩阵部(虚拟)和项目管理部。何小鹏亲自兼任机器人中心负责人及产品部负责人,直接听取产品部汇报。其内部信称机器人业务进入量产和商业化前夜,相当于8年前小鹏G3发布阶段。新一代IRON人形机器人即将进入ET2软硬件合围阶段,计划三季度亮相,年底实现高阶量产,先在小鹏门店试商用,明年起面向中国及海外商业客户交付。
小鹏汽车 CEO 何小鹏微博透露,VLA 2.0 走向全球进入确定模式。联合国 WP29 缔约国会议批准了 DCAS UNR 171 series 02(对应城区 NGP 法规)与 UNR ADS(对应 L3-L5 自动驾驶法规)。DCAS 将在六个月后成为欧盟强制法规,即 2026 年底自动驾驶可合法进入全球;UNR ADS 为框架性法规,加速 L4 级 Robotaxi 落地。何小鹏称 2027 年海外小鹏汽车将搭载 VLA 和 VLM,支持中英文混合语音对话。
视觉-语言-动作(VLA)模型继承预训练VLM中过大的语言骨干,引发冗余质疑。Drop-Then-Recovery(DTR)协议通过删除Transformer块并微调恢复,结合单次虚拟门控敏感度指标GateProbe评测容量必要性。在LIBERO上,删除半数LLM块后OpenVLA-OFT在相同微调预算下从95.0%升至98.3%,仅保留两个语言块仍恢复基线性能;但视觉与动作路径对删除耐受性显著更低。结果表明现有VLA基准对深层语言理解压力不足,未来架构应更均衡分配语言、视觉、动作容量。代码已开源。
研究从人类动作数据向双臂平行夹爪机器人转移操作技能的方法。针对6DoF人体姿态估计噪声大、接触模式差异大的问题,提出桥接动作表示——初始头部相机帧内的相对手腕平移,作为人类与机器人共有的动作空间。构建π_0-like视觉-语言-动作模型,通过交错动作token和注意力掩码处理不同形态间动作分量的缺失。在双臂操作任务上,该方法比噪声6DoF动作更有效地转移人类操作知识,且效果随人类数据量增加而提升。
视频生成模型常生成物理不合理的操作。PhysisForcing 通过联合优化像素级和语义级特征,重点监督物理信息区域来强化物理一致性,包括像素级轨迹对齐损失和语义级关系对齐损失。在 R-Bench、PAI-Bench 和 EZS-Bench 上,PhysisForcing 一致提升基线模型:Wan2.2-I2V-A14B 和 Cosmos3-Nano 在 R-Bench 分别提升 22.3% 和 9.2%(优于普通微调的 7.1% 和 3.7%),Cosmos3-Nano 变体取得最佳总分。作为 WorldArena 世界模型,闭环成功率从 16.0% 提升至 24.0%,并改善下游策略。
SimFoundry是一个模块化自动化系统,能从视频零样本构建真实到仿真的场景,生成可用的数字孪生,并支持对象、场景和任务的编辑,自动生成保持原始功能但经过变化的数字表亲。基于SimFoundry数据训练的策略可零样本迁移到真实世界的多步操作、铰接物体交互和双手交互任务;数字表亲有助于泛化到新真实条件。在7个操作任务和5种策略架构上,SimFoundry仿真评估与真实性能高度相关(平均Pearson相关系数0.911,最大排序违反0.018)。使用对象、场景和任务表亲训练的仿真策略在零样本真实评测中,任务成功率分别提升17%、21%和40%。
General Intuition 周四以23亿美元估值完成3.2亿美元融资,累计融资4.54亿美元。其AI智能体通过分析数亿小时游戏视频中的动作标签(玩家按键记录)训练,掌握时空推理能力,能从游戏泛化到仿真和现实世界。仅用8分钟真实机器人数据微调即可控制四足机器人自主导航。公司计划夏季末开放API。本轮由Khosla Ventures领投,General Catalyst、Jeff Bezos、Eric Schmidt、Nico Rosberg及Google DeepMind、MIT研究人员参投。
General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,累计披露融资 4.54 亿美元。公司从旗下游戏剪辑平台 Medal 获取数亿小时含精确按键动作标签的游戏操作数据,训练单一模型同时驾驭 Fortnite 等虚拟环境和四足机器人。演示中,AI 智能体在游戏中连续运行 100 小时,机器人仅靠 8 分钟真实街道数据微调即可自主探索办公室。本轮由 Khosla Ventures 领投,General Catalyst、Jeff Bezos、Eric Schmidt 等参投。资金将用于通过 CoreWeave 扩大计算规模、预训练下一代模型,计划夏末前开放 API。
据央视财经报道,2025年中国具身智能市场规模约9150亿元,预计2026年将达10904亿元。全国相关企业已突破万家。链博会上,产业链上下游企业完整呈现从核心零部件到整机系统再到场景应用的产业闭环。国家发改委政策研究室副主任李超5月表示,将全面推进具身智能领域高质量发展,加快训练基础设施建设,提升通用能力,推动机器人“进工厂、进商场、进家庭”。教育部4月发布的2026年本科专业目录中,首批列入具身智能等4种新专业。
美国交通部计划修改《联邦机动车安全标准》,完全无人驾驶车辆不再强制配备制动踏板,为特斯拉Cybercab、Waymo等企业扩大自动驾驶出租车投放规模降低门槛。现行法规要求保留部分人工控制装置,通用汽车因Origin车型未配备此类装置于2024年终止项目。NHTSA表示取消制动踏板不等于放宽制动安全标准,严格制动距离等要求仍保留;可人工驾驶的自动驾驶车辆继续遵守现行标准。方向盘等要求是否放宽尚未明确。
北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)6月25日发布多智能体群控方案,多台全尺寸天工3.0人形机器人完成高同步、多队形、高流畅度集体舞蹈展演。方案基于自研通用具身智能平台“慧思开物”,实现一套智能底座兼容多类型机器人本体、一套全局指令驱动多智能体协同、一次技术开发适配多类应用场景。认知大脑具备全局场景理解、长时序任务规划与多智能体任务分配等能力;执行小脑依托自研低时延分布式通信协议、毫秒级同步控制算法及跨本体运动适配引擎。方案支持低代码开发与快速部署,可灵活适配不同行业需求。
菜鸟在上海亚洲物流双年展推出 L4 级无人物流车菜鸟 GT 2026,具备 1780kg 载重与 6.2m³ 货箱,40.8 度电池支持 230km 续航,基于 400V 高压平台,30 分钟可充 30%-80%。产品可定制,覆盖城配、冷链、园区接驳等场景。同日,支付宝与九识智能及菜鸟无人车达成即时运力合作,菜鸟无人车还与 5 家客户签约战略合作。
2026年6月22—26日,联合国世界车辆法规协调组织(UN/WP.29)第199次全体会议在日内瓦召开,由中国、欧盟等共同牵头的自动驾驶系统全球技术法规(ADS GTR)正式获批发布。该法规是全球首个自动驾驶全球技术法规,明确了产品核心技术指标、安全管理、安全档案、全流程试验验证及部署后安全等要求,覆盖全生命周期。我国搭载组合驾驶辅助系统的新车渗透率超60%,2025年12月附条件许可首批2款L3级车型。工信部参与法规核心编制并提出多项技术提案,同时加快国内强制性国标制定,已完成编制并报批,全面覆盖ADS GTR技术内容并对L3、L4级系统提出更细要求。
MWC26上海期间,智元联合创始人彭志辉指出,AI从数字世界走进物理世界是下一阶段核心命题,具身智能体将在物理世界长期在线完成感知、决策、执行闭环。他强调未来Token最大消耗群体将是物理世界的具身机器人,资本不再只为Demo买单,行业必须在真实场景落地商业价值。他用XYZ曲线划分产业周期:X曲线为开发尝鲜期(以表演为主),Y曲线为部署成长期(大规模落地真实场景),Z曲线为部署普及期(预计5年左右迎来GPT时刻)。
昨日(6月24日)股东大会上,英伟达CEO黄仁勋称AI产业进入新阶段,智能体AI已到来,物理AI将驱动下轮增长。他将数据中心比作“AI工厂”,强调AI基础设施成企业计算核心。财务方面,过去1年营收增长65%,利润增长60%,2026财年自由现金流超960亿美元,计划将50%通过回购和分红返还投资者。黄仁勋举例称,运行英伟达系统生成token具盈利性,GitHub今年pull request数量增长近3倍。
美光科技发布2026财年第三财季财报,总收入415亿美元创新高,环比增74%,同比增346%,毛利率84.9%。预计第四财季收入500亿美元,毛利率约86%。CEO表示第四财季资本支出约100亿美元,2026财年全年约270亿美元。美光已签16份战略客户协议,未来履约保底收入达1000亿美元;另签220亿美元内存订单,约180亿美元为现金押金。高管称人形机器人存储容量约为L2+自动驾驶车辆10倍,预计从本十年后半段开启长期内存需求周期。下一代DRAM与NAND节点预计2027年下半年量产,HBM4 12层爬坡速度是HBM3E两倍,已交付超10亿美元HBM4。内存供应短缺预计持续到2027年以后。
该方案在 LeHome Challenge 2026(ICRA 2026 双臂衣物折叠竞赛)中获得在线仿真轮次第1名、真实世界决赛第2名。核心方法是用强化学习循环改进视觉-语言-动作(VLA)策略:策略同时作为价值函数,预测动作、成功、进度及任务相关未来量,用于优势估计、实时故障检测和候选选择。技术组合包括 AWR + RECAP 结合的流匹配 VLA、HuggingFace Hub 异步分布式训练/部署、基于 Thompson 采样的推理时超参数优化,以及融合相机对齐、强数据增强与类 DAgger 人工数据采集的 sim-to-real 方案。
PhysiFormer 是一种扩散 Transformer 模型,用于物理可信的 3D 物体运动模拟。它将物体表示为世界坐标下的 3D 网格,输入初始顶点位置、速度及材料类型(刚性或弹性),通过去噪扩散过程直接采样未来顶点轨迹,不依赖显式归纳偏置。概率性公式捕捉动力学不确定性,生成多种合理未来。模型在时间、空间和物体维度上分解注意力,实现置换不变的多物体推理。基于 10 万+模拟轨迹训练,可生成刚体和弹性力学,并泛化至混合材料、未见真实几何及更多物体场景,在轨迹精度、刚性保持和动量一致性上显著优于自回归基线。
视频推理模型假设每帧可靠,在运动模糊、眩光等扰动下准确率下降15–30%p。Robust-TO框架将每帧信任度融入推理各阶段:通过统一接口组织异构视觉工具,每个工具接收子查询和经可靠性-相关性评分筛选的可信帧,返回预测、时间定位和校准可靠性分数。推理时分数指导三层次综合(高/中/低)与置信-成本GRPO奖励,联合优化正确性、可靠性和效率。在八个任务上,Robust-TO清洗输入准确率56.4%,超过最强开源基线10.6%p和Gemini-2.5-Pro(46.2%);五种腐蚀下保持54.3%,高出最强开源基线5.8%p,且准确率下降最小。
传统VLA模型因仅依赖当前观测和语言指令,难以泛化到相机视角或机器人形态变化的新场景。In-Context World Modeling(ICWM)将系统辨识作为上下文适应问题:机器人通过短暂自生成、任务无关交互历史,自主推断系统变量,从而理解当前系统的世界动态。ICWM利用上下文窗口捕获系统运行方式,无需参数更新即可适应新配置。在仿真和真实机器人上的实验表明,ICWM在新相机视角下显著优于标准VLA基线。
现代生成式世界模型渲染逼真未来时产生幻觉,集中于状态-动作空间低覆盖区域。研究引入MMBench2(427小时、210任务)数据集,训练350M参数世界模型,识别出三种幻觉模式(感知、动作边缘化、场景发散),并开发相应预测信号。训练时采用覆盖感知采样;在线时预测信号作为好奇心奖励指导数据收集,仅需50条真实轨迹即可微调模型全新环境。结论:世界模型幻觉本质是数据覆盖问题,检测信号可用于缓解。
InSight是一个框架,通过让视觉-语言-动作(VLA)模型在原始动作层面(如“将夹爪移动到碗边”“向上抬起”)变得可控,实现自主技能获取。包含两个阶段:(1)自动化分割管道,利用VLM规划分解和末端执行器位姿将演示分割为带标签原始动作;(2)VLM引导的数据飞轮,识别缺失原始动作,自主尝试并标注存储成功演示。在模拟和真实操作任务(方块翻转、抽屉关闭、清扫、扭转、倾倒)上的评估表明,无需人类演示目标技能即可习得,且原始动作可组合执行新任务。
人形机器人公司 Agility Robotics 宣布通过与特殊目的收购公司 Churchill Capital Corp XI 合并上市,估值约 25 亿美元。交易预计带来超 6.2 亿美元收益,包括约 2 亿美元来自新老机构投资者。其双足机器人 Digit 已在 Schaeffler、GXO、丰田汽车加拿大制造公司等九个客户站点部署。公司计划利用募资扩大下一代 Digit v5 产能、履行现有订单并拓展客户。Agility 已获下一代模型超 3 亿美元多年期订单,另有 30 多家潜在客户评估大规模部署。合并后公司预计以代码 AGLT 在北美交易所上市。
亚马逊旗下Zoox升级了Robotaxi车型,保留无方向盘方盒造型、天幕星空顶、40个感知设备、双向行驶和四轮转向、4人面对面布局,最高时速约121公里。升级重点为高频运营:座椅和头枕增加填充物,内饰改为芦荟绿座椅加石灰色地板;无线充电板增加防滑凹槽,杯架加大,触摸屏更醒目。车外增加双向反光装置和车门交互区扬声器/麦克风,支持双向通话。此次升级旨在为今年晚些时候启动商业运营做准备。
摩根士丹利6月24日报告将2026年中国人形机器人出货量上调至5万台,较此前预测的2.8万台几乎翻倍,为今年第二次上调。预计2026年市场规模达20亿美元(约136亿元),2030年增至150亿美元(约1020亿元),年出货44.6万台。分析师称商业验证、政策支持和供应链信息显示普及加速。Omdia数据显示,2025年全球出货1.3万台,前五名均为中国企业,美国Figure AI和特斯拉仅排第七、第九。
6月24日,宁德时代与银河通用机器人签署全球战略合作协议,银河通用研发的重载人形机器人Galbot S1成为全球首款搭载宁德时代电池的具身智能常态化运营机器人。该机器人具备双臂50公斤级载重、纯视觉厘米级定位、360°全向避障能力;宁德时代电芯失效率达PPB级别,保障8小时超长续航与产线高安全性。目前Galbot S1已在宁德时代智慧产线中替代物料搬运、拣选等高强度人工。
比亚迪执行副总裁李柯计划未来每家门店部署2-3台机器人,用于介绍、演示车辆及活跃气氛。她认为家庭和服务行业人形机器人市场巨大,机器人销售顾问有望一两年内具备应用条件,但无法取代人类销售的情感联系。摩根士丹利预计人形机器人市场将从2025年30亿美元增至2030年280亿美元。中国企业主导市场,去年贡献超八成出货量。比亚迪拟自研自制人形机器人,不排除外购,并已大力投入工业机器人推进“黑灯工厂”。李柯预计机器人制造三到五年内迎来重大变化,部分生产环节可能无需人类。
宇树科技将双足人形机器人 Unitree R1 价格从 3.99 万元降至 2.99 万元起,并开启现货发售。R1 重量仅 25 千克,拥有 26 个关节(腿部 12 个、手臂 10 个、头部和腰部各 2 个),集成语音和图像多模态大模型,支持用户自行开发与改制。该产品于去年 7 月首次推出。
软银创办人孙正义表示计划继续执掌至少10年,放弃60多岁退休计划。现年68岁的他称没有时间退休,希望推动AI普及,将软银打造成全球领先AI机器人企业,已调整原本的50年规划,打算再工作10-15年。软银目前拥有安谋控股近90%股份,已承诺向OpenAI投资约650亿美元,并以54亿美元估值收购ABB旗下机器人部门。知情人士透露,软银计划在美国设立AI机器人公司Roze。