北京人形机器人创新中心与地瓜机器人宣布,全尺寸通用人形机器人天工3.0将于2026年下半年开启规模化量产交付。该机型搭载旭日S600具身智能大算力芯片,可应用于工业制造、商业服务、3D复杂场景作业等领域。天工3.0配备高扭矩一体化关节,能翻越1米障碍,操作精度达毫米级。量产落地后关键零部件综合成本有望降低,将投入产线作业、仓储物流、智能服务、特殊环境运维等实景应用。
欧菲光推出 RoboVision 系列首款产品 Dex400R RGBD 相机,支持 D2C+IMU 同步、数采、外部触发等模式,可实现手眼协同、无序抓取、近远场避障。该相机专为机器人机械臂抓取识别、数据采集、补盲避障场景定制,尺寸 45mm×28mm×28mm,近距离 10-20cm 识别精度<1.5mm,远距离误差<1%,测距盲区 5cm。采用 USB+GMSL 双接口设计,为同品类业内唯一,兼顾本地直连与长距抗干扰传输,适配工业与机器人多场景部署。
宾夕法尼亚州连锁超市 Weis Markets 与 Instacart 合作,在部分门店部署 AI 智能购物车 Caper Carts。该购物车配备摄像头、认证秤、定位系统和触摸屏,支持数字优惠券、忠诚度功能以及基于历史购买的重复购买推荐,将线上体验融入线下购物场景。
中国人形机器人价格断崖式下跌。宇树科技(Unitree)均价从2023年$81.6k降至2024年$35.8k,2025年前三季度进一步跌至$23k,而单位成本仅从$10k降至$8.5k,利润空间被急剧压缩。竞争对手Bumi推出消费级人形机器人,补贴后售价仅$1.4k,身高3英尺1英寸,面向教育和陪伴场景。核心部件如伺服电机、减速器已实现国产化,机器人供应链大量借鉴电动汽车和智能手机成熟产线,电池、视觉传感器均从现有产线复用。
优必选直接上线全球首个超仿生机器人“赛博伴侣”,分男女两款:男款身高183cm,女款168cm,全系标配88个运动关节,动作逼真。支持WiFi联网,续航仅2-4小时。搭载养成系情感大模型,本地加密存储记忆,支持多维度外观定制并开启IP合作。虽未召开发布会,已开启盲订,需支付3000元定金,目前超2000人下单。
在小米 17T 系列发布会上,小米机器人手持 17T Pro,通过音量键变焦拍照,演示手机长焦能力。该机器人此前已在汽车工厂实现 3 小时持续作业,双侧同时安装成功率 90.2%,满足产线 76 秒节拍。3 月 27 日对 Xiaomi CyberOne 仿生手进行改造:体积压缩 60%、自由度增加 64%、全掌触觉传感器覆盖面积增至 8200 平方毫米、抓握循环寿命超 15 万次,并增加仿生汗腺主动散热。发布会上仿生手操控手机,是精细操控能力的进一步体现。
阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述,10分钟即可在消费级GPU上生成公里级3D城市,输出可编辑3DGS格式,可直接导入Unity等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往abot-earth.amap.com提交申请。
理想汽车6月8日宣布,Livis Day软件与人工智能发布会将于6月15日16:30举行,探讨具身智能及未来方向。全新理想L9 Livis搭载自研5nm马赫M100芯片(算力1280TOPs),配备3D ViT感知模型与马赫VLA2.1系统,多模态计算量提升10倍,支持自动驾驶、自主泊车、智能交互。理想AI眼镜Livis重量36克,售价1999元起,续航18.8小时,支持控车、听歌。
英伟达与韩国斗山集团6月8日宣布扩展合作,覆盖四大板块:斗山机器人将整合英伟达Isaac Sim、Cosmos及Jetson Thor,升级“智能体机器人操作系统”,并探索双臂及人形机器人;斗山山猫将引入物理AI至建筑、农业及物料搬运设备;斗山重工拟以燃气轮机、小型模块化反应堆等为英伟达AI工厂供电;斗山电子材料以覆铜板支持英伟达MGX生态AI服务器及网络设备PCB。
Boston Dynamics has demonstrated its new Atlas humanoid robot lifting and carrying a 50-pound fridge. The robot uses its...
iMaC提出将原始视觉图像作为具身世界模型的原生动作表征,替代传统低维动作向量。其双分支架构包括图像动作编码器和动态世界预测器:编码器将目标视觉图像压缩为紧凑动作嵌入,预测器基于图像动作学习环境转移规则,实现高保真未来状态预测和闭环控制。在公共基准和真实机器人场景中,iMaC在预测精度、任务成功率与跨场景泛化上超越基于向量的基线,且无需手动定义动作空间,可灵活控制异构智能体。
多模态基础模型因无法将自我中心观察转化为全局异中心空间表征,导致物理世界空间推理脆弱。AlloSpatial引入World2Mind认知映射沙盒,将观察转换为异中心空间树(ASTs)和路线图,支持查询对象拓扑、几何关系等。通过Spatial Reasoning Harness进行工具使用判断和几何-语义仲裁,并利用冷启动强化学习内化至Qwen3-VL。在VSI-Bench和MindCube上,无需训练提升专有模型5%-18%;仅ASTs即使无视觉输入也支撑强推理;训练后智能体超越更大通用模型与竞争基线。
ABot-Earth 0.5是一个生成式3D框架,利用3D高斯泼溅(3DGS)表示,从地理参考卫星图像合成大规模无缝3D环境。模型在真实城市重建数据集上训练,推理时仅依赖卫星图像,以每平方公里不到10分钟的速度生成逼真的几何与纹理。框架集成层次细节(LOD)结构,支持网页地图引擎上的实时交互可视化。该高保真模拟沙箱可缩小sim-to-real差距,服务于闭环无人机导航等具身AI应用,降低大规模3D重建的技术与财务门槛。
2026年全国统一高考首日,杭州十四中考点外出现多台穿着大红旗袍的人形机器人,为考生跳舞助威,祝福“旗开得胜”;深圳多个考点有交警人形机器人护考,考生可与其碰拳互动;东南大学在南京市第九中学考点带来智能机器人,通过翻跟头、举牌等方式循环呐喊“高考加油”,为考生送上暖心祝福。
英伟达 CEO 黄仁勋今天在首尔与 SK 集团高管共进晚餐时确认,明天将与三星电子副会长全永铉会面。双方预计讨论 HBM、下一代存储器技术及机器人等未来技术合作。黄仁勋明天行程紧凑,将先后前往 SK 集团总部、LG 双子塔、首尔大学、现代汽车集团和 Naver 总部,分别会见崔泰源、具光谟、郑义宣、李海珍等人。李在镕因海外出差无法会面。
Robot soccer player that will likely render humans obsolete kicks ball so hard it dents wall https://trib.al/j6dRRkb
据消息,小米机器人有望在小米 17T 系列手机发布会中亮相。该机器人延续 2022 年 CyberOne“铁大”具身人形设计,机身采用暗灰色面料并印有小米标志,已于今年 4 月亮相投资者日,具体技术细节暂未披露。同期发布的小米 17T 系列采用四曲包裹式中框、2D 直屏、一体化金属镜头 Deco 及超大 R 角设计,配备超窄边框。其中 17T Pro 搭载天玑 9500(3nm)芯片,GPU 性能较上一代提升 33%,功耗降低 42%,光追渲染性能提升 199%;后置徕卡光学专业三摄,包括光影猎人 950 主摄(13.5EV 动态范围)、5X 潜望长焦和 120° 超广角,全系支持 5X 光学变焦、10X 无损变焦、120X UltraZoom 及 30cm 长焦微距。
特斯拉AI基础设施及信息安全副总裁拉吉·杰加纳坦在领英宣布离职,结束13年职业生涯。他自今年2月起逐步离任,将加盟云基础设施服务商Chronoscale任首席技术官。杰加纳坦直接向马斯克汇报,主导设计了全球顶尖GPU集群,为FSD神经网络提供算力,处理数十亿英里实车数据并开展大规模模型训练。他的离职是过去半年特斯拉多位资深高管离职的最新一例。
现有数据来源在轨迹质量与可扩展性间存在矛盾。OASIS 提出仿真数据驱动框架:用 3D 生成模型从真实图像重建物体资产,在仿真中遥操作收集轨迹,再经域随机化后处理增强。基于仿真数据训练的分层视觉运动策略在真实人形机器人零样本部署下,多数任务成功率优于用真实机器人遥操作数据训练的模型,原因是仿真渲染覆盖了更广泛的光照与环境变化。
Real-world AI is about solving for the edge case, not the average case
软银创始人兼CEO孙正义表示,AI的市场规模可能比互联网泡沫大50倍,下一个万亿美元公司将来自机器人领域。他指出,互联网泡沫在2000年破裂后实际增长远超当时顶峰,而AI目前才刚刚起步,未来的利润和增长机会极为巨大。
6月6日,2026款小鹏X9启动AIOS 6.2.0推送。本轮升级中,Ultra和Ultra SE车主收到VLA 2.0的第二个版本,Max版VLA 2.0蒸馏版仍在开发。新增功能包括:园区地库无导航NGP漫游、全场景原地起步、终点车位选项、车位被占漫游找车位、效率泊车风格(本轮Max可用)、辅助驾驶车道级渲染、熟路智能推荐、手机App车内遥控器、后视镜展开时机设置、车窗拨杆控制方式、间歇雨刮灵敏度调节、停止模式指示灯、自动连接媒体音频开关、车辆信息及辅助驾驶战绩。
小鹏机器人产品规划高级总监施晓鑫于6月初正式离职。施晓鑫是小鹏人形机器人体系从0到1搭建的元老,主导IRON全系列产品定义。市场担忧其离职影响量产进度,小鹏内部人士回应业务进展顺利。何小鹏在5月底财报电话会上透露,新一代IRON人形机器人计划于今年三季度亮相,目标今年底实现量产,首先在小鹏门店试商用,明年起面向商业客户交付。人形机器人的硬件和AI模型收入将成为集团收入增长的重要驱动力。
在2026台北国际电脑展上,黄仁勋指出未来计算将收敛为一套面向AI智能体的统一模式,从云端延伸至PC、汽车、机器人及各类边缘设备。该模式覆盖AI训练与推理,使所有边缘设备具备自主运行能力。自动驾驶、类人机器人和通信基站本质上是同类智能体系统。英伟达驾驶系统基于语言推理,未来可通过读取“技能文件”和教程视频操作陌生设备。数据中心方面,新推的88核Arm处理器Vera已全面量产,专为AI智能体生成词元设计,侧重单线程速度和内存带宽。
比亚迪否认网传其自研人形机器人代号“尧舜禹”、第七代原型机在深圳和长沙工厂实地测试、约150台上岗、年内内部部署2万台等消息,称均不属实。比亚迪集团执行副总裁李柯此前表示,比亚迪也在开发人形机器人,汽车相关AI能力与机器人有同源性,未来可通过经销商网络售卖机器人。李柯还称,中国机器人缺大脑,美国机器人四肢不发达,需实现两者结合。
针对机器人操作中关节部件感知的准确性与泛化性需求,提出几何主结构(GPS)表示,在可扩展性与质量间取得平衡。GPS结合便携式VR设备,标注单个物体序列仅需一分钟,质量高于基于点跟踪的affordance方法。利用VR-GPS系统收集6个部件类别下234个物体的41K帧数据,训练出以单张RGB-D图像为输入的泛化GPS模型。无需领域内微调,基于GPS预测的启发式策略在9个物体270个初始状态上达到73%成功率。代码、数据和工具已开源。
Light-WAM是面向机器人操作的高效轻量级世界动作模型。它采用紧凑视频骨干,在降采样潜在空间中进行未来视频监督,降低视频协同训练成本。动作预测由StateFusionActionExpert完成,从多个骨干层读取状态并通过学习查询池化融合特征,在单次前向中直接预测动作块,避免重型生成式动作专家。该模型仅0.44B可训练参数,在LIBERO上保持强劲性能,在RoboTwin 2.0上达到可用多任务水平,推理延迟72.03ms,峰值GPU内存4.1GiB,并提升了训练吞吐量。
多模态大语言模型(MLLM)擅长2D语义理解,但缺乏3D空间一致性。GeoVR框架利用纯2D视频序列,通过从预训练3D基础模型蒸馏几何知识,重构MLLM的语义隐空间。其多目标学习策略包含四个互补几何约束:帧间相机位姿估计、密集深度图回归、度量尺度因子预测以及多尺度3D特征对齐。在空间推理基准上,GeoVR达到当前最佳性能(SOTA),为赋予基础模型空间智能提供了新范式。
AffordanceVLA 是一种视觉-语言-动作模型,通过引入结构化具身感知预测作为任务导向中间表示,建立更精准的感知-动作映射。模型包含三个互补组件:Which2Act(通过视觉潜变量预测实现目标中心定位以抑制干扰)、Where2Act(通过具身感知图估计定位二维交互区域)、How2Act(进行三维几何推理以引导操控策略)。采用混合 Transformer 架构,结合三阶段训练策略和渐进式数据课程,并配有自动数据增强管道。在仿真和真实世界实验中,模型在多种操控场景中取得强性能。
6月5日,开源鸿蒙具身智能PMC(筹)发布EmbodiedAI 1.0.1版本。该版本聚焦机器人控制与智能体应用,升级导航规划、运动控制、仿真开发、硬件适配等核心能力,兼容ROS生态、机器人模拟器及多种本体形态。集成开源鸿蒙原生模拟器、MuJoCo、Gazebo三大仿真环境,打通从代码开发到真机验证的全流程链路。人形机器人、四足机器狗、商用服务机器人等已完成适配验证。目前具身智能方向已组建18个专项SIG工作组,版本源码已正式开放。
鸿海科技集团与英特尔宣布战略合作,结合英特尔在处理器、硅光子技术与软件生态的优势,以及鸿海的全球制造、系统整合与AI数据中心部署能力,共同探索从芯片、机柜到系统与应用的全方位AI解决方案。合作首先聚焦AI机柜领域,开发基于英特尔至强处理器的机柜级AI基础设施,推进高速互连、散热与液冷设计;同时在边缘与物理AI领域定义下一代平台架构,布局代理式AI、终端智能与机器人;此外还将探索定制ASIC、SoC与系统整合设计服务的合作。
Dream.exe 是一个评估视频生成模型物理世界理解能力的框架,通过视频到执行的流水线,将生成的机器人操作视频转化为真实可执行轨迹,并在物理模拟器中验证成功率。研究评估了8个模型,包括GPT-4o、Sora、CogVideoX-5B、Meta-LLaMA 3D、GR-1等,覆盖101个手动设计的操作任务,分为三个物理复杂度等级,评测视觉质量、轨迹保真度和执行成功率。结果显示,多个模型达到了可测量的执行成功率,但视觉质量不能预测可执行性。Dream.exe即将开源。
小米机器人团队在CVPR 2026 Workshops和ICRA 2026 WBC两项国际赛事中夺得冠军。在CVPR 2026 RoboChallenge中,匿名参赛模型「my16」(自研WAM世界动作模型)以40.89%成功率位列总榜第一,是本届唯一突破40%的模型。在ICRA 2026 WBC超市场景挑战中,综合得分99.2分(接近满分),整体成功率94%,领先第二名10个百分点;简单任务成功率100%,复杂任务成功率90%。该模型采用“S1/S2双系统+长短期记忆+跨本体预训练”架构。