全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「具身智能」清除

6月12日周五

05:29Rohan Paul83同事件精选Jeff Bezos 在 CNBC 披露 Prometheus 愿景：构建人工通用工程师，融资 120 亿美元估值 410 亿美元同一事件，精选展示《Prometheus 融资120亿美元，估值410亿美元，定位“人工通用工程师”》

04:29Rohan Paul29广州车展超逼真机器人服误认小鹏IRON

00:33IT之家（RSS）482590.8 万元，千里智驾收购视觉毫米波融合雷达企业融感科技 100% 股权

6月11日周四

17:31IT之家（RSS）57银河通用机器人智慧药房创人形机器人持续自主工作超一年世界纪录

16:17Hacker News 热门（buzzing.cc 中文翻译）66精灵宝可梦GO的扫描功能为军用无人机导航技术提供了训练

13:30IT之家（RSS）54脑虎科技"三全"脑机接口助两高位截瘫患者异地象棋对弈

11:30IT之家（RSS）59京东 MALL 首批实习机器人员工上岗

11:30IT之家（RSS）59理想汽车 6 月 15 日举办 AI 发布会，李想回应"不务正业"质疑

10:58HuggingFace Daily Papers（社区热门论文）63World Pilot：用世界动作先验引导视觉-语言-动作模型

10:58HuggingFace Daily Papers（社区热门论文）61世界模型自蒸馏：训练世界模型解决通用任务

08:00HuggingFace Daily Papers（社区热门论文）48μ_0：一种可扩展的3D交互轨迹世界模型

04:47Hacker News 热门（buzzing.cc 中文翻译）37喷气推进实验室如何让服役13年的"好奇号"火星车继续开展科学探索

6月10日周三

23:28IT之家（RSS）38消息称小米 YU7 GT 将以自动驾驶挑战纽北，路透图曝光

23:28IT之家（RSS）47智元推出灵犀 X2 EDU"人人造"版本机器人，可选配夹爪、仿真假手、假拳等部件

21:56HuggingFace Daily Papers（社区热门论文）68Next Forcing：基于多块预测的因果世界建模

21:16TechCrunch：AI（RSS）61Decart 发布 Oasis 3：实时世界模型可模拟数小时逼真驾驶场景

19:11Chubby♨️51TARS DexHand 彰显手脑整合新纪元

17:42Huawei Cloud69精选华为云发布全球首个端到端具身AI平台CloudRobo

16:28IT之家（RSS）46跃伴发布智能如厕机器人"小伴"，28999元

16:28IT之家（RSS）63工信部：大力发展 AI 手机和电脑、智慧家庭、智能穿戴设备等产品

12:56HuggingFace Daily Papers（社区热门论文）67WorldOlympiad：视频世界模型三项全能评测基准

12:28IT之家（RSS）53何小鹏发内部信：亲自下场直管机器人业务，称迎来量产和商业化前夜

11:47Rohan Paul49宇树人形机器人户外表演中国武术

10:56HuggingFace Daily Papers（社区热门论文）60强化学习中流策略的测试时梯度引导

10:47Rohan Paul47AheadForm仿生面部突破恐怖谷适配小鹏

08:00HuggingFace Daily Papers（社区热门论文）37APT：通过动作专家预训练提升视觉-语言-动作策略的语言指令泛化能力

6月9日周二

22:04Google DeepMind：Blog（RSS）48Google DeepMind 欧洲机器人加速器启动，15家初创公司入选

21:45Rohan Paul68Antioch Agent：浏览器端机器人仿真器加速物理AI测试

21:00公众号：火山引擎69精选全新汽车品牌AIVA发布，火山引擎助力打造AI汽车新体验

21:00公众号：百度智能云（文心）26千寻智能与百度智能云合作：98.8%有效训练时长加速具身模型进化

20:05Chubby♨️49UBTECH发布首款仿生人形机器人

16:26IT之家（RSS）54英飞凌与越南企业 VinRobotics 签署合作备忘录，共同开发人形机器人

13:55HuggingFace Daily Papers（社区热门论文）68AHA-WAM：异步视界自适应世界-动作建模

11:55HuggingFace Daily Papers（社区热门论文）60Echo-Memory：动作世界模型中记忆机制的控制研究

11:29Elon Musk42SpaceX AI卫星项目

11:22IT之家（RSS）57特斯拉向内华达申请 Robotaxi 运营许可，计划一年内投放 5000 辆自动驾驶网约车

10:55HuggingFace Daily Papers（社区热门论文）61SpatialWorld：多模态智能体在真实世界任务中的交互式空间推理基准

09:21IT之家（RSS）70精选两部门：到2026年底人形机器人等重点产品完成应用验证并常态部署

08:00HuggingFace Daily Papers（社区热门论文）78精选Embodied-R1.5：通过具身基础模型演化物理智能

05:12Rohan Paul50美国GUARD法案拟禁止中国机器人入美

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月12日

05:29

Rohan Paul@rohanpaul_ai

同事件精选83

Jeff Bezos 在 CNBC 披露 Prometheus 愿景：构建人工通用工程师，融资 120 亿美元估值 410 亿美元

Jeff Bezos 在 CNBC 披露其新公司 Prometheus 的愿景：构建人工通用工程师，设计制造喷气发动机、芯片、医疗设备等硬物理产品，将传统数年设计周期缩短 10 倍以上。公司宣布完成 120 亿美元融资，估值 410 亿美元。初始启动资金 62 亿美元，新一轮融资表明公司需要更多算力、人才和工业数据才能验证产品。410 亿美元估值表明，前沿 AI 已从软件竞赛变为计算采购竞赛——投资者实质在为可能实现模型所需的机器预付费。

智能体具身智能行业动态

同一事件，精选展示《Prometheus 融资120亿美元，估值410亿美元，定位"人工通用工程师"》

推荐理由：这不是又一家AI初创，而是直接宣告算力即护城河的开端。Bezos的12B融资对创业者和投资人都是一本摊开的说明书，得读。

04:29

Rohan Paul@rohanpaul_ai

29

中国广州车展一个超逼真的机器人服装，许多人最初误以为是小鹏的IRON人形机器人。🙂

具身智能行业动态

00:33

IT之家（RSS）

48

2590.8 万元，千里智驾收购视觉毫米波融合雷达企业融感科技 100% 股权

千里科技6月11日公告，控股子公司千里智驾拟以2590.8万元收购融感科技100%股权。融感科技成立于2023年6月，主营视觉与毫米波融合雷达，基于AI算法提供堪比激光雷达效果的点云输出。收购旨在构建覆盖L2至L4的全栈式智能驾驶解决方案，践行软硬一体、全栈交付战略。此外，5月末有消息称吉利中央研究院辅助驾驶团队将整合入千里科技。

具身智能行业动态

6月11日

17:31

IT之家（RSS）

57

银河通用机器人智慧药房创人形机器人持续自主工作超一年世界纪录

银河通用机器人智慧药房创下人形机器人持续自主工作超一年的世界纪录。其24小时运行的机器人已承担夜间拣货任务，实现店铺夜间自主值守。银河通用还推出由人形机器人完全自主运营的智慧零售解决方案“银河太空舱”，已在20余个城市落地超百家门店，首家门店位于北京海淀，计划未来几年在全国扩展至1000家。

具身智能行业动态

16:17

Hacker News 热门（buzzing.cc 中文翻译）

66

精灵宝可梦GO的扫描功能为军用无人机导航技术提供了训练

精灵宝可梦GO的扫描功能被用于训练军用无人机的导航技术。该游戏通过玩家提交的地理位置和扫描数据，帮助优化无人机在复杂环境中的自主导航能力。

具身智能数据/训练行业动态

13:30

IT之家（RSS）

54

脑虎科技"三全"脑机接口助两高位截瘫患者异地象棋对弈

脑虎科技宣布，两位高位截瘫患者通过自研“三全”脑机接口完成上海与南昌相距800公里的象棋对弈。上海小张2025年10月植入，术后第5天实现脑控光标，经17天训练脑控速率达5.2 BPS，可上网、打游戏、控智能轮椅和家居。南昌邓老师2025年12月植入，术后一月可通过脑控外骨骼辅助吃饭、喝水、书写，今年4月借助BCI-FES技术实现用手绘画。“三全”系统采用柔性电极贴附大脑表面不刺入组织，发热单元置于胸部皮下，复用成熟DBS手术范式，无需专用机器人。

具身智能行业动态

11:30

IT之家（RSS）

59

京东 MALL 首批实习机器人员工上岗

京东 618 期间，京东 MALL 引入多款智能机器人担任实习员工，覆盖迎宾、导购、理货、咨询等岗位。迎宾岗采用智元 X2 人形机器人，实现点位导航；导购岗由宇树 Go2 四足机器狗接入 JoyInside 能力；理货岗的智元 G2、睿尔曼 RealBOT 基于 JoyAI-RA 模型，单品上架成功率突破 90%；咨询岗众擎导购机器人对接京东数万 SKU 商品体系。此外，京东已建成具身智能数据采集中心，计划发动数十万人参与覆盖超百个场景的数据采集。

具身智能行业动态

11:30

IT之家（RSS）

59

理想汽车 6 月 15 日举办 AI 发布会，李想回应"不务正业"质疑

理想汽车将于 6 月 15 日 16:30 举办 Livis Day 发布会，探讨具身智能定义与用户价值。CEO 李想回应质疑，认为基于汽车形态的具身智能是首个进入物理世界的人工智能机器人。内部消息称理想已规划双轮和双足两款人形机器人，双轮机器人已准备就绪，最佳状态下将于今年年中发布用于工厂。李想强调 2026 年是 AI 头部公司上车最后一年，最晚 2028 年 L4 落地，理想将布局基座模型、芯片、操作系统、具身智能，并一定会做人形机器人。

具身智能行业动态

10:58

HuggingFace Daily Papers（社区热门论文）

63

World Pilot：用世界动作先验引导视觉-语言-动作模型

World Pilot 是一种视觉-语言-动作（VLA）框架，通过世界动作模型（WAM）提供场景演进隐变量与预期轨迹两种先验，分别经 Latent Steering 和 Action Steering 注入决策链。在 LIBERO-Plus 零样本 OOD 基准上，总成功率达 84.7%，并在四个真实机器人操作任务中取得最高成功率，在视角、几何、变形状态和位姿变化场景下优势最显著。

具身智能多模态论文/研究

10:58

HuggingFace Daily Papers（社区热门论文）

61

世界模型自蒸馏：训练世界模型解决通用任务

提出结合自蒸馏与强化学习的可扩展框架，激发预训练视频扩散模型（Demonstrator）的任务解决能力。给定未标注场景图像，视觉语言模型（VLM）生成候选任务及详细步骤，条件化Demonstrator生成视频；通过蒸馏将执行知识迁移至仅以图像和简短任务提示为条件的Executor，无需配对任务-视频数据。进一步利用VLM反馈的强化学习优化Executor。在WorldTasks-Benchmark和DreamGen机器人基准上，Executor在VLM评估协议下超越Demonstrator，并有效迁移至机器人任务。

具身智能多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

48

μ_0：一种可扩展的3D交互轨迹世界模型

μ_0是基于3D轨迹的可扩展世界模型，通过预测物体、工具、手及接触区域等关键交互点的平滑3D轨迹，形成紧凑且无关具身形态的运动接口。其配套的TraceExtract系统可从多样化视频源自动提取3D监督。μ_0结合预训练视觉-语言骨干与模块化轨迹专家，用B样条控制点表示查询并预测未来轨迹。实验显示，μ_0在2D和3D轨迹预测上优于基线模型。冻结后的μ_0可搭配下游机器人动作专家，无需动作标签预训练的策略性能与使用动作监督预训练的VLA模型相当。

具身智能论文/研究

04:47

Hacker News 热门（buzzing.cc 中文翻译）

37

喷气推进实验室如何让服役13年的"好奇号"火星车继续开展科学探索

NASA喷气推进实验室（JPL）正维持已运行13年的“好奇号”火星车继续执行科学任务。该火星车自2012年着陆以来持续探测盖尔陨石坑，JPL通过远程软件更新、故障规避和能源管理策略延长其工作寿命。

其他具身智能

6月10日

23:28

IT之家（RSS）

38

消息称小米 YU7 GT 将以自动驾驶挑战纽北，路透图曝光

Instagram 用户曝光的照片显示，一辆车身涂有“12”字样的小米 YU7 GT 原型车停在纽北赛道旁，标牌注明其为“Nordschleife Autonomous Driving Prototype”，预示小米即将公布该车官方圈速。小米官方未回应。该用户暗示自动驾驶圈速可能明显慢于任周灿驾驶的成绩。YU7 GT 量产版双电机 738kW，零百 2.92 秒，曾以 7 分 22 秒 755 创纽北量产 SUV 最快圈速；任周灿在 5 月 19 日曾以 7 分 34 秒 931 刷新纪录。

具身智能行业动态

23:28

IT之家（RSS）

47

智元推出灵犀 X2 EDU"人人造"版本机器人，可选配夹爪、仿真假手、假拳等部件

6月10日，智元推出灵犀X2 EDU“人人造”版本机器人，面向科研教育、工程实训、机器人赛事开发。整机高130cm、重35kg，全身29个自由度（单臂7自由度），末端负载3kg，行走速度1.8m/s，搭载RK3588算力模组。支持选配夹爪、仿真假手、假拳等多类型末端执行器，适配抓取、人机交互、运动实验等任务。开放关节控制与运动控制接口，允许底层算法二次开发，并支持传感器及开发板自由加装。

产品更新具身智能

21:56

HuggingFace Daily Papers（社区热门论文）

68

Next Forcing：基于多块预测的因果世界建模

Next Forcing 提出多块预测（MCP）框架，受大语言模型多 token 预测启发，在主模型上添加轻量级辅助 MCP 模块，同时对多个未来时间步的视频块去噪。50fps 下训练 5k 步时相对 LingBot-VA 提升 93.1%，收敛速度加快 2.3 倍；在 RoboTwin 基准上达 94.1%（Clean）/93.5%（Random）新 SOTA。推理时保留 MCP 模块可实现 2 倍加速。在物理规律基准 PhyWorld 上也有显著提升，通用视频预训练 FVD 降低超 50%。

arXiv 具身智能数据/训练视频

21:16

TechCrunch：AI（RSS）

61

Decart 发布 Oasis 3：实时世界模型可模拟数小时逼真驾驶场景

Decart 推出 Oasis 3，一个实时世界模型，能够生成逼真的驾驶环境用于自动驾驶车辆测试，现已通过 API 向开发者开放。

具身智能模型发布视频

19:11

Chubby♨️@kimmonismus

51

TARS DexHand 彰显手脑整合新纪元

TARS Robotics 在 ICRA 2026（维也纳）展出 21-DoF DexHand，触觉传感器可检测 0.05mm 纹理，精确复制人体骨骼关节结构，能重现 26 种标准手语手势并实现实时镜像控制交互。配合 AWE 3.0 模型实现“手脑整合”。现场演示 A1 机器人自主打包背包及亚毫米线束装配（实时纠错）。新发布 TacForeSight 技术可预测接触事件发生前的状态，适用于高频接触操作任务。

产品更新具身智能

17:42

Huawei Cloud@HuaweiCloud1

精选69

华为云发布全球首个端到端具身AI平台CloudRobo

华为云推出全球首个端到端具身AI开发平台CloudRobo，覆盖从数据、模型到部署、集成的全生命周期，基于PB级可信数据底座。在INSPIRE2026上，国家地方共建人形机器人创新中心、Yijiahe Technology、上海交通大学展示了其核心能力：数据与模型双评估系统、主动力控模型快速组装、机器人小时级上云、模型分钟级部署。

产品更新具身智能

推荐理由：具身智能开发链条太长，华为云这个平台把数据、模型、部署打通了，对机器人创业团队来说可能是个加速器，但实际效果还得看落地案例。

16:28

IT之家（RSS）

46

跃伴发布智能如厕机器人"小伴"，28999元

跃伴在2026上海国际养老、辅具及康复医疗博览会上发布智能如厕机器人“小伴”，售价28999元。该产品将“人找马桶”升级为“马桶找人”，通过自建马桶数据库无需改动下水即可精准对位家中马桶或蹲厕，内置低噪粉碎结构防止堵塞。排污后360度涡旋自清洁，自动生成泡沫阻断异味，配合高密封污水箱自动关盖、冲水、关闭隔臭阀。搭载AI芯片及5路线激光、1个激光雷达等传感器，实现全流程无人干预的自主移动。配备大按键遥控与离线语音操控，扶手设有紧急呼叫按钮。

产品更新具身智能端侧

16:28

IT之家（RSS）

63

工信部：大力发展 AI 手机和电脑、智慧家庭、智能穿戴设备等产品

工信部印发《“人工智能+信息通信”创新发展实施意见（2026—2028年）》，提出打造网智融合新终端，加强具身智能与信息通信融合创新，推动具身智能与网联通信模组适配验证，大力发展人工智能手机和电脑、智慧家庭设备、智能穿戴设备。意见鼓励基础电信企业利用AI赋能传统业务，深化智慧个人助理、智慧管家、家庭看护等应用。面向卫生健康和教育等领域，开展智能健康监测、老人和儿童看护、智能课堂、智能学伴等应用，提供精准化与普惠化服务。

具身智能政策/监管

12:56

HuggingFace Daily Papers（社区热门论文）

67

WorldOlympiad：视频世界模型三项全能评测基准

WorldOlympiad 将视频世界模型评估分解为物理、几何和交互三个维度。物理轨道用物体分割和 MLLM-as-judge 检验视频对力学、热现象、材料属性等规则的遵循；几何轨道以高斯泼溅重建评估结构一致性、跨视角连贯性与相机轨迹对齐；交互轨道评测模型能否按复杂动作提示生成连贯长程视频。基准覆盖游戏、机器人和通用真实视频三大场景。实验表明，当前最先进模型在物理推理、3D 一致性和长程交互上存在显著差距。

arXiv 具身智能多模态视频

12:28

IT之家（RSS）

53

何小鹏发内部信：亲自下场直管机器人业务，称迎来量产和商业化前夜

何小鹏通过内部信宣布亲自直管机器人业务，称小鹏机器人正迎来量产和商业化前夜，相当于8年前小鹏汽车完成G3发布时的阶段。接下来几个月是最艰苦、最关键的冲刺期，需解决量产细节。新一代IRON人形机器人计划于今年三季度正式亮相，目标今年底实现高阶人形机器人量产，首先在小鹏门店试商用，明年起面向中国及海外商业客户交付。从明年起，人形机器人的硬件收入和AI模型收入将成为集团收入和毛利增长的重要驱动力之一。

具身智能行业动态

11:47

Rohan Paul@rohanpaul_ai

49

宇树机器人人形机器人在户外单独表演了一套中国传统武术套路流畅的踢腿、宽大的步法以及精准的手臂动作，展现出强大的平衡与协调能力。

具身智能行业动态

10:56

HuggingFace Daily Papers（社区热门论文）

60

强化学习中流策略的测试时梯度引导

QGF（Q-Guided Flow）是一种完全在测试时执行策略优化的强化学习算法。它先通过标准行为克隆预训练参考流策略和价值函数批评家，然后在测试时利用价值梯度引导参考策略生成更高价值的动作。在单任务和目标条件离线RL基准测试中，QGF优于先前的测试时强化学习方法，与最先进的训练时算法性能相当但运行成本更低，且通过避免演员-评论家训练的不稳定性展现了良好的模型规模扩展性。

具身智能论文/研究

10:47

Rohan Paul@rohanpaul_ai

47

那些眼睛动得如此自然 AheadForm的仿生面部，正在突破恐怖谷。想象这张脸出现在小鹏那模特般流畅的步行机器人上。那将非常震撼。

产品更新具身智能多模态

08:00

HuggingFace Daily Papers（社区热门论文）

37

APT：通过动作专家预训练提升视觉-语言-动作策略的语言指令泛化能力

视觉-语言-动作（VLA）模型将预训练VLM与连续动作专家结合，但在分布外语言指令上泛化差——原因是数据中语言多样性低且动作专家随机初始化导致梯度噪声削弱VLM。APT从贝叶斯视角将策略分解为语言无关的视觉-动作（VA）先验和语言条件VLA似然，采用两阶段训练：阶段1冻结VLM，在视觉-动作对上预训练动作专家作为VA先验；阶段2通过门控融合注入语言token，保留已学习的视觉运动先验。APT适用于π和GR00T风格架构，在未见指令和组合任务上实现一致提升。

具身智能多模态论文/研究

6月9日

22:04

Google DeepMind：Blog（RSS）

48

Google DeepMind 欧洲机器人加速器启动，15家初创公司入选

Google DeepMind 加速器从欧洲选出15家机器人初创公司，提供为期3个月的密集指导和AI技术整合支持，帮助公司将AI融入核心产品。

DeepMind 具身智能行业动态

21:45

Rohan Paul@rohanpaul_ai

68

Rohan Paul 介绍 Antioch 推出的 Antioch Agent，一款基于浏览器的机器人仿真器。它允许现有机器人软件在仿真环境中运行，连接虚拟传感器与执行器，无需物理硬件即可反复测试。Antioch 宣称首次实现完整物理 AI 堆栈的浏览器端闭环智能体模拟，将数周实地测试缩短至数小时，加速实体自主系统的开发进程。

Antioch: Introducing Antioch Agent. For the first time, simulate the full physical AI stack in a closed agentic loop, entirely fr...

产品更新具身智能

21:00

公众号：火山引擎

精选69

全新汽车品牌AIVA发布，火山引擎助力打造AI汽车新体验

由赛力斯、宁德时代等多方产业资本组建的AI出行品牌AIVA正式发布。火山引擎提供豆包大模型、智能座舱等技术服务。概念车AIVA Origin Concept亮相，首款量产车AIVA ME7将于2026年内亮相，全系覆盖20万元以上市场。AIVA提出“AI定义汽车”路径，让汽车成为具身AI生命体。火山引擎副总裁表示，人与汽车的关系将实现交互、智能、感受三方面根本转变。未来双方将围绕AI交互、智能体验、情感陪伴深度共创。

具身智能端侧行业动态

推荐理由：AIVA把「先有AI再有车」当作造车逻辑，火山引擎直接下场定义汽车AI体验，这是豆包大模型从软件跑到物理世界的第一次大规模试水，做具身智能和车载产品的人该仔细看看。

21:00

公众号：百度智能云（文心）

26

千寻智能与百度智能云合作：98.8%有效训练时长加速具身模型进化

千寻智能与百度智能云合作，依托百度智能云AI Infra底座，将集群有效训练时长提升至98.8%，训练和推理效率分别提高30%和60%。其自研Spirit系列通用具身基座模型，Spirit v1.6在RoboArena评测中登顶，超越英伟达Cosmos3与Physical Intelligence Pi0.5，成为首个登顶的中国具身模型。公司成立于2024年1月，近期完成15亿元A+轮融资，近三个月累计融资近50亿元，预计今年积累100万小时真实交互数据，推动智能制造、服务行业等场景商业化落地。

具身智能行业动态

20:05

Chubby♨️@kimmonismus

49

这只是时间问题。 UBTECH 发布了其首批仿生人形机器人。它们不仅外表像人--触感也像人。

产品更新具身智能

16:26

IT之家（RSS）

54

英飞凌与越南企业 VinRobotics 签署合作备忘录，共同开发人形机器人

英飞凌与越南智能机器人公司 VinRobotics 签署谅解备忘录，共同开发人形机器人。双方将在河内建立联合研发中心，在微控制器、电源系统、传感器、连接技术等领域合作。英飞凌表示，一台人形机器人所需的半导体物料成本约 500 美元（约合 3397 元人民币），其解决方案可帮助客户开发“感知、思考”的机器人。

具身智能行业动态

13:55

HuggingFace Daily Papers（社区热门论文）

68

AHA-WAM：异步视界自适应世界-动作建模

提出AHA-WAM，基于双扩散Transformer（DiT）架构，将视频DiT作为低频世界规划器，维护滚动键值记忆编码长程场景演化；高频动作DiT通过分层联合注意力查询上下文，在闭环中执行短动作块。引入视界自适应偏移训练与观测引导视频上下文路由（OVCR），使动作专家无需重新运行视频DiT即可利用长程世界上下文并保持对实时状态的响应。在RoboTwin基准上平均成功率达92.80%，4项真实世界任务平均成功率78.3%，闭环控制频率24.17 Hz，相比Fast-WAM加速4.59倍，无需任何机器人数据预训练。

具身智能论文/研究

11:55

HuggingFace Daily Papers（社区热门论文）

60

Echo-Memory：动作世界模型中记忆机制的控制研究

Echo-Memory固定视频扩散骨干、优化器、相机动作表示、采样器和评估流水线，比较原始上下文、压缩记忆、空间摘要（不同读取路径）和状态空间循环四种记忆设计。三分支评估（回放质量、域内循环重访、开放域返回）显示排序常不一致，回放保真度不足以代理世界记忆。发现：原始上下文提升开放域返回远超回放指标；紧凑无法替代容量，激进空间与混合压缩丢失关键证据；块状态空间循环在开放域返回中最强，隐式记忆结构与使用同等重要。

具身智能视频论文/研究

11:29

Elon Musk@elonmusk

42

SpaceX AI 卫星

产品更新具身智能

11:22

IT之家（RSS）

57

特斯拉向内华达申请 Robotaxi 运营许可，计划一年内投放 5000 辆自动驾驶网约车

特斯拉子公司 Tesla Robotaxi, LLC 向内华达州提交自动驾驶车辆运营网络公司许可申请（案卷编号：26-05015），获批后计划在业务启动后 12 个月内于克拉克县投放最多 5000 辆 Robotaxi，覆盖拉斯维加斯、亨德森机场等人流密集区域。继 2025 年 9 月获测试许可并建成运维中心后，此举是商业化运营关键一步。2026 年第一季度股东报告显示，达拉斯、休斯顿已上线，其余城市在筹备；当季付费运营里程环比近乎翻倍，得克萨斯州运营未出现事故。新款 Cybercab 已于今年 4 月在得州超级工厂投产，将逐步取代 Model Y 成为主力运营车辆。

具身智能行业动态

10:55

HuggingFace Daily Papers（社区热门论文）

61

SpatialWorld：多模态智能体在真实世界任务中的交互式空间推理基准

SpatialWorld 是为评估多模态智能体在复杂真实任务中的交互式空间理解而设计的统一基准。它整合 8 个异构模拟后端，包含 760 个人工标注任务，覆盖家庭日常、旅行、社交协作等场景。智能体需在仅视觉部分可观测条件下主动收集第一人称证据，并通过统一文本动作接口输出决策。对 15 个先进多模态智能体的评测显示，最强闭源模型 GPT-5 平均任务成功率仅 17.4%，最强开源模型 Qwen-3.5 达 14.1%。分析表明任务成功与执行效率存在脱节，不同领域性能差异显著，主动探索与长程规划仍是瓶颈。

arXiv 具身智能多模态论文/研究

09:21

IT之家（RSS）

精选70

两部门：到2026年底人形机器人等重点产品完成应用验证并常态部署

工信部、国资委6月8日联合发布通知，目标到2026年底，人形机器人等重点产品在代表性场景完成应用验证并开启常态部署，形成百个以上高价值场景，万台级规模落地。要求各省级地区选取不少于20个场景单元（覆盖两类领域），央企不少于10个。围绕打造实景实训空间、组建创新应用联合体、攻关作业技能、加强验证部署、强化要素保障、凝练经验等六大任务展开，鼓励“人形机器人即服务”等商业创新。

具身智能政策/监管

推荐理由：工信部和国资委联合发文，目标2026年底人形机器人万台规模落地，这不是画饼，是实打实的场景清单和验证要求，做机器人的同行该逐条对照了。

08:00

HuggingFace Daily Papers（社区热门论文）

精选78

Embodied-R1.5：通过具身基础模型演化物理智能

Embodied-R1.5是一个统一具身基础模型，将具身认知、任务规划、纠错与指向能力整合在单一架构中。基于三条自动化数据构建流水线，团队搭建超过150亿模型token的数据系统，并设计多任务平衡强化学习方案以缓解异构任务冲突。其Planner-Grounder-Corrector闭环框架使模型能在长周期任务中自主执行并自我纠正。仅8B参数的Embodied-R1.5在24个具身VLM基准中的16个上达到SOTA，超越Gemini-Robotics-ER-1.5与GPT-5.4，并可微调为VLA，在4个操作任务基准上领先π_{0.5}等模型。零样本真实机器人实验验证了其指令遵循、可操作物体判别、铰接物体操控与长周期复杂任务中的泛化能力。模型权重、数据集、训练代码及评估框架EmbodiedEvalKit已开源。

arXiv 具身智能开源生态论文/研究

推荐理由：仅8B参数就在24项具身视觉语言基准上赢过GPT-5.4和Gemini-Robotics，还把模型权重、训练代码全开源了，做具身智能的团队不跟进就是犯罪。

05:12

Rohan Paul@rohanpaul_ai

50

美国GUARD法案拟禁止中国机器人入美

美国新提出的GUARD法案要求安全机构审查来自中国及其他敌对国家生产的机器人，并将高风险系统列入FCC“覆盖清单”，类比此前对华为、中兴的禁令。立法者担忧机器人不仅配备摄像头、麦克风、传感器、地图、马达和无线链路，更会成为可在工厂、实验室、家庭和警局内移动的计算机。另一项Schumer-Cotton法案单独禁止联邦机构购买或使用中国人形机器人，但允许受控的军事或执法研究例外。

具身智能政策/监管行业动态

1…6 789 10…27