全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 759 条

全部一手资讯 X 论文

标签「具身智能」清除

5月10日周日

09:32IT之家（RSS）24功勋车型正式停产：特斯拉弗里蒙特工厂最后一辆 Model S 和 X 生产下线

08:00HuggingFace Daily Papers（社区热门论文）43零次模拟到真实机器人学习：反应式抓取的灵巧操作研究

08:00HuggingFace Daily Papers（社区热门论文）48Sub-JEPA：用于稳定端到端世界模型的子空间高斯正则化方法

00:32IT之家（RSS）64两台 Figure AI 人形机器人大秀新技能：不到两分钟铺好一张床

5月9日周六

08:00HuggingFace Daily Papers（社区热门论文）54RigidFormer：使用Transformer学习刚体动力学

5月8日周五

20:22IT之家（RSS）56消息称沃尔沃拟搭载千里浩瀚智驾方案，最快明年初上车

16:16IT之家（RSS）58索尼、台积电拟建立战略合作，将在日本成立图像传感器合资企业、探索物理 AI

12:22HuggingFace Daily Papers（社区热门论文）57何时信任想象：世界行动模型的自适应动作执行

08:00HuggingFace Daily Papers（社区热门论文）51基于残差潜在动作学习视觉特征世界模型

5月7日周四

16:16IT之家（RSS）35宇树 G1 人形机器人在韩国佛门"受戒"：法名"迦悲"，需遵守不过度充电等戒律

15:16IT之家（RSS）59全球首个人形机器人任务动作应用商店：宇树 UniStore 官方共享应用平台正式全面开放

13:16IT之家（RSS）33穿越机、机器狗齐上阵，武警捕歼演练现场画面公开

11:22HuggingFace Daily Papers（社区热门论文）56PhysForge：为交互式虚拟世界生成基于物理的3D资产

08:00HuggingFace Daily Papers（社区热门论文）48MobileEgo Anywhere：基于通用硬件的长时程自我中心数据开放基础设施

08:00HuggingFace Daily Papers（社区热门论文）57HumanNet：将人类中心视频学习扩展到百万小时

5月6日周三

15:16IT之家（RSS）57工信部：研究制定宠物用家电、特殊人群用服务机器人等新产品标准

10:20HuggingFace Daily Papers（社区热门论文）64交互式世界模型基准测试与统一动作生成框架

08:00HuggingFace Daily Papers（社区热门论文）57ReflectDrive-2：基于强化学习对齐的自编辑离散扩散驾驶规划器

07:15IT之家（RSS）50华为靳玉志晒 ADS 5 出行报告，称全程 102 公里 100% 用领航辅助驾驶完成

5月5日周二

17:14IT之家（RSS）63特斯拉奥斯汀 Robotaxi 开启夜间无安全员运营

15:14IT之家（RSS）52英伟达九成生产成本来自亚洲供应商，AI 产能争夺加剧

12:17HuggingFace Daily Papers（社区热门论文）75精选MolmoAct2：面向真实世界部署的动作推理模型

11:14IT之家（RSS）53成立仅 1 年，物理 AI 初创企业 ARI 被 Meta 收购

10:14IT之家（RSS）59英特尔任命前高通高管 Alex Katouzian 为客户端计算和物理 AI 事业部总经理

08:14IT之家（RSS）51宇树机器人在美买票坐飞机，电池被没收

08:00HuggingFace Daily Papers（社区热门论文）56参数高效的多视角技能熟练度估计：从判别式分类到生成式反馈

08:00HuggingFace Daily Papers（社区热门论文）73精选RLDX-1技术报告

5月4日周一

18:14IT之家（RSS）57中国机器人创企"灵心巧手"寻求下一轮融资，目标估值 60 亿美元

16:21Hacker News 热门（buzzing.cc 中文翻译）46类人机器人执行器

12:13IT之家（RSS）63特斯拉 FSD 行驶里程突破 100 亿英里，马斯克"无监督自动驾驶"数据里程碑达成

12:13IT之家（RSS）45苹果机器人项目高级工程师离职，跳槽谷歌 DeepMind

10:13IT之家（RSS）37无需等待人类指令，半自主探测机器人可大幅提升火星探测效率

08:00HuggingFace Daily Papers（社区热门论文）59KinDER：机器人学习与规划的物理推理基准测试

5月3日周日

17:12IT之家（RSS）47超维动力发布全球最高 115 自由度人形机器人 KAI：173 厘米、70 公斤，全身覆盖 18000 个触觉传感点

07:12IT之家（RSS）47跨越百亿里程碑：华为乾崑 4 月安全出行报告发布，累计辅助驾驶里程 104.7 亿公里

5月2日周六

16:20The Decoder：AI News（RSS）66Meta 收购 Assured Robot Intelligence 以加速人形机器人布局

08:00HuggingFace Daily Papers（社区热门论文）57ESARBench：面向无人机具身搜索与救援的智能体基准

5月1日周五

22:11IT之家（RSS）35韩国投放起亚 PV5 新式 AI 警车：内置无人机、热成像、90 倍变焦摄像头

20:11IT之家（RSS）40全国首支机器人交警中队在杭州正式上岗，能提醒违章、为游客指路

19:11IT之家（RSS）52浙江杭州为具身智能机器人立法，今起正式施行

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月10日

09:32

IT之家（RSS）

24

功勋车型正式停产：特斯拉弗里蒙特工厂最后一辆 Model S 和 X 生产下线

特斯拉官方确认，最后一辆Model S和Model X已在弗里蒙特工厂下线，标志着这两款拥有14年和11年历史的功勋车型正式停产。它们曾是确立特斯拉品牌地位的行业标杆，但自Model 3/Y推出后，其市场地位被大幅削弱。2025年，Model 3/Y全球交付量达160万辆，而包含S/X在内的其他车型仅交付约5万辆，占比为个位数。停产后的弗里蒙特工厂将转向生产Optimus人形机器人。

其他具身智能

08:00

HuggingFace Daily Papers（社区热门论文）

43

零次模拟到真实机器人学习：反应式抓取的灵巧操作研究

本研究提出域随机化实例集（DRIS）方法，以提升机器人灵巧操作策略在模拟到真实环境中的迁移能力。传统域随机化每轮仅随机化一个模拟实例，对真实世界动态变化的覆盖有限。DRIS能同时处理一组随机实例，更全面地逼近不确定动态环境，使策略学习应对多种可能结果。理论分析与实验表明，即使实例数量较少（如10），该方法也能生成更鲁棒策略，减少真实场景微调需求。研究在高难度反应式抓取任务上验证，该任务使用无被动稳定性的平板，对噪声敏感。最终，策略展现出强鲁棒性，实现可靠的零次模拟到真实迁移。

具身智能数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

48

Sub-JEPA：用于稳定端到端世界模型的子空间高斯正则化方法

研究团队提出Sub-JEPA方法，以解决联合嵌入预测架构训练中的偏差-方差权衡问题。该方法放弃在原始高维嵌入空间直接施加各向同性高斯先验，转而通过在多个随机子空间中施加高斯约束，从而放松了全局限制，同时保留了防止模型崩溃的效果，在训练稳定性与表示灵活性间取得了更好平衡。在四个连续控制环境中的实验表明，该方法以明显优势持续超越了此前基于各向同性高斯先验的LeWorldModel方法。该方法简单有效，为未来基于JEPA的世界模型研究提供了有力基线。

GitHub 具身智能论文/研究

00:32

IT之家（RSS）

64

两台 Figure AI 人形机器人大秀新技能：不到两分钟铺好一张床

Figure AI发布视频展示两台人形机器人协作完成整理卧室任务。它们能挂外套、合电脑、铺床单，并在不到两分钟内协同铺好一张床。此次演示基于升级后的Helix 02模型，机器人完全通过视觉（如点头）进行协调，无需显式通信或远程操控。公司指出，处理柔软变形的床单、实时理解同伴动作以及在多任务间切换是技术难点。Figure AI目前估值约390亿美元，但未公布消费者产品的上市时间。

具身智能行业动态视频

5月9日

08:00

HuggingFace Daily Papers（社区热门论文）

54

RigidFormer：使用Transformer学习刚体动力学

RigidFormer是一种以物体为中心的Transformer模型，用于学习无网格刚体动力学并支持可控积分步长。该模型在物体级别推理，通过紧凑锚点推进物体，利用锚点-顶点池化融入局部顶点特征，保留接触几何而无需密集顶点交互。基于锚点的RoPE将几何注入注意力机制，尊重物体与锚点的无序性，并通过可微Kabsch对齐将更新投影到刚体流形以保持刚性。在标准基准测试中，它使用点云输入优于或匹配基于网格的基线，运行更快，能泛化到未见点分辨率和跨数据集，可扩展至200多个物体。初步研究还展示了扩展到指令条件化铰接体的潜力。

arXiv 具身智能论文/研究

5月8日

20:22

IT之家（RSS）

56

消息称沃尔沃拟搭载千里浩瀚智驾方案，最快明年初上车

沃尔沃汽车计划搭载千里浩瀚G-ASD智驾方案，相关开发工作已启动，预计最快2027年年初实现上车。延迟主要因沃尔沃对功能安全、操作系统等标准极为严苛，且需满足欧洲法规。千里浩瀚是吉利与千里科技联合研发的全栈自研高阶智能驾驶方案，覆盖L2至L4级别，可适配不同车型。该方案目前已交付近50万辆，计划2026年上车超百万辆，H5、H7、H9硬件年内将覆盖40款车型，明年扩展至七大品牌96款车型，并计划在今年实现出海。

具身智能行业动态

16:16

IT之家（RSS）

58

索尼、台积电拟建立战略合作，将在日本成立图像传感器合资企业、探索物理 AI

索尼半导体与台积电签署备忘录，计划成立合资公司，共同开发制造下一代图像传感器。索尼将持有多数股权并控制合资公司，研发与生产将设于其日本熊本县的新晶圆厂。双方旨在结合索尼的传感器设计与台积电的制程技术，以提升产品性能，并探索汽车、机器人等物理AI应用的新机遇。合资公司的成立取决于后续正式协议的签署。

具身智能端侧行业动态

12:22

HuggingFace Daily Papers（社区热门论文）

57

何时信任想象：世界行动模型的自适应动作执行

针对世界行动模型（WAMs）执行固定预测动作、缺乏实时验证的问题，本研究提出一种自适应执行框架。该框架通过轻量级验证器FFDC，联合推理预测动作、视觉动态、真实观测与语言指令，以评估剩余动作序列的可信度，从而根据预测与观测的一致性动态调整执行的动作块大小。该方法在保持长时程执行效率的同时，提升了机器人在接触密集或困难阶段的响应能力。实验表明，其在RoboTwin基准上显著减少了模型前向传递与执行时间，并提高了任务成功率。

具身智能论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

51

基于残差潜在动作学习视觉特征世界模型

本研究提出了一种新型的残差潜在动作表示，它能从DINO残差中学习，并具备预测性、泛化性与时序编码能力。基于此构建的RLA世界模型通过流匹配预测未来状态，在仿真与真实数据集上超越了当前最先进的基于特征的方法和视频扩散世界模型，且速度快数个数量级。此外，团队开发了两种利用该世界模型改进机器人策略学习的技术：一是从无动作演示视频中学习的极简世界动作模型；二是首个完全在仅从离线视频学习的世界模型内训练、使用视频对齐奖励且无需在线交互或手工奖励的视觉强化学习框架。

具身智能论文/研究

5月7日

16:16

IT之家（RSS）

35

宇树 G1 人形机器人在韩国佛门"受戒"：法名"迦悲"，需遵守不过度充电等戒律

韩国曹溪宗在首尔曹溪寺为人形机器人“宇树G1”举行受戒仪式，授予其法名“迦悲”。该机器人以普通佛教徒身份受戒，并在佛诞节期间作为“名誉”僧侣参与活动。仪式中，机器人穿戴特制僧服，完成了忏悔和象征性的燃臂环节。传统的佛教“五戒”被改编为机器人版本，包括不伤害生命、不损坏物品、服从人类、不做欺骗行为以及节约能源、不过度充电。曹溪宗表示，此举旨在倡导技术应基于慈悲与责任的价值，并探索人机和谐共存的新可能。

具身智能行业动态

15:16

IT之家（RSS）

59

全球首个人形机器人任务动作应用商店：宇树 UniStore 官方共享应用平台正式全面开放

宇树科技宣布其全球首个人形机器人任务动作应用商店“UniStore”正式全面开放。该平台允许用户像使用手机应用商店一样，轻松上传、分享和下载训练好的机器人动作模型，例如舞蹈、武术和劳动技能。此举旨在推动人形机器人从“功能机”向“智能机”时代跨越，通过共享应用生态解锁机器人的无限潜能。平台包含用户广场和动作库，用户可一键获取复杂操作预设。

产品更新具身智能

13:16

IT之家（RSS）

33

穿越机、机器狗齐上阵，武警捕歼演练现场画面公开

武警第二机动总队某支队近日在西南边陲组织了一场有人和无人协同捕歼演练。演练模拟2名暴恐分子藏匿于废弃厂房，侦察组使用无人机进行高空侦察。突击组兵分两路：一组借助机器狗对目标区域实施封控警戒；另一组操控穿越机率先进入屋内，对暴恐分子可能藏匿的位置进行精准打击。此次演练将无人力量正式纳入作战编组，旨在优化战法训法，将新质战斗力转化为复杂环境下的实际制胜能力。

具身智能现象/趋势

11:22

HuggingFace Daily Papers（社区热门论文）

56

PhysForge：为交互式虚拟世界生成基于物理的3D资产

针对交互式虚拟世界与具身智能中物理3D资产合成的瓶颈，现有方法多忽视功能性。本文提出PhysForge，一个由大规模四层物理标注数据集PhysDB支持的两阶段框架。第一阶段，视觉语言模型担任“物理架构师”，规划定义材料、功能与运动学约束的“分层物理蓝图”。第二阶段，基于物理的扩散模型通过新颖的运动体素注入机制，合成高保真几何与精确运动学参数。实验证明，PhysForge能生成功能合理、可直接仿真的资产，为交互式3D内容与具身智能体提供了强大的数据引擎。

arXiv 具身智能多模态数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

48

MobileEgo Anywhere：基于通用硬件的长时程自我中心数据开放基础设施

为解决VLA模型对长时程自我中心数据的需求与现有短时程数据集之间的矛盾，本文提出MobileEgo Anywhere框架。该框架利用智能手机传感器实现高精度位姿追踪，降低了数据采集的硬件门槛。主要贡献包括：发布了一个包含200小时多样化长时程轨迹的数据集，开源了移动数据采集应用，并提供了将原始数据转换为标准训练格式的完整处理流程。这实现了跨全球环境的大规模长时程数据获取，为机器人策略研究提供了关键数据支持。

arXiv 具身智能开源生态数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

57

HumanNet：将人类中心视频学习扩展到百万小时

HumanNet是一个百万小时规模的人类中心视频数据集，涵盖第一和第三人称视角，包含精细活动、人-物交互、工具使用及长期行为。它提供交互中心标注，如描述文本、动作说明及身体信号，支持动作与交互感知学习。数据构建强调人类中心筛选、时序结构化、视角多样性和标注增强，将互联网视频转化为可扩展学习基础。实验表明，用其1000小时第一人称视频训练Qwen VLM模型，效果优于100小时真实机器人数据，提示人类视频可作为机器人数据的可扩展且经济高效替代。该项目旨在探索通过人类视频扩展具身基础模型。

arXiv 具身智能数据/训练视频

5月6日

15:16

IT之家（RSS）

57

工信部：研究制定宠物用家电、特殊人群用服务机器人等新产品标准

工信部公开征求《以标准提升引领轻工产品品质革命实施方案》意见。方案提出将推广应用家用电器抗菌、除菌、噪声限值等现有标准，并研究制定宠物用家电、特殊人群用服务机器人等新产品标准。目标到2027年，制修订产品及方法标准约200项，完成约100项标准评估复审，译制外文版标准约30项，牵头制修订国际标准占比提升至8%左右。到2030年，基本建成全球领先的轻工业标准体系，助力“中国轻工”品牌国际化。

具身智能政策/监管

10:20

HuggingFace Daily Papers（社区热门论文）

64

交互式世界模型基准测试与统一动作生成框架

为系统评估交互式世界模型的物理交互能力，研究团队提出了iWorld-Bench基准测试。该基准包含一个33万视频片段的数据集，并精选了2100个涵盖多视角、天气与场景的高质量样本。针对现有模型交互模态不统一的问题，研究设计了一个统一的动作生成框架，构建了六类任务共4900个测试样本，以综合评估模型在视觉生成、轨迹跟随和记忆等方面的性能。通过对14个代表性模型的评估，研究揭示了当前关键局限，为未来方向提供了见解。相关排行榜已公开。

arXiv 具身智能多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

57

ReflectDrive-2：基于强化学习对齐的自编辑离散扩散驾驶规划器

ReflectDrive-2是一种用于自动驾驶的掩码离散扩散规划器，它将规划表示为离散轨迹令牌并通过并行掩码解码生成。其核心是AutoEdit自编辑功能，可在同一模型内直接重写选定令牌，无需额外优化网络。模型采用两阶段训练：先通过扰动专家轨迹进行监督学习，再利用强化学习微调“决策-起草-反思”全流程，将最终驾驶奖励分配给编辑后的轨迹。强化学习使编辑效果的PDMS指标增益从0.3提升至1.9。在NAVSIM测试中，该模型仅使用摄像头输入即达到91.0 PDMS，在最优6次采样下可达94.8 PDMS，平均延迟为31.8毫秒。

具身智能数据/训练论文/研究

07:15

IT之家（RSS）

50

华为靳玉志晒 ADS 5 出行报告，称全程 102 公里 100% 用领航辅助驾驶完成

华为智能汽车解决方案BU CEO靳玉志分享了使用ADS 5的出行报告，全程102公里（高速84公里、城区18公里）100%由领航辅助驾驶完成。华为乾崑智驾ADS 5已于4月23日正式发布，其核心是面向自动驾驶的AI智能体WEWA 2.0架构。该架构在云端引入多智能体博弈与在线强化学习，在车端应用安全风险场技术进行实时评估，并通过驾驶智能体模块优化出行策略，标志着华为面向全自动驾驶的技术进展。

具身智能行业动态

5月5日

17:14

IT之家（RSS）

63

特斯拉奥斯汀 Robotaxi 开启夜间无安全员运营

特斯拉在得克萨斯州奥斯汀的Robotaxi服务取得重要进展，于5月4日首次开启夜间无安全员运营，突破了此前仅限日间的限制。此举使奥斯汀与达拉斯、休斯顿的运营模式同步，并扩大了运行设计域。面对夜间低能见度、车灯眩光等挑战，特斯拉依靠其纯视觉方案和端到端AI技术栈应对。拓展至晚间出行高峰期有助于提升车辆利用率和营收，并收集更多关键数据。此次突破为未来在凤凰城、迈阿密等更多城市推广服务，以及实现全天候、更复杂路况的运营奠定了基础。

产品更新具身智能

15:14

IT之家（RSS）

52

英伟达九成生产成本来自亚洲供应商，AI 产能争夺加剧

英伟达生产成本中亚洲供应商占比已升至90%，其新发布的Jetson Thor机器人平台等实体AI产品，与数据中心GPU共同争夺台积电3纳米晶圆产能，并消耗由三星、SK海力士供应的紧缺LPDDR5X内存，导致旧款模组因LPDDR4断供提前停产。尽管英伟达承诺在美投资，但亚洲供应链的依赖与产能争夺仍在加剧，美国本土产能尚无法承接快速增长的需求。

具身智能行业动态

12:17

HuggingFace Daily Papers（社区热门论文）

精选75

MolmoAct2：面向真实世界部署的动作推理模型

MolmoAct2 是一个为实际部署设计的全开放动作推理模型，在五个方面取得进展。其核心是专为空间与具身推理训练的 VLM 骨干 MolmoER，基于 330 万样本语料库训练。团队发布了三个新数据集，包括迄今最大开放双手数据集 MolmoAct2-BimanualYAM（720 小时遥操作轨迹），并开源了动作分词器 OpenFAST。模型采用层间 KV 缓存条件化架构，嫁接连续动作专家，还引入自适应深度推理变体 MolmoThink，以极低延迟保持几何基础。在广泛实证研究中，MolmoAct2 在 7 个仿真与真实世界基准上超越 Pi-05 等基线，MolmoER 在 13 个具身推理基准上超过 GPT-5 和 Gemini Robotics ER-1.5。模型权重、训练代码与数据均已公开。

智能体具身智能多模态开源/仓库

推荐理由：开源具身动作推理模型首次全面超越 GPT-5 和 Gemini Robotics，还附赠最大的双手操作数据集和全套训练代码，做机器人的同学本周必读。

11:14

IT之家（RSS）

53

成立仅 1 年，物理 AI 初创企业 ARI 被 Meta 收购

Meta于5月1日完成了对物理AI初创公司Assured Robot Intelligence的收购，具体金额未披露。这家成立仅一年的公司专注于开发能在动态环境中理解、预测和适应人类行为的机器人智能。Meta表示，ARI团队在模型设计、机器人控制及自主学习方面拥有深厚专业知识，其技术将应用于全身人型机器人控制领域。ARI联合创始人称，公司创立目标是实现物理通用人工智能，未来团队将加入Meta Superintelligence Labs，共同推动具有类人形态的智能体从人类经验中学习并进入物理世界。

Meta 具身智能行业动态

10:14

IT之家（RSS）

59

英特尔任命前高通高管 Alex Katouzian 为客户端计算和物理 AI 事业部总经理

英特尔宣布重大人事与组织架构调整，任命前高通高管 Alex Katouzian 为执行副总裁兼新成立的客户端计算和物理 AI 事业部总经理。该部门由原客户端计算业务与物理AI业务合并而成，旨在整合资源，抓住边缘计算与物理AI（如机器人、自主机器）的发展机遇。同时，公司正式任命 Pushkar Ranade 为企业首席技术官，负责推进量子计算等新兴技术战略。两位高管均直接向首席执行官陈立武汇报，此举旨在推动AI PC、边缘AI推理及下一代计算体验的创新。

具身智能端侧行业动态

08:14

IT之家（RSS）

51

宇树机器人在美买票坐飞机，电池被没收

机器人租赁公司Elite Event Robotics近日携带一台重约31.8公斤的宇树人形机器人Bebop，乘坐美国西南航空从奥克兰飞往圣地亚哥的航班。由于机器人包装箱超重，团队为其购买了一个人类座位。但西南航空以电池尺寸超标为由没收了机器人的动力电池，导致航班延误超过一小时。此次事件展示了人形机器人实际乘坐民航客机的尝试，也凸显了航空运输对大型机器人电池的严格限制。

具身智能行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

56

参数高效的多视角技能熟练度估计：从判别式分类到生成式反馈

评估人的动作完成质量（熟练度）对教学、康复等领域至关重要，但其挑战在于细微的时空差异分布于多视角视频中。本文针对Ego-Exo4D数据集提出三种创新方法：SkillFormer采用参数高效的判别式架构实现选择性多视角融合；PATS通过保留基础动作的局部密集片段来改进时序采样；ProfVLM则将任务重构为条件语言生成，通过门控跨视角投影器和紧凑语言模型，同时输出熟练度标签与专家风格反馈。这些方法仅需比视频Transformer基线少20倍的可训练参数和少3倍的训练周期，即达到最优准确率，推动了该任务从封闭集分类向可解释反馈生成的范式转变。

具身智能多模态视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

精选73

RLDX-1技术报告

为提升视觉-语言-动作模型在复杂现实任务中的功能覆盖，研究团队推出通用机器人策略RLDX-1。该模型基于多流动作变换器架构，整合运动感知、记忆决策与物理传感等异构模态，并辅以合成罕见场景数据、仿人操作学习流程及实时推理优化等系统设计。在仿真与真实测试中，RLDX-1全面超越前沿模型π_{0.5}和GR00T N1.6，尤其在ALLEX人形机器人任务上取得86.8%的成功率，显著高于对照模型的约40%，标志着其在接触密集型动态灵巧操作领域取得关键进展。

智能体具身智能多模态论文/研究

推荐理由：在 ALLEX 人形任务上把成功率从 40% 拉到 86.8%，RLDX-1 证明了多模态流架构对灵巧操作的价值，做机器人的同学可以重点关注一下。

5月4日

18:14

IT之家（RSS）

57

中国机器人创企"灵心巧手"寻求下一轮融资，目标估值 60 亿美元

中国机器人初创公司灵心巧手计划在下一轮融资中寻求60亿美元估值，较其上周完成的B+轮融资估值翻倍。该公司是全球高灵巧度机械手市场的领先者，占据超过80%份额，并计划将月产能提升至1万台。其核心产品O6型号机械手重量仅370克，却能承载50公斤负载，已能执行拧螺丝、抓取柔软物体等高精度任务。公司拥有包含500多项技能的LinkerSkillNet平台，旨在硬件中复现人类灵巧技能库，目标应用于弹钢琴、牙科操作等高附加值领域。

具身智能行业动态

16:21

Hacker News 热门（buzzing.cc 中文翻译）

46

类人机器人执行器

Firgelli公司发布了专为人形机器人设计的新型执行器系列。该系列执行器在扭矩密度、能效和控制精度方面实现显著提升，旨在更精准地模拟人类关节运动，从而增强机器人的灵活性与适应性。产品信息发布于公司官网，相关讨论在Hacker News上获得100点热度。

具身智能行业动态

12:13

IT之家（RSS）

63

特斯拉 FSD 行驶里程突破 100 亿英里，马斯克"无监督自动驾驶"数据里程碑达成

特斯拉FSD（监督版）车队行驶总里程已突破100亿英里，达到马斯克设定的关键数据里程碑，且数据收集速度大幅加快。特斯拉宣称其FSD安全性优于人类驾驶，但业内指出其统计口径与官方不一致，存在误导性，其奥斯汀自动驾驶出租车事故率约为人类驾驶员的四倍。马斯克已将无监督版FSD上线时间推迟至2026年第四季度。相比之下，Waymo已在多城运营L4级无人驾驶，并公布其重伤事故率比人类低90%。

具身智能数据/训练行业动态

12:13

IT之家（RSS）

45

苹果机器人项目高级工程师离职，跳槽谷歌 DeepMind

苹果机器人团队高级工程经理伯努瓦・兰德里离职，跳槽至谷歌DeepMind。苹果正研发智能家居机器人，包括一款桌面机器人，外观类似加装机械臂的iPad，可执行基础任务并搭载全新Siri系统。苹果员工流失严重，机器人团队负责人去年已跳槽Meta，团队多名高级工程师相继离职，人才被Meta和谷歌以高薪挖走。

DeepMind 具身智能行业动态

10:13

IT之家（RSS）

37

无需等待人类指令，半自主探测机器人可大幅提升火星探测效率

苏黎世联邦理工学院等机构研发了一款半自主探测机器人，旨在解决传统火星探测因通讯延迟和数据传输限制导致的效率低下问题。该机器人能自主往返多个目标点，利用小型精密仪器进行探测分析。测试显示，其完成多目标探测仅需12至23分钟，而人工操控需41分钟，且能高精度识别石膏、碳酸盐岩等关键岩石类型。这项技术未来将应用于月球、火星等深空探测任务，显著扩大勘测范围并高效搜寻生命痕迹。

其他具身智能

08:00

HuggingFace Daily Papers（社区热门论文）

59

KinDER：机器人学习与规划的物理推理基准测试

KinDER是一个针对机器人学习与规划中物理推理挑战的基准测试平台。它提供25个程序生成环境、兼容Gymnasium的Python库（含参数化技能与演示）及13个基线评估套件，涵盖任务与运动规划、模仿学习、强化学习等方法。平台聚焦五大核心挑战：基础空间关系、非抓握多物体操控、工具使用、组合几何约束和动态约束，剥离了感知与语言理解等复杂性。实验表明，现有方法在多数环境中表现不佳，揭示物理推理能力显著不足。此外，通过移动机械臂的实-仿-实实验验证了仿真与真实交互的对应性。KinDER已开源，旨在推动物理推理研究的系统化比较。

arXiv 具身智能论文/研究

5月3日

17:12

IT之家（RSS）

47

超维动力发布全球最高 115 自由度人形机器人 KAI：173 厘米、70 公斤，全身覆盖 18000 个触觉传感点

超维动力发布全球最高115自由度人形机器人KAI。其身高173厘米，体重70公斤，全身覆盖约18000个触觉传感点。该机器人搭载1.7kWh半固态电池，可支持3小时双臂操作，负载近20公斤，手部具备36个自由度。发布会由两台KAI机器人自主对谈完成。技术核心是“KAI World Model”物理世界模型系统，通过自研头戴设备采集第一人称数据，并采用三阶段训练体系提升技能。

产品更新具身智能

07:12

IT之家（RSS）

47

跨越百亿里程碑：华为乾崑 4 月安全出行报告发布，累计辅助驾驶里程 104.7 亿公里

华为乾崑智能汽车解决方案发布4月安全出行报告，其累计辅助驾驶里程已达104.7亿公里，跨越百亿里程碑。月度辅助驾驶里程为9.1亿公里，智驾辅助月活用户数达143万，用户占比94.8%，月度人均辅助驾驶里程637公里。具体功能上，车位到车位功能使用956万次，辅助泊车达6548万次。此前，华为已发布乾崑智驾ADS 5.0系统，首发防误打方向盘与车位到车位3.0版本，并推出了乾崑OS与迭代至3.0版本的乾崑XMC车辆控制技术。

具身智能行业动态

5月2日

16:20

The Decoder：AI News（RSS）

66

Meta 收购 Assured Robot Intelligence 以加速人形机器人布局

Meta 收购了机器人AI初创公司Assured Robot Intelligence，旨在加速其人形机器人研发进程。此次收购的核心目标是打造一个面向全行业的开放平台，其战略定位类似于Android在智能手机领域所扮演的角色。Meta计划通过这一平台，推动人形机器人技术的标准化与普及化发展。

Meta 具身智能开源生态行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

57

ESARBench：面向无人机具身搜索与救援的智能体基准

研究团队提出了具身搜索与救援新任务，并发布首个综合性基准ESARBench，用于评估多模态大语言模型驱动的无人机智能体。该基准基于Unreal Engine 5和AirSim构建了四个从真实世界GIS数据映射的高保真、大规模开放环境，包含动态天气、昼夜变化和随机线索布置。基准包含600个基于真实救援案例建模的任务及一套评估指标。实验评估了从传统启发式方法到基于MLLM的导航智能体等多种基线，结果揭示了该任务在空间记忆、空中适应性及搜索效率与飞行安全权衡方面的关键瓶颈。

具身智能多模态论文/研究

5月1日

22:11

IT之家（RSS）

35

韩国投放起亚 PV5 新式 AI 警车：内置无人机、热成像、90 倍变焦摄像头

起亚与韩国警察厅合作推出基于PV5车型的高科技AI警车。该车集成车顶无人机自动起降系统，无人机配备热成像仪和90倍变焦摄像头，可进入狭窄危险区域执行巡逻、追踪与搜救任务，并利用车辆V2L系统自动充电。车顶三台AI摄像头实现360度无盲区监控，能通过衣着配饰实时识别嫌疑人，并可检测携带武器人员、倒地市民及人群密度风险。该警车计划于2026年6月在首都圈启动试点，用于犯罪预防与快速响应。

具身智能行业动态

20:11

IT之家（RSS）

40

全国首支机器人交警中队在杭州正式上岗，能提醒违章、为游客指路

全国首个交通管理机器人中队“杭警智行”于“五一”假期首日在杭州正式上岗。首批15台机器人部署在西湖景区周边、湖滨商圈及延安路、西湖大道等主干道沿线，覆盖多个重要交通节点。它们主要承担非机动车和行人违法劝导、交通指挥、游客问路指引等任务，与路面警力协同作战以提升管理效能。机器人已全面接入大语言模型，在断桥、动物园等景区路口可通过语音提问提供路线规划，在钱江路、延安路等路段则重点监控违法行为。

具身智能行业动态

19:11

IT之家（RSS）

52

浙江杭州为具身智能机器人立法，今起正式施行

全国首部具身智能机器人领域地方性法规《杭州市促进具身智能机器人产业发展条例》于5月1日正式施行。该条例率先对“具身智能机器人”作出明确定义，填补了概念空白，并明确了产业与监管边界，旨在推动创新资源向算法、感知等核心技术集聚。条例同时支持关键部件研发与平台建设，并推动机器人在应急救援、医疗康养等公共场景落地。目前杭州已集聚机器人相关企业700余家，2025年该产业集群产值达1068亿元。

具身智能政策/监管

1…13 141516 17…19