5月19日

10:59

歸藏(guizang.ai)@op7418

波士顿动力机器人的新演示，现在可以搬动很重的东西

具身智能行业动态

10:45

IT之家（RSS）

6cm 仿生机械足越障：小米米家扫拖机器人 6 Max 国补后 3827 元新低

小米米家扫拖机器人 6 Max 于 2026 年 3 月 19 日开售。京东 618 大促期间，其水箱版通过叠加 8.7 折优惠券、国补立减、以旧换新补贴等多重优惠后，到手价由原价 5168 元降至 3827.94 元新低。该产品具备 6cm 仿生机械足越障能力，吸力达 35000Pa，并搭载 AI 三摄全景识别避障系统，支持小米澎湃智联。

其他具身智能

09:45

IT之家（RSS）

矩阵超智发布 MATRIX-3 旗舰人形机器人：英伟达 AGX 算力、自研直线关节，售价 58 万元起

5月18日，上海企业矩阵超智发布了全能旗舰人形机器人MATRIX-3及工厂、模型等一整套生态。该机器人身高170cm、体重65kg，采用英伟达AGX算力实现端侧AI推理，搭载峰值推力5000N的自研直线关节，具备半吨级负载能力。其配套的MFH超智工厂一期规划年产能达1万台。MATRIX-3标准版售价58万元起，PRO版售价68万元，均已开启预订。

产品更新具身智能

08:45

IT之家（RSS）

全国首个：智元 WITA（硅光动语）大模型完成备案

智元WITA（硅光动语）大模型近日完成备案，成为全国首个合规的具身智能交互大模型。该模型主要用于人形机器人交互，能实现自然拟人的情感交互，部署于导览、零售等场景。智元计划于今年三季度推出行业首个机器人原生端到端全模态交互大模型WITA Omni 1.0，将交互时延压缩至500ms以内，支持连续交流与打断纠正。公司还发布了“358宏图计划”，目标在2027年实现超100亿元营收，2030年达1000亿元。

具身智能政策/监管

08:00

HuggingFace Daily Papers（社区热门论文）

反思Muon在预训练之外：VLA和RLVR中的谱失效与高通补救

该研究指出，Muon优化器通过Newton-Schulz迭代进行统一谱白化，虽在LLM预训练中有效，但在两个新场景存在根本局限：在跨模态视觉-语言-动作训练中，低秩动作梯度会放大噪声尾部方向；在带可验证奖励的强化学习中，低信噪比梯度使得白化过程不稳定。为此，研究提出Pion作为替代方案，采用两阶段提升-抑制机制，形成高通谱效应，将主导奇异值锚定于1而抑制噪声分量，并支持按注意力头独立更新。实验表明，在LIBERO的VLA任务中，Pion在1500步训练后达到100%成功率，优于Muon的97.0%和AdamW的32.2%。在基于通义千问（Qwen3）的RLVR后训练中，Pion在MATH和GSM8K上优于AdamW，而Muon在此场景下会崩溃。

具身智能数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

极简视觉惯性里程计方案

传统视觉惯性里程计依赖高像素相机，资源消耗大。本研究提出了一种极简方案，仅需四个向下感知的光电二极管（通过光学Gabor掩膜提取速度信息）与一个IMU，即可为差速驱动机器人提供鲁棒的平面运动估计。通过物理仿真器联合优化掩膜参数与时序卷积网络，该模型能从四个光电二极管的测量中解算速度，并结合IMU的角速度输出连续轨迹。原型传感器在多样化的室内外地形验证中，无需真实场景微调即可紧密跟踪参考真值，证明了极简传感方案能够实现高效、精准的平面里程计。

具身智能端侧论文/研究

00:52

Hugging Face：Blog（RSS）

精选67

NVIDIA Cosmos Predict 2.5 微调：使用 LoRA/DoRA 生成机器人视频

NVIDIA Cosmos Predict 2.5 是一个 2B 参数的世界模型，可根据文本、图像或视频片段生成物理合理的视频。通过 LoRA 或 DoRA 在 DiT 的注意力层（to_q, to_k, to_v, to_out.0）和前馈层注入可训练适配器，冻结全部基座权重，在单个 80GB GPU 上即可完成参数高效微调，避免了全量微调的高成本与灾难性遗忘。该流程使用 diffusers 和 accelerate 库，利用 92 个机器人操作视频训练集与 50 个 (prompt， image) 测试对进行微调，并展示如何用微调模型生成合成机器人轨迹以支持下游机器人学习任务。支持单 GPU 与多 GPU 训练，切换不同领域适配器无需重训。

具身智能教程/实践数据/训练视频

推荐理由：这篇教程把微调Cosmos Predict 2.5的方法从头到尾讲清楚了，做机器人合成数据的同行可以直接抄作业，LoRA/DoRA切换也很方便，值得收藏。

5月18日

23:45

IT之家（RSS）

何小鹏：小鹏 Robotaxi 将在广州开启示范运营

小鹏汽车首台前装量产的Robotaxi于广州工厂下线，计划未来数月内在广州启动示范运营。该车型基于旗舰平台GX打造，搭载4颗自研图灵AI芯片，算力达3000TOPS，为全球车端最高，并配备第二代VLA大模型以实现L4级自动驾驶。今年1月，小鹏已获广州智能网联汽车道路测试许可；3月成立Robotaxi业务部。车内提供隐私玻璃、重力座椅及后排娱乐屏等智能座舱体验。

产品更新具身智能数据/训练

21:45

AYi@AYi_AInotes

Damn，波士顿机器人这么牛逼了，家政、搬运工不得失业一大批😭

具身智能现象/趋势

21:41

Rohan Paul@rohanpaul_ai

Boston Dynamics展示了Atlas机器人使用强化学习搬运超100磅小冰箱，通过全身感知协调处理重量、抓握与平衡。这体现了人形机器人处理重体力任务的核心逻辑：不依赖视觉识别，而是通过接触适应、本体感知反馈、针对特定领域的随机化训练，以及专为力量与可维护性设计的硬件来完成复杂协作。引用的背景信息进一步说明，Atlas已能精准可靠地协调全身关节，管理重型物体的复杂接触点。

Boston Dynamics: Everyone asks if Atlas can bring them a drink, but this robot can bring you the whole fridge. Using AI-driven behaviors,...

具身智能行业动态

18:45

IT之家（RSS）

【IT之家评测室】大疆扫地机器人 ROMO 2 体验：8.5cm 越障 +36000Pa 吸力，再把无人机技术"降维"到地面

大疆推出第二代扫地机器人ROMO 2系列，包含P2透明旗舰版、A2进阶版及S V2标准版，售价区间4299元至6499元。该系列在核心性能上全面升级，吸力从初代的25000Pa大幅提升至36000Pa，涨幅达44%，并搭载123°超大外摆机械臂。产品设计在延续透明基站风格的基础上，将机身调整为半透明纯白，更贴近家居环境。此外，水箱版机型支持后续单独购买套件升级自动上下水功能。

具身智能评测/基准

17:45

AYi@AYi_AInotes

我的天，连快递分拣员都要失业了吗？人类迟早完蛋🤣

Figure: We're live Man vs. Machine https://x.com/i/broadcasts/1aJbdbgeAaQKX

具身智能行业动态

16:49

DogeDesigner@cb_doge

Elon Musk谈智能出行与未来科技愿景

在智能出行峰会上，Elon Musk展望了由AI和机器人驱动的未来。他透露，特斯拉完全自动驾驶系统（FSD）及无人驾驶出租车业务预计将于2026年底前在美国和以色列推出。他构想人形机器人将远超人类数量，创造巨大物质丰富，甚至可能实现“普遍高收入”。Musk强调，星舰的快速可复用性是实现火星殖民的关键，而Neuralink等脑机接口技术旨在恢复残障人士的功能。整体上，他平衡了乐观与风险意识，认为自主技术、机器人、太空探索与脑机接口共同致力于提升文明未来的概率。

具身智能大佬观点

16:45

IT之家（RSS）

马斯克：十年后九成行驶里程将由自动驾驶完成

具身智能大佬观点

16:19

DogeDesigner@cb_doge

马斯克称Tesla FSD技术将远超人类驾驶安全性

马斯克阐述Tesla全自动驾驶（FSD）软件完全基于AI与摄像头，不使用雷达或激光雷达，通过数字神经网络模仿人类以视觉为主驾驶车辆的方式。他预期该技术最终将至少比人类驾驶安全一个数量级，并形容车辆表现得仿佛具有知觉。目前FSD已在德州三个城市实现无安全员运营，预计将在美国广泛普及。

具身智能行业动态

16:19

DogeDesigner@cb_doge

埃隆·马斯克："我的预测是，世界上智能机器人的数量将远超人类，我认为这很可能是一件好事。我们总是希望对机器人安全保持一点警惕，或者至少不能掉以轻心，但我认为这将开启一个不是全民基本收入，而是全民高收入的时代。"

具身智能大佬观点

09:45

IT之家（RSS）

法拉第未来完成 7000 万美元机构投资者募资，贾跃亭计划两年内实现过去 12 年没有完成的梦想

法拉第未来近期完成了7000万美元机构投资者募资，并启动五大体系变革。公司宣布升级为物理AI生态公司，专注于EAI人形机器人与EAI汽车机器人两大产品引擎。贾跃亭设定了使公司市值重回2021年水平、在2027年第四季度实现经营性现金流为正等目标，并承诺在两年内实现过去十二年未完成的梦想。此次融资缓解了公司近端资金压力，使其融资决策得以从流动性驱动转向更注重长期股东价值的资本结构驱动。

具身智能行业动态

09:23

meng shao@shao__meng

Figure AI 这个 PR 视频，槽点太多，感觉甚至不如去跑马拉松 😂

Brett Adcock: We got bored. Time for Man vs. Machine https://x.com/i/broadcasts/1qGvvkQMgNgGB

具身智能大佬观点

09:02

小互@xiaohu

Figure 直播机器人 VS 人类挑战快递分拣任务目前人类稍稍领先…😌

Figure: We're live Man vs. Machine https://x.com/i/broadcasts/1aJbdbgeAaQKX

具身智能行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

ESI-Bench：迈向闭合感知-行动循环的具身空间智能

研究提出了ESI-Bench基准，用于评估具身空间智能。该基准基于OmniGibson平台，涵盖10个任务类别，要求智能体主动决策以调动感知、移动和操作能力，在交互中收集证据。实验表明，主动探索显著优于被动观察，但随机多视角采集常引入噪声。研究发现，模型失败主因是“动作盲目”，即不佳的动作选择导致观测质量低下并引发连锁错误。尽管显式3D表征对深度推理有稳定作用，但不完美的3D表示会扭曲空间关系，效果反而差于2D基线。人类研究进一步揭示，与人类基于证据修正信念不同，模型倾向于过早做出高置信度决策，暴露了仅靠改进感知或交互无法弥合的元认知差距。

arXiv 具身智能多模态论文/研究

07:54

Berryxia.AI@berryxia

Yann LeCun预测12-18个月内将出现分层世界模型通用训练方法

Meta AI首席科学家Yann LeCun预测，未来12到18个月内将出现训练分层世界模型的通用方法。这些模型将从视频和真实世界数据中学习，具备理解物理因果和规划行动的能力，可应用于机器人、医疗等多个领域解决实际问题。最终目标是将其扩展为通用的世界模型。这标志着AI研究重点可能从当前以LLM为代表的“会聊天”模型，转向能够理解并作用于物理世界的“会做事”模型。

Haider.: Yann LeCun says that within a year to 18 months, we'll have a general method for training hierarchical world models Thes...

Meta 具身智能大佬观点

04:35

Chubby♨️@kimmonismus

值得庆幸的是，人们很快就不再需要从事这项工作。

Figure: We're live Man vs. Machine https://x.com/i/broadcasts/1aJbdbgeAaQKX

具身智能现象/趋势

5月17日

21:44

IT之家（RSS）

特斯拉推送 FSD V14.3.3：智能召唤最高时速提升至 13 公里 / 小时

特斯拉已向美国和加拿大用户推送FSD V14.3.3（监督版）软件更新。本次更新的重点之一是优化智能召唤功能，其最高行驶速度从6英里/小时提升至8英里/小时（约13公里/小时），提升了在停车场等密集场景的实用性。在核心系统层面，引入了强化学习模块优化决策，并升级视觉编码器以增强空间感知和复杂路况识别能力。此外，系统反应速度提升20%，减少了无故偏道、近距离跟车等行为，并加强了对异形障碍物的识别。

产品更新具身智能

21:32

The Decoder：AI News（RSS）

World Action Models 让机器人在行动前能够模拟后果

World Action Models 旨在解决当前机器人AI的一个根本弱点：传统模型仅学习动作与摄像头图像的匹配，而无法理解动作如何导致世界状态变化。一项新研究梳理了约百篇论文，归纳出两种架构路径。其关键优势在于，这些模型能从不含机器人动作标签的日常视频中学习，而此类数据对传统机器人AI几乎无用。这使机器人具备了在行动前模拟后果的能力。

具身智能多模态论文/研究

19:44

IT之家（RSS）

荣耀官宣萨维为全球首席跑步官

荣耀宣布肯尼亚长跑名将萨巴斯蒂安·萨维出任“荣耀全球首席跑步官”。同日，其自研机器人“闪电”走进南京大学参与活动，萨维通过视频向其隔空致敬。他惊叹于中国机器人技术的发展速度，指出人类将全马推进至2小时内用了118年，而立项仅7个月的“闪电”已刷新人类半马纪录。该机器人此前在北京亦庄人形机器人半程马拉松赛中以50分26秒夺冠，并带领荣耀机器人包揽赛事前六名，首次打破人类半马世界纪录。萨维期待未来能与“闪电”同场竞技。

具身智能行业动态

15:40

Rohan Paul@rohanpaul_ai

一见钟情。😍 字面意义上的。在费城，一个正在过马路的送货机器人被卡车擦撞。随后其LED面板上立即出现了爱心眼睛图案。机器人调整状态后继续执行路线。

其他具身智能

12:44

IT之家（RSS）

抢占全球科技竞争战略制高点：国家具身智能应用中试基地揭牌，摩尔线程将提供一站式国产算力方案

国家人工智能应用中试基地（具身智能）在杭州揭牌，旨在抢占全球科技竞争战略制高点。该基地聚焦技术发展、成果转化和生态构建，致力于打造自主可控、安全可靠的具身智能基础设施与产业生态。摩尔线程作为共建合伙人及产业委员会委员，将提供一站式国产算力方案，并已与基地成立“具身智能算力与仿真联合实验室”，以加速具身智能的规模化落地。具身智能强调智能体通过身体与环境的交互实现自主学习，是人工智能发展的前沿领域。

具身智能行业动态

07:54

Berryxia.AI@berryxia

Figure人形机器人连续自主运行四天，迈向实用化关键一步

Figure公司的F.03人形机器人已进入第四天不间断自主运行测试，在真实仓库环境中24/7连续工作直至出现故障。测试核心在于评估机器人执行抓取、搬运、分拣等任务的长期耐力，并收集故障数据、维护需求及安全恢复机制等信息。这标志着人形机器人从展示单次动作的“能动”阶段，进入了考验持续工作能力的“能干”实用化关键阶段。

Figure: We're now on Day 4 of nonstop autonomous operations with F.03 humanoid robots running 24/7 until failure https://x.com/i...

具身智能行业动态

07:43

IT之家（RSS）

特斯拉解封 17 份 Robotaxi 碰撞报告：首次披露事故细节，多数被追尾、两次远程操作失误

特斯拉向美国监管机构解封了17份Robotaxi碰撞报告，首次披露2025年7月至2026年3月在奥斯汀测试期间的详细事故情况。报告显示，多数事故为特斯拉车辆被后车追尾，共导致13起财产损失和4起轻伤。但报告也揭示出两次因远程操作员失误导致的碰撞，以及FSD系统在转弯、倒车等场景下存在空间感知问题，发生了剐蹭障碍物的情况。此前特斯拉以商业机密为由涂黑报告，此次全面公开让外界得以审视其自动驾驶测试的真实安全表现。

具身智能安全/对齐行业动态

5月16日

23:54

Berryxia.AI@berryxia

具身智能新前沿：世界行动模型综述发布

HuggingPapers发布首篇系统性定义“世界行动模型”的综述论文。WAMs被视为具身智能的下一个前沿，其核心是能同时预测未来世界状态并生成真实可执行动作的具身基础模型，超越了仅能推理的语言模型。论文系统梳理了WAMs的架构设计、数据生态系统和评估协议，并提供了发展时间线图，对从事机器人、具身Agent、物理世界AI及世界模型的研究者具有重要参考价值。

DailyPapers: World Action Models: The Next Frontier in Embodied AI The first systematic survey defining WAMs as embodied foundation m...

Hugging Face 具身智能论文/研究

22:43

IT之家（RSS）

精选70

杭州基地启用，机器人有了国家级职业技能训练场

国家人工智能应用中试基地（具身智能）5月16日在浙江杭州挂牌启用，为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台，旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规，支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家，2025年具身智能产业集群产值达1068亿元。

具身智能行业动态部署/工程

推荐理由：杭州这个国家级具身智能训练场不是「又一个基地」，它是把散点技术拢成产业链标准化的关键一步，做机器人的可以盯着政策红利和开放场景了。

21:38

Rohan Paul@rohanpaul_ai

🇨🇳 中国正在扩大农业机器人的规模。 24/7节奏的自主收割成为粮食安全的新基准。视觉模型采摘，机械臂放置，物流同步，人类监管员处理异常。更便宜的水果，更少的损伤，更快乐的供应链。

具身智能行业动态

21:38

Rohan Paul@rohanpaul_ai

Zipline（无人机配送公司）的新一代无人机基础设施如同一个机器人蜂巢

产品更新具身智能

21:08

Rohan Paul@rohanpaul_ai

机器人在医疗领域的一个很好的应用案例。 Aletta是一个全自动抽血的机器人。患者坐下；机器人用超声波寻找静脉，帮助固定手臂位置，采集样本，并贴上绷带--全自动完成。

具身智能行业动态

20:38

Rohan Paul@rohanpaul_ai

机器人技术的创新应用。外骨骼高速移动专业钢琴家的手指，推动他们执行比正常能力更快的击键动作，使大脑适应更高的"速度设定"，从而突破表演瓶颈。

其他具身智能视频

17:08

Rohan Paul@rohanpaul_ai

这是Melody，专为AI陪伴设计的人形机器人。专门针对社交与情感交流进行调校。能保持眼神接触、回忆上下文并处理对话。通过面部驱动器与皮肤材料，使表情反馈灵敏且类人。 https://x.com/XNews24_7/status/1951822670561202542/video/1

产品更新具身智能多模态

15:42

IT之家（RSS）

地平线创始人余凯重申自动驾驶时间表：2028 年脱手开、2030 年闭眼开、2035 年睡觉开

地平线创始人兼CEO余凯在轩辕汽车蓝皮书论坛上重申自动驾驶发展时间表：到2028年实现100%“脱手开”，驾驶员无需手握方向盘；2030年达到L4级“闭眼开”，特定场景下车辆完全自主；2035年实现L5级完全自动驾驶，车辆转变为“移动智能空间”。地平线已与全球超40家车企合作，其征程6系列芯片出货超百万片，HSD高阶智驾系统计划在2028年将城区平均接管里程提升至上万公里。

具身智能大佬观点行业动态

15:38

Rohan Paul@rohanpaul_ai

Fei-Fei Li警告，人工智能可能过度专注于语言模型。世界不仅仅是屏幕上的文字。它是物理的、视觉的、空间的，并且始终在变化。大部分经济活动依赖于看见、移动、互动和具身智能。

具身智能大佬观点现象/趋势

09:54

Berryxia.AI@berryxia

韩国WIRobotics获6800万美元融资，其人形机器人手部技术引关注

韩国WIRobotics公司近日获得6800万美元融资，其ALLEX人形机器人的手部技术表现突出。该仿生手具备0.3mm指尖重复精度、15自由度、100gf以下的力觉感知及高度反向驱动能力，能执行从抓取微小电路元件到举起30kg哑铃的多样化任务。这一优势得益于公司从WIM可穿戴机器人积累的海量真实人类运动数据，显著提升了手部灵巧度与力控水平。公司计划今年推出移动版ALLEX研究平台，并目标在2027年底实现初步商业化。手部被视为人形机器人的核心难点，WIRobotics在此领域取得了关键突破。

AG: Korean WIRobotics just raised ~$68M. Known for its WIM wearable robots and ALLEX humanoid platform, the company plans to...

具身智能行业动态

08:54

Berryxia.AI@berryxia

精选77

智能体驱动系统Articraft实现3D资产生成自动化，开源万件数据集降低门槛

剑桥大学团队推出Articraft，这是一个由智能体驱动的编码系统，能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化，将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集，包含超1万个物体，覆盖250个类别，所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛，为解决“数据饥渴”问题提供了高效的自动化方案。

Elliott / Shangzhe Wu: Check out Ariticraft 🦾 - a highly efficient agentic system that generates articulated 3D assets fully automatically at ...

智能体具身智能开源生态论文/研究

推荐理由：这个开源直接把物理AI训练的资产瓶颈打掉了一大半，agent全自动生成带关节的可交互3D，做仿真和机器人的可以立刻拉代码试试，诚意很足。