全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态一手 · 55 条

全部一手资讯 X 论文

标签「具身智能」清除

3月11日周三

11:15公众号：MiniMax（稀宇科技）56来MaxClaw开源，人人参与OpenClaw生态共建

3月9日周一

08:00Hugging Face：Blog（RSS）71精选LeRobot v0.5.0：扩展每一个维度

3月5日周四

22:16Hugging Face：Blog（RSS）73精选将机器人AI引入嵌入式平台：数据集记录、VLA微调与设备端优化

2月6日周五

18:00公众号：生数科技（Vidu·视频）48生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

1月6日周二

06:56Hugging Face：Blog（RSS）80精选NVIDIA发布Cosmos Reason 2模型，增强物理AI推理能力

1月5日周一

08:00Hugging Face：Blog（RSS）38NVIDIA 借助 DGX Spark 与 Reachy Mini 将智能体带入现实

00:00Runway：News（网页）Runway基于NVIDIA Rubin平台加速视频生成与世界模型

12月2日周二

00:00字节 Seed：Research Papers（网页内嵌数据）GR-RL：实现灵巧精准的长程机器人操作

00:00字节 Seed：Research Feed（网页内嵌数据）GR-RL 发布：突破 VLA 精细操作瓶颈，首次实现真机强化学习穿鞋带

11月14日周五

05:37Hugging Face：Blog（RSS）58参与 AMD Open Robotics 黑客松

10月22日周三

00:00字节 Seed：Research Papers（网页内嵌数据）Seed3D 1.0：从图像生成高保真、可直接仿真的 3D 资产

7月1日周二

17:00BAIR：Berkeley AI Research Blog基于全身条件的第一人称视角视频预测

6月24日周二

22:00Google DeepMind：Blog（RSS）精选Gemini Robotics On-Device 将 AI 引入本地机器人设备

3月25日周二

17:00BAIR：Berkeley AI Research Blog规模化强化学习实现交通平滑：100辆AV的高速公路部署

7月8日周六

08:00EleutherAI：BlogMinetester：基于 Minetest 构建的完全开放 RL 环境

没有更多了

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

3月11日

11:15

公众号：MiniMax（稀宇科技）

56

来MaxClaw开源，人人参与OpenClaw生态共建

MaxClaw 在 Skill 生成器中预置了基于对话生成并发布技能的流程，用户仅需描述想法即可自动梳理、调优、打包并上传至 OpenClaw 开源社区。MaxClaw 已最新内嵌企业微信和微博官方接口，通过简单对话即可完成接入。目前 MaxClaw 已支持飞书、钉钉、企业微信、WhatsApp、Telegram 等主流 IM 工具。MiniMax 将在 3 月 12 日至 14 日的 AWE 2026 上展示全模态大模型与数十款 AI 智能硬件生态产品。

产品更新具身智能开源生态

3月9日

08:00

Hugging Face：Blog（RSS）

精选71

LeRobot v0.5.0：扩展每一个维度

Hugging Face 发布了 LeRobot v0.5.0 版本。该版本在数据集、模型、任务和社区四个维度上进行了全面扩展。具体包括：引入了新的现实世界和模拟数据集，推出了支持多任务学习的模型，并扩展了任务范围至移动操作和双臂协调。社区方面，提供了更易用的库、演示应用和教学资源。此次更新的核心目标是降低机器人技术的应用门槛，推动其民主化发展。

Hugging Face 具身智能开源/仓库

推荐理由：开源机器人AI框架大版本更新，降低具身智能研发门槛，值得关注落地进展

3月5日

22:16

Hugging Face：Blog（RSS）

精选73

将机器人AI引入嵌入式平台：数据集记录、VLA微调与设备端优化

NXP在Hugging Face发布技术博客，详细介绍了将视觉语言动作模型应用于嵌入式机器人系统的完整流程。核心工作包括构建真实世界的机器人交互数据集，对VLA模型进行针对性微调，以及实施一系列设备端优化以实现高效部署。该方案旨在解决大型模型在资源受限的嵌入式硬件上运行的挑战，推动机器人AI在边缘端的实际应用。

Hugging Face 具身智能教程/实践端侧

推荐理由：嵌入式AI开发者可掌握从数据集记录到设备端优化的全流程实践。

2月6日

18:00

公众号：生数科技（Vidu·视频）

48

生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

生数科技与清华大学联合开源统一世界模型Motus，该模型在性能上全面超越Pi0.5，提升幅度达40%。

具身智能开源生态模型发布

1月6日

06:56

Hugging Face：Blog（RSS）

精选80

NVIDIA发布Cosmos Reason 2模型，增强物理AI推理能力

NVIDIA在Hugging Face上发布了Cosmos Reason 2模型，旨在提升物理AI系统的推理能力。该模型通过改进的推理架构，使AI能更准确地理解和预测物理世界的动态与交互，核心升级包括对复杂场景的多步推理、不确定性量化及时间序列数据的深度理解。这一进展将推动机器人、自动驾驶等领域的发展，使AI在现实环境中的决策更可靠、更符合物理规律。

具身智能推理模型发布

推荐理由：物理AI推理能力升级，机器人和具身智能落地的关键拼图

1月5日

08:00

Hugging Face：Blog（RSS）

38

NVIDIA 借助 DGX Spark 与 Reachy Mini 将智能体带入现实

NVIDIA 推出 DGX Spark 平台与 Reachy Mini 机器人，旨在通过开源框架降低智能体开发门槛。该组合将大语言模型与物理执行器结合，使 AI 智能体能完成复杂任务。DGX Spark 提供分布式训练基础设施，Reachy Mini 则提供高精度七自由度机械臂硬件，共同推动具身智能发展。

智能体产品更新具身智能

00:00

Runway：News（网页）

Runway基于NVIDIA Rubin平台加速视频生成与世界模型

Runway率先在NVIDIA Rubin平台部署视频生成模型Gen-4.5与世界模型GWM-1。Gen-4.5在一天内从Hopper迁移至Vera Rubin NVL72，展现平台后向兼容性与生产就绪能力。Rubin单GPU提供50 PF推理算力，可加速实时长视频生成。GWM-1作为Runway首个通用世界模型家族，支持物理感知机器人训练、可探索虚拟世界及交互式化身，推动AI从文本理解向物理世界模拟演进。

产品更新具身智能视频

12月2日

00:00

字节 Seed：Research Papers（网页内嵌数据）

GR-RL：实现灵巧精准的长程机器人操作

GR-RL 框架通过多阶段训练将通用 VLA 策略转化为长程灵巧操作专家。针对精细任务中人类演示的次优性，利用离线 RL 的 Q 值过滤有效轨迹，结合形态对称增强与在线 RL 对齐部署行为。在自主系鞋带任务中实现 83.3% 成功率，首次完成需毫米级精度和长程推理的复杂操作。

具身智能推理论文/研究

00:00

字节 Seed：Research Feed（网页内嵌数据）

GR-RL 发布：突破 VLA 精细操作瓶颈，首次实现真机强化学习穿鞋带

字节跳动 Seed 团队发布 GR-RL，采用离线数据筛选结合在线真机微调的强化学习框架，突破 VLA 模型长时程精细操作瓶颈，首次实现机器人连续穿鞋带。相比前作 GR-3，成功率从 45.7% 提升至 83.3%，减少近 70% 失败。方案通过 Critic 价值判别器剔除次优演示数据，并在隐空间探索优化，解决模仿学习的数据次优性与执行错位问题，模型涌现出自纠错与场景调整能力。

具身智能数据/训练论文/研究

11月14日

05:37

Hugging Face：Blog（RSS）

58

参与 AMD Open Robotics 黑客松

AMD联合Hugging Face和Data Monsters举办AMD Open Robotics黑客松，首站将于2025年12月5日至7日在日本东京举行，第二站于12月12日至14日在法国巴黎举行。活动面向18岁以上开发者，需组成最多四人的团队，在三天内完成LeRobot开发环境学习与自主创新项目开发两个任务。比赛将提供SO-101机器人套件、搭载AMD Ryzen™ AI处理器的笔记本电脑以及AMD Developer Cloud上的AMD Instinct™ MI300X GPU。每座城市的前七名团队将获得奖励，冠军奖金为一万美元。评委将依据创意、难度、易用性和实用性对项目进行百分制评分。

Hugging Face 具身智能端侧行业动态

10月22日

00:00

字节 Seed：Research Papers（网页内嵌数据）

Seed3D 1.0：从图像生成高保真、可直接仿真的 3D 资产

Seed3D 1.0 基础模型支持从单张图像直接生成具备准确几何、对齐纹理与真实物理材质的 3D 资产，可直接集成至物理引擎用于机器人操作与仿真训练，无需复杂配置。该系统解决了现有世界仿真器在内容多样性与物理准确性之间的权衡难题，并支持将物体组合为连贯场景，实现可扩展的仿真就绪内容创作。

具身智能多模态论文/研究

7月1日

17:00

BAIR：Berkeley AI Research Blog

基于全身条件的第一人称视角视频预测

PEVA 模型实现基于全身动作的第一人称视频预测。该模型接收历史视频帧和描述 3D 姿态变化的动作指令，生成下一帧画面，支持原子动作合成、反事实场景模拟及长视频生成。针对具身智能体设计，模型处理 48+ 自由度的高维人体控制，解决第一人称视角下身体不可见、感知滞后于动作等挑战，为机器人规划与控制提供世界模型基础。

具身智能视频论文/研究

6月24日

22:00

Google DeepMind：Blog（RSS）

精选

Gemini Robotics On-Device 将 AI 引入本地机器人设备

Gemini Robotics On-Device 推出高效端侧机器人模型，具备通用灵巧操作与快速任务适应能力，支持本地设备直接部署运行。

DeepMind Google 具身智能模型发布

关联讨论 1 条Google DeepMind：Blog（RSS）

推荐理由：DeepMind 发布端侧机器人模型，支持本地部署与快速任务适应

3月25日

17:00

BAIR：Berkeley AI Research Blog

规模化强化学习实现交通平滑：100辆AV的高速公路部署

研究团队在田纳西州纳什维尔附近的I-24高速公路部署了100辆由强化学习（RL）控制的自动驾驶汽车，通过实时抑制"走走停停"交通波来平滑拥堵并降低所有车辆的燃油消耗。实验证明仅需少量采用去中心化架构、基于标准雷达传感器的智能控制AV，即可显著提升道路通行效率并减少碳排放，为缓解高速公路拥堵提供了可扩展的技术方案。

具身智能论文/研究

7月8日

08:00

EleutherAI：Blog

Minetester：基于 Minetest 构建的完全开放 RL 环境

Minetester 是一个基于开源游戏 Minetest 构建的完全开放强化学习（RL）环境。该项目概述了 Minetest 平台的技术架构及早期开发工作，为研究人员提供了一个代码完全开放、可自由修改的 AI 训练与测试平台，填补了现有 Minecraft 类 RL 环境在开放性方面的空白。

具身智能开源/仓库数据/训练

12

下一页 ›