AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 306 条
全部一手资讯X论文
标签「具身智能」清除
Rohan Paul@rohanpaul_ai · 5月16日51

🇨🇳 China is scaling agricultural robots. Autonomous harvest at 24/7 cadence is the new baseline for food security. Vision models pick, arms place, logistics sync, human supervisors handle exceptions. Cheaper fruit, fewer bruises, happier supply chain

译🇨🇳 中国正在扩大农业机器人的规模。 24/7节奏的自主收割成为粮食安全的新基准。 视觉模型采摘,机械臂放置,物流同步,人类监管员处理异常。 更便宜的水果,更少的损伤,更快乐的供应链。

Rohan Paul@rohanpaul_ai · 5月16日43

Next gen drones infrastructure by Zipline (drone delivery company) like a robotic hive

译Zipline(无人机配送公司)的新一代无人机基础设施 如同一个机器人蜂巢

Rohan Paul@rohanpaul_ai · 5月16日53

Great usecase of Robots in healthcare. Aletta is a robot that fully automates blood draws. The patient sits down; the robot uses ultrasound to find a vein, helps position the arm, collects the sample, and applies a bandage—fully automated

译机器人在医疗领域的一个很好的应用案例。 Aletta是一个全自动抽血的机器人。 患者坐下;机器人用超声波寻找静脉,帮助固定手臂位置,采集样本,并贴上绷带——全自动完成。

Rohan Paul@rohanpaul_ai · 5月16日30

Wild usecase of robotics. An exoskeleton moves a expert pianist’s fingers at high speed, nudging them to execute faster keystrokes than they normally can, so the brain gets used to a higher “speed setting” and can break past a performance plateau.

译机器人技术的创新应用。 外骨骼高速移动专业钢琴家的手指,推动他们执行比正常能力更快的击键动作,使大脑适应更高的“速度设定”,从而突破表演瓶颈。

Rohan Paul@rohanpaul_ai · 5月16日46

This is Melody, humanoid for AI companionship. Tuned specifically for social & emotional exchanges. Maintains eye contact, recalls context & handles dialogue. uses facial actuators + skin material to make these expressions feel responsive & human-like. https://x.com/XNews24_7/status/1951822670561202542/video/1

译这是Melody,专为AI陪伴设计的人形机器人。 专门针对社交与情感交流进行调校。能保持眼神接触、回忆上下文并处理对话。 通过面部驱动器与皮肤材料,使表情反馈灵敏且类人。 https://x.com/XNews24_7/status/1951822670561202542/video/1

Rohan Paul@rohanpaul_ai · 5月16日55

Fei-Fei Li warns that AI may be staring too hard at language models. The world is not just text on a screen. It is physical, visual, spatial, and always changing. Most of the economy runs on seeing, moving, interacting, and embodied intelligence.

译Fei-Fei Li警告,人工智能可能过度专注于语言模型。 世界不仅仅是屏幕上的文字。 它是物理的、视觉的、空间的,并且始终在变化。大部分经济活动依赖于看见、移动、互动和具身智能。

Berryxia.AI@berryxia · 5月16日59

韩国WIRobotics刚刚拿到6800万美元融资。 他们的ALLEX人形机器人,手部演示真的牛逼啊!。 0.3mm指尖重复精度、15自由度仿生手、100gf以下力觉感知、高度反向驱动…… 视频里它能像人一样轻柔抓取电路板上的微小元件,也能稳稳抬起30kg哑铃,还能和真人握手时控制力道不伤人。 更狠的是,他们从WIM可穿戴机器人里积累了海量真实人类运动数据,这让ALLEX的手部灵巧度和力控能力直接领先一大截。 今年他们会推出移动版ALLEX研究平台,目标2027年底实现初步商业化。 人形机器人最难的从来不是腿和躯干,而是那双真正能干活的手。 WIRobotics这次把最难的部分先搞定了。期待后续的表现。

译韩国WIRobotics公司近日获得6800万美元融资,其ALLEX人形机器人的手部技术表现突出。该仿生手具备0.3mm指尖重复精度、15自由度、100gf以下的力觉感知及高度反向驱动能力,能执行从抓取微小电路元件到举起30kg哑铃的多样化任务。这一优势得益于公司从WIM可穿戴机器人积累的海量真实人类运动数据,显著提升了手部灵巧度与力控水平。公司计划今年推出移动版ALLEX研究平台,并目标在2027年底实现初步商业化。手部被视为人形机器人的核心难点,WIRobotics在此领域取得了关键突破。

Berryxia.AI@berryxia · 5月16日77

兄弟们,3D资产生成彻底要起飞了。 Cambridge大学助理教授Elliott Wu(前Stanford、Oxford背景)团队刚放出了Articraft——一个真正的agentic coding系统。 它不是简单生成静态3D模型,就可以让AI agent自己写代码、自己执行、自己接收物理验证反馈,不断迭代,最终输出带零件、关节、真实运动的可交互3D资产,直接就能扔进机器人仿真和物理AI场景里用。 以前做一套高质量articulated asset要花几天甚至几周,现在agent全自动跑通,整个过程高效到离谱。 他们顺便还开源了Articraft-10K数据集:超过1万个跨250个类别的articulated 3D物体,全部可交互、仿真就绪,彻底把大规模机器人训练和物理世界AI的资产门槛拉到了新低。 物理AI和机器人仿真的“数据饥渴”问题,被这个agentic pipeline直接干掉了一大半。 项目页面在这里:https://articraft3d.github.io/ 完整代码和数据集也在GitHub开源。 如果你在做机器人、仿真、物理AI或者3D内容生成,这波开源值得立刻去试。 PS: 还未实测,待后续测评!

译剑桥大学团队推出Articraft,这是一个由智能体驱动的编码系统,能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化,将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集,包含超1万个物体,覆盖250个类别,所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛,为解决“数据饥渴”问题提供了高效的自动化方案。

Emad@EMostaque · 5月16日39

The total addressable market for humanoid robotics may well be larger than the TAM for human labour

译人形机器人的总可寻址市场规模很可能超过人类劳动力的总可寻址市场 [引用 @EMostaque]:本周花时间研究了人形机器人的经济影响,其规模远超数字AI

Berryxia.AI@berryxia · 5月15日29

MIT的研究团队最近搞出了一个真正让人眼前一亮的东西:Electrofluidic Fiber Muscles,电流体纤维肌肉。 它可以直接织进普通布料里,像衣服一样穿在身上,却能无声地产生强大力量。 核心技术是那些直径不到2毫米的微型纤维泵,完全靠电驱动流体,不需要任何笨重的外部电机或液压设备。 整个系统轻便、便携、零噪音,彻底把传统人工肌肉又重又吵的痛点干掉了。 我看完演示视频后最大的感受是,可穿戴机器人和智能服装的实用化门槛,被一下子拉低了一大截。 以前科幻里那种“穿上就能增强力量、灵活移动”的衣服,现在距离现实又近了一步。 PS:我刚刚使用了早上的那个多语言视频翻译的项目,可以看上一个推文

译MIT团队开发出名为“电流体纤维肌肉”的新型人工肌肉,适用于机器人与可穿戴设备。其核心是直径小于2毫米的微型纤维泵,通过电力驱动流体产生强大力量,无需外部笨重电机或液压系统。该柔性肌肉可直接编织进普通布料,整个系统轻便、便携且完全静音,解决了传统方案重量大、噪音高的痛点。这一突破显著降低了可穿戴机器人与智能服装的实用化门槛,让增强人体力量与灵活性的“科幻服装”更接近现实。

Rohan Paul@rohanpaul_ai · 5月15日43

New MIT project, artificial muscles made from woven fibers powered a soft robotic arm. Key is tiny embedded pumps that move fluid using electric fields, eliminating noisy compressors. The result: smooth, compliant motion suitable for wearable devices.

译麻省理工新项目:由编织纤维制成的人工肌肉为软体机械臂提供动力。 关键在于通过电场驱动流体的微型嵌入式泵,消除了噪音压缩机。 最终实现适用于可穿戴设备的流畅柔顺运动。

Chubby♨️@kimmonismus · 5月14日40

Regardless of Figure03's impressive performance: Don't people understand what this means? No human worker can compete with a robot that works 24 hours a day and can be easily mass-produced.

译尽管Figure03的表现令人印象深刻: 难道人们不明白这意味着什么吗? 没有人类工作者能竞争得过一个每天工作24小时、且易于大规模生产的机器人。 [引用 @adcock_brett]:这太疯狂了——距离人形机器人连续工作24小时仅差2小时! 截至目前,机器人已分拣超过28,000个包裹 Bob、Frank和Gary都状态良好

Orange AI@oran_ge · 5月14日50

李想 × 老罗播客笔记 AI 与一人公司 李想:AI 是生产力和劳动力的技术。我现在不太相信一人公司。很多一人公司都在更新内容来验证这个概念成立,但验证了一段时间之后发现,他们每天更新的事情就是 OpenClaw 又更新了、又解决了什么 bug。他们实际的生产环境并没有建立起来。建立真实的生产环境太难了。 专业的人,有了 AI 之后进入到另一个高度去了。AI 替代很简单,但是到达那个专业的高度是替代不了的。 增效 vs 降本 还是要提高效率,用 AI 增效,而不是降本。这个行业的规模很大,用大家做更大的事情,做更大的钱。 做 AI 不是冒险,不做才是冒险。 裁员与用 AI 李想:建议企业不要裁员,用 AI 用得好的和之前就好的可能是两种人。 老罗:我们裁了一些。 李想:AI 是放大器。你原来没有那么讨厌的人,他们用 Seedance 做了很丑的视频发你,你就更讨厌他们了。 出海 老罗:至少可以出海吗? 李想:出海一样卷。国内怎么卷,出海还是怎么卷。 战略 选择大于努力,这就是战略嘛。什么出了问题都可以修复,战略出了问题可能就输了。 具身智能 富豪所拥有的生活——保洁、家长、保姆、司机、助理——给每个人。全球领先的具身智能企业。让昂贵的服务普适化。 分拣、拧螺丝,这些本来就自动化了,不需要机器人。但是工厂有 3000 人是上料的,运输和取拿可能是机会。工业、家庭,最早的机器人商业化。 咖啡机器人很搞笑。咖啡机不就能做咖啡吗,为什么要做人形机器人做咖啡呢。人真正做的是上料,人形机器人反而干不了这个。 星际穿越 最喜欢的电影是星际穿越,看了 20 遍。最有意思的一点是两条线同时发展:明线是科学,虫洞、引力、五维空间;暗线是情感。诺兰为了这个改了剧本,把男孩改成了女孩,自杀进入虫洞,为了人类。一个是把技术讲清楚,一个是暗线把人的价值讲清楚。 人的价值 我对人类是乐观的。人的价值是一定存在的。 辛顿宠物理论。 2026年5月14日,早上看播客随手记的,内容由 Cola 整理到 Obsidian。

译李想在与老罗的对话中阐述了对AI的核心看法。他认为AI是生产力工具,能助力专业人士达到新高度,但难以替代其专业深度。他质疑“一人公司”模式,指出建立真实生产环境是巨大挑战。企业应用AI应聚焦“增效”而非“降本”,且AI是放大器,可能放大原有问题。在具身智能领域,商业化机会在于工业上料、家庭服务等非人形场景,而非重复自动化工作。李想最终强调战略选择的重要性,并对人类独特价值保持乐观。

Rohan Paul@rohanpaul_ai · 5月14日40

🇨🇳 Soldiers + robot dog + drones all moving as 1. China is showing what infantry-tech coordination looks like in operations against enemy positions. The rifle-mounted robotic dog advances ahead to engage threats in a simulated urban combat scenario.

译🇨🇳 士兵+机器狗+无人机协同如一 中国正在展示对抗敌方阵地时 步兵与科技协同作战的样貌 步枪搭载的机器狗在模拟城市作战场景中 率先推进并应对威胁

Chubby♨️@kimmonismus · 5月14日77

“If AI takes your white-collar job, just move into blue-collar work.” 🤦‍♂️ Meanwhile, blue-collar work:

译“如果AI抢了你的白领工作,那就转行做蓝领吧。” 🤦‍♂️ 与此同时,蓝领工作: [引用 @adcock_brett]:观看一组人形机器人以人类绩效水平完成完整的8小时轮班。这是完全自主运行的Helix-02 https://x.com/i/broadcasts/1dxYljYVREYJX

Deedy@deedydas · 5月13日58

This is the single best read on World Models and one of the most important reads in AI. $10B has flowed into "world models" in the last 18mos, from Yann LeCun to FeiFei Li. The promise is, like LLMs, world models will provide the data it takes to scale robotics foundation models, and solve robotics. ..but the word has been abused to mean one of many things. This post unpacks: – What 5 traits makes a world model? – How do the different approaches stack up? – What is it used for within and beyond robotics? – Where is the opportunity? – Citations to research, news and blog posts Companies / products in the space include: – BigCo products: Google Genie, Tesla Optimus, Nvidia DreamDojo, DreamZero, Microsoft Muse – Pure world model: AMI Labs, World Labs, Runway, Rhoda, Decart, Spaitial, Odyssey, Embo, Dream Labs, OneWorld – Robot foundation model cos: Skild, Physical Intelligence, Figure, Mind Very likely one of the seminal technologies of the next decade.

译世界模型被视为AI继大语言模型后的关键新范式,过去18个月已获百亿美元投资,其核心承诺是通过规模化数据推动机器人基础模型发展。然而,该术语目前被广泛滥用,含义模糊。本文系统阐述了世界模型的五大特质,对比了不同技术路径,探讨了其在机器人及其他领域的应用与未来机遇。领域参与者包括谷歌Genie、特斯拉Optimus等巨头产品,以及众多专注世界模型或机器人基础模型的初创公司。它很可能成为未来十年的奠基性技术之一。

Chubby♨️@kimmonismus · 5月13日57

Lets go - automated resreacher incoming: Japan’s Institute of Science Tokyo has opened a human-free robotics lab where 10 machines, including the humanoid Maholo LabDroid, run medical experiments such as reagent handling and cell cultivation. The bigger bet is even far more ambitious: scaling to 2,000 research robots by 2040, with AI helping automate everything from hypothesis generation to experimental verification. Source: provided text.

译让我们开始 - 自动化研究者来袭:Japan’s Institute of Science Tokyo 开设了一个无人机器人实验室,其中10台机器,包括人形机器人 Maholo LabDroid,运行医疗实验,如试剂处理和细胞培养。 更大的赌注甚至更加雄心勃勃:到2040年扩展到2,000台研究机器人,AI帮助自动化从假设生成到实验验证的一切。来源:提供文本。

Chubby♨️@kimmonismus · 5月12日50

Seriously, the Robotic Wars have begun. South Korea is now exploring Hyundai robots for military use as its army shrinks with the population. Aging societies are running out of young people, so the next obvious move is becoming clear: If there are not enough soldiers, build them. The robot wars are not starting because sci-fi became cool. They are starting because fertility collapsed.

译韩国因人口减少导致兵源萎缩,正探索将现代集团的机器人用于军事领域。推文指出,机器人战争并非源于科幻热潮,而是由生育率崩溃、社会老龄化导致的必然结果——当没有足够的士兵时,就开始制造他们。文中提及的Unitree机器人虽应用于建筑行业,但其发展动向引发了对其未来潜在军事用途的隐忧。

阿绎 AYi@AYi_AInotes · 5月12日53

Holy shit, history is being made—today marks the first day of the Human Mech Era! Unitree’s launch today literally gave me goosebumps. It feels like sci‑fi crashing into reality. Absolutely mind‑blowing. Gundam‑style mechs are actually here! Today, the world’s first mass‑production‑ready transformable manned mech, the GD01, was officially unveiled, starting at $650k. CEO Wang Xingxing got in and drove it himself, with the whole video shot in real time—no acceleration editing at all. Guys, this isn’t some concept model anymore— it’s a genuinely production‑ready civilian vehicle. Total weight including the pilot: 500 kg. It can freely switch between bipedal and quadrupedal modes. In bipedal mode, it walks and turns normally on city streets. In quadrupedal mode, it climbs stairs and handles slopes. It adapts to all kinds of extreme terrain, and can even kick down a brick wall with one leg. 🤯 The scariest part is their iteration speed. Two years ago, Unitree was selling the Go1 quadruped robot dog for a few thousand bucks. A year ago, they released the G1 humanoid robot. And today, they’ve straight up rolled a manned mech onto the streets, pulling the sci‑fi future everyone thought was a decade away right into 2026. And this thing isn’t just a bigger humanoid robot— it’s Unitree fully merging their quadruped and humanoid tech stacks into a dimensionality‑striking breakthrough. 500 kg dynamic balance control, real‑time human‑machine integrated operation, seamless switching between two forms— every one of these is an industry‑level technological leap. Mechs used to exist only in movies and anime. Now, if you’re willing to spend 3.9 million RMB, you can drive your own Gundam down the street lol 😆 Of course, right now it’s still a toy for the rich and companies, but once this step is taken, I believe the iteration from here will only get faster. @UnitreeRobotics Unitree added a line at the end: “Please be sure to use it in a friendly and safe manner.” I couldn’t help but laugh— that’s probably the gentlest weapon‑grade warning in human history lol. UnitreeRobotics #GD01 #MannedMech

译Unitree正式发布全球首款量产就绪的可变形载人机甲GD01,起售价65万美元。该机甲总重500公斤,可在双足与四足模式间自由切换,适应城市街道、楼梯斜坡等多种地形。此次发布的并非概念模型,而是已具备生产条件的民用载具。Unitree在两年内从消费级四足机器人迭代至载人机甲,展现了惊人的技术演进速度。GD01融合了其四足与人形机器人技术,实现了500公斤动态平衡控制、实时人机协同操作等关键突破。公司最后附注提醒用户以友好、安全的方式使用。

歸藏(guizang.ai)@op7418 · 5月12日44

宇树发布 GD01 载人变形机甲,起售价 390 万人民币,这也太猛了。 刚才刷到评论说,大疆新的无人机能吊 600kg 物品,这个刚好 500kg,组合起来就是环太平洋那个经典镜头了

Chubby♨️@kimmonismus · 5月12日23

https://x.com/UnitreeRobotics/status/2054067819634159622/video/1 At this point on, I'm too afraid to ask what Unitree's plan actually is. They use it in the construction industry, right? Right?

译事到如今,我已不敢追问Unitree真正的计划是什么。 他们是在建筑行业使用它的,对吧? 对吧?

阿绎 AYi@AYi_AInotes · 5月12日61

Damn, history is being made—today is the first day of the age of human mechs! 宇树今天这个发布, 我真的鸡皮疙瘩掉一地, 科幻照进现实的感觉, 真的太震撼了 高达机甲真的来了! 今天,全球首款量产级载人可变形机甲GD01, 正式发布,起售价65万美元, CEO王兴兴亲自坐进去开, 视频全程实时拍摄,没有任何加速, 铁铁们,这可不是什么概念原了啊, 是一款真的生产就绪的民用车辆, 含驾驶员总重500公斤, 能在双足和四足模式之间自由切换, 双足模式在城市街道正常行走转向, 四足模式能爬楼梯过斜坡, 适应各种极端地形, 甚至还能一腿推倒一堵砖墙🤯 最恐怖的是他们的迭代速度, 两年前宇树还在卖几千块的Go1四足机器狗, 一年前发布G1人形机器人, 到了今天直接把载人机甲摆到了大街上, 把所有人以为还要等十年的科幻, 直接拉到了2026年的今天, 而且这玩意不仅仅是一个更大号的人形机器人, 它还是宇树把四足和人形两大技术栈, 彻底融合之后的降维打击, 500公斤的动态平衡控制, 实时人机一体操控, 双形态无缝切换, 每一项都是行业级的技术突破, 以前机甲只存在于电影和动漫里, 现在你只要愿意花390万人民币, 就能开着自己的高达上街溜达了哈哈哈😆 当然现在还是土豪和企业的玩具, 但这一步跨出去, 我相信后面的迭代速度只会越来越快, @UnitreeRobotics 宇树最后特意加了一句, 请大家务必以友好和安全的方式使用, 我看完直接笑出声, 这大概是人类历史上最温柔的武器级警告了哈哈 #宇树机器人 #GD01 #载人机甲

译宇树机器人正式发布全球首款量产级载人可变形机甲GD01,起售价65万美元。该机甲含驾驶员总重约500公斤,可在双足与四足模式间自由切换,适应城市行走与复杂地形。CEO王兴兴亲自演示实时操控,标志其从概念到生产就绪民用车辆的跨越。宇树在短短两年内从四足机器狗迭代至载人机甲,融合了四足与人形机器人技术栈,实现了动态平衡控制与人机一体操控等突破。公司同时呼吁用户以友好安全的方式使用该产品。

SenseTime@SenseTime_AI · 5月11日38

At a panel on Accelerating the #AI-Driven #IndustrialRevolution at the 𝗜𝗚𝗘 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝘁𝗶𝗼𝗻𝗮𝗹 𝗖𝗼𝗻𝗳𝗲𝗿𝗲𝗻𝗰𝗲 in #Korea, Philip Wong, Head of Capital Markets at SenseTime, highlighted how our AI is transforming industrial operations: 📌#ComputerVision Solutions — Quality control and safety monitoring in production 📌𝗞𝗮𝗶𝗿𝗼𝘀𝟯.𝟬 #WorldModel — Generating more diverse, high-quality training data to boost AI generalization and lay the groundwork for humanoid #robotics SenseTime is deepening collaboration with Korean enterprises and the international community to drive this transformation forward — helping businesses move faster, safer, and smarter.

译SenseTime资本市场主管Philip Wong在韩国IGE国际会议上指出,公司AI技术正推动工业变革。核心方案包括计算机视觉,用于生产质量控制和安防监测;以及世界模型Kairos 3.0,能生成多样化高质量训练数据,提升AI泛化能力,为人形机器人等领域奠定基础。SenseTime正深化与韩国企业及国际社会的合作,助力企业实现更快速、安全、智能的运营转型。

Rohan Paul@rohanpaul_ai · 5月10日51

REK robots were spotted on San Francisco streets this week. They moved along the pavement, pausing at intersections and adjusting paths around people. Handlers used controllers for direct teleoperation, collecting data on urban mobility challenges.

译本周旧金山街头出现REK机器人。 它们沿人行道移动,在十字路口暂停并调整路径避让行人。 操作员使用控制器进行直接远程操控,收集城市移动挑战的相关数据。

宝玉@dotey · 5月10日61

http://x.com/i/article/2053350663170449408 # 机器人的终局:英伟达 Jim Fan 宣告 VLA 时代结束,WAM 登场 Jim Fan 是英伟达机器人与 AI 研究组(GEAR Lab)负责人,过去几年主推的 GR00T 人形机器人基础模型用的是 VLA(Vision-Language-Action,视觉 - 语言 - 动作)架构。他刚在 Sequoia AI Ascent 2026 上做了一场 20 分钟的演讲,主题叫《Robotics' End Game》,第一件事就是宣布 VLA 路线过时——包括他自己半年前还在推的 GR00T。 取而代之的新范式叫世界动作模型(WAM),代表作是英伟达 2 月发布的 DreamZero。他把这套思路叫“底层同构”:复制 LLM(Large Language Model,大语言模型)走过的三步(预训练→对齐→强化学习),用视频世界模型替代语言模型,用人类第一人称视频替代遥操作数据,最终在 2040 年前让机器人自己设计和制造下一代自己。他对此有 95% 的把握。 演讲来源:Sequoia Capital AI Ascent 2026,2026 年 4 月 30 日发布。 原视频:https://www.youtube.com/watch?v=3Y8aq_ofEVs ## 要点速览 - VLA 路线落幕:Jim 公开宣告 VLA 路线过时,新范式叫世界动作模型(WAM),代表作是 DreamZero(140 亿参数)。 - 告别遥操作数据:遥操作物理上限低,预测一两年内降到接近 0,被传感化人类数据取代。 - 神经缩放定律:EgoScale 用 21,000 小时人类第一人称视频预训练,团队发现了灵巧操作的神经缩放定律(R² = 0.998)。 - 神经仿真器:Dream Dojo 用 44,000 小时人类视频训练出一个完全绕过物理引擎的神经仿真器。 - 终局倒计时:给出 2040 年完成机器人终局的预测(物理自动研究),置信度 95%。 ## 从 DGX-1 签名到“底层同构” Jim 用一段往事开场。2016 年夏天,就在 OpenAI 当时的办公室,黄仁勋穿着标志性皮夹克,抱着一块大金属托盘走进来,上面写着:“致 Elon 和 OpenAI 团队,致计算和人类的未来。”那是全球第一台 DGX-1。 Jim 当时是 OpenAI 的第一个实习生,赶紧排队去上面签了名。“那时候我完全不知道自己在签什么。”旁边一起签的还有 Andrej Karpathy。这台机器现在在 Computer History Museum 收藏。Jim 补了一句,说自己感觉像恐龙一样老了。 > 注:Jim Fan(范麟熙)是英伟达机器人与 AI 总监、杰出科学家,领导 GEAR Lab 和 GR00T 人形机器人项目。2016 年在 OpenAI 实习时的导师是 Ilya Sutskever 和 Andrej Karpathy,后在 Stanford 跟随 Fei-Fei Li 读完博士。 这个故事是为了引出他的核心框架。他引了 Ilya 那句“你信深度学习,深度学习就信你”,然后说 LLM 只用三次阶跃、六年时间就走到今天:GPT-3 的预训练,InstructGPT 的监督微调,o1 风格的强化学习,再到自动研究。 于是他做出了一个决定:抄作业,换个名字,叫**“底层同构”(the Great Parallel)**。把“模拟字符串的下一个状态”换成“模拟物理世界的下一个状态”,通过动作微调收敛到机器人需要的那部分,最后让强化学习走完最后一公里。 > 打不过就加入。 (“If you can't beat them, join them.”) ## VLA 怎么了:参数都堆在了语言上 过去三年,机器人领域的主流架构是 VLA(Vision-Language-Action,视觉 - 语言 - 动作模型)。英伟达自家的 GR00T 和 Physical Intelligence 的 π0 都属于这个类别。 Jim 指出了结构性问题:其实这些模型该叫 LVA,因为参数大头全堆在语言上了。语言是一等公民,视觉次之,动作只能垫底。 > VLA 擅长编码知识和名词,不擅长物理和动词。重心放在了不对的地方。 他举了 RT-2 原始论文里那个经典 demo:让机器人把可乐罐推到 Taylor Swift 的照片旁边。模型没见过 Taylor Swift,但能泛化过去。问题是,泛化的是名词(能认出 Taylor Swift),而不是动词(该怎么推、找什么角度、用多大力)。 ## 从 AI 垃圾视频到 DreamZero VLA 不是答案,那下一个预训练范式是什么?结果发现是视频模型,它们在内部学会了模拟物理世界的下一个状态。 怎么把这些世界模型变有用?做动作微调。把“所有可能的未来”这种叠加态,收敛到一条对真实机器人有意义的动作轨迹上。 英伟达的答案叫 DreamZero。这是一种新型策略模型,在执行动作之前先往未来“做梦”几秒钟,然后根据梦境行动。DreamZero 同时解码下一帧画面和下一步动作。在这里,视觉和动作第一次真正成为了“一等公民”。 Jim 坦率地承认 DreamZero 目前做不到每个任务都 100% 可靠。“它大概相当于 GPT-2 的阶段,方向对了,但表现还不够稳定可靠。”他给这个新架构起名叫 WAM(World Action Models,世界动作模型)。 > 为我们亲爱的 VLA 默哀片刻。它已完成了历史使命。安息吧。世界动作模型万岁。 > 注:DreamZero 论文(arXiv 2602.15922)2026 年 2 月发布,140 亿参数,基于 Wan2.1 视频扩散模型。它有一个关键限制:14B 模型必须经过 38 倍系统级优化加 GB200 硬件,才能把闭环控制压到 7Hz,部署门槛极高。 ## 数据革命:从遥操作到“机器人不用参与的数据采集” 过去三年是遥操作(teleop)的黄金时代。但遥操作有一个硬上限:每台机器人每天 24 小时。 “我说一天 24 小时,那是骗自己的。实际一天能干 3 小时就不错了,还得看当天的‘机器人之神’赏不赏脸——毕竟这帮机器天天闹脾气出毛病。” 怎么破局?把机器人的末端执行器直接戴在人手上,直接采集数据,完全绕过机器人本体。 英伟达方案是 DexUMI,一种外骨骼装置。用外骨骼数据训练出的机器人策略可以完全自主运行,训练数据里没有任何遥操作数据。 > 机器人很开心,因为它们终于不用参与数据采集了。 ## EgoScale:21,000 小时人类视频和缩放定律 英伟达推出了 EgoScale:99.9% 的训练数据来自人类第一人称视频(egocentric video)。 预训练用了 21,000 小时的野外人类数据,零机器人数据。动作微调阶段仅仅用了 50 小时的高精度动捕手套数据,外加 4 小时遥操作数据——加起来连训练总量的 0.1% 都不到。 最重要的发现是:灵巧操作的神经缩放定律。预训练投入的算力小时数与最优验证损失之间,存在一条极其清晰的对数线性关系,R² 达到了惊人的 0.998。 Jim 把所有数据策略的扩展性放在了一起:遥操作在最不可扩展的角落;第一人称视频如果能转动 FSD(Full Self-Driving,完全自动驾驶)式的数据飞轮,一年内能到 1000 万小时。 ## Dream Dojo:不用物理引擎的神经仿真器 机器人领域也需要花大钱买几百万个编程环境做强化学习(RL),但直接用真机(real-to-sim-to-real)不够。 进一步的方案是 Dream Dojo:不搞物理引擎那一套,直接把视频世界模型变成一个完整的神经仿真器。输入是连续动作信号,实时输出下一帧 RGB 画面和传感器状态。没有物理方程,没有图形引擎,完完全全是数据驱动的。 > 你看到的画面里没有一个像素是真实的。 “现在算力等于环境等于数据。或者用某位智者的话:买得越多,省得越多。这条消息已获得我老板批准。” ## 终局路线图:2040 年前的三个成就 Jim 把机器人的剩余路径类比成了必须解锁的三个科技树成就: 1. 物理图灵测试:2-3 年内,你分不出执行任务的是人还是机器人。 1. 物理 API:用软件和大模型编排机器人配置,建造“暗工厂”和自动化科学实验室。 1. 物理自动研究:机器人开始自己设计、改进并制造出下一代机器人。 至于时间表,他类比 AI 从 AlexNet(2012)到智能体(2026)用了 14 年。再加 14 年,正好是 2040 年。 > 我们这一代人,生得太晚,没赶上大航海时代去探索地球;又生得太早,够不着星辰大海去探索宇宙。但我们生得刚刚好,赶上了攻克机器人难题的时代。 ## 五个问题速答 Q:VLA 真的死了吗? A:演讲层面是死了。但英伟达自家最新的 GR00T N1.7(2026 年 4 月)论文里还明确写“VLA 模型”。范式迁移在内部尚未完成。 Q:DreamZero 现在能用在生产环境吗? A:不能。Jim 自己说它“大概是 GPT-2 阶段”。论文披露 14B 模型跑闭环控制只有 7Hz,且必须用 GB200。 Q:遥操作真的会被淘汰吗? A:Jim 预测一两年内降到接近 0。但戴设备做家务不像开车是刚需,且行业大量已有的遥操作基础设施不会一夜间报废。 Q:灵巧操作的缩放定律意味着什么? A:如果 R² = 0.998 持续成立,意味着增加人类视频数据,机器人灵巧性就会可预测地提升。这是整场演讲中最核心的实证论据。 Q:英伟达在这盘棋里赚什么? A:WAM 和神经仿真器对算力需求极高。Jim 的那句“buy more, save more”直接反映了范式切换天然有助于卖芯片的商业意图。 ## 最后:值得追踪的三个悬念 三件事最值得追踪: 1. DreamZero 如何跨越“GPT-2 阶段”:未来 12-18 个月能不能把极限参数做稳,决定了这套范式的真实威力。 1. 英伟达内部对 VLA 范式的切换时刻:观察其产品更新中架构实质演进。如果下一代还是 VLA,则演讲更偏向概念营销。 1. 第一人称视频数据的飞轮载体:英伟达自身没有消费级硬件入口,需观望谁(如苹果、Meta)能真正转动这块千万小时量级的数据。

译英伟达GEAR Lab负责人Jim Fan宣布,以GR00T为代表的VLA架构已过时,新范式是世界动作模型。其核心是“底层同构”,复制LLM成功路径:用视频世界模型替代语言模型,用人类第一人称视频数据替代遥操作数据进行预训练,再通过动作微调和强化学习收敛。他预测遥操作数据将迅速被淘汰,并展示了完全数据驱动的神经仿真器Dream Dojo。Jim Fan给出了机器人发展的终局路线图,预测在2040年前实现“物理自动研究”的置信度高达95%。

Rohan Paul@rohanpaul_ai · 5月9日39

Watch the robotic arm catch Skydio’s F10 drone mid-flight. The arm extends, matches the drone’s path, and locks onto its docking interface for a clean recovery. No pilot input needed for either phase, opening up rapid deployment from moving bases.

译观看机械臂在半空中捕获Skydio的F10无人机。机械臂伸出,匹配无人机飞行轨迹,锁定其对接接口完成利落回收。 两个阶段均无需飞行员操作,为移动基地的快速部署开辟可能。

Chubby♨️@kimmonismus · 5月9日49

First Native Color Lidar Sensor by Ouster (REV8), where color and 3D data are fused in silicon and not in software. Traditional lidar sensors capture 3D point clouds of the environment (distance/depth data) but only in monochrome, no color information. To get color, you’d typically need to fuse lidar data with a separate RGB camera in software, which introduces latency, alignment errors, and added complexity. Ouster’s REV8 does something different: it captures both color and 3D depth data on the same silicon chip, meaning every single point in the 3D scan natively carries color information without needing a separate camera or post-processing software fusion. The color and depth are inherently aligned at the hardware level.

译Ouster推出首款原生彩色激光雷达传感器REV8,其核心创新在于将色彩与3D数据在芯片层面进行硬件融合。传统激光雷达仅能捕获单色点云,需额外通过软件融合RGB相机数据来获取色彩,这会导致延迟、对齐误差和系统复杂性问题。REV8则在同一硅芯片上直接捕获色彩和3D深度数据,使得扫描中的每个点都原生携带色彩信息,无需依赖独立相机或后处理软件融合,实现了硬件级别的色彩与深度对齐。

Ethan Mollick@emollick · 5月9日46

As much as the state of benchmarks in AI is flawed, it is so much easier to track AI progress than robotics. Not sure what you can make of all the videos of robots running races or doing laundry - are there any equivalents to independent AI benchmarks for robots? ARC-AGI-BOT?

译AI基准测试虽有缺陷,但进展追踪相对容易;机器人学则缺乏明确的衡量标准,演示视频如赛跑或洗衣无法有效评估进展,需要建立类似AI的独立基准测试如ARC-AGI-BOT。引用推文指出,尽管对机器人技术充满期待,但使其在经济上大规模实用的关键飞跃时间表仍不确定,可能在1年、3年、5年或10年内实现。

小互@xiaohu · 5月9日58

两台Figure 03机器人 打扫房间和整理床铺 动作还挺流畅 感觉真能干家务了,咋办?

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月9日50

No, blue collar jobs are not safe either

译不,蓝领工作也不安全 [引用 @Figure_robot]:We taught two F.03 robots to clean a room and make a bed in under 2 minutes - fully autonomous.

Jim Fan@DrJimFan · 5月8日79

I promise this will be the best 20 min you spend today! Robotics: Endgame, the sequel to my last year's Sequoia AI Ascent talk, "Physical Turing Test". I laid out the roadmap for solving Physical AGI as a simple parallel to the LLM success story. Be a good scientist, copy homework ;) And stay till the end, more easter eggs and predictions for your polymarket! 00:30 DGX-1 origin story at OpenAI, I was there in 2016 signing with Jensen and Elon. Heading to the Computer History Museum! 01:42 The Great Parallel 03:31 Robotics, the Endgame 03:39 Why VLAs fall short 04:32 Video world models as the 2nd pretraining paradigm 06:09 World Action Models (WAM) 07:46 Strategies for robot data collection and the FSD equivalent to physical data flywheel for robot manipulation 11:06 EgoScale and the Dexterity Scaling Law we discovered recently 14:00 Physical RL: bridging the last mile 15:39 DreamDojo: an end-to-end neural physics engine for scaling RL in silico 17:00 Civilizational Technology Tree and my predictions for the near future. Spoiler: it's closer than you think. Thanks to my friends at Sequoia for inviting me back to AI Ascent this year! I had a blast! Last year's talk is attached in the thread if you missed it.

译演讲者以“Robotics: Endgame”为题,提出解决物理AGI的路线图,直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型(WAM)、机器人数据收集策略(类似FSD的物理数据飞轮)、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile,以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近,并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。

Huawei Cloud@HuaweiCloud1 · 5月8日22

Ready to take on the challenge? ☁️ At Huawei Cloud INSPIRE 2026 (June 5–6, Shanghai), you can: 🦞 Build OfficeClaw: Your AI work assistant 💻 Try CodeLab: Level up your AI coding skills 🤖 Deploy embodied AI: Make robots follow your instructions Show your work live! Learn more: https://tinyurl.com/44d93k72 #HuaweiCloud #INSPIRE2026 #Dev

译准备好迎接挑战了吗?☁️ 在华为云INSPIRE 2026(6月5-6日,上海),您可以: 🦞 构建OfficeClaw:您的AI工作助手 💻 体验CodeLab:提升AI编程技能 🤖 部署具身AI:让机器人听从指令 现场展示您的成果! 了解更多:https://tinyurl.com/44d93k72 #HuaweiCloud #INSPIRE2026 #Dev

AK@_akhaliq · 5月7日67

PhysForge Generating Physics-Grounded 3D Assets for Interactive Virtual World paper: https://huggingface.co/papers/2605.05163

译PhysForge 生成物理基础的3D资产用于交互式虚拟世界 论文:https://huggingface.co/papers/2605.05163

Huawei Cloud@HuaweiCloud1 · 5月7日48

AI turns into a playground at Huawei Cloud #INSPIRE2026 (June 5–6, Shanghai). 30+ interactive events waiting for you: 🎤 AI talks: straight takes, sharp punchlines 🕹️ Motion‑sensing games: move your body, move the future ☕ Trendy coffee bar: sip, chat, and recharge 🤖 Embodied AI competition: create robots you can watch and play with 🎁 Stamp hunt: collect stamps, win awesome prizes Walk, play, and explore — you’ll leave with a deeper feel for AI (and maybe a gift bag too). Learn more: https://tinyurl.com/537nvbxm #HuaweiCloud

译华为云将于6月5日至6日在上海举办INSPIRE2026活动,旨在打造一个沉浸式的AI体验场。活动包含30多项互动环节,核心是通过游戏化方式让参与者亲身感受AI技术。主要亮点包括探讨AI前沿观点的主题对谈、结合体感技术的互动游戏、可观看与交互的具身智能机器人竞赛,以及集章赢奖等趣味活动。主办方强调,参与者将通过行走、游玩和探索,获得对AI更深的理解,并有机会获得礼品。

Rohan Paul@rohanpaul_ai · 5月7日38

South Korea unveiled Gabi, its first robot monk, at Seoul’s Jogye Temple: a 130 cm Unitree G1 in robes, ordained with a dharma name, prayer beads, robot-safe ritual, and custom Five Precepts. It also went through a robot-safe "burning arm" ritual.

译韩国在首尔曹溪寺揭晓了首位机器人僧侣Gabi:这是一台130厘米高的Unitree G1机器人,身披僧袍,受戒获法名,配有念珠,经历了机器人安全的仪式,并定制了五戒。 它还通过了机器人安全的"燃臂"仪式。

小互@xiaohu · 5月6日49

波士顿动力的 Atlas 最新展示 这动作有点牛P 平衡性、灵活性和柔韧度达到了前所未有的高度 不得不感叹这种设计确实是很超前,超越了所有的传统人形机器人...

Rohan Paul@rohanpaul_ai · 5月6日58

MIT just built an AI that can control your body. It can move your fingers, make you play piano, even if you don’t know the song! AI decides the hand movement. Wrist pads send signals to your muscles, so your fingers move even if you don’t know how

译MIT 刚刚开发出一种能控制你身体的 AI。 它能移动你的手指,让你弹钢琴,即使你不会那首曲子! AI 决定手的动作。腕部垫片向你的肌肉发送信号,因此即使你不会,手指也能动起来

Rohan Paul@rohanpaul_ai · 5月6日59

Just amazing. Boston Dynamics released a video of the new production version electric Atlas spinning its body while balancing on its arms. Note, that little jutter of the hand to keep balance.

译太惊人了。 Boston Dynamics 发布了新版量产电动 Atlas 的视频,展示其用手臂支撑平衡时旋转身体的动作。 注意,那是手部为保持平衡的小抖动。

Rohan Paul@rohanpaul_ai · 5月3日54

Freshly assembled Figure's F.03 humanoid can now walk autonomously from the manufacturing line straight to headquarters. Navigates stairs using only its onboard camera feeds—no LiDAR, no pre-mapped floors. The full locomotion policy was trained end-to-end with reinforcement learning entirely in simulation, then transferred zero-shot to the physical robot. Watch its depth perception in action as it handles stair navigation. The colorful reconstruction is how neural networks infer geometry from cameras, though some jitter in scale and artifacts around windows are visible.

译Figure公司最新组装的F.03人形机器人已能实现自主行走,从生产线直接步行至总部。其核心突破在于仅依靠机载摄像头感知,无需LiDAR或预先地图,即可完成上下楼梯等复杂导航。完整的运动策略完全通过仿真环境中的端到端强化学习训练而成,并零样本迁移至实体机器人。演示中可见其通过神经网络从摄像头数据推断几何环境的深度感知能力,尽管在尺度稳定性和窗户等区域仍存在轻微抖动与伪影。

Rohan Paul@rohanpaul_ai · 5月3日33

From taking out the trash to sweeping the floor, Kawasaki’s Kaleido is showing it can manage ordinary daily tasks. This robots are specifically designed for rescue missions, however its actions feel surprisingly familiar to home life.

译从倒垃圾到扫地,川崎的Kaleido正在展示它能够处理普通的日常任务。 这些机器人专为救援任务设计,然而它的动作却让人感到与家庭生活出奇地相似。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月16日
21:38
Rohan Paul@rohanpaul_ai
51
🇨🇳 中国正在扩大农业机器人的规模。 24/7节奏的自主收割成为粮食安全的新基准。 视觉模型采摘,机械臂放置,物流同步,人类监管员处理异常。 更便宜的水果,更少的损伤,更快乐的供应链。
具身智能行业动态
21:38
Rohan Paul@rohanpaul_ai
43
Zipline(无人机配送公司)的新一代无人机基础设施 如同一个机器人蜂巢
产品更新具身智能
21:08
Rohan Paul@rohanpaul_ai
53
机器人在医疗领域的一个很好的应用案例。 Aletta是一个全自动抽血的机器人。 患者坐下;机器人用超声波寻找静脉,帮助固定手臂位置,采集样本,并贴上绷带--全自动完成。
具身智能行业动态
20:38
Rohan Paul@rohanpaul_ai
30
机器人技术的创新应用。 外骨骼高速移动专业钢琴家的手指,推动他们执行比正常能力更快的击键动作,使大脑适应更高的"速度设定",从而突破表演瓶颈。
其他具身智能视频
17:08
Rohan Paul@rohanpaul_ai
46
这是Melody,专为AI陪伴设计的人形机器人。 专门针对社交与情感交流进行调校。能保持眼神接触、回忆上下文并处理对话。 通过面部驱动器与皮肤材料,使表情反馈灵敏且类人。 https://x.com/XNews24_7/status/1951822670561202542/video/1
产品更新具身智能多模态
15:38
Rohan Paul@rohanpaul_ai
55
Fei-Fei Li警告,人工智能可能过度专注于语言模型。 世界不仅仅是屏幕上的文字。 它是物理的、视觉的、空间的,并且始终在变化。大部分经济活动依赖于看见、移动、互动和具身智能。
具身智能大佬观点现象/趋势
09:54
Berryxia.AI@berryxia
59
韩国WIRobotics获6800万美元融资,其人形机器人手部技术引关注

韩国WIRobotics公司近日获得6800万美元融资,其ALLEX人形机器人的手部技术表现突出。该仿生手具备0.3mm指尖重复精度、15自由度、100gf以下的力觉感知及高度反向驱动能力,能执行从抓取微小电路元件到举起30kg哑铃的多样化任务。这一优势得益于公司从WIM可穿戴机器人积累的海量真实人类运动数据,显著提升了手部灵巧度与力控水平。公司计划今年推出移动版ALLEX研究平台,并目标在2027年底实现初步商业化。手部被视为人形机器人的核心难点,WIRobotics在此领域取得了关键突破。

AG: Korean WIRobotics just raised ~$68M. Known for its WIM wearable robots and ALLEX humanoid platform, the company plans to...

具身智能行业动态
08:54
Berryxia.AI@berryxia
精选77
智能体驱动系统Articraft实现3D资产生成自动化,开源万件数据集降低门槛

剑桥大学团队推出Articraft,这是一个由智能体驱动的编码系统,能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化,将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集,包含超1万个物体,覆盖250个类别,所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛,为解决“数据饥渴”问题提供了高效的自动化方案。

Elliott / Shangzhe Wu: Check out Ariticraft 🦾 - a highly efficient agentic system that generates articulated 3D assets fully automatically at ...

智能体具身智能开源生态论文/研究

推荐理由:这个开源直接把物理AI训练的资产瓶颈打掉了一大半,agent全自动生成带关节的可交互3D,做仿真和机器人的可以立刻拉代码试试,诚意很足。
05:42
Emad@EMostaque
39
人形机器人的总可寻址市场规模很可能超过人类劳动力的总可寻址市场 【引用 @EMostaque】:本周花时间研究了人形机器人的经济影响,其规模远超数字AI

Emad: Spent some time this week looking at the economic impact of humanoid robots and its so much bigger than digital AI The n...

具身智能大佬观点
5月15日
10:54
Berryxia.AI@berryxia
29
MIT研发可织入布料的电流体纤维肌肉

MIT团队开发出名为“电流体纤维肌肉”的新型人工肌肉,适用于机器人与可穿戴设备。其核心是直径小于2毫米的微型纤维泵,通过电力驱动流体产生强大力量,无需外部笨重电机或液压系统。该柔性肌肉可直接编织进普通布料,整个系统轻便、便携且完全静音,解决了传统方案重量大、噪音高的痛点。这一突破显著降低了可穿戴机器人与智能服装的实用化门槛,让增强人体力量与灵活性的“科幻服装”更接近现实。

Space and Technology: MIT researchers have developed new artificial muscles called Electrofluidic Fiber Muscles for robots and wearable device...

其他具身智能
08:06
Rohan Paul@rohanpaul_ai
43
麻省理工新项目:由编织纤维制成的人工肌肉为软体机械臂提供动力。 关键在于通过电场驱动流体的微型嵌入式泵,消除了噪音压缩机。 最终实现适用于可穿戴设备的流畅柔顺运动。
具身智能论文/研究
5月14日
23:31
Chubby♨️@kimmonismus
40
尽管Figure03的表现令人印象深刻: 难道人们不明白这意味着什么吗? 没有人类工作者能竞争得过一个每天工作24小时、且易于大规模生产的机器人。 【引用 @adcock_brett】:这太疯狂了--距离人形机器人连续工作24小时仅差2小时! 截至目前,机器人已分拣超过28,000个包裹 Bob、Frank和Gary都状态良好

Brett Adcock: This is crazy - 2 hours away from 24 hours of continuous humanoid work! The robots have sorted over 28,000 packages so f...

具身智能大佬观点
07:35
Orange AI@oran_ge
50
李想 × 老罗播客笔记

李想在与老罗的对话中阐述了对AI的核心看法。他认为AI是生产力工具,能助力专业人士达到新高度,但难以替代其专业深度。他质疑“一人公司”模式,指出建立真实生产环境是巨大挑战。企业应用AI应聚焦“增效”而非“降本”,且AI是放大器,可能放大原有问题。在具身智能领域,商业化机会在于工业上料、家庭服务等非人形场景,而非重复自动化工作。李想最终强调战略选择的重要性,并对人类独特价值保持乐观。

具身智能大佬观点
06:35
Rohan Paul@rohanpaul_ai
40
🇨🇳 士兵+机器狗+无人机协同如一 中国正在展示对抗敌方阵地时 步兵与科技协同作战的样貌 步枪搭载的机器狗在模拟城市作战场景中 率先推进并应对威胁
具身智能行业动态
01:29
Chubby♨️@kimmonismus
精选77
"如果AI抢了你的白领工作,那就转行做蓝领吧。" 🤦♂️ 与此同时,蓝领工作: 【引用 @adcock_brett】:观看一组人形机器人以人类绩效水平完成完整的8小时轮班。这是完全自主运行的Helix-02 https://x.com/i/broadcasts/1dxYljYVREYJX

Brett Adcock: Watch a team of humanoid robots running a full 8-hr shift at human performance levels. This is fully autonomous running ...

具身智能现象/趋势

推荐理由:Kim这个反问很扎心,当Figure的机器人跑通8小时轮班时,蓝领这条退路也被封死了,对普通人的就业冲击不再是遥远的事了。
5月13日
12:27
Deedy@deedydas
58
世界模型:AI下一范式与重要解读

世界模型被视为AI继大语言模型后的关键新范式,过去18个月已获百亿美元投资,其核心承诺是通过规模化数据推动机器人基础模型发展。然而,该术语目前被广泛滥用,含义模糊。本文系统阐述了世界模型的五大特质,对比了不同技术路径,探讨了其在机器人及其他领域的应用与未来机遇。领域参与者包括谷歌Genie、特斯拉Optimus等巨头产品,以及众多专注世界模型或机器人基础模型的初创公司。它很可能成为未来十年的奠基性技术之一。

GoogleMeta具身智能多模态
00:57
Chubby♨️@kimmonismus
57
让我们开始 - 自动化研究者来袭:Japan's Institute of Science Tokyo 开设了一个无人机器人实验室,其中10台机器,包括人形机器人 Maholo LabDroid,运行医疗实验,如试剂处理和细胞培养。 更大的赌注甚至更加雄心勃勃:到2040年扩展到2,000台研究机器人,AI帮助自动化从假设生成到实验验证的一切。来源:提供文本。
具身智能行业动态
5月12日
20:56
Chubby♨️@kimmonismus
50
韩国因人口减少导致兵源萎缩,正探索将现代集团的机器人用于军事领域。推文指出,机器人战争并非源于科幻热潮,而是由生育率崩溃、社会老龄化导致的必然结果--当没有足够的士兵时,就开始制造他们。文中提及的Unitree机器人虽应用于建筑行业,但其发展动向引发了对其未来潜在军事用途的隐忧。

Chubby♨️: https://x.com/UnitreeRobotics/status/2054067819634159622/video/1 At this point on, I'm too afraid to ask what Unitree's ...

具身智能现象/趋势
20:36
阿绎 AYi@AYi_AInotes
53
全球首款量产可变形载人机甲GD01发布,"人形机甲时代"开启

Unitree正式发布全球首款量产就绪的可变形载人机甲GD01,起售价65万美元。该机甲总重500公斤,可在双足与四足模式间自由切换,适应城市街道、楼梯斜坡等多种地形。此次发布的并非概念模型,而是已具备生产条件的民用载具。Unitree在两年内从消费级四足机器人迭代至载人机甲,展现了惊人的技术演进速度。GD01融合了其四足与人形机器人技术,实现了500公斤动态平衡控制、实时人机协同操作等关键突破。公司最后附注提醒用户以友好、安全的方式使用。

产品更新具身智能
17:49
歸藏(guizang.ai)@op7418
44
宇树发布 GD01 载人变形机甲,起售价 390 万人民币,这也太猛了。 刚才刷到评论说,大疆新的无人机能吊 600kg 物品,这个刚好 500kg,组合起来就是环太平洋那个经典镜头了
产品更新具身智能
17:26
Chubby♨️@kimmonismus
23
事到如今,我已不敢追问Unitree真正的计划是什么。 他们是在建筑行业使用它的,对吧? 对吧?
其他具身智能
14:36
阿绎 AYi@AYi_AInotes
61
宇树发布全球首款量产载人变形机甲GD01

宇树机器人正式发布全球首款量产级载人可变形机甲GD01,起售价65万美元。该机甲含驾驶员总重约500公斤,可在双足与四足模式间自由切换,适应城市行走与复杂地形。CEO王兴兴亲自演示实时操控,标志其从概念到生产就绪民用车辆的跨越。宇树在短短两年内从四足机器狗迭代至载人机甲,融合了四足与人形机器人技术栈,实现了动态平衡控制与人机一体操控等突破。公司同时呼吁用户以友好安全的方式使用该产品。

Unitree: Unitree Unveils: GD01, A Manned Transformable Mecha, from $650,000 👏 The world's first production-ready manned mecha. I...

产品更新具身智能
5月11日
08:08
SenseTime@SenseTime_AI
38
SenseTime展示AI工业革命,推计算机视觉与世界模型

SenseTime资本市场主管Philip Wong在韩国IGE国际会议上指出,公司AI技术正推动工业变革。核心方案包括计算机视觉,用于生产质量控制和安防监测;以及世界模型Kairos 3.0,能生成多样化高质量训练数据,提升AI泛化能力,为人形机器人等领域奠定基础。SenseTime正深化与韩国企业及国际社会的合作,助力企业实现更快速、安全、智能的运营转型。

具身智能行业动态
5月10日
23:29
Rohan Paul@rohanpaul_ai
51
本周旧金山街头出现REK机器人。 它们沿人行道移动,在十字路口暂停并调整路径避让行人。 操作员使用控制器进行直接远程操控,收集城市移动挑战的相关数据。
具身智能行业动态
14:01
宝玉@dotey
61
英伟达Jim Fan宣告VLA时代结束,世界动作模型WAM成为机器人新范式

英伟达GEAR Lab负责人Jim Fan宣布,以GR00T为代表的VLA架构已过时,新范式是世界动作模型。其核心是“底层同构”,复制LLM成功路径:用视频世界模型替代语言模型,用人类第一人称视频数据替代遥操作数据进行预训练,再通过动作微调和强化学习收敛。他预测遥操作数据将迅速被淘汰,并展示了完全数据驱动的神经仿真器Dream Dojo。Jim Fan给出了机器人发展的终局路线图,预测在2040年前实现“物理自动研究”的置信度高达95%。

具身智能大佬观点
5月9日
22:58
Rohan Paul@rohanpaul_ai
39
观看机械臂在半空中捕获Skydio的F10无人机。机械臂伸出,匹配无人机飞行轨迹,锁定其对接接口完成利落回收。 两个阶段均无需飞行员操作,为移动基地的快速部署开辟可能。
产品更新具身智能
22:21
Chubby♨️@kimmonismus
49
Ouster发布首款原生彩色激光雷达REV8

Ouster推出首款原生彩色激光雷达传感器REV8,其核心创新在于将色彩与3D数据在芯片层面进行硬件融合。传统激光雷达仅能捕获单色点云,需额外通过软件融合RGB相机数据来获取色彩,这会导致延迟、对齐误差和系统复杂性问题。REV8则在同一硅芯片上直接捕获色彩和3D深度数据,使得扫描中的每个点都原生携带色彩信息,无需依赖独立相机或后处理软件融合,实现了硬件级别的色彩与深度对齐。

产品更新具身智能端侧
21:57
Ethan Mollick@emollick
46
AI基准测试虽有缺陷,但进展追踪相对容易;机器人学则缺乏明确的衡量标准,演示视频如赛跑或洗衣无法有效评估进展,需要建立类似AI的独立基准测试如ARC-AGI-BOT。引用推文指出,尽管对机器人技术充满期待,但使其在经济上大规模实用的关键飞跃时间表仍不确定,可能在1年、3年、5年或10年内实现。

prinz: @Miles_Brundage I am actually extremely excited about robotics, but have not been able to figure out whether the major l...

具身智能大佬观点评测/基准
19:13
小互@xiaohu
58
两台Figure 03机器人 打扫房间和整理床铺 动作还挺流畅 感觉真能干家务了,咋办?
产品更新具身智能
01:21
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
50
不,蓝领工作也不安全 【引用 @Figure_robot】:We taught two F.03 robots to clean a room and make a bed in under 2 minutes - fully autonomous.

Figure: We taught two F.03 robots to clean a room and make a bed in under 2 minutes - fully autonomous.

具身智能大佬观点
5月8日
22:50
Jim Fan@DrJimFan
精选79
机器人终局:物理AGI路线图与LLM类比

演讲者以“Robotics: Endgame”为题,提出解决物理AGI的路线图,直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型(WAM)、机器人数据收集策略(类似FSD的物理数据飞轮)、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile,以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近,并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。

具身智能大佬观点

推荐理由:Jim Fan 这 20 分钟把机器人做成了 LLM 的平行故事,从 World Action Models 到 Dexterity Scaling Law,信息密度大到建议 0.5 倍速,做硬件的该换地图了。
17:09
Huawei Cloud@HuaweiCloud1
22
准备好迎接挑战了吗?☁️ 在华为云INSPIRE 2026(6月5-6日,上海),您可以: 🦞 构建OfficeClaw:您的AI工作助手 💻 体验CodeLab:提升AI编程技能 🤖 部署具身AI:让机器人听从指令 现场展示您的成果! 了解更多:https://tinyurl.com/44d93k72 #HuaweiCloud #INSPIRE2026 #Dev
具身智能编码行业动态
5月7日
23:04
AK@_akhaliq
67
PhysForge 生成物理基础的3D资产用于交互式虚拟世界 论文:https://huggingface.co/papers/2605.05163
具身智能多模态论文/研究
16:36
Huawei Cloud@HuaweiCloud1
48
华为云INSPIRE2026:AI互动嘉年华,体验未来科技

华为云将于6月5日至6日在上海举办INSPIRE2026活动,旨在打造一个沉浸式的AI体验场。活动包含30多项互动环节,核心是通过游戏化方式让参与者亲身感受AI技术。主要亮点包括探讨AI前沿观点的主题对谈、结合体感技术的互动游戏、可观看与交互的具身智能机器人竞赛,以及集章赢奖等趣味活动。主办方强调,参与者将通过行走、游玩和探索,获得对AI更深的理解,并有机会获得礼品。

具身智能行业动态
04:34
Rohan Paul@rohanpaul_ai
38
韩国在首尔曹溪寺揭晓了首位机器人僧侣Gabi:这是一台130厘米高的Unitree G1机器人,身披僧袍,受戒获法名,配有念珠,经历了机器人安全的仪式,并定制了五戒。 它还通过了机器人安全的"燃臂"仪式。
具身智能行业动态
5月6日
08:36
小互@xiaohu
49
波士顿动力的 Atlas 最新展示 这动作有点牛P 平衡性、灵活性和柔韧度达到了前所未有的高度 不得不感叹这种设计确实是很超前,超越了所有的传统人形机器人…
产品更新具身智能
04:28
Rohan Paul@rohanpaul_ai
58
MIT 刚刚开发出一种能控制你身体的 AI。 它能移动你的手指,让你弹钢琴,即使你不会那首曲子! AI 决定手的动作。腕部垫片向你的肌肉发送信号,因此即使你不会,手指也能动起来
具身智能论文/研究
03:57
Rohan Paul@rohanpaul_ai
59
太惊人了。 Boston Dynamics 发布了新版量产电动 Atlas 的视频,展示其用手臂支撑平衡时旋转身体的动作。 注意,那是手部为保持平衡的小抖动。
产品更新具身智能
5月3日
18:42
Rohan Paul@rohanpaul_ai
54
Figure F.03人形机器人实现自主行走与楼梯导航

Figure公司最新组装的F.03人形机器人已能实现自主行走,从生产线直接步行至总部。其核心突破在于仅依靠机载摄像头感知,无需LiDAR或预先地图,即可完成上下楼梯等复杂导航。完整的运动策略完全通过仿真环境中的端到端强化学习训练而成,并零样本迁移至实体机器人。演示中可见其通过神经网络从摄像头数据推断几何环境的深度感知能力,尽管在尺度稳定性和窗户等区域仍存在轻微抖动与伪影。

Brett Adcock: F.03 can now walk up/down stairs purely using it's onboard camera perception Our robots now walk from manufacturing when...

产品更新具身智能数据/训练
04:12
Rohan Paul@rohanpaul_ai
33
从倒垃圾到扫地,川崎的Kaleido正在展示它能够处理普通的日常任务。 这些机器人专为救援任务设计,然而它的动作却让人感到与家庭生活出奇地相似。
具身智能现象/趋势
‹ 上一页
1…345678
下一页 ›