"In 5 years, digital intelligence will exceed the sum of all human intelligence. Within five years, there may be at least 100 million humanoid robots, possibly even 1 billion. The economy could double in size within 5 to 7 years because AI and robotics may increase output dramatically. The pace of change will be so fast that the world could look very different in just a few years." — Elon Musk

译Elon Musk 预测，5年内AI（数字智能）将超越所有人类智能总和；同期人形机器人数量可能达到1亿至10亿台。因AI与机器人极大提升产出，全球经济规模将在5-7年内翻倍。最终AI+机器人将能完成一切工作，带来全民高收入，工作成为可选选项。

Rohan Paul@rohanpaul_ai · 16小时前44

Robotics is hard. Every unit must behave reliably after it leaves the clean geometry of the production line. Cars repeat a narrow task inside a heavily engineered road system, while humanoid robots are being asked to generalize across spaces that were designed for human bodies, human judgment, and human tolerance for failure. A robot must survive contact with kitchens, stairs, tools, dust, people, hesitation, bad lighting, dropped objects, and all the small chaos that factories spend decades trying to remove.

译机器人需要在离开生产线后应对厨房、楼梯、工具、灰尘、人、犹豫、光线差、掉落物品等真实世界的混乱，这与汽车在高度工程化的道路系统上重复窄任务完全不同。引用 Elon Musk 称，Optimus 生产最初将极其缓慢，因为一切都是新的，不像造车。

Baidu Inc.@Baidu_Inc · 19小时前33

Glad you enjoyed the ride🤩

译在迪拜朱美拉区乘坐百度Apollo Go。全区域无人驾驶服务仅需5迪拉姆，约1.36美元。没有安全员，位于主要旅游区，比一杯咖啡还便宜。很疯狂。🤯 百度官方回应："Glad you enjoyed the ride🤩"

Jim Fan@DrJimFan · 1天前71

ENPIRE -> ASPIRE, our 2nd work in the series for Physical AutoResearch. We are building the components for robot self-improvement, one /skill at a time.

译继EMPIRE后，Jim Fan团队发布ASPIRE，为机器人构建可自我进化、无限累积的技能库。编码智能体观察仿真和真实机器人的多模态感官轨迹，对控制程序进行进化搜索，将最佳策略蒸馏进不断扩展的库中。ASPIRE无需梯度下降或端到端策略，而是通过传递“技能知识”绕过sim2real和跨本体迁移难题，相比从头训练实现约10倍迁移学习token缩减。已在150+任务和90+技能上验证，计划开源全栈。

Chubby♨️@kimmonismus · 1天前52

Booster Studio launched as an IDE for embodied AI, combining coding, high-fidelity simulation, robot debugging, and real-world deployment in one platform. Thats pretty cool, especially robots are the future, without any doubt!

译Booster Studio 是行业首个专为具身AI打造的IDE，已上线 http://studio.booster.tech。该平台集成代码编辑、高精度仿真、真实机器人调试和实际部署于一体，提供从初始想法到硬件落地的完整一站式工作流，打破了数字与物理世界的壁垒。

🚨 AI News | TestingCatalog@testingcatalog · 2天前60

Booster Robotics has launched Booster Studio, the first IDE built specifically for embodied AI. > Booster Studio features code editing, high-precision simulation, real-robot debugging, and real-world deployment. > It shortens the path from the first idea to the working hardware, with the build, test, and deployment loop living in a single environment rather than scattered across separate tools. Vibe Robotics 👀

译Booster Robotics 推出 Booster Studio，这是业界首个专为具身 AI 打造的 IDE。该平台将代码编辑、高精度仿真、真实机器人调试与实地部署集成于单一环境中，取代了以往分散在多个工具中的工作流。用户可在一站式平台上完成从最初想法到最终硬件部署的完整开发流程，高保真仿真环境与全面开发栈打破了数字与物理之间的壁垒，加速了具身 AI 从想法到工作硬件的落地。

DogeDesigner@cb_doge · 2天前52

Neuralink patients controlling a robotic arm just by thinking. ❤️

译Neuralink患者仅凭思考控制机械臂。❤️

Jim Fan@DrJimFan · 2天前53

Today, we give robots a /skills library that self-evolves and compounds indefinitely! Introducing ASPIRE: a robot solving its 100th task is no longer as clueless as solving its first. Coding agents observe multimodal sensory traces from simulation and real robots, launch an evolutionary search over control programs, and distill the best know-how into an ever-expanding library. ASPIRE is a new type of continual learning: "training" is skill refinement instead of gradient descent. "Trained model" is a repo of sensorimotor skills instead of floating weights. “Distributed training” is a panel of agents each practicing a different skill instead of sharded minibatches. Here's the beauty: ASPIRE gives the tired terms "sim2real transfer" and "cross-embodiment transfer" a whole new meaning. Bridging the sim-to-real gap is notoriously brutal. An end-to-end policy has to swallow both the visual shift (sim looks toyish next to a real camera) and the subtle contact physics it never quite gets right. ASPIRE sidesteps the mess, because it doesn't ship pixels or weights across the gap, but ships the know-how. The robot still has to practice in the real world, not zero-shot, but it gets there way faster because it isn't rediscovering the strategy from scratch. Same for going single-arm to bimanual hardware, which usually requires new data and retraining from zero. ASPIRE achieves up to ~10x cut in "transfer learning” tokens (yes, tokens are the new unit of *training* compute ;) Check out our gallery of 150+ tasks and 90+ skills the robots taught themselves, all on the website! Kind of wild that we can ship the "learned weights" as an HTML page rather than a GGUF. We'll open-source the full stack so your own robot library starts compounding from ours! Deep dive in thread:

译Jim Fan 团队推出 ASPIRE，一种让机器人通过进化搜索自动扩充技能库的持续学习系统。编码智能体观察仿真与真实机器人的多模态感知痕迹，对控制程序进行进化搜索，将最佳知识蒸馏到不断扩展的技能库中，使机器人解决第 100 个任务时不再像第 1 个那样从零开始。ASPIRE 实现约 10 倍“迁移学习 token”的削减，支持 sim2real 及单臂到双臂硬件的跨实体迁移。项目展示了 150+ 任务和 90+ 技能，将开源完整代码栈。

X.PIN@thexpin · 2天前50

UBTech has unveiled life-like robots! It’s their first consumer humanoid robot under the new UWORLD brand: the U1, a full-size humanoid designed for emotional companionship. Available in male (183 cm) and female (168 cm) versions, the robot features 88 degrees of freedom, 2–4 hours of battery life, local encrypted memory, and an on-device emotional AI model trained with Huawei’s Ascend framework. UBTech says the U1 has already received more than 11,000 pre-orders, with deliveries expected to begin in mid-September. They do look a lot like C-Drama characters 😂 If their interactions are also this life-like, my sorry isolated ass may actually consider buying one.

译优必选（UBTech）推出新品牌UWORLD首款消费级人形机器人U1，主打情感陪伴。提供男款（183cm）与女款（168cm）两个版本，具备88个自由度、2-4小时电池续航、本地加密存储，搭载基于华为昇腾框架训练的端侧情感AI模型。该机器人已获超11,000份预订单，预计9月中旬开始交付。

数字生命卡兹克@Khazix0918 · 2天前73

http://x.com/i/article/2071822941252407296 # 给机器人打工了一天，我们体验上了AI时代最魔幻的工作。我们公司的一个小伙伴，前阵子应聘了一份给机器人打工的工作。也就是给具身智能，做实体的数据采集。非常有意思的是，这个几乎是世界最前沿的科技行业，在这个地方，却有着非常传统的用人方式。故事的起因，是我们小伙伴，之前刷到了推特上的一条很有意思的视频。画面里是印度的一个工厂，流水线上的工人低着头在缝纫，和普通车间没什么区别。但是你仔细看的话，其实每个人头上都戴着一个造型奇怪的设备。就是这种东西。当时我们觉得还挺有意思，于是就去搜了一下。发现这个设备是用于录制工人操作的第一人称视频，而这个视频数据，之后会被拿去训练具身智能，让他们学习人类的操作，从来来训练模型。穿戴这种设备去干活的工人，在这个行业，一般叫做数据采集员。这两年具身智能在全世界范围内爆发式的发展，今年甚至还被叫做具身智能的数据元年，但是大家几乎都知道，具身智能的数据获取，比大模型困难太多了，因为几乎都是现实世界的实体数据。所以，就诞生了这种职位，为具身智能的训练，提供数据。而且这个职位，不止在印度有，国内其实也到处都是。在Boss直聘上一搜，相关岗位一大堆，有兼职也有全职。兼职一般是日结。全职有些会缴纳五险一金甚至六险一金，但是相对的，全职的要求会比兼职高很多，需要采集的任务更难，工作时长可能会更长，稳定性的要求也会更高。而有一些数据采集工作，也可以居家办公。且不只是北京或者一线城市，连我老家安庆那边都有。只不过可能职位写的会更加高大上一点，比如，机器人训练师。而且这些招聘帖，你会看到，是完全没有学历要求，也没有经验要求的。你根本不需要做过这个，甚至不需要知道具身智能是什么，来就能干。非常有意思。这个反差一下子就把我们的好奇心给勾起来了。我们内容组的有个小伙伴，叫达达，今年正好刚毕业，他也来了兴趣，说非常想亲眼去看看这到底是个什么样的工作。我觉得那行啊，那你去体验体验吧，毕竟说完全不需要经验和学历。于是他就真的去投了简历，然后面试，然后真的去做了一天的兼职采集。再见到他的时候，已经是2天以后了。回来以后，跟我们滔滔不绝的讲了好多。他说这个工作比他想象的有意思得多，但也比他想象的离谱得多。最开始呢，他先是在Boss直聘上找了不少相关的职位，投了一圈简历。因为简历确实还可以，几乎所有投过去的都给了面试机会。可能很多人确实没有接触过这个工种，为了保证大多数人的阅读体验，我先简单给大家聊一下数据采集到底是干嘛的。 23年24年大语言模型智能还没有到今天如此离谱的程度的时候，大家应该都对数据标注有印象。那时候训练大模型会相对简单。因为互联网几十年积累下来的文字、图片、代码、网页，本身就是一座现成的数据矿山，所以虽然也招了很多做标注的人，但是坦率的讲，采集和标注的门槛并不是特别高。但是今天，具身智能面对的是完全不同的困境。它需要的是真实物理世界中的交互数据。比如一个人怎么拿起杯子，怎么叠一件衣服，手指施加了多大的力，手臂沿着什么轨迹运动。而这类数据，人类历史上从来没有大规模采集和存储过。一切都要从零开始，靠人一条一条地采集。所以需求量极其恐怖。截至2026年初，全球高质量的真实物理交互数据总量仅约50万小时，不足大语言模型训练数据的两万分之一。而要训练一个能干家务的通用机器人，至少需要千万小时级别的数据。中间差了整整一个数量级。所以就需要大量的人，穿上这套设备，去各种真实的生活场景里重复做那些日常动作。这就是数据采集，其实就是在给机器人当老师。然后这个职位的面试，一般都先是线上的，有的只有一轮，有的会有两轮，然后会是最终的试岗。一轮的话就是跟劳务公司直接面。两轮的话，第一轮是劳务公司，第二轮会由甲方的机器人公司来面。但不管几轮，真正决定你能不能干的，其实都是最后的试岗环节。对达达来说，整个体验下来最让他触动的是这一轮面试。这个面试，很特殊，是在腾讯会议里，大家一起进去。他说他秋招面试过那么多次，也经历过群面，但从没见过20多个人一起来面试的场面。这么多人也不是为了跟互联网群面一样，搞什么无领导小组讨论，就是纯自我介绍。最开始，HR会简单介绍一下这个岗位大概是做什么的，平时的工作时间、薪资等等基本信息。然后开始一个一个按照入场顺序来问个人情况，介绍完的人就可以离开。因为他进会议比较晚，所以听到了几乎每个人的背景。这个环节比较有趣的是，HR会在一开始先问你身高体重。是的，你没看错。面AI公司的岗位，会关注你的身高体重。因为采集设备的手套是固定规格的，类似于这样。手太大会塞不进去，太小又兜不住，太胖不行太瘦也不行。达达当时就被提醒了一句，说这个身高体重可能会有点瘦，设备可能不太适配，但还是先来试试吧。我听到这的时候真的觉得太魔幻了。 2026年最前沿的AI工种，入职第一关，是量手掌。。。然后还会问你之前有没有戴过VR眼镜，有没有在游乐场看过4D/5D影院。因为有些设备需要戴类似VR眼镜的东西，有人天生对晃动比较敏感，戴上去几分钟就开始犯晕，这种情况就基本干不了。自我介绍的环节的时候，每个人说的都非常简洁。甚至有人只说了三句话。我是谁，我之前干过什么，我真的很想来做这个工作。对，就这几句话。。。达达说，他第一次觉得自己之前准备的那套自我介绍会如此的格格不入。为了不那么突兀，他也没详细介绍自己的毕业学校，也没说啥专业，只说自己是应届生，对具身智能感兴趣，想来试试。他对这场面试印象最深，是因为听到了很多人的故事。各行各业的人都有，什么背景的都有。有人之前试过自己做点小生意，没做起来，现在就想找一份能稳定出勤、按时发钱的活。还有人刚满18岁，没读大学了，这是他人生的第一份正经的工作。而且工作是分白班和夜班的，可以自己选择。他以为选择白班的人会更多，没想到兼职的人里面，选夜班的反而更多。因为这是一个兼职岗，纯粹的日结，不少人都在盘算怎么跟自己的主线生活拼在一起，靠着这份兼职，再多挣一些收入。有人问能不能白天干一份交社保的工作，晚上过来兼职。 HR说可以，但是希望大家注意身体，确保自己能扛得住。面试结束之后，除了几个觉得自己身体条件不太合适、主动放弃的，其他人基本都过了。真的是已经很久很久很久没见过通过率这么高的面试了。听到这里，我感觉有点割裂。就是感觉，这个新时代能容纳很多人的一种工作，好像有点熟悉的感觉。我想起高三毕业那年暑假，去面过工厂的兼职，其实就是进厂打螺丝。那种面试跟这个几乎一模一样，看你是个男的，体力还行，没啥毛病，就能来了。也是日结，干一天结一天。那是我人生中第一次知道，原来一个人的一整天，可以被标价成一张红色的毛爷爷。达达也没多犹豫，因为确实想实地去看看，于是他接了这个兼职，说去干一天试试看。 HR就跟他对接了试岗的具体信息，发了一个地址过来。第二天他按照地址过去了，到了一个产业园附近。很抓马的是，地址告诉错了，到了个工地。又绕了半天，才到了正确的位置因为不是从正门进去的，要从停车场绕上去。他跟我说，那一瞬间真的有点慌，心想不会在北京也碰上人贩子了吧，我不会要被卖到缅甸了吧？但他还是鼓起了很大的勇气上去了。不过，进去之前还是给朋友发了条消息，说待会可能联系不上，一直没回消息的话记得担心他一下。不过还好，一切正常，场地还是新装修的，一推门进去还能闻到油漆味。进去的第一件事是收手机，因为工作期间不允许干工作以外的事情。然后他才进入了真正的工作区域，是一个很大的开放空间，摆着大概十几台机器人。因为现场没法拍照，我从网上找了一些类似的画面，大概就是这样的场景。里面有两类工作。一种是有机器人的，也是他当天体验的。需要先穿戴设备，脖子上挂一个东西，两只手各握一个控制手柄，长得跟游戏手柄差不多，上面有摇杆，还有按钮，面前站着的，是一台比他还高的双臂机器人。操控方式其实不复杂，左手手柄控制机器人的左臂，右手控制右臂。摇杆推哪个方向，那条机械臂就往哪个方向动。按钮控制末端夹爪的开合，按一下合上，再按一下松开。刚开始做的时候其实挺好玩的，有点像玩游戏。第一次操控的时候，推了一下摇杆，面前这台非常大的机器人跟着你动。那一瞬间确实有点上头，觉得，卧槽，未来到了。但做到后面，未来感就没了，剩下的只有手腕酸。他的任务也是分拣积木、叠纸杯、把东西从盒子里拿出来再放回去。在这个场景下，你的每一个动作都在被记录，要走什么路径、夹爪合上的时机、这些全部变成数据。在操控的时候，机器人也会有很轻微的抖动，抖起来的样子很像得了帕金森。。。他体验的这种，在行业里叫遥操作采集，就是人穿上设备远程操控机器人，同时记录数据。还有一种是旁边没有机器人的，他们会戴着VR眼镜，手上穿着采集设备，然后就开始叠衣服、叠裤子。达达说他在做遥操作的时候，余光一直能看到旁边那些人。一个动作，重复一遍，再重复一遍，再重复一遍，像被按下了循环播放键。这个叫做无机器人示教采集，不需要操控机器人，人直接在真实环境里做动作，穿戴的设备负责把你的每一个动作轨迹记录下来。这两种方法不一样，但核心逻辑是一样的。都是需要大量的人，去做大量重复的动作，然后把人类的行为和经验翻译成机器能读懂的数据。采集员具体在哪干活，取决于采的是哪种数据，遥操采集一般在固定的场地里，无机器人示教采集因为不需要机器人跟着，有些公司会要求去不同的场景，比如小区、民宿、超市、4S店，哪里需要就去哪里。之前就看到网上有人去麦当劳采集的。客户需要什么场景的数据，团队就去什么地方，一个场景大概待两三个月，采完了就换下一个。在一天的高强度且几乎没有休息和摸鱼时间的工作之后，达达终于可以下班了。他兼职的工作时间是这样的，从早上9点一直做到了晚上的6点半。那赚到的钱呢，日薪大概在200到250之间。我去翻了一下各个平台上兼职数据采集的薪资，大部分岗位给的也都是这个价。如果是全职的话，工作强度会大很多，需要轮班，加班也是常态，不过补贴会多一些。其实我们能看到，整个具身智能、整个AI背后的每一次进步，更多的是来自于这些人。他们用自己的体力、自己的时间、自己的心血，贡献出自己的数据，推动了这个行业往前走了一步。 AI大模型其实也是一样。大模型之所以走到今天这一步，除了算法上的突破，真正最底层的数据清洗和数据标注，全部也是最开始由人一条一条做出来的。最先进的技术，底下永远站着最普通的人。但是AI在吃掉了这些进步之后。绝大多数的能工智人，却已经比不上人工智能了。最后，我们挥着手。送着AI们，一往无前。也不知道等到有一天，机器人真的什么都会了。会不会有人记得。它的第一课，是一个日薪两百块的能工智人，在刚装修完的厂房里，一遍一遍叠着纸杯，教会它的。

译全球高质量真实物理交互数据截至2026年初仅约50万小时，不足大语言模型训练数据的两万分之一，而训练通用机器人需千万小时级别，因此大量人工采集成为必需。该岗位无学历经验要求，面试先问身高体重（因手套固定规格），通过率极高。试岗需穿戴设备进行遥操作或示教采集，重复叠衣服、分拣积木等简单动作。兼职日结，吸引各行各业的人。作者小伙伴达达亲身体验，感叹其魔幻与现实。

Rohan Paul@rohanpaul_ai · 3天前39

"If we could snap our fingers and get a pile of data... we would solve general robotics right now." - Figure CEO Brett Adcock The big bottleneck in Physical AI / robotics is not better models, but better robotics data infrastructure. That is the gap @cyberorigin_ai is building around with CyberCode. Robotic data is insanely expensive and brutal to collect. Real-world manipulation data is messy. A robot policy does not learn from "clips" the way a human watches a demo. It needs training data that can be searched by task, scene, action, device, collector, quality result, and data ID. It needs every useful frame traceable back to where it came from. It also needs different signals aligned on the same timeline, because a model can learn the wrong thing if vision, motion, language, robot state, and other sensor streams are slightly out of sync. CyberCode turns real human manipulation data into an operating layer where the data is searchable, inspectable, traceable, synchronized, quality-checked, and evaluation-ready before it reaches the model. That sounds less flashy than a humanoid demo, but it is closer to where a lot of the real bottleneck sits. For manipulation policies, world models, and vision-language-action models, better data infrastructure can matter as much as better model architecture, because the model can only learn from the structure, coverage, timing, and quality the data system actually exposes. 🧵 1.

译Figure 公司 CEO Brett Adcock 表示，若能获得大量数据，就能解决通用机器人问题。他认为物理 AI / 机器人领域的真正瓶颈不是更好的模型，而是更好的机器人数据基础设施。CyberOrigin 推出的 CyberCode 正是为解决该问题构建：将真实的人类操作数据转化为可搜索、可检查、可追溯、多模态信号精准同步、质量检查、评估就绪的运营层。机器人策略、世界模型和视觉-语言-动作模型只能从数据系统暴露的结构、覆盖范围、时序和质量中学习，因此更好的数据基础设施与更好的模型架构同等重要。

AK@_akhaliq · 3天前36

PhysisForcing Physics Reinforced World Simulator for Robotic Manipulation

译PhysisForcing 用于机器人操作的物理强化世界模拟器

AYi@AYi_AInotes · 5天前53

这条机器人推文刷爆了，但我敢说 90% 转发的人都没意识到，物理 AI 的门槛已经被砸到脚面了。不是什么AI做出来的动画演示，是正儿八经的 SO-ARM101 ACT 控制策略，直接在浏览器里跑仿真，连半毛钱硬件都不用买，以前想碰物理 AI 少说要几千块的机械臂入门，现在点开网页就能上手调参看效果，最厉害的是它的门槛下沉速度，如果我们不用付出成本就能接触最前沿的方案，这个领域的迭代速度会超出所有人的预期 https://x.com/pham_blnh/status/2070160360309698813/video/1

译物理AI的门槛已被大幅降低。SO-ARM101 ACT控制策略可直接在浏览器中运行仿真，无需购买任何硬件。此前接触物理AI至少需要数千元的机械臂入门设备，现在只需打开网页即可上手调参并观察效果。这种门槛的下沉速度意味着，当人们能以零成本接触前沿方案时，该领域的迭代速度将远超预期。

Rohan Paul@rohanpaul_ai · 5天前60

Q1 marked an inflection point for Robotics and Physical AI: PitchBook recorded roughly $16B of investment across just under 500 deals, an all-time high on both axes. versus the 2021–2025 run-rate, deal count is up about 2x while deal value is up 4.5x. So investors are underwriting a new AI cost curve: foundation-model capability migrating from screens into manipulators, vehicles, warehouses, factories, hospitals, and homes. --- Source: A16Z substack .com/@ therealrandomwalk/p-203608554

译Q1 标志着机器人与物理 AI 的一个转折点： PitchBook 录得约 160 亿美元投资，涉及近 500 笔交易，两者均创历史新高。与 2021–2025 年运行率相比，交易数量增长约 2 倍，交易价值增长 4.5 倍。因此，投资者正在为一条新的 AI 成本曲线承保：基础模型能力从屏幕迁移到机械臂、车辆、仓库、工厂、医院和家庭。

Chubby♨️@kimmonismus · 6天前54

Morgan Stanley just doubled its 2026 China humanoid robot shipment forecast again, from 28,000 to 50,000 units. In January, the bank expected 14,000 units. A few months later, that forecast has more than tripled. China now shifts from demos to deployment. CNBC says Chinese manufacturers are moving humanoids into factories, logistics, convenience stores and restaurants, backed by policy support and a deep industrial supply chain.

译Morgan Stanley 刚刚再次上调了对 2026 年中国仿人机器人出货量的预测，从 28000 台提高到 50000 台。 1 月时，该行预计为 14000 台。几个月后，这一预测已增长超过两倍。中国现在正从演示转向部署。CNBC 表示，中国制造商正在将仿人机器人引入工厂、物流、便利店和餐厅，背后有政策支持和深厚的工业供应链。

Rohan Paul@rohanpaul_ai · 6天前65

Morgan Stanley now expects China to ship 50,000 humanoid robots this year, almost 2x its January forecast. China’s edge is scale, because firms such as Xpeng, Unitree, UBTech, and Galbot can place robots inside factories, showrooms, warehouses, hospitals, and state-backed training sites to collect real task data. Morgan Stanley now sees China reaching 446,000 annual shipments by 2030, up from 262,000, with full-sized humanoids rising from 30% of shipments this year to 70% in 2028. Xpeng plans to mass-produce its Iron robot by end-2026 and Unitree says it shipped more than 5,500 humanoids in 2025. --- scmp. com/tech/article/3358210/morgan-stanley-raises-china-humanoid-robot-shipment-forecast-50000-units

译摩根士丹利将2025年中国类人机器人出货量预测上调至5万台，较1月预测几乎翻倍；2030年年度出货量预计达44.6万台（此前26.2万），其中全尺寸机器人占比从2025年的30%升至2028年的70%。中国优势在于规模：小鹏、宇树、优必选、银河通用等厂商可在工厂、仓库、医院等场景采集真实任务数据。小鹏计划于2026年底量产其Iron机器人，宇树称2025年已交付超5500台类人机器人。

Rohan Paul@rohanpaul_ai · 6天前41

A Unitree Robotics humanoid performed a solo sequence of traditional Chinese martial arts outdoors fluid kicks, wide stances, and precise arm movements with strong balance and coordination.

译宇树机器人人形在户外表演了一段中国传统武术套路——流畅的踢腿、宽阔的站姿和精准的手臂动作，展现出强大的平衡与协调能力。

Rohan Paul@rohanpaul_ai · 6天前40

"If we could snap our fingers and get a pile of data... we would solve general robotics right now." - Figure CEO Brett Adcock. General robotics is closer than it looks, but data is holding it back.

译"如果我们能打个响指就获得一堆数据……我们现在就能解决通用机器人问题。" —— Figure CEO Brett Adcock。通用机器人比看起来更近，但数据阻碍了它。

Rohan Paul@rohanpaul_ai · 6天前45

Brett Adcock, CEO of Figure AI: "we're working until midnight every night... we are here every weekend. By end of 2026, we'll be able to put a robot into home and be able to do fairly long horizon work."

译Figure AI 首席执行官 Brett Adcock：“我们每晚工作到午夜……我们每个周末都在这里。到 2026 年底，我们将能把机器人放进家中，并能够完成相当长时间跨度的工作。”

Berryxia.AI@berryxia · 6天前53

阿里最近通义实验室这个视频挺火的！其实也和之前发的黄教授因果模型那个事儿还有异曲同工之妙的地方！ Tongyi Lab抛出一个问题：为什么AI在虚拟世界里很强，但让机器人去拿个鸡蛋却容易卡住？他们的新视频在讲Embodied Intelligence的核心难点，机器人“想得清楚”和“做得稳”完全是两回事。在数字世界里，模型可以反复试错、快速迭代。但在物理世界，传感器噪声、执行延迟、环境变化、物理约束让每一步都充满不确定性。一个简单的抓取动作，可能因为光线、摩擦力、物体形状的微小差异就失败。这其实把当前AI的两大世界拉开了对比：语言和代码世界里，scaling law还在狂飙。所以，待解决的问题还是很多，路还挺长。 AI时代，才是寒武纪爆发之际。

译阿里通义实验室视频指出，具身智能核心难点在于AI在虚拟世界强，但物理世界抓取鸡蛋等任务因传感器噪声、环境变化易失败。引用指出Physical AI瓶颈不在模型规模，当前VLA/LLM路线只学统计相关性而非因果律（如桌子高2cm即失败）。UCSD黄碧薇教授在CVPR 2026提出Causal World Models框架，让AI从模仿进化到理解因果，并宣布Aether AI融资2000万美元，成为全球首个因果世界模型公司。世界模型赛道火热，但Aether AI不卷规模，卷因果结构。

向阳乔木@vista8 · 6天前49

随着AI技术发展，给机器人装上大脑，聪明不少啊！一个清华团队，据说没有融太多钱，但从 Demo 效果看是真不错。发布会好几个朋友在场，都表示很震惊。没有遥控、没有剧本，机器人全现场发挥，甚至还会跟人争论、各种吐槽、抱怨。最好玩的感觉是人形机器人，见第二条。

译清华团队展示人形机器人Demo，无需遥控或预设剧本，机器人完全现场发挥，能与人争论、吐槽、抱怨。据现场参加发布会的人反馈，效果令人震惊。该团队据称融资规模不大，但技术表现亮眼。

SemiAnalysis@SemiAnalysis_ · 7天前24

Between colleagues attending dates with robots and ishowspeed getting mogged by a rizzbot, man is one step away from humanoid kind. EPISODE 16 LIVE NOW! https://www.youtube.com/watch?v=MD5zKs7j0mk

译同事与机器人约会，ishowspeed被rizzbot碾压，人类离人形机器人仅一步之遥。第16集现已上线！ https://www.youtube.com/watch?v=MD5zKs7j0mk

SemiAnalysis@SemiAnalysis_ · 6月25日49

IN-DEPTH: What Unitree's Evolution Means For Robotics Unitree Playbook, China's Scaling Law, Geopolitics, and Humanoids in the wild https://www.fabricatedknowledge.com/publish/post/203332874?r=7ekf6a&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true

译深度解析：宇树科技的进化对机器人学意味着什么宇树策略、中国的规模定律、地缘政治及野外的人形机器人 https://www.fabricatedknowledge.com/publish/post/203332874?r=7ekf6a&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true

Berryxia.AI@berryxia · 6月25日19

M5 Stack 小机器人在AI这一波算是破圈了，你别说怪好玩的😂

AYi@AYi_AInotes · 6月25日51

宇树科技是真敢要价啊，花$4900买个能跳街舞翻跟头的的机器人😂

SemiAnalysis@SemiAnalysis_ · 6月24日29

IShowSpeed mogging Unitree, colleagues dating robots, the humanoid robots era is BOOMING!!

译IShowSpeed碾压宇树科技，同事与机器人约会，人形机器人时代正在蓬勃发展！！

MiniMax (official)@MiniMax_AI · 6月24日28

some scenes from the @hud_evals × @ycombinator Frontier RL Environments Hackathon over the weekend. 24 intense, collaborative hours with 200 of the top builders in the world turning browser-use, robotics, logistics, and worldsims into environments where models can actually learn from. a few highlights built with MiniMax M3: Tera — zero-token browser-use RL env, #3 overall Warehouse AI — autonomous warehouse robot fleet coordination Atomz — Mars construction rovers in simulation project videos in the comments.

译MiniMax 官方回顾了上周末与 HUD Evals、Y Combinator 联合举办的 Frontier RL Environments 黑客马拉松。活动吸引了 200 名顶尖开发者，在 24 小时内利用浏览器使用、机器人、物流和世界模拟等环境进行强化学习。基于 MiniMax M3 构建的出色项目包括：零 token 浏览器使用 RL 环境 Tera（总排名第三）、自主仓库机器人车队协调系统 Warehouse AI，以及火星建筑漫游车仿真项目 Atomz。

SemiAnalysis@SemiAnalysis_ · 6月23日43

This approach will mean that American robotics companies can't access the hardware they need for R&D.

译这种做法将意味着美国机器人公司无法获得研发所需的硬件。

DogeDesigner@cb_doge · 6月22日51

ELON MUSK: "In 5 years, digital intelligence will exceed the sum of all human intelligence." Within five years, there may be at least 100 million humanoid robots, possibly even 1 billion. The economy could double in size within 5 to 7 years because AI and robotics may increase output dramatically. The pace of change will be so fast that the world could look very different in just a few years.

译Elon Musk 在回应中预测 AI 可能在 4-5 年内超越所有人类智能的总和，并进一步展望：5 年内人形机器人数量至少达 1 亿，甚至可能达到 10 亿；由于 AI 和机器人大幅提升产出，经济将在 5-7 年内翻倍。Musk 称变化速度极快，世界将在短短几年内截然不同。

Rohan Paul@rohanpaul_ai · 6月21日51

Startupfortune: Hyundai is moving to take 100% of Boston Dynamics by buying SoftBank’s remaining 9.65% stake for $325M Should be great for Atlas as, Hyundai has the cleanest humanoid robotics trial path because the first customer is inside the company. Atlas is built for industrial work such as parts sequencing, with Hyundai planning deployment at its Georgia Metaplant by 2028 and broader component assembly by 2030. SoftBank’s exit looks less like quitting robotics and more like shifting capital toward bigger AI infrastructure bets. --- startupfortune .com/hyundai-takes-full-control-of-boston-dynamics-as-softbank-exits-for-325-million/

译现代汽车以3.25亿美元收购软银持有的波士顿动力剩余9.65%股份，实现100%控股。此举为Atlas人形机器人提供最清晰的工业部署路径：内部客户（现代自身）率先使用。Atlas专为工业任务设计，如零部件排序，现代计划2028年前在佐治亚州Metaplant部署，2030年扩展到更广泛的组件装配。软银退出机器人领域，转向更大规模的AI基础设施投资。

AK@_akhaliq · 6月20日44

S-Agent Spatial Tool-Use Elicits Reasoning for Spatial Intelligence

译S-Agent 空间工具使用催生空间智能的推理

Rohan Paul@rohanpaul_ai · 6月20日78

We are past the point of theory. For the first time ever, Figure’s robot count has passed its human count.

译我们已超越理论阶段。有史以来第一次，Figure的机器人数量超过了人类员工数量。

DogeDesigner@cb_doge · 6月20日44

NEWS: Texas Department of Transportation Executive Director Marc Williams says Tesla’s Cybercab is proof that the future of transportation is already here. He also said Cybercab will help “dramatically scale” Tesla Robotaxi operations in the coming months. • No steering wheel. • No accelerator. • No brake pedal. • Controlled entirely through a touchscreen. Tesla Cybercab will change the look of the roads.

译NEWS: 德州交通局执行主任马可·威廉姆斯表示，特斯拉的Cybercab证明了交通的未来已经到来。他还表示，Cybercab将在未来几个月帮助“大幅扩展”特斯拉Robotaxi的运营。 • 没有方向盘。 • 没有油门。 • 没有刹车踏板。 • 完全通过触摸屏控制。特斯拉Cybercab将改变道路的面貌。

Rohan Paul@rohanpaul_ai · 6月19日68

Anthropic just showed Claude Opus 4.7 program a robodog in 12:07 mint, about 20x faster than last year’s Claude-aided human team on the tested tasks. Project Fetch asks whether an LLM can connect real robot hardware, read camera/lidar feeds, write movement code, track location, and detect a ball. Opus 4.7 did 5 tasks alone versus Team Claude’s 264 minutes, while writing 1,045 lines instead of 10,309. The gain came from choosing the right interfaces quickly and writing scripts that worked without long human trial-and-error. It still couldn’t fetch the ball. The failure came from closed-loop control, where the robot must see a drifting ball and adjust movement after each shove. AI is getting very good at turning messy hardware into working code, but real-time physical judgment is still hard.

译Anthropic 在 Project Fetch 第二阶段展示 Claude Opus 4.7 独立编程机器狗。Opus 4.7 用 12 分 7 秒完成 5 项任务，约为去年人类团队（借助 Opus 4.1）耗时 264 分钟的 20 倍，代码量从 10,309 行降至 1,045 行。速度提升源于快速选择正确接口并写出无需人类试错的脚本。但机器狗仍未能取球，失败原因在于闭环控制——机器人需根据飘移的球实时调整动作。AI 擅长将杂乱硬件转为可运行代码，但实时物理判断仍具挑战。

Anthropic@AnthropicAI · 6月19日68

New Frontier Red Team blog: Phase 2 of Project Fetch, where we test how well Claude can program a robodog. Opus 4.7, on its own, was ~20x faster than last year's best human team aided by Opus 4.1. (The robodog, alas, still failed to fetch a beach ball.) https://www.anthropic.com/research/project-fetch-phase-two

译New Frontier Red Team 博客：Project Fetch 第二阶段，我们测试 Claude 编程机器狗的能力。 Opus 4.7 单独完成任务的速度比去年最佳人类团队（辅以 Opus 4.1）快约 20 倍。（可惜，机器狗仍然未能取回沙滩球。） https://www.anthropic.com/research/project-fetch-phase-two

Alibaba Cloud@alibaba_cloud · 6月18日45

See Qwen‑Robot Suite in action! 🤖 Bridging language and physical action, Qwen‑RobotNav, Qwen‑RobotManip, and Qwen‑RobotWorld redefine robotics with seamless instruction generalization and adherence to physical laws.

译看看 Qwen-Robot Suite 的实际表现吧！🤖 桥接语言与物理动作，Qwen-RobotNav、Qwen-RobotManip 和 Qwen-RobotWorld 通过无缝的指令泛化与遵循物理定律，重新定义了机器人技术。

Berryxia.AI@berryxia · 6月18日58

AI界大佬李飞飞眼光和远见是真的超前啊！直言：“空间智能是人工智能的下一个前沿” 在11个月年YC 的访谈中李飞飞 @drfeifei ： “世界模型要超越平面像素、超越语言，真正捕捉3D结构和空间智能。” 这句话和因果世界模型简直是天作之合。杨立昆、李飞飞这些人在推的世界模型，本质上都在往“真正理解物理世界”这个方向走。但光有3D结构和空间智能还不够，如果模型只学会了相关性，桌子高了2cm还是会直接翻车。 Aether AI的因果世界模型正好补上了这一块：不只是看到“手伸过去物体掉下来”，而是理解“为什么掉、怎样才能不掉”。因果结构让世界模型从“看起来像”进化到“真正懂”。现在两条路线在同时推进：一条是让世界模型拥有更强的3D和空间表征，另一条是给它装上因果推理引擎。两者结合之后，物理AI才有可能从“会模仿”变成“会思考”。这波理念上的对齐，感觉具身智能的下一个范式已经在慢慢成形了。原访谈完整版地址见评论区👇🏻

译李飞飞在YC访谈中称“空间智能是AI下一个前沿”，要求世界模型超越像素和语言，捕捉3D结构。现有VLA模型仅学统计相关性，物理场景易失败（如桌子高2cm即翻车）。UCSD黄碧薇在CVPR 2026提出因果世界模型框架，并宣布旗下Aether AI融资2000万美金，为全球首个因果世界模型公司。她拥有12年因果AI研究（CMU PhD，causal-learn作者，100+顶会论文）。

Berryxia.AI@berryxia · 6月18日52

兄弟们！这个研究有点牛逼啊！ Physical AI 的瓶颈根本不是「模型不够大」，是一开始范式就错了。先说一个真实场景：桌子高了 2cm，当前最强的 VLA 模型直接失败。为什么？因为它只学到了「手伸到某个位置」的相关性，根本不知道「为什么」会摔、「怎样」才能不摔。这就是 LLM/VLA 路线的致命伤，它在互联网数据上学的是统计相关性，但物理世界运行靠的是因果律。你可以生成一段完美的「桌面物体掉落」视频，但模型完全不知道下一秒会发生什么。 UCSD 黄碧薇教授 @huang_biwei 刚在 CVPR 2026 发了 Causal World Models（因果世界模型）框架，给这个问题指出了一条新路：让 AI 从「模仿动作」进化到「理解因果」。不是学「人做了什么」，是让它学「这样做为什么有效、换一个场景为什么失效」。她今天宣布 Aether AI 融资2000万美金，也成为全球首个因果世界模型公司。关于她的含金量，我们也来挖一挖： ① 12 年因果 AI 深耕，CMU PhD（导师 Kun Zhang + Clark Glymour） ②100+ 顶会论文，Apple Scholar in AI/ML ③causal-learn 作者（Python 因果发现库，GitHub 高星） CLeaR 2025 Program Co-Chair ④世界模型赛道正热：杨立昆 AMI 融了 $10 亿+，李飞飞 World Labs $10 亿，国内 25 起融资超 22 亿。几乎所有玩家都在卷数据量、卷仿真规模。但 Aether AI 的切入点完全不同，不卷 Scale，卷因果结构。这可能是具身智能从「花拳绣腿」到「真正理解物理世界」的范式转折点。感兴趣的可以看看官网：http://aetherlabs.ai

译UCSD 黄碧薇教授在 CVPR 2026 提出 Causal World Models 框架，让 AI 从模仿动作进化到理解因果。她同时宣布其公司 Aether AI 完成 2000 万美元融资，成为全球首个专注因果世界模型的公司。她拥有 12 年因果 AI 经验，CMU 博士，100+ 顶会论文，是因果发现库 causal-learn 作者。推文指出当前 VLA/LLM 路线仅学到统计相关性，因果世界模型被视为具身智能的范式转折点。

Jim Fan@DrJimFan · 6月18日81

I made Physical AutoResearch sound simple (conceptually), but it took a village to pull off and lots of design thinking into the robot /loopcraft. The hardest part is everything we need to setup *before* pressing Enter. Here's a behind-the-scene tour: 1. Safety harness Letting 8 robots run unattended overnight means safety has to be more than a hint in the system prompt. ENPIRE hardwires it in 2 layers: (1) hard kinematic limit that trips an immediate task failure and auto-resets as soon as a robot leaves its safety envelope, and (2) a torque-limited compliant gripper so a bad contact or misaligned insertion ends in a safe stall, instead of crushing the robot or the object at hand. We make safety more conservative than usual so humans can sleep tight. In reality, we still need a few human operators to watch over the "robots of loving grace". 2. Definition of /done An agent that can edit its own reward will game it for sure. ENPIRE fixes the goalposts before the fleet can move them. Here's the recipe: Collect a few minutes of success & failure demos -> Ask agent to write code using computer vision tools to classify success and measure against groundtruth -> Agent hill-climbs on classifier until reliably good -> This classifier becomes the real-time reward function that directly computes on sensor streams -> *Freeze* the reward function before AutoResearch. It's sacred, enshrined in a Gym env that no one can touch. 3. System telemetry design Robot-seconds is by far the scarcest resource, followed by GPU-seconds, and finally tokens. We instrument all three and surface them to ENPIRE for live resource awareness rather than letting it hill-climb in a vacuum. We define: - Mean Robot Utilization ("MRU"): the fraction of wall-clock time when the robot is actively executing an experiment. Otherwise the hardware is sitting idle and waiting for the next code commit. - Mean Token Utilization ("MTU"): tokens consumed per minute, our proxy for how hard the agent is actually thinking. A low MTU means the agent is stalled, waiting on a robot rollout to finish instead of doing research. - GPU utilization: fraction of wall-clock time when GPU is active. ... and evaluate on two budget-to-outcome metrics: 1. Tokens-to-Success: token budget the fleet burns to complete /goal. 2. Time-to-Success: wall-clock time to /goal

译NVIDIA GEAR实验室推出ENPIRE系统，首次实现物理世界自主研究。系统让8个Codex智能体控制8台机器人，配备GPU和token预算。安全方面采用硬运动极限切断和扭矩受限夹爪两层硬件保障，支持通宵无人运行。奖励函数通过视觉分类器离线固定并冻结，防止智能体作弊。实时监测机器人利用率（MRU）、token利用率（MTU）和GPU利用率，以Tokens-to-Success和Time-to-Success评估效率。ENPIRE自主完成扎带、整理细针、安装GPU等高精度任务，发现8机器人并行探索显著更快。系统将开源。

Alibaba Cloud@alibaba_cloud · 6月17日47

Bring Qwen into the physical world! 🤖 Welcome to the EdgeAgent Arena! Build robots & IoT devices that perceive via edge sensors and act locally to win your share of the $70,000+ prize pool. 🔗 Register now: https://click.qwencloud.com/m/20000000281/

译将Qwen带入物理世界！🤖欢迎来到EdgeAgent Arena！构建通过边缘传感器感知并在本地行动的机器人和物联网设备，赢取超过7万美元的奖金池中的份额。 🔗立即注册：https://click.qwencloud.com/m/20000000281/