小米米家扫拖机器人 6 Max 于 2026 年 3 月 19 日开售。京东 618 大促期间,其水箱版通过叠加 8.7 折优惠券、国补立减、以旧换新补贴等多重优惠后,到手价由原价 5168 元降至 3827.94 元新低。该产品具备 6cm 仿生机械足越障能力,吸力达 35000Pa,并搭载 AI 三摄全景识别避障系统,支持小米澎湃智联。
5月18日,上海企业矩阵超智发布了全能旗舰人形机器人MATRIX-3及工厂、模型等一整套生态。该机器人身高170cm、体重65kg,采用英伟达AGX算力实现端侧AI推理,搭载峰值推力5000N的自研直线关节,具备半吨级负载能力。其配套的MFH超智工厂一期规划年产能达1万台。MATRIX-3标准版售价58万元起,PRO版售价68万元,均已开启预订。
智元WITA(硅光动语)大模型近日完成备案,成为全国首个合规的具身智能交互大模型。该模型主要用于人形机器人交互,能实现自然拟人的情感交互,部署于导览、零售等场景。智元计划于今年三季度推出行业首个机器人原生端到端全模态交互大模型WITA Omni 1.0,将交互时延压缩至500ms以内,支持连续交流与打断纠正。公司还发布了“358宏图计划”,目标在2027年实现超100亿元营收,2030年达1000亿元。
该研究指出,Muon优化器通过Newton-Schulz迭代进行统一谱白化,虽在LLM预训练中有效,但在两个新场景存在根本局限:在跨模态视觉-语言-动作训练中,低秩动作梯度会放大噪声尾部方向;在带可验证奖励的强化学习中,低信噪比梯度使得白化过程不稳定。为此,研究提出Pion作为替代方案,采用两阶段提升-抑制机制,形成高通谱效应,将主导奇异值锚定于1而抑制噪声分量,并支持按注意力头独立更新。实验表明,在LIBERO的VLA任务中,Pion在1500步训练后达到100%成功率,优于Muon的97.0%和AdamW的32.2%。在基于通义千问(Qwen3)的RLVR后训练中,Pion在MATH和GSM8K上优于AdamW,而Muon在此场景下会崩溃。
传统视觉惯性里程计依赖高像素相机,资源消耗大。本研究提出了一种极简方案,仅需四个向下感知的光电二极管(通过光学Gabor掩膜提取速度信息)与一个IMU,即可为差速驱动机器人提供鲁棒的平面运动估计。通过物理仿真器联合优化掩膜参数与时序卷积网络,该模型能从四个光电二极管的测量中解算速度,并结合IMU的角速度输出连续轨迹。原型传感器在多样化的室内外地形验证中,无需真实场景微调即可紧密跟踪参考真值,证明了极简传感方案能够实现高效、精准的平面里程计。
NVIDIA Cosmos Predict 2.5 是一个 2B 参数的世界模型,可根据文本、图像或视频片段生成物理合理的视频。通过 LoRA 或 DoRA 在 DiT 的注意力层(to_q, to_k, to_v, to_out.0)和前馈层注入可训练适配器,冻结全部基座权重,在单个 80GB GPU 上即可完成参数高效微调,避免了全量微调的高成本与灾难性遗忘。该流程使用 diffusers 和 accelerate 库,利用 92 个机器人操作视频训练集与 50 个 (prompt, image) 测试对进行微调,并展示如何用微调模型生成合成机器人轨迹以支持下游机器人学习任务。支持单 GPU 与多 GPU 训练,切换不同领域适配器无需重训。
小鹏汽车首台前装量产的Robotaxi于广州工厂下线,计划未来数月内在广州启动示范运营。该车型基于旗舰平台GX打造,搭载4颗自研图灵AI芯片,算力达3000TOPS,为全球车端最高,并配备第二代VLA大模型以实现L4级自动驾驶。今年1月,小鹏已获广州智能网联汽车道路测试许可;3月成立Robotaxi业务部。车内提供隐私玻璃、重力座椅及后排娱乐屏等智能座舱体验。
Everyone asks if Atlas can bring them a drink, but this robot can bring you the whole fridge. Using AI-driven behaviors,...
大疆推出第二代扫地机器人ROMO 2系列,包含P2透明旗舰版、A2进阶版及S V2标准版,售价区间4299元至6499元。该系列在核心性能上全面升级,吸力从初代的25000Pa大幅提升至36000Pa,涨幅达44%,并搭载123°超大外摆机械臂。产品设计在延续透明基站风格的基础上,将机身调整为半透明纯白,更贴近家居环境。此外,水箱版机型支持后续单独购买套件升级自动上下水功能。
We're live Man vs. Machine https://x.com/i/broadcasts/1aJbdbgeAaQKX
在智能出行峰会上,Elon Musk展望了由AI和机器人驱动的未来。他透露,特斯拉完全自动驾驶系统(FSD)及无人驾驶出租车业务预计将于2026年底前在美国和以色列推出。他构想人形机器人将远超人类数量,创造巨大物质丰富,甚至可能实现“普遍高收入”。Musk强调,星舰的快速可复用性是实现火星殖民的关键,而Neuralink等脑机接口技术旨在恢复残障人士的功能。整体上,他平衡了乐观与风险意识,认为自主技术、机器人、太空探索与脑机接口共同致力于提升文明未来的概率。
马斯克阐述Tesla全自动驾驶(FSD)软件完全基于AI与摄像头,不使用雷达或激光雷达,通过数字神经网络模仿人类以视觉为主驾驶车辆的方式。他预期该技术最终将至少比人类驾驶安全一个数量级,并形容车辆表现得仿佛具有知觉。目前FSD已在德州三个城市实现无安全员运营,预计将在美国广泛普及。
法拉第未来近期完成了7000万美元机构投资者募资,并启动五大体系变革。公司宣布升级为物理AI生态公司,专注于EAI人形机器人与EAI汽车机器人两大产品引擎。贾跃亭设定了使公司市值重回2021年水平、在2027年第四季度实现经营性现金流为正等目标,并承诺在两年内实现过去十二年未完成的梦想。此次融资缓解了公司近端资金压力,使其融资决策得以从流动性驱动转向更注重长期股东价值的资本结构驱动。
We got bored. Time for Man vs. Machine https://x.com/i/broadcasts/1qGvvkQMgNgGB
We're live Man vs. Machine https://x.com/i/broadcasts/1aJbdbgeAaQKX
研究提出了ESI-Bench基准,用于评估具身空间智能。该基准基于OmniGibson平台,涵盖10个任务类别,要求智能体主动决策以调动感知、移动和操作能力,在交互中收集证据。实验表明,主动探索显著优于被动观察,但随机多视角采集常引入噪声。研究发现,模型失败主因是“动作盲目”,即不佳的动作选择导致观测质量低下并引发连锁错误。尽管显式3D表征对深度推理有稳定作用,但不完美的3D表示会扭曲空间关系,效果反而差于2D基线。人类研究进一步揭示,与人类基于证据修正信念不同,模型倾向于过早做出高置信度决策,暴露了仅靠改进感知或交互无法弥合的元认知差距。
Meta AI首席科学家Yann LeCun预测,未来12到18个月内将出现训练分层世界模型的通用方法。这些模型将从视频和真实世界数据中学习,具备理解物理因果和规划行动的能力,可应用于机器人、医疗等多个领域解决实际问题。最终目标是将其扩展为通用的世界模型。这标志着AI研究重点可能从当前以LLM为代表的“会聊天”模型,转向能够理解并作用于物理世界的“会做事”模型。
Yann LeCun says that within a year to 18 months, we'll have a general method for training hierarchical world models Thes...
We're live Man vs. Machine https://x.com/i/broadcasts/1aJbdbgeAaQKX
特斯拉已向美国和加拿大用户推送FSD V14.3.3(监督版)软件更新。本次更新的重点之一是优化智能召唤功能,其最高行驶速度从6英里/小时提升至8英里/小时(约13公里/小时),提升了在停车场等密集场景的实用性。在核心系统层面,引入了强化学习模块优化决策,并升级视觉编码器以增强空间感知和复杂路况识别能力。此外,系统反应速度提升20%,减少了无故偏道、近距离跟车等行为,并加强了对异形障碍物的识别。
World Action Models 旨在解决当前机器人AI的一个根本弱点:传统模型仅学习动作与摄像头图像的匹配,而无法理解动作如何导致世界状态变化。一项新研究梳理了约百篇论文,归纳出两种架构路径。其关键优势在于,这些模型能从不含机器人动作标签的日常视频中学习,而此类数据对传统机器人AI几乎无用。这使机器人具备了在行动前模拟后果的能力。
荣耀宣布肯尼亚长跑名将萨巴斯蒂安·萨维出任“荣耀全球首席跑步官”。同日,其自研机器人“闪电”走进南京大学参与活动,萨维通过视频向其隔空致敬。他惊叹于中国机器人技术的发展速度,指出人类将全马推进至2小时内用了118年,而立项仅7个月的“闪电”已刷新人类半马纪录。该机器人此前在北京亦庄人形机器人半程马拉松赛中以50分26秒夺冠,并带领荣耀机器人包揽赛事前六名,首次打破人类半马世界纪录。萨维期待未来能与“闪电”同场竞技。
国家人工智能应用中试基地(具身智能)在杭州揭牌,旨在抢占全球科技竞争战略制高点。该基地聚焦技术发展、成果转化和生态构建,致力于打造自主可控、安全可靠的具身智能基础设施与产业生态。摩尔线程作为共建合伙人及产业委员会委员,将提供一站式国产算力方案,并已与基地成立“具身智能算力与仿真联合实验室”,以加速具身智能的规模化落地。具身智能强调智能体通过身体与环境的交互实现自主学习,是人工智能发展的前沿领域。
Figure公司的F.03人形机器人已进入第四天不间断自主运行测试,在真实仓库环境中24/7连续工作直至出现故障。测试核心在于评估机器人执行抓取、搬运、分拣等任务的长期耐力,并收集故障数据、维护需求及安全恢复机制等信息。这标志着人形机器人从展示单次动作的“能动”阶段,进入了考验持续工作能力的“能干”实用化关键阶段。
We're now on Day 4 of nonstop autonomous operations with F.03 humanoid robots running 24/7 until failure https://x.com/i...
特斯拉向美国监管机构解封了17份Robotaxi碰撞报告,首次披露2025年7月至2026年3月在奥斯汀测试期间的详细事故情况。报告显示,多数事故为特斯拉车辆被后车追尾,共导致13起财产损失和4起轻伤。但报告也揭示出两次因远程操作员失误导致的碰撞,以及FSD系统在转弯、倒车等场景下存在空间感知问题,发生了剐蹭障碍物的情况。此前特斯拉以商业机密为由涂黑报告,此次全面公开让外界得以审视其自动驾驶测试的真实安全表现。
HuggingPapers发布首篇系统性定义“世界行动模型”的综述论文。WAMs被视为具身智能的下一个前沿,其核心是能同时预测未来世界状态并生成真实可执行动作的具身基础模型,超越了仅能推理的语言模型。论文系统梳理了WAMs的架构设计、数据生态系统和评估协议,并提供了发展时间线图,对从事机器人、具身Agent、物理世界AI及世界模型的研究者具有重要参考价值。
World Action Models: The Next Frontier in Embodied AI The first systematic survey defining WAMs as embodied foundation m...
国家人工智能应用中试基地(具身智能)5月16日在浙江杭州挂牌启用,为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台,旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规,支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家,2025年具身智能产业集群产值达1068亿元。
地平线创始人兼CEO余凯在轩辕汽车蓝皮书论坛上重申自动驾驶发展时间表:到2028年实现100%“脱手开”,驾驶员无需手握方向盘;2030年达到L4级“闭眼开”,特定场景下车辆完全自主;2035年实现L5级完全自动驾驶,车辆转变为“移动智能空间”。地平线已与全球超40家车企合作,其征程6系列芯片出货超百万片,HSD高阶智驾系统计划在2028年将城区平均接管里程提升至上万公里。
韩国WIRobotics公司近日获得6800万美元融资,其ALLEX人形机器人的手部技术表现突出。该仿生手具备0.3mm指尖重复精度、15自由度、100gf以下的力觉感知及高度反向驱动能力,能执行从抓取微小电路元件到举起30kg哑铃的多样化任务。这一优势得益于公司从WIM可穿戴机器人积累的海量真实人类运动数据,显著提升了手部灵巧度与力控水平。公司计划今年推出移动版ALLEX研究平台,并目标在2027年底实现初步商业化。手部被视为人形机器人的核心难点,WIRobotics在此领域取得了关键突破。
Korean WIRobotics just raised ~$68M. Known for its WIM wearable robots and ALLEX humanoid platform, the company plans to...
剑桥大学团队推出Articraft,这是一个由智能体驱动的编码系统,能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化,将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集,包含超1万个物体,覆盖250个类别,所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛,为解决“数据饥渴”问题提供了高效的自动化方案。
Check out Ariticraft 🦾 - a highly efficient agentic system that generates articulated 3D assets fully automatically at ...