5月29日

18:21

IT之家（RSS）

美初创公司 Shift 声称可以免费帮你打扫房屋，代价是全程录像以训练自家 AI

美国公司 Shift 在纽约市提供免费公寓清洁服务，作为交换，专业清洁人员需全程佩戴设备录制第一视角画面。这些视频将被用于制作数据集，授权给机器人和人工智能训练，以学习人类完成日常任务的操作数据。Shift 声称，所有画面会在使用前进行匿名化处理，模糊所有可识别个人信息，且录像仅用于训练，不会公开分享或出售。目前服务范围限于纽约，未来计划扩展至全球并提供上门维修、跑腿等更多免费服务。

具身智能数据/训练行业动态

16:30

HuggingFace Daily Papers（社区热门论文）

PhyGenHOI：动态人-物交互的物理感知4D生成

PhyGenHOI是一个用于生成物理准确、视觉逼真的4D人-物交互场景的新框架。给定静态3D人体和目标物体的3D高斯表示，该框架旨在合成人体与物体主动交互的动态场景。它将人体建模为由运动扩散模型驱动的语义智能体，物体则通过物质点方法模拟为物理智能体，并以3D高斯作为统一可微表示。交互通过三个耦合机制监督：时间同步的窗口吸引力损失、碰撞触发的接触驱动重模拟，以及增强接触保真度的遮罩视频-SDS目标。实验证明，PhyGenHOI能生成物理一致的交互，性能优于基线方法。

arXiv 具身智能多模态论文/研究

14:21

IT之家（RSS）

全程无人：鸿蒙智行全新一代问界 M9 实现工厂内部自动驾驶，自动过检测线、自动强化路试、自动泊车入库

产品更新具身智能

11:29

HuggingFace Daily Papers（社区热门论文）

同事件精选70

Qwen-VLA：统一跨任务、环境与机器人形态的视觉-语言-动作建模

Qwen-VLA是一个统一的具身基础模型，将Qwen的视觉-语言建模从感知、理解与推理扩展至连续动作和轨迹生成。它通过基于DiT的动作解码器实现，使用包含机器人操作轨迹、人类第一人称示范、仿真及导航数据等在内的大规模数据进行联合预训练。为支持多种平台，引入了感知载体感知的提示条件机制，并将操作、导航与轨迹预测统一到一个框架中。实验显示，Qwen-VLA-Instruct在多个基准上表现优异，例如在LIBERO达到97.9%，在真实世界ALOHA实验中平均分布外成功率为76.9%。

具身智能多模态论文/研究

同一事件，精选展示《Qwen-VLA：从理解世界到付诸行动》

推荐理由：Qwen-VLA 让一个模型同时搞定操作、导航和轨迹，在具身智能统一化上迈出了关键一步。虽然还停在实验室阶段，但 97.9% LIBERO 和真实世界泛化结果证明这条路走得通，做机器人的值得认真读。

11:10

Hacker News 热门（buzzing.cc 中文翻译）

据诉讼称，一家旧金山初创公司正在Airbnb房源中测试机器人，并将其损毁

旧金山一家初创公司因在未告知房东的情况下，于Airbnb房源内测试机器人并造成损坏而被起诉。诉讼称，该公司秘密安装摄像头和机器人设备进行测试，导致房屋受损。原告要求赔偿损失并停止相关测试活动。

具身智能行业动态

08:38

swyx@swyx

AI服务商 shift 推出纽约免费清洁服务。用户预约后，经过审核的 shift 操作员将佩戴设备上门清洁，用户无需付费。作为交换，清洁过程会被记录，这些关于人类执行日常任务的行为数据将用于训练机器人技术，其价值资助了免费服务。录音中的个人信息会被匿名化处理。该模式旨在让AI变革具体化，未来计划扩展至水管工、维修和跑腿等全球服务。

shift: Today, we're launching shift. We're starting by cleaning your apartment in New York City, for free. Here's how it works....

产品更新具身智能数据/训练