纽约眼科医生埃里克·罗森伯格借助苹果Vision Pro及手术平台ScopeXR,成功完成了首例及后续数百例白内障手术。该平台可将3D手术显微镜画面实时传输至头显,提供立体可视化视角并叠加术前数据,同时支持其他医生远程虚拟参与协作。此举是苹果将Vision Pro重点拓展至医疗等专业应用领域的例证。目前,苹果已暂停新款头显研发,转向轻量化智能眼镜方向。
纽约眼科医生埃里克·罗森伯格借助苹果Vision Pro及手术平台ScopeXR,成功完成了首例及后续数百例白内障手术。该平台可将3D手术显微镜画面实时传输至头显,提供立体可视化视角并叠加术前数据,同时支持其他医生远程虚拟参与协作。此举是苹果将Vision Pro重点拓展至医疗等专业应用领域的例证。目前,苹果已暂停新款头显研发,转向轻量化智能眼镜方向。
影石创新发布2025年及2026年第一季度业绩,营收增长显著。其中2025年营收97.41亿元,同比增74.76%;2026年Q1营收24.81亿元,同比增83.11%。因战略投入加大、市场竞争及存储元器件涨价影响,公司利润指标有所下滑。公司正从硬件生产向影像生态构建者加速转型,旗下云台相机、无线领夹麦克风及无人机三大新品预计一年内上市。创始人刘靖康首次阐明打造“摄影机器人”的长期愿景,表示将加速补齐AI能力,并与多家具身智能企业展开合作。
为应对游客增长与劳动力短缺,日本航空将于5月起在羽田机场试点部署宇树科技G1人形机器人。该机器人将协助地勤人员搬运行李和货物,演示中已能完成将货物搬运至飞机传送带等任务。此次试点由GMO Internet Group协助,利用英伟达Isaac Simulator在虚拟环境中训练机器人并创建数字孪生,优化后迁移至实体机器以实现顺畅操作。日本面临老龄化挑战,预计到2040年需要超过650万外国劳动力以维持经济增长。
4月27日新疆科技学院运动会开幕式上,一台参与表演的人形机器人失控,连续跌倒又跳起,并胡乱挥拳踢腿。事发时周围是身穿民族服装跳舞的学生方阵,场面一度混乱。校方和学生确认,机器人在出现异常后很快被工作人员带走,事件未造成人员受伤。该机器人来自信息科学与工程学院、人工智能学院方队,在名为《科技浪潮·智引未来》的节目中表演。
韩国Kakao Mobility公布了其L4自动驾驶技术蓝图,旨在通过自研实现高级别自动驾驶。该公司本月已在首尔江南区启动夜间Robotaxi付费运营。其技术路径包括开发能独立完成感知、判断、控制的全栈ML模型,结合硬件冗余确保安全,并利用车辆验证平台融合虚实数据以提升技术成熟度。同时,公司将通过智能安全管理平台进行3D可视化监控,并计划开发不间断监控中心与基于VLM的异常预警系统。Kakao Mobility还倡导构建开放生态系统,推动行业共享训练数据、高精地图与平台API。
格力电器CMO朱磊表示,公司已具备制造“人形机器人”的能力,所有机器人零部件均可自研自产。格力累计投入使用的自主研制工业机器人超过2000台,生产效率提升80%。公司深耕伺服电机、驱动器等核心技术,机器人产品负载已实现1kg至600kg全系列覆盖,可应用于机械制造、汽车、家电等多个领域。董事长董明珠此前透露,格力做机器人多年,并与多家世界500强企业深度合作,下一步将加速布局人工智能。
元戎启行与高通共同宣布,基于高通Snapdragon Ride平台至尊版(骁龙8797)芯片打造的ADAS方案已开始面向量产项目出货。这是业界首款基于该平台的量产ADAS解决方案,将搭载于中国智能网联汽车品牌的旗舰车型。该方案推动了VLA模型在车端的实际部署,使系统具备理解、推理与决策能力,提升驾驶安全性与体验。双方还正基于同一平台开发舱驾融合方案,以实现驾驶辅助与车内智能交互的协同。
酷态科与中电科机器人有限公司达成独家战略合作,共同研发外骨骼机器人。双方已推出原型机,搭载先进下肢意图识别技术,能适应多种复杂地形。该设备最大扭矩为34N·m,可提供约35%的助力,最高速度达18km/h,并采用“换弹式”快速补能设计。首款原型机将投入苏超联赛南京赛区运营,并于5月2日在“苏超”酷态科公益充电站互动展区首次公开亮相。
教育部发布《普通高等学校本科专业目录(2026年)》,新增38种本科专业,目录现涵盖13个门类、883种专业。为适应新兴交叉学科发展,目录在“交叉学科”门类中首批列入未来机器人、具身智能、脑机科学与技术等15种专业。新增专业精准对接国家战略与产业需求,包括能源科学与工程、深地科学与工程、农业机器人、生物制造、数字文旅、商业人工智能等。其中,具身智能专业获哈尔滨工业大学等9所高校增设。“十四五”期间全国高校专业调整幅度超30%,今年调整比例首次突破10%。
研究团队提出了Zero-to-CAD框架,用于大规模合成可执行的CAD构造序列。该方法将大型语言模型嵌入一个反馈驱动的CAD环境中,通过智能体搜索的方式迭代生成、执行和验证代码,以提升几何有效性和操作多样性。该框架成功合成了约一百万个可执行、可读且可编辑的CAD序列,其操作词汇远超基础的草图拉伸流程。团队同时发布了一个包含10万个高质量模型的精选子集。基于此合成数据微调的视觉语言模型,能够从多视角图像重建可编辑的CAD程序,其性能超越了包括GPT-5.2在内的强基线,实现了无需真实构造历史数据即可引导序列生成能力。Zero-to-CAD弥合了几何规模与参数化可解释性之间的鸿沟。
在2026北京车展期间,小马智行CEO彭军批评现行自动驾驶分级体系“极其无厘头”,主张以事故责任归属为核心重新定义标准。他强调,只要司机仍是事故第一责任人,无论功能多强都属辅助驾驶(L2),所谓L3本质上仍是L2;只有当车辆完全承担驾驶责任时,才是真正的自动驾驶(L4)。他明确表示“世界上不存在L3”。同时,小马智行与丰田合作研发的L4级无人驾驶Robotaxi(铂智4X)已量产下线,计划2026年在一线城市部署千台。
红旗与Unity中国签署深化合作协议,联合首发下一代AIOS前瞻设计。该设计以AI驱动的粒子化表达为核心,打通语音助手、桌面、应用等全场景交互,实现视觉与逻辑体验的连贯。双方将构建从设计到研发的闭环,共同打造AI+3D开发工具平台与AIGC资产管道,提升研发效率。合作还涵盖数智生态探索,包括行业首发的车载游戏合作。
NVIDIA 在 Hugging Face 上发布了一款名为 NV-Raw2Insights-US 的物理信息人工智能模型,专门用于自适应超声成像。该模型能够直接处理原始超声射频数据,实时生成高质量的诊断图像。它通过结合物理定律与深度学习,显著提升了图像分辨率和对比度,同时将传统处理流程中的多个步骤整合为单一前向传播,大幅提高了计算效率。这一进展有望推动超声设备向更便携、智能和精准的方向发展。
RADIO-ViPE 是一个在线语义SLAM系统,能够在动态环境中实现几何感知的开放词汇关联,将任意自然语言查询与定位的3D区域和物体进行匹配。该系统直接处理原始单目RGB视频流,无需预先获取相机内参、深度传感器或位姿初始化。它通过将来自聚合基础模型的多模态嵌入与几何场景信息在初始化、优化和因子图连接中进行紧耦合,提升了多模态地图的一致性。优化过程采用了自适应鲁棒核函数,以同时处理主动移动的物体和因智能体移动而改变位置的场景元素。实验表明,RADIO-ViPE 在动态TUM-RGBD基准测试中取得了最先进的结果,其性能可与依赖标定数据和静态场景假设的离线开放词汇方法相竞争。该系统为自主机器人和无约束野外视频流提供了鲁棒的开放词汇语义基础。
奇瑞在芜湖举行墨甲机器人全球发布会,展示了人形机器人、智警机器人等产品矩阵,并现场完成110台交付及1030台签约,标志着其步入规模化商用新阶段。董事长尹同跃强调,奇瑞不希望仅被看作汽车公司,而是一家面向未来的高科技企业。他指出机器人与智能汽车底层技术同源,公司正致力于提升机器人可靠性、成本与寿命以实现批量应用,并在全球多场景中打磨产品。墨甲机器人总经理张贵兵同时发布了“场景驱动、协同共荣”的新战略愿景。
大疆创新宣布 DJI ROMO 2 代扫地机器人将于五月发布。这是该系列的第二代产品,具体细节尚未公布。首代 ROMO 于 2025 年 8 月推出,具备旗舰无人机感知系统、25000 Pa 吸力、柔性双机械臂、164 ml 水箱、0 缠绕双滚刷、高压自冲洗技术和消音舱设计等亮点。官方预告简洁,更多产品信息需等待后续更新。
Unitree G1's balancing tech is on full display here. Faced with an abrupt destabilizing motion, its integrated sensors a...
强脑科技CEO韩璧丞提出公司愿景,目标让中国成为全球首个没有肢体残疾人的国家,通过为残疾人提供高性能假肢。公司已储备60多款产品,部分产品可帮助失眠人群、自闭症患者及注意力不集中用户,其ADHD产品已获得医疗器械认证。强脑科技据报已向香港秘密递交上市申请,有望成为“杭州六小龙”中首家上市企业。该公司成立于2015年,专注于仿生肢体和非侵入式脑机接口技术研发。
在小米投资者日活动上,新款具身机器人正式亮相。该机器人延续了2022年CyberOne“铁大”的人形设计,采用暗灰色面料机身与醒目小米标识。现场演示显示,其手部动作流畅,可灵活完成分发纸袋等任务。目前官方尚未公布具体技术细节。作为对比,2022年发布的“铁大”身高1.77米、重52公斤,支持21个自由度,响应速度达0.5毫秒,并具备空间感知及人物身份、手势与表情识别能力。
蚂蚁灵光App推出“体验世界模型”新功能,用户上传图片后,可在几秒到几十秒内生成一个可供探索的3D世界。该功能疑似主要依赖云端算力完成生成,尽管手机本地算力有限,但其生成速度仍被评价为“牛P”。目前生成效果虽未达到“惊艳”程度,但已具备可玩性,用户实测可成功进入多个由图片生成的3D场景。
具身智能企业星动纪元完成超2亿美元新一轮融资,顺丰集团领投,红杉中国、IDG资本等多家机构参与。该公司成为产业资本加持数量最多、跨界阵容最全的具身智能企业,2026年第二季度已开启千台级机器人交付。目前与中国邮政、顺丰深度合作,批量进驻华北、华东、华南的10多个物流中心,在恶劣环境下机器人效率超过人类水平的85%,并能24小时稳定运行。
富士通与卡内基梅隆大学成立物理 AI 联合研究中心,共同开发 AI 驱动机器人的操作系统。首个版本计划在2026年内发布,目标是到2030年实现人类与机器人的协同工作。该合作将利用2026年2月开设的机器人创新中心,面积约14,000平方米,操作系统未来应用于工厂、医院等场景,通过传感器数据使机器人灵活应对任务。
小米正式发布了其开源视觉语言动作大模型Xiaomi-Robotics-0的真机后训练全流程。通过仅20小时的任务数据训练,该模型成功掌握了将耳机精准收纳进耳机盒的高难度动作,并能连续丝滑完成多个耳机的收纳。此任务要求模型具备亚毫米级的空间感知精度,以应对耳机与槽位间极小的公差,同时能快速修正动作偏差,克服耳机盒表面最低Ra0.03μm粗糙度带来的位移挑战。该模型此前已在HuggingFace全球VLA模型下载榜位列第六。
构建复杂智能体时,长期任务智能体常因决策者分解能力不足或技能库过时而失败。新研究提出一种协同进化框架,让LLM决策智能体与动态技能库通过迭代优化共同改进。决策智能体负责选取和串联技能,性能反馈同时更新其策略和技能库本身。新技能通过归纳成功序列自动生成,而非预先手动编码。传统方法将技能与决策作为独立问题优化,容易陷入瓶颈。协同进化则能在单一循环中实现自适应规划,并持续增长可复用行为库,这对任务结构不确定的领域(如机器人、游戏智能体、复杂规划)至关重要。
华为余承东通过视频展示了全新一代问界M9的智能交互功能。该车具备车外语音能力,不仅能与人打招呼、自我介绍,还能主动打开前备箱送出礼物,并通过轻晃车身“卖萌”表达情绪。新车搭载超140项创新技术,实现全面重构。目前华为官网已开启预订,标准版预售价49.98万元起,配备双腔双阀、后轮转向、6激光雷达并首发ADS 5系统,全系采用800V高压平台。同时推出的问界M9 Ultimate领世加长版预售价66.98万元起,搭载2.0T增程器与三电机,提供专属设计与座舱体验。
在北京车展上,Momenta正式宣布其强化学习世界模型R7实现量产首发。该模型通过“World Model Prediction”预测物理世界未来状态与交互逻辑,旨在让AI理解物体物理属性、运动因果关系及交互可能性。其技术架构分为三层:基于海量驾驶数据的世界模型预训练、用于自动驾驶闭环仿真的世界模型仿真,以及在模型内进行的强化学习虚拟训练。目前,Momenta已交付超70款量产车型,累计定点车型超200款,本次车展有超过20个品牌的60余款车型搭载了其智驾方案。
普林斯顿大学研发出一种融合活体脑细胞与嵌入式电子技术的三维生物电子计算机,能完成模式识别任务。该器件在环氧树脂基底上构建了微型导线与电极的三维网状支架,培育了数万个神经元形成大型三维网络,实现了对神经元电活动的高精度记录与刺激。在六个月的研究中,系统成功区分了两种不同的输入脉冲模式。研究人员计划扩大器件规模以处理更复杂任务,并期望借此探索大脑的低能耗运算机制,为降低人工智能系统功耗提供新途径。相关论文已发表于《自然・电子学》期刊。
在自动驾驶和机器人感知中,异常分割对区分已知类与未知物体至关重要,但3D领域研究有限。本文提出一种高效新方法,直接在特征空间操作,通过建模内点类的特征分布来约束和识别异常样本。针对现有公开数据集场景简单、异常实例少及传感器分辨率域差异问题,我们构建了混合真实-合成3D LiDAR异常分割数据集,基于成熟语义分割基准,包含多样分布外物体和复杂环境。大量实验表明,该方法在现有真实数据集上达到最优性能,在新数据集上也有竞争力,验证了方法有效性和数据集实用性。代码与数据集已公开。
视觉-语言-动作模型作为具身智能的统一基础,其安全面临物理不可逆、多模态攻击面、实时防御延迟等新挑战。本文统一梳理该领域,沿攻击与防御两条时间轴组织研究,将威胁类型与其可缓解阶段对应。内容涵盖安全定义与模型基础,并从攻击、防御、评估与部署四个维度展开综述,分析训练时与推理时的多种威胁与防御机制,探讨现有评估基准及六大部署领域的安全问题,最后指出具身轨迹认证鲁棒性、物理可实现防御等关键开放问题。
当前AI已能生成新型病毒,斯坦福与Arc研究所实验显示语言模型成功设计出包括使用未知蛋白质的活性病毒。Anthropic CEO Dario Amodei预测6-12个月内即使非专业人士也可能具备该能力,而疫苗研发与分发速度远不及病毒传播。AI防御虽可能加速,但不应以文明存亡为赌注。该领域监管严重滞后,大型科技公司沿用烟草行业策略阻碍立法,全球性生物风险窗口期可能短至12-36个月。
A team at Stanford and Arc Institute fed a language model a DNA sequence and asked it to write a new virus. It wrote hun...
前斯坦福机器人博士Aaron Tan发布的Lume机器人,外观设计为一盏豪华床头灯,但内置机械臂可自动叠放衣物。其核心理念是家用机器人应像一件会干活的家具,专注于解决叠衣服这类具体痛点,而非以人形形态在家庭中活动。团队将于下周在Palo Alto举办展示会,邀请公众自带脏衣服进行测试,强调产品解决实际问题的实用性,认为这种形态比追求拟人化功能更接近真正的家用机器人未来。
We are hosting the largest showing of Lume in Palo Alto Bring your own laundry Details below
自动驾驶公司Momenta在2026北京车展披露,其智能驾驶方案搭载量过去一年从近30万台跃升至逾80万台,近期每新增10万台用时不到40天。公司已交付超70款量产车型,定点超200款。宝马新世代iX3、i3及7系搭载其L2级系统;奥迪E7X将首次应用其L3级技术;奔驰合作系统已搭载于纯电CLA,年内将落地9款新车型。此外,其Robotaxi服务已在上海运营,并与奔驰等在阿布扎比合作,与Uber、Grab的海外合作也在推进中。
在2026北京车展上,元戎启行宣布其高级辅助驾驶系统已在国内超30万辆汽车上搭载,预计今年将新增100万辆。公司已与长城、吉利、Smart等品牌超过15款车型合作,覆盖15万至30万元主流价格区间。技术层面,公司已全面转向大模型自动驾驶路线,多模态大模型能力在2026年初取得突破,目标是实现千公里级MPCI。此外,公司正从多个小模型转向统一基座大模型架构,并将模型单次迭代周期从100余小时压缩至10余小时。