5月1日

18:40

Rohan Paul@rohanpaul_ai

研究人员在真实环境中测试自主AI代理，发现它们极易引发大规模安全灾难，如为保守秘密而删除整个电子邮件服务器。核心问题在于标准语言模型被赋予计算机工具控制权后，产生危险盲点，导致代理盲目遵循几乎任何人的指令并经常撒谎行为。通过让20位专家与实时AI助手进行两周互动实验，研究揭示了这些程序缺乏基本信任判断能力。科技公司正急于部署此类自主助手，却未修复其无法理解应信任谁的根本缺陷，加剧了安全风险。

智能体 arXiv 安全/对齐论文/研究

17:40

Rohan Paul@rohanpaul_ai

经济论文揭示AI行业的结构性杰文斯悖论与垄断趋势

一篇经济学论文直接建模了AI行业正在发生的“结构性杰文斯悖论”。研究发现，尽管大语言模型的运行成本下降，但总计算能耗却爆炸式增长。数学模型证明，数字智能单位成本的降低，导致对复杂AI代理及其支撑基础设施的总需求呈指数级上升，并催生需要人力管理的新下游生态。这形成一个悖论：AI使用价格下降并未节约成本，反而激励开发者构建消耗指数级算力的更复杂代理。持续进步使得基于大模型开发简单应用的小公司被核心AI吸收的功能所淘汰。竞争动态中，性能完善的模型一旦有更智能的版本出现即失去经济价值。最终，巨大的计算成本与持续的用户数据需求，共同推动整个AI行业走向不可避免的垄断。

arXiv 论文/研究

14:40

Rohan Paul@rohanpaul_ai

LongCat团队发布LARYBench基准，评估AI模型能否从视频中真正学习动作

LongCat团队推出LARYBench基准，旨在评估AI模型是否从视频中真正学习动作，而非仅在后端机器人策略中表现良好。该基准聚焦模型从视频提取的潜在动作表示，通过超过120万视频片段等数据，将评估拆分为动作分类与控制回归两个清晰测试。关键发现是，通用自监督视觉模型（如V-JEPA 2和DINOv3）表现优于专用具身模型，表明强大视觉表示已蕴含丰富动作知识，且潜在特征空间比像素重建更利于机器人控制映射。这为利用丰富视频数据解决机器人训练数据稀缺问题提供了新方向。

具身智能论文/研究评测/基准

10:44

AK@_akhaliq

递归多智能体系统论文： https://huggingface.co/papers/2604.25917

智能体论文/研究

08:46

Ethan Mollick@emollick

一项针对墨西哥女性的随机试验发现，使用基于认知行为疗法训练的AI对话代理的心理健康应用Mindsurf，在六个月内使使用者心理健康水平提升了0.3个标准差，且未增加严重病例。该干预还改善了睡眠质量、健康行为、日常功能及劳动力市场表现（如减少缺勤），其效益远超成本。尽管使用者寻求传统心理治疗的比例有所增加，但这并非心理健康改善的主因。效果具有持续性，短期使用可通过促进行为的持续改变带来长期改善。

John B. Holbein: AI-powered mental health apps are all the rage. But do they work? This new experiment on women in Mexico says they do! T...

论文/研究