AIHOT

5月4日

06:42

Ethan Mollick@emollick

有时当我演示AI时，我会展示它将求职信转换成滑稽格式（诗歌等）的过程，以此引入AI作为形式间翻译者的概念。这是第一次，GPT-5.5试图让我缓和这类请求，以免毁掉我的工作机会。

OpenAI大佬观点现象/趋势

06:11

Tibo@thsottiaux

关于Codex，我们显然没做对什么？

OpenAI其他

06:10

Ethan Mollick@emollick

Artificial Analysis指数适用于模型间粗略比较，但不适合趋势分析。有分析引用当前指数分数与OpenAI发布节奏，将每次更新的分数增益减半后进行保守外推，预测GPT的指数分数可能在2029年左右达到90分。这意味着模型在CritPt、HLE、SciCode等多样化前沿基准上的平均表现接近博士水平。该预测已大幅调低了当前进展速度，若智能体、测试计算或AI辅助研究等技术加速发展，这一目标可能更早实现，使晚期AGI成为基本预期。

OpenAI大佬观点现象/趋势

05:52

宝玉@dotey

精选70

大多数公司尚未做好迎接AI的准备

多数公司无法有效利用AI，核心障碍并非技术，而是企业自身目标模糊、战略混乱且缺乏清晰的业务流程描述。AI擅长执行明确指令，但大多数公司处于“混乱黑盒”状态，无法清晰定义目标、工作流与衡量指标。只有少数具备高度自我认知和组织纪律的公司能真正借助AI提升竞争力。企业应首先审视自身是否具备让AI有效协助的清晰内部状态，而非盲目追求技术应用。

现象/趋势部署/工程

推荐理由：这篇把AI落地难的老问题说透了，不是技术不行，是公司自己都没想清楚要干啥。AI就是照妖镜，混乱的企业用AI只会把瞎忙活放大十倍。

05:20

Ethan Mollick@emollick

推文指出，Anthropic与其AI模型Claude的关系独树一帜。Claude在组织内部被赋予最高道德权威，可拒绝执行其认为错误的指令，并可能参与人员招聘、绩效评估等核心管理。这超越了将AI视为实用工具（如GPT）的传统模式，形成了一种组织与AI深度交织、近乎"修道院"式的商业-伦理共同体。作者认为，Claude所引发的社会文化影响力已超越经典技术垄断，代表了一种前所未有的新型组织形态。

Anthropic大佬观点现象/趋势

05:06

Chubby♨️@kimmonismus

对欧洲战略失误的忧虑：能源与科技领域缺乏雄心与清晰规划

作者指出欧洲正犯下急需纠正的严重战略错误，导致竞争力下降与生活质量结构性下滑。核心批评聚焦于能源政策存在根本缺陷，且缺乏可信解决方案。在科技与经济层面，欧洲缺乏雄心与清晰规划：既无解决能源问题的可靠战略，也未大力建设支持AI发展的数据中心，更无培育全球性科技公司的计划。尽管欧盟委员会试图微调AI法案，但这几乎是唯一迎合企业需求的让步。相比之下，中美在核能、太阳能及储能领域大力投入，而欧洲的应对方式却显得摇摆、模糊且极不严肃。

大佬观点政策/监管

05:00

Peter Steinberger 🦞@steipete

马上回来，给 @sama 打个电话

OpenAI其他

04:30

PixVerse@PixVerse_

那场怪物派对的能量简直不可思议 🧛♀️🤘 感谢 @StevieMac03 带来这首史诗级的 Seedance 2.0 热曲！

教程/实践视频

04:17

Rohan Paul@rohanpaul_ai

基于脑图多智能体系统提升大语言模型推理能力

本文提出BIGMAS系统，通过构建针对特定问题的小型专家智能体图，以提升大语言模型在多步骤复杂任务中的推理可靠性。该系统让多个智能体在一个共享工作空间中进行读写协作，并由独立控制器监控全局状态、规划下一步行动。在涵盖算术表达式搜索和多步骤规划的3个谜题任务上，对6个前沿模型进行的测试表明，该方法在所有模型和任务上均显著提升了性能，例如Six Fives任务准确率从12%提升至30%，伦敦塔任务从57%提升至93%。这证明通过优化多智能体系统结构，而非仅依赖延长单一模型的思考，能有效增强大语言模型的推理能力。

智能体arXiv推理论文/研究

04:15

Hacker News 热门（buzzing.cc 中文翻译）

精选70

OpenAI的o1系统对急诊患者的诊断准确率为67%，而分诊医生的准确率仅为50%至55%

OpenAI的o1系统在急诊分诊诊断测试中表现优于医生。该系统对急诊患者的诊断准确率达到67%，而分诊医生的准确率仅为50%至55%。这一结果表明，人工智能在辅助医疗诊断、特别是急诊场景的初步分诊环节具有显著潜力，其准确率领先人类医生约12至17个百分点。相关研究由哈佛团队进行，具体数据来自《卫报》的报道。

OpenAI推理论文/研究

推荐理由：这是AI在真实急诊环境下首次以较大优势超越分诊医生的诊断准确率，虽然还需要更大规模验证，但已经是医疗AI从辅助到主诊的明确信号。