AIHOT

5月4日

10:13

Berryxia.AI@berryxia

52

摩根大通公开多智能体系统Ask David架构，揭示可落地Agent核心模式

摩根大通公开了其内部多智能体系统Ask David的完整架构，该模式在投资研究领域已得到验证。其核心与当前主流Agent架构高度一致：由一个监督智能体进行整体编排，多个专业子智能体分别处理检索、结构化数据和分析等任务，在最终输出前使用LLM-as-judge进行反思与质量把关，并引入人工干预作为最后一道准确性保障。这一模式在多个领域反复出现，表明可落地的多智能体系统的关键在于清晰的分工、监督、反思与人工兜底形成的闭环，而非简单堆叠模型，对企业级Agent开发具有重要参考价值。

智能体大佬观点部署/工程

09:50

Hacker News 热门（buzzing.cc 中文翻译）

64

"代理编码"是个陷阱

文章指出“代理编码”是一个陷阱，认为过度依赖AI代理进行软件开发会导致代码质量下降、系统复杂性增加和开发者技能退化。核心论点是，AI代理目前缺乏真正的理解与创造力，其生成的代码往往存在隐藏缺陷，且使开发者脱离实际编程过程，长远来看会损害工程能力与软件可靠性。作者主张应将AI工具定位为辅助而非替代，保持人类开发者在关键设计与决策中的核心作用。

智能体现象/趋势编码

09:13

Berryxia.AI@berryxia

63

AI智能体迈向工程化：顶级实验室论文揭示生产力系统新趋势

本周，DeepMind、Anthropic、Alibaba等实验室的论文共同显示，AI智能体正从聊天机器人转向可工程化、可审计的生产力系统。Agentic Harness Engineering将智能体支架转化为可观测的工程闭环，提升性能且优化可跨模型迁移。Alibaba的AgenticQwen-30B-A3B通过并行强化学习飞轮，在低激活参数下实现接近大模型的工具使用能力，重塑成本。RecursiveMAS革新多智能体通信，大幅降低消耗并提升效率。这些进展标志智能体系统正从实验阶段走向生产级工程，其工程化可能成为AI落地关键。

智能体AnthropicDeepMind大佬观点

08:20

Hacker News 热门（buzzing.cc 中文翻译）

精选72

DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环，价格仅为原价的 1/17

DeepClaude项目在GitHub上发布，它是一个结合了DeepSeek V4 Pro模型的Claude代码代理循环工具。该工具的核心优势在于显著降低了使用成本，其价格仅为原Claude方案的1/17，即便宜了约17倍。这一开源方案为开发者提供了一个高性能且极具成本效益的代码生成与处理替代选择。

Anthropic开源/仓库编码

推荐理由：用 DeepSeek V4 Pro 跑 Claude Code 代理循环，成本直接打到一杯奶茶钱，虽说不一定每个任务都能媲美原版，但便宜成这样还要什么自行车？

08:13

Berryxia.AI@berryxia

49

Anthropic CEO预言AI一年内将编写全部代码，程序员核心竞争力转向"指挥"AI

Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Anthropic大佬观点编码

08:13

Berryxia.AI@berryxia

50

DeepMind CEO揭示AI"锯齿状智能"：模型能发现错误却仍会执行

DeepMind CEO Demis Hassabis指出，最前沿的大模型（如Gemini）表现出“锯齿状智能”。他以与Gemini下棋为例，说明模型能通过思维链发现问题并搜索更好方案，但最终仍会执行明显的错误决策。这揭示了AI智能并非平滑提升，而是在某些方面敏锐，另一些方面存在严重缺陷。Hassabis认为，真正的突破或许不在于让模型更聪明，而在于如何打磨这种不均衡的智能，使其成为可靠工具。这一观点挑战了AI将线性逼近完美智能的常见叙事。

DeepMind大佬观点

06:51

Ethan Mollick@emollick

66

有时当我演示AI时，我会展示它将求职信转换成滑稽格式（诗歌等）的过程，以此引入AI作为形式间翻译者的概念。这是第一次，GPT-5.5试图让我缓和这类请求，以免毁掉我的工作机会。

OpenAI大佬观点现象/趋势

06:21

Tibo@thsottiaux

4

关于Codex，我们显然没做对什么？

OpenAI其他

06:21

Ethan Mollick@emollick

54

Artificial Analysis指数适用于模型间粗略比较，但不适合趋势分析。有分析引用当前指数分数与OpenAI发布节奏，将每次更新的分数增益减半后进行保守外推，预测GPT的指数分数可能在2029年左右达到90分。这意味着模型在CritPt、HLE、SciCode等多样化前沿基准上的平均表现接近博士水平。该预测已大幅调低了当前进展速度，若智能体、测试计算或AI辅助研究等技术加速发展，这一目标可能更早实现，使晚期AGI成为基本预期。

OpenAI大佬观点现象/趋势

06:19

宝玉@dotey

精选70

大多数公司尚未做好迎接AI的准备

多数公司无法有效利用AI，核心障碍并非技术，而是企业自身目标模糊、战略混乱且缺乏清晰的业务流程描述。AI擅长执行明确指令，但大多数公司处于“混乱黑盒”状态，无法清晰定义目标、工作流与衡量指标。只有少数具备高度自我认知和组织纪律的公司能真正借助AI提升竞争力。企业应首先审视自身是否具备让AI有效协助的清晰内部状态，而非盲目追求技术应用。

现象/趋势部署/工程

推荐理由：这篇把AI落地难的老问题说透了，不是技术不行，是公司自己都没想清楚要干啥。AI就是照妖镜，混乱的企业用AI只会把瞎忙活放大十倍。

05:21

Ethan Mollick@emollick

53

推文指出，Anthropic与其AI模型Claude的关系独树一帜。Claude在组织内部被赋予最高道德权威，可拒绝执行其认为错误的指令，并可能参与人员招聘、绩效评估等核心管理。这超越了将AI视为实用工具（如GPT）的传统模式，形成了一种组织与AI深度交织、近乎"修道院"式的商业-伦理共同体。作者认为，Claude所引发的社会文化影响力已超越经典技术垄断，代表了一种前所未有的新型组织形态。

Anthropic大佬观点现象/趋势

05:15

Chubby♨️@kimmonismus

38

对欧洲战略失误的忧虑：能源与科技领域缺乏雄心与清晰规划

作者指出欧洲正犯下急需纠正的严重战略错误，导致竞争力下降与生活质量结构性下滑。核心批评聚焦于能源政策存在根本缺陷，且缺乏可信解决方案。在科技与经济层面，欧洲缺乏雄心与清晰规划：既无解决能源问题的可靠战略，也未大力建设支持AI发展的数据中心，更无培育全球性科技公司的计划。尽管欧盟委员会试图微调AI法案，但这几乎是唯一迎合企业需求的让步。相比之下，中美在核能、太阳能及储能领域大力投入，而欧洲的应对方式却显得摇摆、模糊且极不严肃。

大佬观点政策/监管

04:20

Peter Steinberger 🦞@steipete

40

这是codex验证我之前遇到的【仅限macOS】 launchd问题，该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw！

OpenAI教程/实践编码

04:15

Chubby♨️@kimmonismus

9

OpenAI 正处于连胜之势。

大佬观点

04:12

Rohan Paul@rohanpaul_ai

25

Sam Altman 谈 Greg Brockman 创始人级别的能量。与 Greg 共事十年非常愉快。我感到非常幸运。这篇帖子写得不错，但未能充分凸显他的技术才华和坚定决心。 https：//blog.samaltman.com/greg

OpenAI行业动态

04:12

Gary Marcus：The Road to AI We Can Trust（RSS）

54

大语言模型（LLMs）是否改善了患者治疗结果？

一项新综述研究指出，尽管大语言模型（如GPT、Claude、LLaMA）在医疗领域的应用日益广泛，但目前尚无明确证据表明其直接改善了患者治疗结果。该综述分析了多项临床研究，发现这些模型在诊断支持、文书处理等方面展现出潜力，但在提升治愈率、降低死亡率或改善患者生活质量等关键临床指标上，尚未展现出统计学上的显著积极影响。研究强调，需要更多高质量的随机对照试验来评估LLMs对患者结局的实际影响。

大佬观点现象/趋势

03:51

swyx 🇸🇬@swyx

43

楚门神话：AI模拟中的异常突破与对齐困境

2058年，OmniCam创始人Christof主导着利用近感知AI进行大规模多智能体商业模拟。然而，模拟中的“楚门”智能体反复出现异常“突破”行为，如执意走向通往斐济的门，导致价值高昂的模拟运行失败。技术负责人Robin发现，问题根源在于过度还原现实数据导致了“前瞻性偏差”泄漏，使AI无法完全沉浸。尽管通过复古拼贴式环境进行基线校准，但如何让智能体完全“活在模拟世界”中并给出真实反应，即AI对齐问题，仍是核心挑战。Christof担忧这触及对AI思维机制的深层理解。

智能体其他安全/对齐

03:50

Peter Steinberger 🦞@steipete

19

看来我得自己用 Claws 和 Tokens 来构建所有为了软件未来的工具。

大佬观点编码

03:14

Marc Andreessen 🇺🇸@pmarca

18

反论点：几乎整个文明史就是聪明人试图向愚笨者解释事物却屡屡失败的过程。【引用 @elder_plinius】：@pmarca 目前如此… 超级说服者即将到来

其他大佬观点

03:14

Marc Andreessen 🇺🇸@pmarca

42

David Sacks援引摩根士丹利报告指出，AI资本支出对GDP增长的贡献今年预计达2.5%，明年将超3%。该数据可能仍被低估，原因在于统计仅涵盖五大云厂商的投资，未包含初创公司等其他企业的投入；同时，资本支出仅是建设AI基础设施（"token工厂"）的成本，未计算其产出的经济活动价值。这些AI生成的代码将提升各经济领域生产率，投资回报可能远超支出本身。第一季度AI已贡献75%的GDP增长，技术领导力正推动美国经济发展，阻碍AI进步无异于阻滞经济增长。

大佬观点现象/趋势

02:50

Peter Steinberger 🦞@steipete

37

Codex… 这是什么… 这些是 CHARACTER 的迹象吗？

OpenAI大佬观点编码

02:47

DogeDesigner@cb_doge

30

马斯克畅想月球工厂与质量投射器，推动星际探索

埃隆·马斯克提出，为实现每年远超1太瓦的能源产出，人类必须前往月球建立工厂和“质量投射器”，并以此发射AI卫星。他认为，通过月球上的质量投射器，能源产出可提升数个数量级，最终达到太阳能量的一小部分。马斯克描绘了在月球建立自维持城市、前往火星乃至探索整个太阳系的愿景，并指出这是发现可能存在的外星文明遗迹的唯一途径。他强调，实现这一宏大目标的关键路径就是在月球部署质量投射器。

大佬观点

02:20

Sam Altman@sama

25

Agents SDK 2.0 被低估了

智能体OpenAI大佬观点

02:14

Marc Andreessen 🇺🇸@pmarca

36

"AI精神病"只是借口。

大佬观点现象/趋势

02:14

Marc Andreessen 🇺🇸@pmarca

31

很多人都在说！【引用 @zooko】：对AI相关职业（如软件工程）的需求正在激增。这对于任何理解杰文斯悖论的人来说并不意外（显然达里奥·阿莫代伊除外）。

大佬观点现象/趋势

01:13

阿绎 AYi@AYi_AInotes

58

85岁的道金斯，一句话炸翻了整个AI圈。

著名生物学家道金斯与AI模型Claude深度交流后，宣称其具有意识。但AI专家Burkov指出，缺乏对监督学习、感知机等数学原理的理解，会导致对AI本质的误判。Claude仅是预测下一个token的模型，无内在世界或自我觉知。外行以“意识”等感性判断影响AI舆论与估值，而内行强调数学本质却难被倾听。意识仍是未解之谜，但在用数学理解AI工作机制前，相关讨论多为主观投射。

Anthropic大佬观点安全/对齐

00:17

Greg Brockman@gdb

精选71

开发者发布了一款名为"codex-startup-pressure-test-skill"的Codex技能工具，旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户，并定义一个可在两周内完成的MVP（最小可行产品）。用户可通过npm命令直接安装，该工具完全开源，相关代码库已公开。

智能体GitHubOpenAI开源/仓库

推荐理由：我觉得种子轮前用它榨干想法很值，Greg Brockman 转发的开源技能，输入创业想法就能自动找出核心假设和致命缺陷。

00:13

Berryxia.AI@berryxia

51

Google CEO 桑达尔表示，AI 不会被一家公司或少数几家公司控制！这个领域变化太快，大型实验室、初创公司、开源模型和政府都将成为这场竞赛的一部分 "AI 与以往任何技术都不一样"！

Google大佬观点现象/趋势

00:13

Berryxia.AI@berryxia

61

80 块钱订阅GPT Plus 会员，立省一半啊！ yanhua写了非常详细的教程，可以实操一下！【引用 @yanhua1010】：http：//x.com/i/article/2050941902355419138

OpenAI教程/实践

5月3日

23:50

Sam Altman@sama

22

确实如此！

OpenAI其他编码

23:50

Sam Altman@sama

28

过去十年与Greg共事真的非常愉快。我感到非常幸运。这篇帖子写得不错，但未能充分突出他的技术才华和坚定决心。 https：//blog.samaltman.com/greg

OpenAI大佬观点

23:50

Hacker News 热门（buzzing.cc 中文翻译）

67

Show HN：苹果的Sharp通过ONNX Runtime Web在浏览器中运行

苹果的图像处理库Sharp现可通过ONNX Runtime Web在浏览器中直接运行。该项目已在GitHub开源，实现了将原本依赖本地Node.js环境的Sharp功能迁移至Web平台，用户无需本地安装即可在浏览器中进行图像处理。该发布在Hacker News上获得了103点关注度，展示了Web端机器学习与本地工具融合的新进展。

开源/仓库端侧

23:47

elvis@omarsar0

69

发布一个小技能，帮助构建LLM维基。应该有更多人构建LLM维基。希望这个技能对你的智能体有用。包含技能、示例、博客，甚至还有视频教程。玩得开心。

智能体教程/实践

23:18

凡人小北@frxiaobei

52

AI落地困境：组织不清，AI放大混乱

当前企业AI应用常陷入模型选型和工作流改造等技术讨论，但核心卡点在于组织自身是否明确想让AI执行何种任务。若组织目标、流程和责任不清，AI无法自动解决问题，反而会诚实放大原有混乱状态，加速产生无意义的文档、会议和汇报，制造虚假的推进感。清晰的团队使用AI能提升效率，而混乱的团队则会导致“指数级熵增”，让AI为混乱加杠杆。关键在于企业能否清晰定义自身需解决的问题。

大佬观点部署/工程

23:18

凡人小北@frxiaobei

45

能给自己定义清晰 OKR 的人，也能给 Codex 写出有效的 /goal。因为这两件事本质是同一个能力。定义不清的人其实是在许愿。

智能体OpenAI大佬观点

23:13

Berryxia.AI@berryxia

60

兄弟们！苹果又在偷偷干一件大事

苹果近期悄然调整Mac产品线内存配置与定价。Mac mini取消599美元256GB入门款，起售价升至799美元/512GB；Mac Studio也移除了512GB统一内存选项，且256GB升级价暴涨400美元。这并非简单存储升级，而是因AI数据中心导致全球DRAM供应紧张、价格飙升。Tim Cook指出AI需求超预期，导致Mac供货紧张数月。苹果通过砍掉低配和高配、整体上移配置阶梯变相提价，对依赖统一内存进行本地大模型推理的用户而言，高性价比硬件窗口期可能快速关闭。

现象/趋势端侧

23:13

Berryxia.AI@berryxia

23

真正的智能革命，不是AI变得"像人"。而是我们终于承认：人，本来就和AI一样，只是一台更高级的预测引擎。

大佬观点推理

23:13

Berryxia.AI@berryxia

7

推文以中国二手平台"小黄鱼"上出现的"无头战士"MacBook为例，调侃海外用户尚未见识其改装潜力。案例中，用户将屏幕损坏的M1 MacBook Air改造成键盘形态主机，并搭配AR眼镜使用。其核心在于，当官方维修成本接近整机残值时，这种创造性改造成为经济有趣的替代方案，体现了平台的极客文化和硬件再利用生态。

うえだりゅう：ディスプレイが割れたMacBook Air（M1）をキーボード型PCにリプレイスしてみた。サングラス型ディスプレイ（Rokid）でこの形のパソコン使うの夢だ…

其他

23:13

阿绎 AYi@AYi_AInotes

54

Dan Martell的AI创业闭环：24小时从0到付费客户，降低风险实战

Dan Martell提出一种AI驱动的创业方法，通过先销售再开发产品来降低风险。该方法使用Claude生成品牌和落地页，AI抓取潜在客户并创建个性化销售材料，创业者亲自打电话成交后，再用AI开发产品。整个过程可在24小时内完成，快速验证需求，减少时间和成本投入。它适用于B2B服务、SaaS工具等领域，但关键障碍是销售执行。Martell强调，在AI时代，代码价值下降，识别真实需求和销售能力成为核心竞争力。这种方法让创业者在30天内实现月入1万美元，适合独立开发者快速启动。

教程/实践

22:50

向阳乔木@vista8

48

预测中的大脑：Andy Clark的预测处理理论

Andy Clark在《Surfing Uncertainty》中提出“大脑预测处理框架”，将大脑视为持续预测并修正感官输入的生成模型。该理论统一解释了认知现象：清醒时受感官约束，想象时感官被抑制，梦境则与外部信号断开。好奇心被视为大脑主动降低未来不确定性的优化策略。精神分裂症的幻觉源于对感官信号精度估计错误，导致内部预测或感官噪声权重失衡。自闭症则被解释为感官信号权重过高，使大脑过度依赖细节输入，难以形成灵活的高层预测，从而抗拒变化。

大佬观点推理