全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「大佬观点」清除

5月17日周日

19:10Rohan Paul63贝尼奥夫谏言SaaS企业专注价值创造

18:44AYi66Citadel创始人震撼于AI阶跃进步，高端金融研究被自动化

18:34Chubby♨️75精选微软AI CEO预测18个月内AI自动化所有白领工作

17:10Rohan Paul49杨立昆称LLM非泡沫，但高估其智能是泡沫

17:10Rohan Paul57斯坦福研究：在同等推理预算下，单智能体LLM通常优于多智能体系统处理多跳问题

16:44Gary Marcus：The Road to AI We Can Trust（RSS）36生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

16:40Rohan Paul58谷歌CEO称前沿模型或能破解多数软件

16:40Rohan Paul36创始人需从专才转向通才

16:12凡人小北46微信读书的 skill，唯一有用的就是笔记和划线导出。

16:10Rohan Paul27ASML：AI与芯片革命的无形支柱

12:16宝玉57Opus 4.6和Gemini 3.1 Pro被评为写作与翻译最佳模型

11:10Rohan Paul77精选Anthropic CEO预言软件免费化与职业结构巨变

11:10Rohan Paul72Anthropic CEO谈AI双重影响：高增长与高失业并存

10:42SemiAnalysis53Jensen Huang谈低MFU策略与智能系统设计

10:40Orange AI65我的奥德赛时期

10:40Rohan Paul42AI时代新公式：能效比决定竞争力

10:23meng shao21新模型或撼动代码助手格局

10:08Ethan Mollick24硅谷新风尚：初创公司必备"巫师"顾问

09:54Berryxia.AI61陶哲轩点破AI核心矛盾：简单数学与不可预测的行为

08:54ginobefun57当软件容易被创作，新时代的产品长什么样？

08:54ginobefun68Box CEO Aaron Levie：现在是创立AI公司的最佳时机

08:53meng shao63Atomic Bot发布Qwen 35B任务视频对比，引发OpenClaw与Hermes创始人性能辩论

08:08Ethan Mollick37个人理财AI需引导与经验验证

07:35Greg Brockman39代币成为通用问题解决输入

06:46宝玉47吐槽一下 Claude Code Desktop 的设计

06:43Emad30纳米机器人研发者何在

06:03Chubby♨️60Claude Mythos惊现Google Cloud控制台引困惑

05:32Hacker News 热门（buzzing.cc 中文翻译）59技术法西斯主义

05:08elvis71工具使用代理认知与行动脱节机制研究

04:41Peter Steinberger 🦞42若未切换至Codex，请开发Claude代码

03:54Dwarkesh Patel：Podcast & Blog（RSS）51RLVR 可能在科学领域格外糟糕

03:54Dwarkesh Patel：Podcast & Blog（RSS）49The mistake of conflating intelligence and power

03:16宝玉18Codex使用限额重置引用户感慨

02:43AYi63AI工具将十年开发经验压缩成一行命令

02:35Greg Brockman27移动端Codex带来自由编程体验

01:58Yann LeCun49美国科研经费跌破历史冰点

01:32Nathan Lambert：Interconnects（RSS）53最新开源成果（#21）：开源模型盛宴！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

01:05Greg Brockman43Codex应用独树一帜，Mac端智能Excel引关注

00:54Berryxia.AI48重复造轮子的人不是傻子，有没有一种可能只是真的是在拿AI练手和提升「熟练度」！😊

5月16日周六

23:33Chubby♨️3830天130万token竞争激烈

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月17日

19:10

Rohan Paul@rohanpaul_ai

63

Salesforce联合创始人兼CEO马克·贝尼奥夫：受AI驱动估值重置影响的SaaS企业CEO们应当停止抱怨。公开市场正在理性调整；私有估值在变现前只是幻想。请聚焦于收入、客户、现金流、利润、创新与价值创造。

18:44

AYi@AYi_AInotes

66

Citadel创始人震撼于AI阶跃进步，高端金融研究被自动化

Citadel创始人Ken Griffin承认，过去几个月AI工具出现阶跃式进步，生产力大幅提升。其公司内部原本需高级金融专家耗时数周至数月完成的高端研究工作，现可由AI代理在数天內完成。Griffin强调这自动化的是极高技能的顶尖认知劳动，非普通白领工作，他对此深感震撼与忧虑，认为将对社会产生戏剧性冲击。金融已成为AI首个杀手级应用场景，法律、医疗等行业将紧随其后。建议普通人立刻转向使用智能体AI、掌握设计多代理工作流，并让AI承担大部分重活，自身专注于判断与洞察。

Brett Caughran: A big pivot from Ken Griffin on AI: "Number one is, in the last few months, there has been a step change in the producti...

智能体大佬观点

18:34

Chubby♨️@kimmonismus

精选75

微软AI CEO预测18个月内AI自动化所有白领工作

微软AI CEO Mustafa Suleyman预测，AI将在18个月内实现人类水平的性能，自动化大多数专业任务，包括会计、法律、营销和项目管理。他在Fortune采访中指出，所有涉及“坐在电脑前”的白领工作都将被AI完全取代。Suleyman透露自己的使命是构建“超级智能”，并展望未来创建新AI模型将像制作播客或写博客一样便捷。

Microsoft 大佬观点现象/趋势

推荐理由：Microsoft AI 老大亲口说 18 个月内所有“坐电脑前的工作”都会被 AI 干掉，不是普通预测，是直接给全球白领贴了倒计时标签。虽然听着像吹牛，但他说这话的位置让我们不得不认真掂量。

17:10

Rohan Paul@rohanpaul_ai

49

杨立昆表示，大语言模型在价值或投资上并非泡沫--它们将推动许多实际应用并证明当前基础设施支出的合理性。真正的泡沫在于假设大语言模型能成为人类水平的思考者。

Meta 大佬观点现象/趋势

17:10

Rohan Paul@rohanpaul_ai

57

斯坦福研究：在同等推理预算下，单智能体LLM通常优于多智能体系统处理多跳问题

斯坦福论文论证，在相等推理令牌预算下，单个LLM解决多跳问题通常比多代理系统更有效。核心在于单代理能保持完整的内部思维链，而多代理需将思维分割为消息传递与交接，每次交接都压缩信息并导致丢失，这以数据处理不等式为形式化解释。实验在多个模型和数据集上验证，预算匹配时单代理表现等同或优于多种多代理设置。多代理的常见增益可能源于额外计算或评估偏差，而非架构优势。论文建议，多跳推理应默认从强单代理开始，仅当单代理上下文受干扰退化时，才将多代理结构作为修复策略使用。

智能体大佬观点推理

16:44

Gary Marcus：The Road to AI We Can Trust（RSS）

36

生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

近期访谈指出，当前大语言模型存在“幻觉”问题，答案常不可靠。业界对“超大规模”的巨额投入可能陷入非理性狂热。作为替代路径，“世界模型”旨在让AI理解物理规律，“神经符号AI”则尝试结合深度学习与符号推理，以提升可靠性、可解释性与逻辑能力，为下一代AI奠定基础。

大佬观点安全/对齐现象/趋势

16:40

Rohan Paul@rohanpaul_ai

58

谷歌CEO Sundar Pichai谈当前前沿模型破解几乎所有现有软件安全的能力。 "这些模型几乎肯定会破解现有的所有软件，也许已经做到了，我们还不确定。"

Google 大佬观点安全/对齐

16:40

Rohan Paul@rohanpaul_ai

36

杰出的创始人可能起步于技术专家，但创立公司需要成为通才并始终保持这一特质。 ~ Sam Altman

OpenAI 大佬观点

16:12

凡人小北@frxiaobei

46

微信读书的 skill，唯一有用的就是笔记和划线导出。

产品更新大佬观点

16:10

Rohan Paul@rohanpaul_ai

27

ASML是人工智能和半导体革命的无形支柱。没有ASML： 🚫 就没有英伟达H100 🚫 就没有AI超级计算机 🚫 就没有GPT-3/4/5或Claude 🚫 就没有可扩展的数据中心他们制造这些价值4亿美元的机器，基本上支撑着所有先进芯片的生产。

大佬观点部署/工程

12:16

宝玉@dotey

57

写作 -> Opus 4.6 是最佳的翻译 -> Gemini 3.1 Pro 是最佳的

jason: When do you reach for other models instead of Codex? What can we do better? Hit me with all of your frustrations. dms op...

Anthropic Google 大佬观点

11:10

Rohan Paul@rohanpaul_ai

精选77

Anthropic CEO预言软件免费化与职业结构巨变

Anthropic CEO Dario Amodei在《华尔街日报》YouTube频道采访中表示，软件成本将急剧下降，可能基本免费，传统软件需百万用户分摊成本的前提将不再成立。同时，数十年来建立的许多工作和职业可能消失。Amodei认为社会能够应对并适应这种变化，但他警告人们目前完全未意识到即将到来的变革及其巨大规模。

Anthropic 大佬观点现象/趋势

推荐理由：Dario 这段 WSJ 访谈把软件免费化说得明明白白，但真正值得警惕的是后半句——整个行业对即将到来的职业冲击几乎没有意识，这种认知差才是风险。

11:10

Rohan Paul@rohanpaul_ai

72

Anthropic CEO谈AI双重影响：高增长与高失业并存

Anthropic CEO Dario Amodei 指出，AI将引领一个前所未有的颠覆性时代：经济可能实现5%-10%的高GDP增长，但同时伴随高失业率与不平等加剧。他举例称，软件成本将大幅下降甚至近乎免费，传统软件商业模式的前提或将瓦解。尽管目前工程师可转向编辑或升级工作，但AI模型将持续承担更多任务，导致许多延续数十年的职业逐渐消失。他强调，社会尚未充分意识到这场变革的巨大规模与冲击，对此他既感到兴奋又深表担忧。

Rohan Paul: Anthropic CEO Dario Amodei : "Software is going to become cheap, maybe essentially free. The premise that you need to am...

Anthropic 大佬观点现象/趋势

10:42

SemiAnalysis@SemiAnalysis_

53

在斯坦福CS153前沿系统课程中，Jensen Huang逐字表示他"希望始终保持低MFU"，其给出的理由是：他希望系统足够智能，以至于超额配置了如浮点运算、网络、内存等工作负载。或许@xai的内核团队也在遵循这一理念。

大佬观点数据/训练

10:40

Orange AI@oran_ge

65

我的奥德赛时期

“奥德赛时期”指年轻人毕业后的迷茫状态，源于旧有清晰路径在互联网时代结束后失效。作者认为，即便在过去，这条路径也少有人走通。问题的核心在于是否承担真实风险与创造价值。在大厂打工常感无意义，因为个人决策无真实后果，高薪可能成为诅咒。真正的成长来自“风险共担”，进化需要筛选力量。AI时代，执行力可交给模型，稀缺的是想象力、判断力与改变世界的冲动。AI无法替人承担风险，人的选择因生命有限而真实。真正的安全垫并非稳定工作，而是自身的快速成长与“创造-验证”循环。人的一生皆是奥德赛时期，需持续在真实世界中冒险进化。

大佬观点现象/趋势

10:40

Rohan Paul@rohanpaul_ai

42

Satya Nadella的能量在此彰显。🔥 "每瓦特每美元的Token数" 这是每个公司、行业或国家在AI时代的新公式。 "这意味着基础设施、基础设施，还是基础设施。"

Microsoft 大佬观点现象/趋势

10:23

meng shao@shao__meng

21

新模型或撼动代码助手格局

Antigravity 要崛起了？不太能想象到，唯一的可能，是 Gemini 4 真的断档的强？全面内置 Nano Banana Pro 和 Veo 4？不过即便这样，也很难再动摇 Codex 和 Claude Code 了吧？

Logan Kilpatrick: Very excited for all the stuff the @antigravity team has been cooking :)

大佬观点编码

10:08

Ethan Mollick@emollick

24

这就解释了这家初创公司。【引用 @deepfates】：旧金山的新潮流不再是参谋长或MTS，而是巫师。每家公司都必须有位巫师。如果你的公司没有巫师和万年宇宙计划，那就注定失败。在某些顶级初创公司，每位高管都配有专属巫师。

🎭: The new thing in San Francisco is no longer chief of staff or MTS. It's wizards. Everybody's got to have a wizard. If yo...

大佬观点现象/趋势

09:54

Berryxia.AI@berryxia

61

陶哲轩点破AI核心矛盾：简单数学与不可预测的行为

菲尔兹奖得主陶哲轩指出，当前大语言模型（LLM）的数学基础（线性代数、矩阵乘法、微积分）其实很简单，本科生即可掌握。我们清楚如何构建和运行这些模型。真正的核心谜题在于，我们无法可靠预测它们为何在某些任务上表现出色，却在另一些任务上失败。关键在于现实世界的数据（如自然语言）处于“中间地带”——既非纯噪声，也非完全结构化，而是部分有序、部分随机。目前数学界对此类中间状态的理论非常薄弱，导致我们能描述模型机制，却无法解释其能力跃升或给出可靠的任务级预测。这种“简单机制”与“难以预测的行为”之间的矛盾，是当前AI领域的核心难题。

Rohan Paul: Terence Tao says the math behind today's LLMs is actually simple. Training and running them mostly uses linear algebra, ...

大佬观点推理

08:54

ginobefun@hongming731

57

当软件容易被创作，新时代的产品长什么样？

AI创业当前的核心挑战并非技术实现，而是功能同质化导致产品发布门槛提高。随着大模型降低开发成本，功能稀缺性已消失，价值转向独特的情感触点与用户连接。模型厂商正直接涉足垂直领域，挤压中间层生存空间，正面竞争模型能力难以取胜。未来或涌现众多“小而美”产品，像泡泡玛特一样，依靠独特品味、社群认同和世界观吸引付费用户，重新定义好产品的标准。

大佬观点现象/趋势

08:54

ginobefun@hongming731

68

Box CEO Aaron Levie：现在是创立AI公司的最佳时机

Box CEO Aaron Levie认为，AI是继大型机、PC、互联网和云之后又一次十年一遇的平台迁移，目前仍处早期，存在约三年的黄金创业窗口。成功关键在于在此期间建立起数据和工作流的优势，以构建结构性护城河。他反驳了“AI将取代软件工程师”的观点，指出部署、集成和问责仍需人类，并提出了“问责差距”概念。看好的方向包括垂直AI、Agent基础设施及AI能显著提升效率的专业服务公司。

智能体大佬观点现象/趋势

08:53

meng shao@shao__meng

63

Atomic Bot发布Qwen 35B任务视频对比，引发OpenClaw与Hermes创始人性能辩论

Atomic Bot发布基于本地模型Qwen 35B的真实任务对比视频，显示OpenClaw在任务完成时间（12分01秒）和token效率上优于Hermes Agent（33分01秒）。OpenClaw创始人@steipete转发结果并强调性能策略见效。Hermes联创@Teknium反驳基准不科学，指出单次运行、模型随机性等问题，并引用公开质量基准及真实用户数据证明Hermes领先，如用户日token量已达OpenClaw的2.5倍。双方各执己见，凸显了AI代理评估标准的争议。

Peter Steinberger 🦞: Looks like our focus on performance paid off.

智能体大佬观点现象/趋势

08:08

Ethan Mollick@emollick

37

将ChatGPT用于个人理财很有趣，但你需要知道该问什么问题，并有足够的经验来验证假设。它确实需要内置一些预设功能，来引导人们实现高效用例，并为AI提供更好的指令。

OpenAI 大佬观点

07:35

Greg Brockman@gdb

39

tokens 正迅速成为解决问题的通用输入

OpenAI 大佬观点

06:46

宝玉@dotey

47

吐槽一下 Claude Code Desktop 的设计

用户集中批评了Claude Code Desktop的几项设计缺陷：会话模式缺乏智能记忆，默认沿用上次的Plan模式；项目管理混乱，所有项目混杂在侧边栏；右侧面板并排布局，多开时相互挤占空间；此外，用户认为将Cowork和Code拆分为两个独立产品并无必要。

Anthropic 大佬观点编码

06:43

Emad@EMostaque

30

谁在建造纳米机器人？这似乎是库兹韦尔预测的最后一步

其他大佬观点

06:03

Chubby♨️@kimmonismus

60

Claude Mythos惊现Google Cloud控制台引困惑

Claude Mythos模型近日意外出现在Google Cloud控制台，且其预览标签已消失，观察者据此猜测Anthropic可能正准备公开发布该模型，类似此前Opus 4.7发布前的先例。然而，Anthropic曾多次公开表示，出于风险考虑不会发布Mythos，且该模型已被证实能力极强，因此部分观点认为该公司此刻进行彻底转向并发布该模型的可能性极低，这也会使其显得不够专业。用户对此表示困惑，强调无法想象任何发布场景，并引用推文示例佐证模型实力。整体上，事件引发猜测，但基于官方立场，实际发布概率被认为较小。

AiBattle: Claude Mythos now appears in the Google Cloud console, which was not the case yesterday The preview label is also gone. ...

Anthropic 大佬观点推理

05:32

Hacker News 热门（buzzing.cc 中文翻译）

59

技术法西斯主义

文章《技术法西斯主义》探讨了技术如何被用于强化威权控制，形成一种新型的社会治理模式。核心观点指出，通过大规模监控、数据收集和算法自动化决策，技术正被系统地用于压制异议、操纵舆论和固化社会不平等。这种“技术法西斯主义”模糊了公共与私人权力的界限，使得控制更为隐蔽和高效。文中警示，若不加以约束，技术工具可能加剧社会分裂，侵蚀民主根基。该文在Hacker News上获得105点关注，引发广泛讨论。

大佬观点安全/对齐现象/趋势

05:08

elvis@omarsar0

71

工具使用代理认知与行动脱节机制研究

该可解释性论文聚焦工具使用代理，通过探测隐藏状态发现模型常能识别应调用工具，但实际调用失败，不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段，而非认知本身。内部探测方向可解码，但后期层的最后令牌机制使信号旋转，几乎与产生的行动正交。研究旨在预测干预措施效果，指出常见归因如提示或训练不足可能忽略后期层几何结构，这为工具使用提示A/B测试中的性能上限提供了合理解释。

智能体 MCP/工具大佬观点

04:41

Peter Steinberger 🦞@steipete

42

如果你还没有切换到 Codex，就开发你的 Claude 代码。

Chris Baker: Yeah that was a lot lol. Lots more to fix. Nice work @steipete https://clawpatch.ai/

大佬观点编码

03:54

Dwarkesh Patel：Podcast & Blog（RSS）

51

RLVR 可能在科学领域格外糟糕

RLVR（强化学习与验证）在科学理论验证中可能表现出不成比例的缺陷。科学理论的验证循环周期长达数十年甚至数个世纪，且当前被视为更优的理论实际上常会做出更差的预测。这一矛盾揭示了基于短期反馈的强化学习范式与科学探索长期性、复杂性之间的根本冲突，凸显了现有AI方法在应对科学发现这类超长反馈周期任务时存在的结构性局限。

大佬观点推理

03:54

Dwarkesh Patel：Podcast & Blog（RSS）

49

The mistake of conflating intelligence and power

文章指出将“智能”与“权力”混为一谈是一个根本性错误。如果仅将“智能”定义为“在广泛领域中实现目标的能力”，那么斯大林将成为有史以来最“智能”的人。这一观点揭示了当前对人工智能（如GPT、Claude、LLaMA等）能力的讨论中，可能存在的概念混淆和评估偏差。真正的智能应包含更丰富的维度，而非单纯以目标达成的效力或权力大小来衡量。

大佬观点安全/对齐

03:16

宝玉@dotey

18

每次 Codex 一重置就后悔之前没多用一点

Tibo: Codex usage limits have now been reset across all paid plans. Enjoy the weekend!

OpenAI 大佬观点

02:43

AYi@AYi_AInotes

63

AI工具将十年开发经验压缩成一行命令

Greg Brockman转发的Codex Skill "Complexity Optimizer"通过一行npx命令安装，能在几秒内扫描代码库，精准定位O(n²)、N+1查询等性能问题，并提供文件、行号、优化建议和风险等级。其核心设计是仅报告问题而不自动修改，将决策权留给开发者。这标志着AI的关注点正从“更快地写代码”转向“发现人类难以察觉的复杂问题”，将十年项目经验才能积累的诊断能力封装成可一键调用的技能。未来，类似的安全审计、架构检测等工具将大量涌现。资深开发者的护城河因此被重新定义：从依靠个人眼力发现问题，转向依靠业务判断力来评估和落地AI提供的解决方案。

Greg Brockman: codex for improving computational complexity

MCP/工具大佬观点编码

02:35

Greg Brockman@gdb

27

在ChatGPT应用中使用Codex是如此自由的体验让你意识到平时被电脑束缚得有多深

OpenAI 大佬观点

01:58

Yann LeCun@ylecun

49

厌倦了胜利【引用 @DrCatharineY】：美国科学正面临巨大风险。

Dr. Catharine Young: American science is at extraordinary risk. NIH has awarded less than half as many grants as it has compared to the past ...

Meta 大佬观点政策/监管

01:32

Nathan Lambert：Interconnects（RSS）

53

最新开源成果（#21）：开源模型盛宴！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

本月开源AI模型领域迎来密集发布，包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新，反映出开源社区当前高速迭代的竞争态势。

DeepSeek Google 大佬观点开源生态

01:05

Greg Brockman@gdb

43

Codex应用独树一帜。 "Mac端的智能Excel"是个有趣的描述。

swyx 🇸🇬 AIE Singapore!: gotta say Codex is completely unrecognizable from 3 months ago. guys went extreme founder mode on this thing @gabrielchu...

智能体 OpenAI 大佬观点

00:54

Berryxia.AI@berryxia

48

重复造轮子的人不是傻子，有没有一种可能只是真的是在拿AI练手和提升「熟练度」！😊

5月16日

23:33

Chubby♨️@kimmonismus

38

这就是你要面对的竞争。 30天130万token。燃烧更多token，否则你将无法成功。【引用 @steipete】：The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar

Peter Steinberger 🦞: The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar

大佬观点部署/工程

1…43 444546 47…50