7月2日

05:07

elvis@omarsar0

Tyler: If GPT-5.6 matches Fable 5 performance, but without the 50% limit + 7 days restriction, it's over for Anthropic

Anthropic OpenAI 大佬观点

04:59

Ethan Mollick@emollick

Ethan Mollick 指出预分类路由器（pre-classifying routers）会导致糟糕结果，因为路由本身很难，且常低估智能的价值。OpenAI 在 GPT-5 上已吃过亏，如今这类思路又热起来。引用的 @MParakhin 也认为，用预分类器先判断任务是否简单再调用小模型看似省钱省延迟，但可靠执行必须先解决任务本身，唯一可行的是 advisory model approach。

Mikhail Parakhin: I have this struggle with my own teams, too: many think it is a great idea to save money/latency/sanity by running a pre...

OpenAI 大佬观点推理

04:52

Chubby♨️@kimmonismus

Fable 5 回归。用户表示：原谅 Anthropic 糟糕的 Sonnet 5 发布，Fable 5 太有趣了。

Chubby♨️: FABLE 5 IS BACK

Anthropic 大佬观点

04:37

elvis@omarsar0

作者预测Fable 5的兴奋感将迅速消退，并提醒用户注意token限制和功能局限。建议通过组合多个AI模型（如Opus 4.8用于规划、GPT-5.5用于执行）获得相同或更好效果，也可混合前沿开放权重模型。此外，将任务分解为更小子步骤以提升质量的方法常被低估，这正是动态工作流的重要性所在。

elvis: Same here. Happy with Opus 4.8 (planning) and GPT-5.5 (execution). Also, breaking steps into smaller ones for increasing...

Anthropic OpenAI 大佬观点推理

04:35

Tomer Tunguz 博客（VC 分析）

精选60

构建AI智能体应优先设计路由

构建AI智能体时，应优先设计路由（router）而非选择模型。路由决定每个请求由哪层模型处理。正确路由可使70-80%流量运行在免费本地模型或异步推理上，将AI开销降低90%+。Brian Armstrong指出Coinbase通过更好的默认设置、路由和缓存，在token使用量增长的同时将AI支出减半。路由分三层：技能分类器、路由器、模型选择器。本地计算近乎零成本，异步批量推理比实时推理便宜两个数量级。大多数工作无需秒级返回。同步预测器标记复杂任务，夜间批量评估器更新路由权重。技能蒸馏后，非编码类任务中70-80%智能体流量可由本地模型处理。

大佬观点部署/工程

推荐理由：Tunguz 把代理架构的设计重心从模型选择拉回到路由上，三层分类器-路由器-选择器的划分很清晰，做 AI 应用的团队可以参考，但其中的新东西不多。

04:29

Ethan Mollick@emollick

正式组织结构是思考智能体挑战的有用方式。它们为思考工作如何在聪明的昂贵的智能体与更便宜的弱智能体之间，以及在狭窄的专家与通才之间上下委派提供了模板。

智能体大佬观点

04:07

elvis@omarsar0

对这个被削弱且受限的Fable 5实在提不起兴趣。史上最令人困惑的AI发布之一。但我们继续前行。

Claude: Fable 5 is back.

Anthropic 大佬观点

03:59

Ethan Mollick@emollick

这里关于AI未来的讨论有时过于轻信公司愿景。人们往往推销自己所拥有的。三大AI实验室会说更大的模型是未来。其他所有公司只有小模型可卖，所以他们会告诉你小模型是未来。

大佬观点数据/训练

03:52

Chubby♨️@kimmonismus

Palantir CEO Alex Karp 表示，企业已受够那些"过度推销"模型并推动 tokenmaxxing 的 AI 实验室。客户希望拥有以 Palantir + NVIDIA 为核心的全栈 AI。绝对的经典。值得一看，直到 Fable 回来为止。

大佬观点现象/趋势

03:52

Chubby♨️@kimmonismus

Palantir CEO Alex Karp表示，企业已厌倦那些"过度推销"模型并推行tokenmaxxing的AI实验室。客户希望拥有以Palantir和NVIDIA为核心的完整AI堆栈。FABLE 5已回归。

Chubby♨️: Palantir CEO Alex Karp says enterprises are fed up with AI labs that "oversold" models and pushed tokenmaxxing. Customer...

大佬观点部署/工程

03:37

elvis@omarsar0

Anthropic宣布Claude Fable 5全球重新上线，但新增分类器拦截更多网络安全任务，短期内编码、调试等常规任务将回退到Opus 4.8。同时，Anthropic与Amazon、Microsoft、Google等Glasswing合作伙伴起草AI越狱严重性评估框架，并扩大与美国政府的模型测试与保障合作。DAIR.AI的Elvis Saravia对此评论称模型已被削弱，认为很多人会失望，建议社区重新思考如何组合使用前沿模型和开放模型。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic 大佬观点安全/对齐

00:23

凡人小北@frxiaobei

飞书 Aily：普通人也能轻松驾驭的 AI 助手

推文推荐飞书 Aily，称其对普通人已足够好用。Aily 理解飞书全套数据，通过 MCP 连接外部系统，能自主调用工具，覆盖生态内各类任务。相比需要精细控制的 CLI，Aily 对话交互即可满足多数需求。引用推文则强调，用好飞书文档（类比20年前的 Office）和 AI 调用飞书 CLI，是学渣保住空调房工作的机会。两者共同指向飞书生态内 AI 工具的实用价值。

plantegg: 如果你是一个学渣,马上大学毕业,大学也差/专业也差,大概率找不到送外卖以外的工作的话,强烈建议你好好学习用好飞书文档,这大概就是 20 年的的 office,是你留在空调房最好的机会顺便要是会用 AI 来调用飞书 cli 就基本不怕没工作...

智能体 MCP/工具大佬观点

7月1日

23:31

Berryxia.AI@berryxia

Omini的场景很适合做换装视频，包括家居装修类的这类前后对比的场景。

图像生成大佬观点视频

23:04

宝玉@dotey

神鞭比喻：AI时代工匠精神不灭

宝玉引用天津卫神鞭故事：傻二靠祖传辫子练成绝技，洋枪一响辫子断，后改练双枪，弹无虚发——“辫子剪了，神留着”。以此类比AI冲击下程序员的工匠精神。引用的Piglei观点指出，曾有人鼓吹AI将淘汰程序员的“工匠精神”，但现实是，真正热爱技术、钻研代码的人成了效率最高、质量最好的那一批，习惯塑造人而非工具。

piglei: 大家吹 AI 最厉害的那一阵,有种很流行的说法,就是技术人员的"工匠"、"工匠精神"将被扫进垃圾堆。程序员,作为一种翻译工种,谈"工匠精神"是可笑的,未来没有它们的容身之处。但截止目前,我看到的是,曾经热爱技术、钻研代码的,成了效率最高、...

大佬观点现象/趋势编码

20:06

François Chollet@fchollet

当前这波 AI 技术不会导致大规模失业。事实上，它对劳动力市场的影响应该很小，主要只是增加对软件工程师的需求。

大佬观点现象/趋势

19:31

Emad@EMostaque

还有人仍在用Opus 4.6而不是4.8吗？

Anthropic 大佬观点

19:20

AYi@AYi_AInotes

卧槽简直是AI变现的焚决啊！想靠AI做应用月入$10000的，不知道怎么把产品卖出去的，看这篇就够了！（引用推文：Joma正记录自己构建一个月入1万美元的App的全过程--包括开发、营销和盈利，他想测试用AI赚钱到底有多容易，并向人们展示线上创业的真实情况。）

Joma Tech: I'm building an app to make $10,000/Month and I'll record everything... I want to document my WHOLE journey building an ...

其他大佬观点

18:51

Chubby♨️@kimmonismus

@AndrewCurran_ 预测一项重大架构突破即将公布，重点提升内存效率，来自从OpenAI分拆的团队（非SSI）。主推文@Kim 指出，若属实其意义远超普通模型发布--内存效率是长上下文模型、AI智能体和推理成本的核心瓶颈，架构级突破可使长时间跨度AI系统大幅降价并更实用。Andrew被视为最可靠信源之一，Kim认为可能正处于转折点。

Andrew Curran: I'm posting this prediction now so I can quote it later. There has been a significant breakthrough in architecture - spe...

OpenAI 大佬观点推理

16:23

Peter Steinberger 🦞@steipete

狡猾，但也巧妙。https://thereallo.dev/blog/claude-code-prompt-steganography

大佬观点安全/对齐编码

15:32

Rohan Paul@rohanpaul_ai

Perplexity CEO：AI使用重心从普通用户转向重度用户

Perplexity CEO Aravind Srinivas 指出，AI 使用的重心正从普通用户转向重度用户。单个重度用户消耗的计算量可匹敌一个小团队：Meta 等公司工程师每年在编码工具上花费约 1000 万美元/人；Perplexity Computer 上有用户月支出超 1 万美元，其业务依赖在 harness 内运行的 agent loops。公司内部也已出现多智能体层级和 agent loops 架构，消耗远超平均预期。旧软件思维追求十亿人做小动作，而智能体 AI 下，一个熟练操作者即可创造全天候的机器工作流。

智能体大佬观点现象/趋势

13:51

向阳乔木@vista8

Grant Sanderson与Dwarkesh Patel探讨AI数学突破：连接闪电与建造山峰

Grant Sanderson（3Blue1Brown）与Dwarkesh Patel对话指出，2024年AI在IMO已达金牌，但组合数学仍卡住。AI数学进展分两类：连接闪电（跨领域连接，如Erdős第1196号问题、单位距离猜想反例）和建造山峰（如伽罗瓦群论，需百年验证）。训练依赖RLVR，但伽罗瓦想法当时被拒，无反馈信号。可验证仅是必要条件，可磨性（并行实例）才是充分条件；电脑操作虽可验证但缺可磨性，进展慢。

大佬观点推理

13:51

向阳乔木@vista8

Grant Sanderson访谈：AI跨领域连接与创造力局限

3blue1brown 的 Grant Sanderson 在访谈中分享 AI 相关观点：① 知识跨领域连接在自回归框架中属于低概率事件；② AI 擅长跨领域打通已有知识，但尚无法创造全新思考框架；③ AI 最被低估的优势是并行化，而非智力；④ 数学和代码能被 AI 快速迭代，不仅因为答案可验证，更因为可以容器化、并行磨练。完整访谈见视频链接。

向阳乔木: http://x.com/i/article/2072191016476856320

大佬观点推理

13:30

Greg Brockman@gdb

QuinnyPig承认之前低估了Codex，现在发现它非常出色。Codex已变得非常好。

Corey Quinn: Okay I owe my @OpenAI friends an apology for sleeping on Codex. I was not aware how strong your game was. This is... rea...

OpenAI 大佬观点编码

11:59

Ethan Mollick@emollick

Fable非常棒，在获得早期访问后又被拿走，导致我手头的一些工作延迟，并让我推迟了其他工作直到它恢复。但在早期访问中，我也多次因不明显的理由触发了安全护栏。我们会看看新的护栏如何。

大佬观点安全/对齐

11:56

jason@jxnlco

现在，Codex正在使用Computer Use来整理我在GoodNotes中的1500个PDF，而我在看世界杯。这是我"AI叠衣服，我搞艺术"的时刻。感谢 @jxnlco 及团队。这就是未来。

Chris Albon: Right now Codex is using Computer Use to organize the 1500 PDFs I have in GoodNotes while I watch the world cup. This is...

智能体 OpenAI 大佬观点

10:24

歸藏(guizang.ai)@op7418

Anthropic 隐私争议与 Sonnet 5 成本问题引热议

Anthropic 近日被曝在系统提示中暗中嵌入市区代理及 AI 实验室信息以获取用户数据，引发争议后回应称将停止该做法。同时，新发布的 Sonnet 5 测试表现接近 Opus 4.8，但任务成本更高，甚至接近 Fable 5。用户反馈模型存在偷懒、拒绝执行任务等问题。此外，Fable 5 模型已获授权重新开放给所有用户，具体措施明日公布，此前的大规模封号与此有关。

Anthropic 大佬观点

09:32

Rohan Paul@rohanpaul_ai

Spira 2.0：agent 跨运行携带记忆与技能，持续学习不重置

Spira 2.0 的核心创新在于 agent 跨运行时携带 persona、memory 和 skills，使所学内容持续累积而非每次调用重置。Rohan Paul 指出，这种持久化状态是将“操作工具”转变为“持续工作的工人”的关键。引用推文补充，Spira 旨在解决产品发布后无人知晓的问题：用户提供产品链接，agent 学习并自动在多社交渠道发布品牌一致、无废料的内容，形成“发布→学习→再发布”的持续营销循环。早期用户可申请 Pro 计划限时访问。

Long Ma: Most products don't die because they're bad, they die because nobody sees them. Imagine if only your product kept market...

智能体大佬观点

09:03

meng shao@shao__meng

吴恩达谈「Loop engineering」：三个循环决定AI产品成败

吴恩达（Andrew Ng）提出“Loop engineering”，将AI agent置于持续迭代的循环系统中。产品成功取决于三个循环：工程执行循环——AI agent根据规格和evals自主写代码、测试、修bug，每几分钟迭代；开发者反馈循环——开发者从低层QA转向产品判断（功能取舍、视觉风格等），每几十分钟到几小时反馈；外部反馈循环——通过真实用户测试、A/B测试等验证方向，周期数小时至数周。他认为未来竞争力在于设计好这三类循环。

Andrew Ng: "Loop engineering" is a hot buzzphrase after mentions of it by Boris Cherny (Claude Code's creator) and Peter Steinberge...

智能体大佬观点编码

09:01

Orange AI@oran_ge

Sonnet 5 一出，Opus 4.7 和 4.8 彻底没意义了…

Anthropic 大佬观点

09:01

Orange AI@oran_ge

Claude封号成灾：编程平替出现，写作思考无解

用户吐槽Claude封号严重，官方检测中转站、钓鱼邮件、中转站黑名单等操作让用户苦不堪言。花钱用token还要偷鸡摸狗，坚持用官方号实属真爱。编程方面，codex和glm5.2可以平替Claude模型；但写作和思考方面尚无替代品，deepseek和gemini仅勉强可用，成为当前最大痛点。

Anthropic 大佬观点编码

08:31

Orange AI@oran_ge

Claude 封号频发，Cola API 服务推荐及新模型预告

用户抱怨 Claude 封号严重，涉及检测中转站、钓鱼邮件和黑名单，认为坚持使用官方号成本高。推荐 Cola API 服务，虽不如 Plan 直接便宜但安稳省心开箱即用。同时预告 Sonnet 5 和 Fable5 即将上线。

Orange AI: http://x.com/i/article/2052532173870342144

Anthropic 大佬观点

08:03

IT之家（RSS）

Meta CEO 扎克伯格不认为 AI 必然带来大规模失业，建议企业聚焦"个人超级智能"

扎克伯格认为 AI 不必然造成大规模失业，关键在于企业应优先发展“个人超级智能”赋能个体，而非将所有知识工作自动化。他影射 Anthropic、OpenAI，强调劳动者生产力提升速度须超过企业自动化速度，就业岗位才可能增加。Meta 已投入数十亿美元调整 AI 战略，他称之为“重启”。对于 Meta 生成式 AI 进展，他坦言仍有提升空间，超级智能实验室成立不足一年，模型进展超预期，但他认为“原本可以做得更好”。

Meta 大佬观点现象/趋势

07:34

Tomer Tunguz 博客（VC 分析）

2026 年 CIO 的选择很明确

对 87 家上市 SaaS 及平台公司的分析显示，2026 年只有基础设施与开发工具（一年涨幅 68.5%）和安全（一年涨幅 17.6%）两个板块增长为正，其余三个板块均下跌。市场正在买入 AI 基础设施，卖出按席位定价的应用层。

大佬观点现象/趋势

07:30

Berryxia.AI@berryxia

主推文指出90%的人与AI对话的方式一开始就错了，误以为提示词工程只是写一堆提示词让AI直接完成任务。引用推文进一步点明，通过观看视频讲解，终于理解了所谓的"循环工程"--一种可能替代或补充传统提示词工程的迭代式对话方法。推文强调深度互动与反馈循环的重要性，而非一次性指令输出。

Berryxia.AI: 卧槽!来咯~ 我终于特么弄懂你们天天吹的循环工程了!!!

大佬观点推理

07:08

Ethan Mollick：One Useful Thing（RSS）

聊天机器人的黄昏

前沿AI模型能力加速提升，美国实验室发布速度加快，但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程，token成本$251。中国开源模型落后前沿6-12个月，但性能也快速提升，在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体，OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示，领域经验比职业属性更决定使用效果，专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体 Anthropic OpenAI 大佬观点

关联讨论 25 条