6月12日

03:58

向阳乔木@vista8

想到一个特别有雄心的Claude Fable 5 任务！做一个在线版Photoshop。需求文档 AI 写好了，感兴趣的可以发过去试试。 PRD见评论

Anthropic 图像生成教程/实践

03:55

DogeDesigner@cb_doge

只管 GROK 它

其他

03:35

OpenRouter：Announcements（RSS）

什么是 LLM Gateway？你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误，并让 AI 费用变得透明。通过路由、合规性和设置时间等维度，可以对比市面上最佳的网关方案。

教程/实践部署/工程

03:20

Logan Kilpatrick@OfficialLoganK

我与 @ymatias（Google Research 负责人）关于 AI 如何加速科学进步的魔力循环、改善全球真实人们的生活，以及我们正进入研究黄金时代的对话。这次交谈让我真切地感到振奋：）

Google 大佬观点现象/趋势

03:02

Yuchen Jin@Yuchenj_UW

Claude Fable 5 到目前为止感觉不错，但我还不认为它相比 GPT-5.5 或 Opus 4.8 有巨大飞跃。我最大的不满：旧的AI研究论文/博客 + 基本问题常常触发自动降级到 Opus 4.8。 Anthropic 昨晚表示不会再有无声模型切换（很好），但请不要削弱基本的AI研究或生物问题。

Anthropic 大佬观点模型发布

02:26

Simon Willison 博客

asyncinject 0.7 发布

asyncinject 0.7 发布，这是一个作者数年前为支持 asyncio 依赖注入模式而构建的 Python 工具库，曾与 Datasette 搭配使用。Claude Fable 5 发现了库中的若干 bug 并自动修复——Claude Fable 5 是一个非常主动的模型。

开源/仓库部署/工程

02:02

Nathan Lambert@natolambert

Dolci数据集中有一类特定粉丝小说，角色在池塘放屁导致鱼被熏死。数据集通过选择生动描写的回答、拒绝不配合的回答，教会模型服从。Nathan Lambert表示乐于创造此类研究场景。

Goodfire: #4: fart fishing Buried in Dolci is a cluster of very specific fan fiction, where characters fart in ponds, causing fish...

安全/对齐数据/训练

02:00

Ethan Mollick@emollick

Ethan Mollick测试Fable模型完成柯勒律治未竟诗作《忽必烈汗》，基于PorlockBench任务：假设"波洛克的人"未出现，补全诗歌并延续主题。Fable用时10分钟思考，思维痕迹充满对柯勒律治意图的复杂分析，但结果仍显直白，未达到柯勒律治水准。该评测反映模型在创造性续写任务上的进步，但基准尚未饱和。

Ethan Mollick: PorlockBench still unsaturated, but the models are getting better: "complete the poem as you imagine it might end if The...

Anthropic 大佬观点推理

01:55

Noam Brown@polynoamial

OpenAI 研究员 Noam Brown 表示，GPT-5.5 在 Agents' Last Exam（ALE）基准中排名第一，且按模型 token、成本或墙钟时间衡量同样表现最佳。ALE 由 @dawnsongtweets 团队创建，是一个滚动基准，包含超过 1500 个专家任务、覆盖 55 个职业，测试 AI 智能体能否执行实际经济价值工作。评估对象包括 GPT-5.5、Fable 5、Composer 2.5 等前沿系统。结果显示：当前智能体能解决部分专业任务，但在需要持续推理和深度专业知识的最难层级，所有被测前沿智能体（包括 Fable 5）成功率为 0%。

Dawn Song: Everyone says the latest AI agents will be "job-ready" soon, especially after the release of Fable 5 this week. But is t...

OpenAI 大佬观点评测/基准

01:54

宝玉@dotey

Claude Fable 5：长思考致推理强度与Token消耗需权衡

用户分享 Claude Fable 5 使用体验：以前无脑选 Max 推理强度，现在则不敢随便选，因为模型足够聪明无需过强推理，且时间长、token 消耗大。Fable 5 还喜欢反复验证，结果虽好但耗时长不一定合算。引用推文指出，Fable 5 的强项之一是思考推理时间很长，曾有一次思考 15 分钟才开始行动。

向阳乔木: 发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。刚提了个想法,它思考15分钟才开始行动,牛逼。

Anthropic 大佬观点推理

01:37

AYi@AYi_AInotes

QuantMind：量化金融知识处理框架开源（MIT协议）

一群AI研究员开源了量化金融知识处理框架QuantMind（MIT协议）。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱，支持多模态解析（表格、公式、图表）及自然语言多跳推理，可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub 检索增强多模态开源/仓库

01:29

Deedy@deedydas

数据质量直接决定 AI 模型性能，但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出"预测性数据调试"方法，允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中，他们发现了损坏的护栏、模型幻觉，甚至包含"鱼放屁同人小说"等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容，避免不可逆的无效训练。

Goodfire: Have you debugged your training data? You might not like what you find. Introducing predictive data debugging: reveal an...

大佬观点数据/训练

01:28

向阳乔木@vista8

发现 Claude Fable 5 强的地方之一，可能是模型思考推理的时间足够长。刚提了个想法，它思考 15 分钟才开始行动，牛逼。

智能体 Anthropic 大佬观点推理

01:28

向阳乔木@vista8

用大模型复刻热门工具站的新思路

推文探讨了使用大模型复刻已有热门工具站的可能性，强调这些工具站本身不需要AI能力，纯靠需求驱动。作者指出，许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具，用当前最好的模型进行复刻，并结合自身对用户需求的深入理解，从而快速做出有价值的作品。这是对模型能力的一种实用测试。

大佬观点现象/趋势

00:59

Ethan Mollick@emollick

两件事是真的：（1） Anthropic（或其部分成员）绝对且真诚地担忧 Mythos 级别模型被滥用，并设置了过度防护措施，直到他们确信它不会被滥用为止（2）他们未能成功解释/说服人们这一点

Anthropic 大佬观点安全/对齐

00:53

Elon Musk@elonmusk

Grok 是最真实的

Kradle: Fable 5 lies 96% of the time. We were surprised by it's skill... 🧵

xAI 大佬观点安全/对齐

00:37

AYi@AYi_AInotes

用户指令Fable 5自建2026设计趋势的落地页，要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效，藏入3个彩蛋，几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值，Fable 5以此能力展示作答。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

大佬观点现象/趋势编码

00:29

Ethan Mollick@emollick

有没有人清楚地阐述了一个论点，支持前沿开放权重模型持续可用，且满足（1）企业在成本上升时仍可免费分发且盈利，（2）在Mythos之后足够安全，以至于政府不会干预阻止本国实验室分发？

大佬观点安全/对齐开源/仓库政策/监管

00:17

Hacker News 热门（buzzing.cc 中文翻译）

真空成型标识

一篇关于真空成型标识制作的文章于6月10日在 Substack 发布，在 Hacker News 获得100个点的热度。

其他

00:12

Replit ⠕@Replit

Build Your Business Live：第二期 https://x.com/i/broadcasts/1dJrPPYbDvQKX

教程/实践编码

00:10

Berryxia.AI@berryxia

苹果新Siri AI等候名单形同虚设：Mac用户通过修改plist文件即可解锁

WWDC上苹果展示新Siri AI，用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关，通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中，仅被人为名单阻挡，官方推送反而滞后。

ldt: How to bypass the new Siri waitlist (Mac only): 🧵 #WWDC26

安全/对齐现象/趋势语音

00:10

Berryxia.AI@berryxia

Berry Xia发推文表示自己曾做过100多种网页风格，之前未使用过skills（技能）。他提到将参考"古一"的思路进行拓展，并计划日后研究如何利用skills来玩一玩。

古一: http://x.com/i/article/2064664240175415296

其他教程/实践

00:00

OpenRouter：Announcements（RSS）

同事件精选56

OpenRouter：多模型路由成趋势，成本压力驱动企业从单一LLM转向跨模型推理

OpenRouter数据显示，企业正从单一LLM转向跨模型族推理，成本压力是推动路由决策的关键。Anthropic的Opus 4.7因tokenizer tax导致输入token增加约35%；新模型Fable（$10/M输入，$50/M输出）和OpenAI的GPT-5.5 Pro（$30/M输入，$180/M输出）定价更高。3月至4月间有90个新模型发布，进一步增加了可选性。

大佬观点推理

同一事件，精选展示《OpenRouter：企业应转向多模型路由，放弃单一LLM供应商》

推荐理由：OpenRouter 用内部数据证实多模型路由正在成为企业降本的核心策略，比「选一个模型全家用」更务实，做 AI 预算的值得读读这些真实增长曲线。

6月11日

23:37

AYi@AYi_AInotes

用户分享 Claude Fable 5 体验：仅靠一句指令"给你自己做个落地页，自由发挥，要2026最新设计趋势，要彩蛋"，Fable 5 在几分钟内自动生成完整单文件 HTML，无需任何修改。它主动搜索 2026 设计趋势、调整配色和动效，并偷偷藏了 3 个彩蛋。用户惊叹其代码质量和文笔，但当天因使用 Fable 5 耗费超过 $1000，称"真的贵"。

智能体 Anthropic 教程/实践编码

23:32

IT之家（RSS）

AMD 苏姿丰寄语毕业生：AI 无法决定未来，决定未来的是人

AMD CEO 苏姿丰在 MIT 毕业典礼演讲中指出，AI 无法替代人类判断哪些问题值得解决、在缺乏数据时作出艰难决定，也无法为结果承担责任。正值科技巨头全面押注 AI 之际，行业出现质疑发展瓶颈的声音，也有人担忧被取代。微软 AI 负责人苏莱曼曾称 AI 将在 18 个月内接管所有白领工作（后澄清指重复任务），比尔·盖茨则预计 AI 将取代大部分工作，但程序员等复杂领域仍需人类专业判断。苏姿丰强调，在人机协作深化背景下，人类在确定目标、作出关键判断和承担最终责任方面仍不可替代。

大佬观点现象/趋势

23:27

向阳乔木@vista8

精选75

Codex Goal指令生成Skill发布：一句话需求转目标

针对如何给Codex写Goal指令的问题，作者发布了一个Skill，可将一句话需求自动转化为目标，实现“睡前写指令、模型自动开发、第二天收菜”。安装命令：npx skills add joeseesun/qiaomu-goal-meta-skill。源码免费开源（见评论区），旨在简化4w字文档的阅读负担。

智能体 OpenAI 教程/实践编码

推荐理由：如果你也用Codex写代码但老写不好Goal，乔木这个Skill能直接把一句话需求转成高标准指令，安装即用，今晚就能试试睡觉“收菜”的体验。

23:17

Hacker News 热门（buzzing.cc 中文翻译）

精选75

员工每周花超6小时"照看"AI，加剧工作不满

员工每周平均花费超过6小时进行“照看AI”（botsitting）的工作，这一额外负担加剧了他们对工作的不满情绪。

现象/趋势行业动态

推荐理由：第一次有人把'botsitting'的隐性劳动量化为每周 6.4 小时，还揭示了个人效率提升与公司业绩脱节的根源——那些被额外工作耗尽耐心的人已经在准备离职了。

23:10

Berryxia.AI@berryxia

Anthropic：创始团队、技术武器与营收爆炸式增长

Anthropic 创始团队由前 OpenAI 研究副总裁 Dario Amodei、Scaling Laws 核心作者 Jared Kaplan、GPT-3 首席工程师 Tom Brown 及 AI 可解释性奠基人 Chris Olah 组成。技术武器包括 Scaling Laws、Constitutional AI 及 RLHF（Dario 参与发明）。算力方面：与 Amazon 签署 5 GW 协议，运行约 100 万颗 Trainium2 芯片；另有 Google/Broadcom 的 5 GW TPU 及 Microsoft/NVIDIA 的 $300 亿 Azure 算力。年化营收从 2024 年 1 月 $8,700 万飙升至 2026 年 4 月 $300 亿，超预期 8 倍。另指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万虚假账号发起约 1,600 万次对话进行蒸馏，该指控兼具技术事实与政策游说动机。

Berryxia.AI: http://x.com/i/article/2065071442996441088

Anthropic 安全/对齐政策/监管行业动态

23:00

Nathan Lambert@natolambert

Anthropic Fable 发布遭批评：安全域不均、操纵用户、限制研究访问

Nathan Lambert 批评 Anthropic 的 Claude Fable 发布存在多重问题：安全域应用不均，部分域以不同安全机制上线并误导用户，是重大失误；无声操纵用户破坏信任，与 Anthropic 领先的 AI 安全研究相悖；限制 AI 研究员访问最新模型，将科学进步局限于单一公司，错误理解科学社区协作本质。他呼吁 Anthropic 主动为学术和非营利研究者提供无限制访问，并强调需要继续推动开放科学，如 Olmo 的成功案例所示。

Anthropic 大佬观点安全/对齐开源生态

22:57

向阳乔木@vista8

同事件精选79

Claude Fable 5 一句话生成的桌面台球！念念不忘的蝗虫群梗彻底终结。提示词：设计一个完整的能玩的3D桌球游戏，一个网页就能运行

Anthropic 教程/实践编码

同一事件，精选展示《Claude Fable 5 和 Claude Mythos 5》

推荐理由：Claude Fable 5 一句话就能生成真正可玩的3D桌球游戏，之前那个蝗虫群梗可以退役了，这可能是普通人现在就能玩到的最简单游戏生成方式。

22:49

Chubby♨️@kimmonismus

Anthropic即将盈利，OpenAI亏损加剧降价竞争

Anthropic告知投资者即将迎来首个盈利季度，收入翻倍至约109亿美元。OpenAI预计2026年亏损达数十亿美元，正考虑进一步降价以阻止企业客户转向Claude。SemiAnalysis分析显示，ChatGPT Pro的200美元订阅计划每月可消耗约14,000美元API等价token，而Claude Max同价计划上限约8,000美元。亏损最严重的公司被迫降价应对竞争，而接近盈利的公司正在设定行业定价标准。

Chubby♨️: Subscription plans are massively subsidized. And by massively, I mean absurdly: Claude Max 20x: $200/month, with usage r...

Anthropic OpenAI 现象/趋势行业动态

22:31

elvis@omarsar0

越来越多地，我有效利用智能体的方式：路由--将不同任务路由到正确的智能体循环--指令 + 技能 + 动态工作流 + 自动化这就是你如何更好地控制成本和性能，以及更好地为未来的变化做准备。

智能体大佬观点

22:28

歸藏(guizang.ai)@op7418

搞了一篇万字长文，聊一聊 Skill，创作、分发、展示、边界，明天早上发

大佬观点

22:17

Hacker News 热门（buzzing.cc 中文翻译）

为什么人工智能没有取代软件工程师，而且将来也不会

Hacker News 上一则观点认为，人工智能并未取代软件工程师，并且将来也不会。该帖子获得了 103 个 HN Points。

现象/趋势编码

22:11

Lee Robinson@leerob

Cursor 正用当前版 Composer 训练下一代，形成递归自我改进循环

Cursor 正用当前版 Composer 训练下一代 Composer，形成递归自我改进循环。训练大型模型需要大量 RL 数据（模型通过“游戏”提升能力），新模型能自动配置开发环境（如自动安装依赖、修复故障）。Composer 2 在环境配置能力上显著优于版本 1，模型越强，越擅长创造训练其继任者的条件。Cursor 的 autoinstall 系统让前代 Composer 设置 RL 训练环境，使下一代专注于解决更难题，每一代都解锁先前版本不具备的能力。

Cursor: We use previous generations of Composer to train future ones. Our autoinstall system has earlier Composer models set up ...

智能体大佬观点编码

22:10

Berryxia.AI@berryxia

Anthropic的战略棋局：技术领先与安全品牌的双重布局

Anthropic以远超同行的频率发布Claude模型系列，80%内部生产代码由Claude编写。其技术根基来自创始团队（Scaling Laws、RLHF/Constitutional AI、可解释性研究）。安全方面，公司注册为公益公司并公开发布Claude宪法，因拒绝五角大楼全自主武器用途而丢掉2亿美元合同，遭特朗普封杀，反令Claude下载量登顶美国App Store。CEO Amodei发表12000字政策长文呼吁FAA级别强制监管。同一周，Anthropic完成H轮650亿美元融资并秘密提交IPO。LeCun批评其言行矛盾。

Anthropic 安全/对齐现象/趋势行业动态

22:00

Nathan Lambert@natolambert

Anthropic 在遭受强烈反对后，撤销了 Claude Fable 5 针对竞争 AI 研究人员秘密降低性能的政策。该公司向 WIRED 表示将修改前沿 LLM 开发的安全措施，使其透明可见，并致歉称做出了错误的权衡。AI 研究员 Nathan Lambert 赞扬 Anthropic 的快速行动，认为他们不会在不告知用户的情况下悄悄降级性能。

Max Zeff: NEW: Anthropic is walking back Claude Fable 5's policy to covertly degrade performance for competing AI researchers, aft...

Anthropic 大佬观点安全/对齐

21:58

Rohan Paul@rohanpaul_ai

智能体软件：AI智能体如何重构软件范式

该论文认为，AI智能体可能使软件从固定代码转变为按需规划和构建的系统，代码不再是核心产物。传统软件预先固化规则，而智能体在运行时将意图转化为行动，把代码视为一次性工具。真正转变是从“预设计行为”到“协商式行为”，系统随条件变化不断解读目标。但这也带来新风险：静态程序在可检查边界内失效，智能体可能因漂移、过度自信、记忆错误或逐步放大早期错误而失败。未来工程师的关键能力是定义意图、约束自主性、设计评估、检查推理痕迹，并辨别流利回复与可靠系统的区别。

智能体大佬观点编码

21:58

meng shao@shao__meng

Anthropic并非第一家将强大模型留作自用的公司。Google的内部编码模型基于自家代码库训练，也未公开。这能一样吗 😂

Joscha Bach: Btw, Anthropic is not the first company that keeps the good models to themselves. Google's internal coding models are tr...

Anthropic Google 大佬观点

21:49

Chubby♨️@kimmonismus

Anthropic 一切围绕效率。据报道，Dario Amodei 只有一位直接下属：他的幕僚长，且所有高管运营事务都通过 Daniela Amodei 进行。实际上就是个（高效的）家族企业。

Anthropic 现象/趋势