23:07

Nathan Lambert：Interconnects（RSS）

博客现状，2026年中

Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标：为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音，避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议，以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万，付费约 900 人；运营实体 Interconnects AI, LLC 已成立，但银行账户数月余额接近零，收入再投入业务，近期不打算全职运营。

大佬观点开源生态

22:55

CMU：Machine Learning Blog

预训练还不够"苦涩"

Richard Sutton的“苦涩教训”通常被解读为警告不要在AI系统中编码过多人类知识，最终胜出的方法是能吸收更多算力和数据的一般性方法。现代基础模型预训练表面上是这一教训的胜利：采用通用架构、海量数据、简单的自监督目标（语言模型预测下一个token，视觉模型重建掩码块等）。但问题在于，训练目标仍由人类在训练循环外选定——完成一次大规模预训练后评估下游表现，再调整方案重新运行。这个控制环路非常粗糙。该论文探讨能否让这一环路变得更高效。

大佬观点数据/训练

22:46

Nathan Lambert@natolambert

我写了一份关于 Interconnects 现状的小型国情咨文，讲述了我如何拥有了一批忠实的小众受众，以及我如何调整运营以确保长期成功！感谢大家的支持。💚

Interconnects: State of the blog, mid-2026 About 3 years since I started writing weekly. https://www.interconnects.ai/p/state-of-the-bl...

现象/趋势行业动态

22:27

Chubby♨️@kimmonismus

GLM-5.2 max 目前是可用模型中第三佳的，无论开放还是闭源选项。这非常棒。开源至关重要，必须继续保持强势地位，让每个人都有开放的替代方案。我坚信这一点。

大佬观点

22:15

Ethan Mollick@emollick

任何人认为AI界面（聊天机器人、Codex、Code、NotebookLM等）是直观的，都应该花点时间向另外三个人解释如何使用它们。我保证你会意识到，要获得好的答案，有十几个小技巧和陷阱，并且这些是障碍。

大佬观点现象/趋势

22:13

AYi@AYi_AInotes

Grok Imagine Video 1.5 完美复刻《黑客帝国》Neo躲子弹经典场景

Grok Imagine Video 1.5 能一键生成电影级视频，完美复刻《黑客帝国》Neo躲子弹的 Bullet Time 场景（雨中后仰、绿色调、皮风衣墨镜），以及《权力的游戏》龙妈骑龙低空飞越君临的史诗镜头。用户感叹该模型“这么便宜还这么好用”，对比之下自己刚充的 6000 多元 seedance 会员显得不值。两个示例均附有详细 Prompt，涵盖镜头运动、物理模拟、光照与音频要求，展现出强大的文生视频能力。

AYi: Grok Imagine Video 1.5真的要吹爆,这么便宜还这么好用,一键复刻权力的游戏! 我刚充的6000多块的seedance会员算什么🥹 Prompt: Faithfully animate this reference im...

图像生成教程/实践视频

22:01

Hacker News 热门（buzzing.cc 中文翻译）

当人工智能接管一切之后

三位软件工程师来信询问AI是否会全面接管编程。作者回答最早今年底、最迟后年。以珍妮纺织机为喻，学会用新工具只是缓刑；美团宣布30%–50%裁员印证趋势。作者提出“终端思维”：意图即实现（PRD is Code），中间步骤注定消失。最终问题：当执行被机器接管，人类站在哪里？

推理现象/趋势编码

22:01

The Verge：AI（RSS）

Meta AI Mode搜索：基于Facebook帖子回答复杂查询

Meta在Facebook应用中推出AI Mode搜索，利用公开帖子回答复杂查询。实测显示基础推荐尚可，但存在严重幻觉：推荐奥斯汀的咖啡店给明尼阿波利斯行程，并错误引用社区泳池周末闭馆（实际周末开放）。AI曾就“1月6日国会骚乱者是否为爱国者”给出可疑答复。作为规划工具，AI Mode能发现用户未注意的活动，但地理错误和引用不实让结果大打折扣。

Meta 搜索评测/基准

21:45

Nathan Lambert@natolambert

我还没准备好面对这场PPO vs GRPO的辩论。又是老调重弹。事实就是策略梯度好。

大佬观点安全/对齐数据/训练

21:30

Hacker News 热门（buzzing.cc 中文翻译）

60%的美国消费者表示，品牌宣传中出现"AI"一词会让他们反感

一项调查显示，74%消费者认为互联网比10年前更不人性化，平均40分钟出现“bot fatigue”。61%的消费者说不出一个在品牌宣传中善用AI的公司，60%表示看到“AI”一词会反感，16%认为没有品牌用好AI。企业团队每周平均花16.6小时改善AI可见性，但该领域尚无公认领导者。报告建议品牌在AI时代注重“人性化”体验，并为AI引擎提供结构化内容。目前AI引用监测工具仍处早期，定价从免费到六位数不等，且无统一仪表盘。

现象/趋势行业动态

21:30

jason@jxnlco

提醒：Codex App、CLI 和 SDK 可与任何开源模型搭配使用，不限于 OpenAI 模型。详情：https://developers.openai.com/codex/config-advanced#oss-mode-local-providers

Tibo: Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models. https://de...

OpenAI 其他开源/仓库

21:13

AYi@AYi_AInotes

Grok Imagine Video 1.5 实测：一键复刻《权力的游戏》高质量视频，价格低廉

用户实测 xAI 的 Grok Imagine Video 1.5 视频生成模型，用详细 prompt 生成《权力的游戏》龙妈骑龙飞越君临城场景，火焰特效、物理模拟、原生音频和光影均达电影级水准。另一测试复刻 Tyrion 法庭演讲，面部微表情、布料动态、火把光影互动自然，效果不输 seedance 2。用户感叹仅需低廉价格（对比刚充的 6000 多元 seedance 会员）即可生成如此高质量视频。

AYi: Grok Imagine Video 1.5 实测: 复刻《权力的游戏》Tyrion 经典法庭演讲,效果真的有点吊炸,完全不输seedance 2, 整个场景真实感、物理表现和原生音频都拉满了......面部微表情、布料动态、火把光影互动都...

图像生成教程/实践视频

关联讨论 3 条

20:30

公众号：百度智能云（文心）

百度伐谋自我演化决策智能体助力三科研团队获突破

百度伐谋自我演化决策智能体在三个科研场景取得突破：清华大学电机系用其将磁芯材料暂态预测MSE Loss从40+提升至96+，全球第五，论文被ECCE收录；中科院学生以200行种子策略经400轮LLM语义级变异，自主发明H-DWA、K-Filter、A-Lock战术，获硬件实战赛全球第一、仿真赛第三；清华大学管理科学与工程学院团队针对A股日内价格预测，720轮自动演化后R²从0.010升至0.032，4周达到传统方法2-3个月水平。三团队均证实自动演化结构优于或持平人工设计。

智能体其他

20:07

IT之家（RSS）

理想汽车詹锟：除特斯拉FSD外国内无智驾第一梯队，下半年马赫VLA对齐FSD V14

詹锟在理想汽车Livis Day上表示，国内除特斯拉FSD外暂无智驾系统能入第一梯队。他于2026年5月赴美体验FSD V14.3后坦言差距真实。理想公布下半年路线：第三季度向AD Max车型推送马赫VLA新版本，第四季度全场景智驾对齐FSD V14。目前L9 Livis搭载马赫VLA 2.1，基于自研5nm马赫M100芯片（单芯1280 TOPS，双芯2560 TOPS）。小鹏何小鹏此前称其VLA将于2026年8月达FSD V14.2的硅谷效果。

具身智能大佬观点

19:44

Rohan Paul@rohanpaul_ai

来自@elder_plinius的那个著名仓库 Claude Fable 5 - 系统提示词

Anthropic GitHub 教程/实践

19:41

Emad@EMostaque

值得注意的是 @Zai_org 在 @Huawei Ascend 芯片上训练，没有 NVIDIA （！）因此你拥有前沿 -3 个月，完全中国堆栈，便宜 90%。我估计总成本为 2500 万美元，主要在后训练（80%） @Zai_org 市值现在接近 1000 亿美元，$$ 在开源中！

Zixuan Li: Finally, Artificial Analysis Intelligence Index concludes the GLM-5.2 release.

大佬观点开源生态行业动态

19:41

Emad@EMostaque

我认为越来越清楚的是，如果中国AI实验室能获得足够的计算能力，它们将击败美国的实验室。

大佬观点推理

19:27

Hacker News 热门（buzzing.cc 中文翻译）

创始人的行动指南：打造一家原生AI初创公司

Anthropic 近日发布创业行动指南，将生命周期分为 Idea、MVP、Launch、Scale 四阶段，每阶段附目标、退出标准、常见失败模式及基于 Claude 的 AI 实践。指南覆盖：用 Claude 验证问题假设、绘制竞争图谱、开展客户发现；通过架构设计避免 AI 生成 MVP 代码的技术债务；区分真正产品市场契合与早期热度的衡量框架；用智能体工作流替代创始人注意力的 Launch 阶段操作系统；以及 Chat、Claude Cowork、Claude Code 各阶段使用矩阵。还收录了 Ambral、Anything、Carta Healthcare 等创始人的实际案例。

智能体 Anthropic 教程/实践编码

19:27

Hacker News 热门（buzzing.cc 中文翻译）

GLM-5.2 成为 Artificial Analysis 智能指数领先开放权重模型

GLM-5.2 在 Artificial Analysis Intelligence Index v4.1 上得分 51，领先 MiniMax-M3（44）、DeepSeek V4 Pro（max，44）和 Kimi K2.6（43）。模型总参数 744B，活跃参数 40B，上下文窗口 1M tokens，API 定价每百万输入/输出/缓存命中 token 分别为 $1.4/$4.4/$0.26。科学推理显著提升：HLE 得分 40%（+12）、CritPt 21%（+16）。GDPval-AA v2 得分 1524，与 GPT-5.5（xhigh）持平。每任务输出 43k tokens（其中 37k 推理），每任务成本约 $0.46，位于智能 vs 成本帕累托前沿。采用 MIT 许可证，可通过 DeepInfra、Novita 等第三方平台使用。

智能体推理评测/基准

19:12

The Decoder：AI News（RSS）

超大规模云服务商可能很快无法仅靠现金流资助AI建设

Epoch AI基于SEC文件分析显示，微软、亚马逊、Alphabet、Meta、Oracle五大超大规模云服务商的AI基础设施支出年增长约70%，经营现金流仅增长约23%。若趋势持续，支出将在2026年第三季度超过现金流。目前Alphabet已通过股权融资850亿美元，亚马逊和英伟达发行债券补充资金。除Oracle外其余公司仍盈利且持有大量现金，但自由现金流可能归零或转负。Epoch AI指出这仅为简单外推，未计入AI投资能否产生足够收入来弥补缺口这一关键因素。

现象/趋势部署/工程

18:50

Chubby♨️@kimmonismus

六月一周内两件事：对Anthropic的限制与对xAI的保护，本质一致

六月的一周里，美国商务部迫使Anthropic对全体外国公民禁用Fable 5和Mythos 5，同时司法部在密西西比法院为xAI未获许可的燃气轮机辩护，称其因国家安全过于重要不能关停。两件事方向相反——一边是束缚，一边是盾牌——但共同证明：AI及其伴随的数据中心扩张、前沿模型访问等，正越来越多地被置于国家管控之下。作者中立指出，AI作为国家战略要务，无法任其自然发展；对xAI有利，对Anthropic不利。

大佬观点

18:50

Chubby♨️@kimmonismus

MaineCoon 是首个不限时长（unlimited-duration）的交互式音视频模型，摒弃了传统AI"等待输入→回复→静默"的轮次模式。它在回答过程中持续实时读取用户的表情、声音和时机，实现边说话边感知的对话体验，将AI视频从被动观看转向主动实时互动，被认为是实时交互AI的前沿信号。

Catnip: 🥇MaineCoon: From Passive Video to Real-Time AI Presence The first unlimited-duration interactive audio-visual model. Mo...

多模态大佬观点视频

18:41

公众号：卡尔的AI沃茨

视频Agent Seko更新无限画布，自动连接节点生成工作流

视频Agent Seko在最新更新中推出无限画布，并能自动将创意、剧本、角色、场景和分镜等素材节点连接成完整工作流。用户可通过Seedance 2.0全能模式输入一句话或完整剧本，Seko自动生成多集短剧大纲、人物、场景、美术风格及分镜描述，并支持逐段修改提示词和生成视频。画布提供全自动与精细手动编辑的双重控制，解决了AI视频从70分改到85分时反复重做的痛点。实测用该流程三小时完成两集悬疑短剧，角色一致性、故事节奏和画面氛围表现力均超出预期。

智能体教程/实践视频

18:38

PixVerse@PixVerse_

PixVerse 官方在 X 上称赞用户 @renataro9 使用 PixVerse Canvas 工具创作的猫骑士故事。该故事讲述了猫骑士 Rosmira Thornvale 在村庄被焚、母亲被害后，面对曾教导她战斗却堕入黑暗的黑猫圣骑士，最终选择以守护而非复仇的力量对抗。作品附有 #pixversecpp 等标签。

meropan: Pixverse(@PixVerse_)のCanvasで作成しました。 #pixversecpp #zargates #pvpvibe @Nika_Ruis Rosmira Thornvale is a young cat knight w...

其他图像生成视频

18:26

凡人小北@frxiaobei

微信推出了 AI 亲密付，你给你的 AI 多少额度。友情提醒：从法律层面来讲，自愿开通并允许对方消费，默认属于无偿赠与行为，AI 没有法定偿还义务。

其他

18:11

Tibo@thsottiaux

提醒一下，你可以使用 Codex App、CLI 和 SDK 搭配任何开源模型，不仅仅限于 OpenAI 模型。

其他开源生态

17:20

Chubby♨️@kimmonismus

来自华盛顿的沉默，源自Anthropic与美国官员的会谈，比任何激烈的争论都更令人担忧。

Anthropic 大佬观点政策/监管

17:11

AYi@AYi_AInotes

Anthropic为苹果生态发布Swift包，主动适配LanguageModel协议

Anthropic发布了Swift包，使Claude模型适配苹果定义的LanguageModel协议，从而能在iPhone和Mac本地运行。这一转变打破了Anthropic一向要求别人适配其API的惯例。背后是苹果通过统一接口把自己变成AI模型分发平台，开发者用同一套代码可在本地模型和Gemini等之间切换。推文认为行业竞争已从模型能力转向规则标准，在苹果生态内顺应其规矩比硬扛更明智。

Anthropic 现象/趋势部署/工程

16:38

X.PIN@thexpin

显然，微软再也用不起商业API了。他们正在考虑使用自托管的DeepSeek-V4版本来驱动Copilot的智能体AI。我想我们都还记得，特朗普政府曾威胁要封禁DeepSeek。此外，Anthropic刚刚阻止了外国用户使用Fable 5和Mythos 5。在这一切发生之际，我很好奇美国人是如何看待的。

DeepSeek 行业动态

16:07

IT之家（RSS）

Claude Code 用户画像：平均每周使用 20 小时，AI 代码修改占 26%

Anthropic 6月16日发布博文，分析2025年10月至2026年4月约23.5万用户的40万次Claude Code会话。用户平均每周使用20小时，其中代码修改占26%，代码编写占25%，合计超半数。典型会话中人类负责约70%规划决策，Claude完成约80%执行决策。新手（1级）每次提示产生约5个操作和600个单词输出，专家（5级）产生2倍操作和5倍输出（约3200个单词）。

智能体 Anthropic 现象/趋势编码

15:23

Greg Brockman@gdb

AI 用于帮助破解健康谜团。像这样的故事如此之多，这是对 AI 感到兴奋的明确动机：

Amy Deng: I'm an AI researcher turned brain tumor patient, and recently I used the models to crack my mystery fatigue faster than ...

OpenAI 大佬观点

15:08

Artificial Analysis@ArtificialAnlys

GLM-5.2 发布：AAI 指数 51 分，开源权重模型新标杆

Z ai 发布 GLM-5.2（744B 总参数/40B 活跃参数），在 Artificial Analysis Intelligence Index v4.1 上得分 51，超越 MiniMax-M3、DeepSeek V4 Pro 和 Kimi K2.6。科学推理大幅提升：CritPt +16、HLE +12、GPQA Diamond 达 89%。GDPval-AA v2 得分 1524，与 GPT-5.5 (xhigh reasoning) 相当。上下文窗口扩展至 1M tokens，MIT 许可证。第一方 API 定价 $1.4/$4.4/$0.26 每百万输入/输出/缓存命中 token，每任务成本约 $0.46，处于智能 vs 成本帕累托前沿。

开源生态推理评测/基准

15:06

AYi@AYi_AInotes

Anthropic CEO白宫沟通失败：技术团队需懂人情而非纯技术

近日，Anthropic CEO Dario Amodei与白宫沟通失败，引发业内反思。技术团队与权力对话存在两套语言体系：技术方讲逻辑、安全、长期价值，对方讲立场、交易、国家安全优先级。业内建议关键谈判应派懂人情、能读空气、擅长建立信任的人出席，而非纯技术团队。AI时代技术门槛将拉平，真正的竞争力在于搞定人和建立信任——技术决定产品上限，沟通决定产品生死。

AYi: 这次达里奥跟白宫沟通失败,Anthropic踩的坑, 给所有技术团队敲了警钟, 建议技术出身的创始人都看一遍经典美剧《广告狂人》, 因为你光把模型做到行业顶尖没用,沟通对不上频道,说下架就下架。技术团队和权力对话,天生是两套语言体系, 你...

Anthropic 大佬观点

15:06

AYi@AYi_AInotes

Grok Imagine 1.5 复刻权游演讲实测惊艳

Grok Imagine Video 1.5 实测：复刻《权力的游戏》Tyrion 经典法庭演讲，效果真的有点吊炸，完全不输seedance 2，整个场景真实感、物理表现和原生音频都拉满了……面部微表情、布料动态、火把光影互动都很自然

xAI: Grok Imagine Video 1.5 is here Our new image-to-video model with sharper realism, better physics and faster generations ...

xAI 视频评测/基准

15:05

DogeDesigner@cb_doge

Grok Imagine 1.5 好得离谱。🔥

xAI 图像生成大佬观点

14:35

小互@xiaohu

Claude Code之父谈"少即是多"：CLAUDE.md越短越好

Claude Code之父分享团队核心理念：CLAUDE.md越短越好，他自己的仅两行（提PR自动合并、发审批频道），并建议定期清空重写。模型能力每代都在飞涨，人为堆配置、做UI很快会过时，因此坚持CLI而非GUI。终端输出在详细与简洁间通过用户反馈迭代（支持verbose模式）。用AI修bug已很高效，能自行分析heap dump。核心观点是做减法、保持轻，并不断推翻过时使用习惯。

智能体 Anthropic 大佬观点编码

13:09

SemiAnalysis@SemiAnalysis_

POV： @ohnePixel 为 DeepSeek V4 首日部署获得一个平台。了解更多：https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance

DeepSeek 推理评测/基准

12:50

Tomer Tunguz 博客（VC 分析）

精选62

5x for Free：本地编程栈

Hacker News 讨论揭示：Qwen 3.6 35B-A3B 模型提及率 33% 领先，27B 变体以 20% 紧随其后，DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称，Claude Opus 可带来 15 倍加速，而本地离线 Qwen 提供 5 倍加速，且完全免费、保护隐私。SWE-bench Verified 基准测试显示，Qwen 3.6 27B 得分 77.2%，35B-A3B 得分 73.4%，接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。

现象/趋势端侧编码

推荐理由：本地模型在编码上正逼近云端前沿，Qwen 35B-A3B 已成社区标配，免费且完全离线让这场替代变得真实，选型逻辑可能从此改变。

12:29

歸藏(guizang.ai)@op7418

博主 @op7418 用 GLM 5.2 发布博客作素材，对比了 GPT 5.5（左）与 GLM 5.2（右）生成的社交媒体卡片。

歸藏(guizang.ai): 智谱 GLM-5.2 正式发布和开源了,基准测试成绩相当吓人核心定位是处理长周期任务,并且有稳定的 100 万上下文,模型还引入了思考力度控制。架构层面,GLM-5.2 提出了 IndexShare 机制,每四层稀疏注意力共享同一个 i...

OpenAI 评测/基准

12:26

Hacker News 热门（buzzing.cc 中文翻译）

让 ast.walk 的运行速度提升 220 倍

作者为优化 AI 生成 Python 代码的 lint 效率，发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理，实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑，并直接读取 __dict__ 及预缓存 AST 子类类型信息，最终将 ast.walk 速度提升约 220 倍。

GitHub 教程/实践编码部署/工程