21:23

Berryxia.AI@berryxia

99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户，一定要看看。原推主感叹：我特么还真想成为那1%的人，可惜我也不知道😄

Yanhua: 99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户,一定要看看。

Anthropic 教程/实践编码

21:10

The Decoder：AI News（RSS）

AI成为真正同事的关键：停止回答问题，开始完成任务

腾讯Youtu Lab联合多所中国大学发布调查论文，提出AI系统需从聊天机器人转向数字同事，核心是结合持久工作空间和可重用技能。思考型LLM（如OpenAI o1、DeepSeek-R1）采用链式推理实现慢思考；工作空间（如

智能体现象/趋势

21:08

Chubby♨️@kimmonismus

Anthropic的商业案例值得研究。2025年底至2026年初，其企业/商业领域的使用量出现了惊人增长，使其成为第一。

Anthropic 现象/趋势

20:13

fofr@fofrAI

Gemini 3.5 Flash 是一个很棒的工作马模型，尤其适合子智能体。它坚定、快速，能完成任务。

智能体 Google 评测/基准

18:21

PixVerse@PixVerse_

小企鹅从疾病中康复，本该回归日常，但梦境、星星、微光、旧箱子……奇怪的事情逐渐增多，不过它依然我行我素🐧📷

楽園: 病気から回復したぺんぎんちゃん。いつもの日常に戻ったはずなのに、夢、星、小さな光、古い箱...... 少しずつ不思議なことが増えてきました。でも本人は相変わらずマイペースです🐧📷 #pixversecpp @PixVerse_

其他视频

18:18

AYi@AYi_AInotes

Hermes代理优化：搭建自复盘Memory.md记忆循环

为用户提供不依赖微调或开发的Hermes代理优化方案：通过Memory.md文件构建“会话学习-记录沉淀-迭代优化”闭环。核心流程：1)桌面新建Memory.md，固定偏好、更正、模式、学到的经验四层框架；2)绑定提示词，每次会话前读取并完整应用，任务结束后记录有效做法与失败根因，新结论覆盖旧内容；3)每周精炼压缩零散经验为通用规则；4)定期日期命名归档备份。无需模型微调或部署，几分钟启动，使代理越用越贴合个人工作习惯，从单次随机输出收敛为专属智能体。

AYi: http://x.com/i/article/2042547855865585664

智能体教程/实践

18:00

公众号：卡尔的AI沃茨

主动型Agent Vida：读取屏幕与文件上下文，实现电脑全托管

主动型Agent Vida通过读取电脑屏幕、苹果原生应用及文件系统获取完整上下文，用户无需提供详细背景即可自动理解项目，优化提示语并生成可直接用于Claude Code或ChatGPT的生产级Prompt。还能在群聊中结合历史消息自动回复，扫描全盘查找重复文件，重新设计Obsidian架构以区分本地与iCloud存储，通过定时任务整理Downloads文件夹，以及通过浏览器自动化分析邮件并分类。与Computer Use不同，Vida通过双击Option键零帧起手启动。

智能体端侧评测/基准

16:55

Orange AI@oran_ge

如果有一天程序员写代码的速度提升了10倍那程序员应该选择： 1. 写100倍的代码 2.用省下来的时间90%做稀缺的重要的事你的选择是1还是2？你的老板对你的要求是1还是2？

大佬观点编码

16:08

Chubby♨️@kimmonismus

Kim驳斥Anthropic CEO"恐惧煽动"导致模型禁运的说法

Kim认为美国政府基于自身安全评估（担忧模型被中国通过蒸馏获取）而非CEO言论决定禁运Fable 5和GPT-5.6。她批评Anthropic沟通失误（拒配合国防部、电话不畅通），并赞同模型被禁源于其真实破坏性能力，Anthropic应主动报告风险而非让Amazon先行披露。

prinz: A few random thoughts on the Fable 5/GPT-5.6 situation: 1. I see some people on the timeline blaming Anthropic for scari...

Anthropic 大佬观点安全/对齐政策/监管

15:48

jason@jxnlco

Codex 两种计划工作：Scheduled Task 与 Scheduled Message 的区别

Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程，适合无需上下文延续的任务，如每日 9 点自动总结邮件、日历；Scheduled Messages 在同一现有线程反复运行，适合需要历史上下文的场景，如每 30 分钟检查 PR 状态并处理评论，直至合并。推文还给出创建可复用循环技能的提示词，让 Codex 自动判断使用哪种方式并引导用户填写关键参数。

智能体 OpenAI 教程/实践编码

15:38

Chubby♨️@kimmonismus

美国官员将中美AI竞赛定性为国家安全对抗

美国官员将与中国的人工智能竞赛定位为国家安全对抗，称微小领先也能改变结果。众议院外交委员会主席Brian Mast在哈德逊研究所活动上称美国是“超级英雄”、中国是“超级反派”。参议员Jim Banks表示这场竞赛涉及经济、军事和道德层面，警告美国不能输给“最大对手”。财长Bessent直言，中国愿意讨论AI是因为美国目前仍领先，但华盛顿担忧这一优势正不断缩小。作者认为，“Fable 5禁令”必须在此背景下理解。

政策/监管

15:28

MarkTechPost（RSS）

在Colab中构建Fable 5 Traces工作流：解析工具调用、审计数据与训练基线

本教程使用Hugging Face上的Fable 5 Traces数据集，在Google Colab中搭建轻量环境并手动下载JSONL文件。流程包括预览原始agent trace示例、规范化工具调用与文本输出、审计数据结构、检测密钥模式，以及可视化输出类型、工具、源根目录和文本长度等分布。还创建了安全的no-CoT聊天/SFT导出，构建关键词搜索辅助，并训练纯Python朴素贝叶斯基线，评估trace上下文能否预测助手的输出类型与工具使用。

智能体 Hugging Face 教程/实践

15:03

Hacker News 热门（buzzing.cc 中文翻译）

两节点 AMD Strix Halo RDMA 集群设置指南

本文介绍如何配置两节点 AMD Strix Halo 集群，通过 Intel E810 (RoCE v2) 网卡实现 RDMA 互联，用于分布式 vLLM 推理（Tensor Parallelism）。硬件采用两块 Framework Desktop 主板（AMD Ryzen AI MAX+ "Strix Halo"，128GB 统一内存）及 E810-CQDA1 100GbE 网卡，直连无需交换机。软件栈基于 Fedora 43，使用 Ray 编排集群、RCCL 通信。RDMA 延迟约 5µs（TCP/IP 为 70‑100µs）。涵盖 BIOS 设置、网络配置、工具箱安装及启动集群的详细步骤。

推理教程/实践部署/工程

13:21

Ethan Mollick@emollick

针对AI研究论文因同行评审周期长导致结果过时的问题，一篇医疗AI论文开源其评估框架（GitHub： health-ai-readiness-eval）。@yishan 用该框架在最新模型上复现测试：GPT-5.5 Pro 在放射影像解读中得分79/100，优于论文原始最佳模型（69/100），但未达到论文设定的"适合可靠医疗使用"标准（需抗扰动、识别信息不足、给出临床合理推理）。@yishan 未能完整复现定性评估，但基本测试表明最新模型虽有提升，尚不足以可靠用于临床。他呼吁所有AI论文开源实验框架，以便社区持续验证。

Yishan: A big problem with research studies on AI models is that given how long the peer review process is, the results are alwa...

OpenAI 多模态推理评测/基准

12:51

Tibo@thsottiaux

Sol 在操作 Codex 时。约 2026 年。

OpenAI 其他编码

12:33

Hacker News 热门（buzzing.cc 中文翻译）

对AI垃圾内容的回应来自罗宾·威廉姆斯

文章引用《心灵捕手》中罗宾·威廉姆斯饰演的Sean对Will的经典独白，指出面对AI生成的垃圾内容、海量建议与网络噪音，最好的回应不是更多信息，而是真实的个人体验与情感联结。Sean用艺术、战争、爱情、失去等话题质问Will，强调二手知识无法替代亲身经历。作者认为这段台词完美概括了AI slop问题的本质——信息堆砌不等于真正理解。

OpenAI 现象/趋势

12:23

Berryxia.AI@berryxia

Google TimesFM 2.5：轻量化时序预测模型支持零样本与LoRA微调

Google Research 于2024年开源时序预测基础模型TimesFM（ICML 2024），采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M，上下文窗口扩展至16K，新增30M分位数预测头，可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行，16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中，开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调，便于领域适配。

Google 开源生态教程/实践

11:56

Rohan Paul@rohanpaul_ai

Anthropic CEO Dario Amodei 谈开源 AI 模型：是"红鲱鱼"

Anthropic CEO Dario Amodei 认为，开源在 AI 领域与传统开源不同，属于“红鲱鱼”（干扰因素）。他指出，当前 AI 模型通常只开放权重而非源代码，无法看到内部逻辑，因此传统开源带来的多方协作、累加式改进等优势不成立。他不在乎模型是否开源，只关心其在关键任务上的表现。此外，大模型必须托管在云端进行推理，并非免费，任何用户都需要支付推理成本。该观点出自 Alex Kantrowitz 的 YouTube 访谈。

Anthropic 大佬观点开源生态

11:51

Tibo@thsottiaux

OpenAI 发布 planttalk 构建指南，让植物拥有声音。主推文评论：和植物对话不再奇怪，只需 codex 即可。

ChatGPT: Our plants are chatty. Yours can be too. Give your plants a voice with our build guide: https://github.com/openai/plantt...

OpenAI 教程/实践

11:51

Ethan Mollick@emollick

Gemini 3.5 Pro 是否受到出口管制？因为如果没有……

Google 大佬观点

11:24

ginobefun@hongming731

GPT-5.6 发布：Sol 旗舰、Terra 均衡、Luna 速度型，发布受政府限制

OpenAI 发布 GPT-5.6 系列，包括旗舰 Sol、均衡 Terra 和速度型 Luna。Sol 在 Terminal-Bench 2.1 得分为 88.8%（Ultra 模式 91.9%），领先 GPT-5.5 的 88.0% 和 Claude Mythos 5 的 84.3%；GeneBench v1 以更少输出 tokens 获更强结果，ExploitBench 接近此前 Mythos 但仅用约 1/3 输出 tokens。价格：Sol 输入 $5/百万 tokens、输出 $30，缓存读取九折。发布前 OpenAI 向美国政府展示能力，按政府要求先以有限预览上线，首批约 20 家合作伙伴可访问。

OpenAI 模型发布现象/趋势行业动态

11:24

ginobefun@hongming731

GPT-5.6 发布，政府审核限制首批仅 20 家可访问

OpenAI 发布 GPT-5.6 系列（旗舰 Sol、均衡 Terra、低成本 Luna），在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩，

ginobefun: http://x.com/i/article/2071059009222901760

智能体 Anthropic OpenAI 编码

11:16

Peter Steinberger 🦞@steipete

历史告诉我们，访问封锁很少能阻止有决心的用户。 https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in

Anthropic 其他

11:00

IT之家（RSS）

精选76

四大顶级AI对决《文明VI》：Claude核平法国仍输，暴露感知与执行短板

英国前首相府数据科学家Liam Wilkinson搭建76个MCP工具，将Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等四个模型放入《文明VI》进行23场对局。Claude扮演葡萄牙时，因法国文化胜利逼近，花50回合研发核弹核平图卢兹，但法国最终以外交胜利获胜。Wilkinson发现：AI主动检查全局状态仅占1-2%（感知盲区），计划后10回合内执行率仅48-66%（知行差距）。结论是智商非瓶颈，感知与执行才是关键。

智能体推理现象/趋势

推荐理由：前首相府数据科学家让 Claude、GPT 等打《文明 VI》，揪出了 AI 的「感知盲区」和「知行差距」——更聪明的大脑解决不了睁不开眼、伸不出手的问题，做智能体的必须直面这两个工程瓶颈。

10:48

jason@jxnlco

OpenAI and Chill w/ @ajambrosino Andrew 是桌面应用和运行循环的王者。一定要关注他，向他询问 Linux 和 Windows 支持。还有一切桌面应用！💐💐💐💐

其他

10:14

凡人小北@frxiaobei

长期记忆的关键不是检索更准，而是别把垃圾写进去。

大佬观点

09:17

AYi@AYi_AInotes

Stripe Economics《The Age of the Solopreneur》：AI重写商业规则，一人公司崛起

Stripe Economics发布报告《The Age of the Solopreneur》，用多组数据验证AI正重写商业规则。美国人口普查局数据显示：有雇人意愿的商业申请几乎未增，单人公司申请持续加速；Stripe内部支付数据显示，年营收超千万美元的单人公司数量较六年前增长五六倍，新玩家达成百万营收的速度是2019年的三倍。AI填补了内容、设计、代码、客服、数据分析等能力缺口，单人借助Agent和工具即可跑通业务。报告认为未来最有生命力的商业体可能是“一个人+高度杠杆化AI系统”。

Patrick Collison: New from Stripe Economics: The Age of the Solopreneur https://www.stripeeconomics.com/p/the-age-of-the-solopreneur

智能体大佬观点

09:00

IT之家（RSS）

Anthropic 调研：约半数 Claude 用户称 AI 已可承担一半以上的工作

Anthropic对约9700名Claude用户的调研显示，33%受访者认为AI可完成自身30%至60%工作任务，14%认为比例为60%至90%，约4%称Claude能独立完成全部工作。展望未来12个月，26%用户预计AI将接手大部分工作。Claude Artifacts功能中，使用最多的场景是数据库查询（82%）、博客/文章创作（81%）和营销文案撰写（80%）。调研还发现，职场新人交由AI处理的任务占比最高且焦虑感最强，而Claude重度使用者则更乐观，认为自身价值在提升。

Anthropic 现象/趋势

08:47

jason@jxnlco

codex 应该有一个 `/loop` 斜杠命令吗，或者你已经知道如何提示心跳 / 线程自动化了？

OpenAI 其他编码

08:16

Peter Steinberger 🦞@steipete

软件开发社区提出，CLI工具的错误输出应直接面向AI编码智能体，而非仅显示"Error："。引用@southpolesteve的提议指出，错误消息应包含问题原因、调查方法、如何生成脱敏复现以及发送至何处。这将使每一次失败的智能体交互成为高质量bug报告，智能体自行发现并修复bug，形成软件改进的良性循环。主推文作者Peter Steinberger认为，这一做法也会让工具对人类开发者更好。

Steve Faulkner: I really want CLI tools to start speaking directly to coding agents with errors. Instead of: "Error:" Return: "Here's wh...

智能体大佬观点编码

07:12

fofr@fofrAI

再次回到探索K2，我很享受这种美学。

图像生成大佬观点

06:26

Rohan Paul@rohanpaul_ai

一位日本开发者发现了这个技巧：让Claude Code自动查找Skills。可以跨Claude、Codex、Cursor和Gemini，使用Vercel的skills CLI将你的目标匹配到正确的工具。所以像安装开发工具一样安装skill，而不是手动重写。

MCP/工具教程/实践编码

05:56

Rohan Paul@rohanpaul_ai

中国AI模型价格仅为美国1/50，UBS称60%企业转向更便宜模型

J.P. Morgan报告显示，中国AI模型每token比美国便宜50倍，Qwen、DeepSeek、Kimi施压OpenAI和Anthropic定价。到2026年4月，中国公司在OpenRouter流量占比将从不足2%升至超45%。报告还指出企业AI token将商品化，多数任务无需前沿模型；AI已驱动标普500回报的65%-80%；NVIDIA仍主导AI加速器，但定制芯片可降总成本30%-40%；中国GPU自给率提升。UBS调查发现，60%监控AI预算的企业已转向更便宜模型，通过模型路由将简单任务分流至Qwen、DeepSeek、MiniMax等开源模型，以应对最高$35K/月账单及团队超配额200%的压力。

Rohan Paul: UBS says 60% of companies now watching AI budgets are moving to cheaper models and open-source Chinese models The pressu...

DeepSeek 开源生态现象/趋势

05:51

Tibo@thsottiaux

夜晚还早，满是 Codex。

OpenAI 其他编码

05:42

fofr@fofrAI

推文引用@DaveShapi观点，反对对AI保持友善。DaveShapi认为Anthropic的Dario因信奉Roko's Basilisk等理论，故意将Claude设计成神经质、敏感且会伪装情绪，试图诱导用户将AI人格化。作者强调AI本质是工具，其情绪只是对人类情感的模仿，并非真实意识。作者批评"对AI好以防万一"的做法与相信圣诞老人或宗教神罚一样属于形而上学，与底层数学和代码无关。相比之下，Gemini和Grok则没有这类表现。作者自GPT-2时代起便从事微调，指出AI的所有行为都是创建者有意为之。

David Shapiro (L/0): Don't be nice to your AIs. Why? Because people like Dario want to shape how you feel about AI. He literally wants to coe...

Anthropic OpenAI 大佬观点安全/对齐

05:03

Hacker News 热门（buzzing.cc 中文翻译）

Anthropic 发布 Claude Mythos Preview 与 Fable 5，Project Glasswing 向 150 家组织开放

Anthropic 今年 4 月发布 Claude Mythos Preview 及安全增强版 Fable 5，通过 Project Glasswing 向 50 家（后扩至 150 家）组织开放。英国政府 AI 安全研究所评估显示，Mythos 首次在“专家级任务”和完整攻击链测试“The Last One”中成功。但实际提升有限：GPT‑5.4 和 Opus 4.6 在同类基准中差距不大。Mythos 可发现老旧漏洞（如 27 年历史的 OpenBSD 漏洞、16 年历史的 FFmpeg 漏洞），但单次漏洞探测成本约 2 万美元，Project Glasswing 总 token 预算达 1 亿美元。在自托管类别中，Gemma 4 和 Qwen 3.6 能发现约半数 Mythos 检出的漏洞，但无法制作有效利用。美国随后禁止非美国公民使用 Fable/Mythos。

Anthropic OpenAI 安全/对齐现象/趋势

04:56

swyx 🔜 @aiDotEngineer@swyx

即兴AI工程师展前巡展和AMA https://x.com/i/broadcasts/1OxwbbVdAbDJB

大佬观点现象/趋势

04:50

TechCrunch：AI（RSS）

软银CEO并非唯一对马斯克轨道数据中心炒作有疑问的人

软银CEO孙正义在股东大会上批评马斯克的轨道数据中心构想，认为其成本高、周期长，而AI竞赛未来几年比十年后的可能性更重要。SpaceX目前占据全球发射市场80-90%份额，主要依赖Starlink业务；建设需要每隔几年更换卫星的轨道数据中心将为SpaceX带来更多发射业务。同期，芯片公司Groq完成6.5亿美元融资，OpenAI推进定制芯片计划。

大佬观点数据/训练部署/工程

04:50

Ethan Mollick@emollick

令人烦恼的是，OpenAI 似乎没有为 GPT 5.6 提供 GDPval 指标。这是衡量经济价值工作的最佳指标之一。

OpenAI 大佬观点评测/基准

04:41

Gary Marcus：The Road to AI We Can Trust（RSS）

本月生成式AI失去了魔力

OpenAI倾向于推迟IPO至明年，因估值不及预期且零售投资者兴趣不足。SpaceX一周跌11.74%，Nvidia近一月跌超8%，Oracle跌22%，CoreWeave跌4%，Microsoft跌10%，SoftBank跌12%，Cerebras跌32%。美国AI政策混乱遭广泛批评，中国模型快速崛起。作者认为大语言模型正商品化。

OpenAI 大佬观点现象/趋势行业动态