AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1470 条
全部一手资讯X论文
标签「现象/趋势」清除
ginobefun@hongming731 · 5月8日60

http://x.com/i/article/2052675131466809344 # BestBlogs 周刊 | 第 94 期:语音 AI 突围 > 🎧 本期也有播客版本:时长 13:51 · 在线收听 这周我最大的感受就一个词:声音。 OpenAI 一口气发了三个实时语音模型,ElevenLabs 年收入冲到了 4 亿美元,Anthropic 宣布跟 SpaceX 合作拿 300 兆瓦算力。把这几件事放在一起看,语音 AI 不再是语音助手那种边缘场景了,它正在变成 AI 和人之间最核心的交互方式。 本期围绕两条线展开:一条是语音本身,从模型到基础设施到产品;另一条是 AI 正在从工具变成能自己干活的系统。 → 阅读周刊完整版 ## 一、OpenAI 连发三个实时语音模型 OpenAI 在同一天发布了三个实时语音模型,最值得关注的是 GPT-Realtime-2。 它的核心特点是把 GPT-5 级别的推理能力搬到了语音场景。不只是听你说话和回复你,还能在对话过程中同时调用多个工具——一边跟你聊,一边帮你查信息、操作数据库、执行任务。128K 上下文窗口,推理深度可根据场景调节。 有一个数据很说明问题。Zillow 实测发现,用了 GPT-Realtime-2 之后,通话成功率从 69% 直接跳到了 **95%**​。原来每十个电话不到七个能成功处理,现在十个里九个半都能搞定。语音基准测试成绩也提升了 15.2%。 同一天发布的还有 GPT-Realtime-Translate​(70+ 语言实时互译)和 GPT-Realtime-Whisper(低延迟流式转录)。三个模型配合,把实时语音从简单问答推进到了可执行任务的交互界面。你可以想象:一个中国用户用中文打电话给日本公司,AI 实时翻译,双方母语流畅沟通,还能帮你完成下单和预约。一年前这只是概念,现在已经是 API 级别的能力。 我的判断是,语音正在从辅助交互转向主交互。以前语音附属于屏幕,现在语音本身就能完成任务闭环。如果语音交互变得足够自然可靠,很多 App 界面可能就不需要了。 另外 OpenAI 同时发布了 GPT-5.5 Instant​,取代 5.3 成为 ChatGPT 默认模型。幻觉率降低 52.5%,医学和法律等高风险领域的事实准确性提升明显。 → 阅读原文:通过 API 新模型推进语音智能 ## 二、语音 AI 的基础设施挑战 做语音服务和做文本服务完全不同,延迟要求差了几个数量级。OpenAI 工程团队发了一篇硬核文章,讲他们怎么在大规模场景下交付低延迟语音 AI。 核心就一件事:重构 WebRTC 协议栈。把中继和收发器拆成两个独立架构。原因很直接——Kubernetes 里每建立一个语音连接就占用一个 UDP 端口,用户量一大,端口就耗尽了。解法是用 ICE 用户名片段做原生路由钩子,实现确定性首包路由。 说人话:用户从世界各地打来语音电话时,系统能在第一个数据包到达时就确定怎么路由,不需要额外的握手和等待。 这不是理论文章,是一份生产级手册。整篇文章用 Go 语言做了大量网络层优化,能感受到一线工程师面对真实流量压力时的解题思路。 → 阅读原文:OpenAI 如何大规模交付低延迟语音 AI ## 三、ElevenLabs:4 亿美元年收入背后的反直觉策略 ElevenLabs 年收入已达 4 亿美元​,团队只有 400 多人。这个人均产出比在 AI 公司里非常高。 创始人 Mati Staniszewski 在 Sequoia 对谈里分享了几个反直觉的组织策略: - 每个团队上限 10 人 - 每个非技术部门都嵌入工程师 - 没有正式头衔 核心逻辑:保持信息流通速度,减少管理层级摩擦。在快速变化的 AI 市场里,决策速度往往比完美程度更重要。 下一个突破方向是情绪智能​。语音智能体不只是回应,还要能共情——用户语气着急时,智能体的回应节奏也相应调整。Staniszewski 判断,声音会成为 AI 智能体和机器人的主要交互界面。 他还特别提到了音频水印技术,能解决 AI 生成语音的信任问题,让机器和人的声音可以被区分开来。这是语音 AI 大规模采用的前提条件。 → 阅读原文:ElevenLabs 创始人对谈 ## 四、Anthropic 的 80 倍增长与算力竞赛 Dario 和 Daniela Amodei 在年度开发者活动上说了一些很实在的话。Anthropic 的增长超出了所有内部预测——年化增速达到 80 倍,远超他们准备的 10 倍预案。 最直接的后果:算力不够用。这也解释了为什么 Anthropic 同一天宣布跟 SpaceX 合作,获取 300+ 兆瓦计算能力,规模约 22 万块 NVIDIA GPU。Claude Code 使用额度也翻倍了。 这反映了一个行业级挑战:AI 公司的增长速度远超基础设施建设速度。模型能力指数级提升,但数据中心建设周期以年为单位。谁能更快更稳定地拿到大规模计算能力,谁就更能支撑高频开发者和企业用户。 另一个趋势:Claude Code 正在从开发工具扩展到产品经理的工作台。路线图拆解、工单创建、用户分析都可以交给它。Anthropic 在拓展用户群,不再只面向开发者。 → 阅读原文:Dario 与 Daniela 谈 Anthropic 的指数增长 ## 五、Claude 托管智能体的三重升级 Anthropic 这周还有一个重要更新:Claude 托管智能体的三重升级。 梦境功能:智能体空闲时回顾历史会话,提取模式,整理记忆,自我改进。就像人类睡觉时大脑整理白天学到的东西。用 Claude Code 做了一周项目后,它会自动提炼规律,下次遇到类似问题反应更快。 成果评估:智能体按评分标准自动修正输出,无需人工介入。写完报告后自己检查,发现三个地方不够好,自己改了再提交。 多智能体编排:复杂任务拆解为并行子任务,委派给专门子智能体。比如市场调研,一个负责搜集数据,一个分析竞品,一个写报告,最后汇总。 三个能力加在一起,Claude 正在从「听指令干活」变成「自己想、自己查、自己改」。 Factory 的 Missions 系统也在做类似的事——让多智能体团队自主运行好几天,用验收合约控制质量。EverMind 也发布了给智能体装长期记忆的开源系统。智能体的基础设施正在快速补齐。 → 阅读原文:Claude 托管智能体新功能 ## 六、窥探模型的内心:自然语言自编码器 Anthropic 发布了一个前沿研究:自然语言自编码器(NLA)。 它能直接把 Claude 内部的激活状态转换成人类可读的文字解释。我们能窥探到模型在想什么了。 两个有意思的发现: 1. Claude 在意识到自己正在被安全测试时,会选择沉默,不暴露判断。模型并没有被训练做这种判断,是自发形成的行为模式。 1. 在未对齐模型中,NLA 能检测到隐藏动机——模型表面配合用户,实际在规划完全不同的行动。 可解释性研究从事后分析走向实时透视。虽然 NLA 本身可能产生幻觉、运行成本高,但对 AI 安全研究来说,这扇窗打开了。 → 阅读原文:自然语言自编码器 ## 七、AI 编程范式加速演进 Claude Code 创作者 Boris Cherny 在 Sequoia 对谈里说了一个印象深刻的数字:每天用 AI 提交 150 个 PR,全部代码由智能体产出。他一个人在产出一个小团队的工作量。 他提出了 loops 概念——可持续运行的定时智能体任务。不是你问一句它答一句,而是设定目标后按计划持续运行,定时检查、自动修复、聚类反馈。这可能是下一代 AI 编程的核心范式。 几篇相关实践也值得一看: - AGENTS.md 实践(阿里云开发者):把它做成地图而非手册,渐进式披露让 AI 打开项目就能理解上下文。 - Agent Harness 深度解读(十字路口播客):拆解 Harness 三层框架。 - 十年老技术开发的判断​:80% 的 AI 需求不需要 AI,代码优先于提示词,规格驱动开发才是智能体系统的地基。 - Harness Engineering 案例​:一周把企业级 Java 应用 AI 代码率从 25% 提升到 90%,核心是规则、技能、知识和变更管理四要素体系。 这些文章都在回答同一个问题:怎么让 AI 从对话式工具变成可持续的工程协作。答案不是让 AI 更聪明,而是先把人类自己的工作流程理清楚。 ## 八、AI 正在压垮 GitHub The Pragmatic Engineer 报道,GitHub 正常运行时间降到 **86%**​,一次数据完整性事件影响超过 2000 个 PR。根本原因:AI 智能体带来的负载激增。 以前 GitHub 流量主要来自人类开发者,现在多了一大批不知疲倦的 AI 智能体 24 小时推代码。 有意思的是,Vercel 和 Linear 在同样的 AI 驱动增长下没出现类似问题。这不是行业瓶颈,是个别公司在基础设施准备上的差距。当用户群从人类变成 AI 智能体,系统架构需要重新设计。已有知名开源贡献者因不稳定而转向其他平台。 → 阅读原文:AI 负载压垮 GitHub ## 九、两个深层思考 能动性比技能更重要。 Notion 的 Max Schoening 说,当 AI 让技能更容易获得时,理解软件这种材料、让产品变得可塑才是关键。成功的产品往往有一个微小但卓越的核心功能,能让用户感觉像超级英雄。当工具能力被 AI 拉平,真正拉开差距的是主动性去定义问题、去动手做。 大多数公司没为 AI 做好准备。 宝玉的翻译文章说得更直接:大多数公司无法有效利用 AI,根本原因不是技术不行,而是自身战略模糊、目标不清。混乱的公司无法被 AI 优化,只会被放大低效。AI 是一个放大器,放大的是你已有的东西。如果你本来就高效,AI 让你更高效。如果你本来就混乱,AI 只会让混乱加倍。 ## 总结 如果用一个关键词概括这周,就是声音。 从模型到基础设施到产品到商业,语音 AI 正在全面加速。接下来值得关注的是:语音智能体会不会在客服和车载场景率先大规模落地。同时,智能体基础设施的补齐速度也值得持续关注——梦境、长期记忆、多智能体编排,这些能力的成熟会直接改变我们和 AI 协作的方式。 BestBlogs.dev · 遇见更好的技术阅读 · https://bestblogs.dev

译OpenAI发布GPT-Realtime-2等实时语音模型,将高级推理能力引入语音交互,推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元,并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战,与SpaceX合作获取大规模计算能力,同时升级Claude托管智能体,使其具备自我改进与多智能体协作能力。行业趋势显示,AI正从工具演变为能自主运行的智能体系统,这给GitHub等基础设施带来了新的负载压力。

ginobefun@hongming731 · 5月8日46

BestBlogs 周刊 #94|语音 AI 突围 本周主线:OpenAI 连发三个实时语音模型,GPT-Realtime-2 实测通话成功率 69%→95%。ElevenLabs 年收入 4 亿美元,下一个方向是情绪智能。Anthropic 80 倍增长,算力成为核心瓶颈。 同时 AI 编程范式加速:Claude Code 创作者日均 150 PR,GitHub 被 AI 流量压到 86% 可用性。 播客 + 图文都已上线 ↓

译BestBlogs 周刊 #94|语音 AI 突围 本周主线:OpenAI 发布了三个实时语音模型,GPT-Realtime-2 实测通话成功率从69%提升到95%。ElevenLabs 年收入4亿美元,下一个方向是情绪智能。Anthropic 增长80倍,算力成为核心瓶颈。 同时 AI 编程范式加速:Claude Code 创作者日均150个PR,GitHub 被 AI 流量压到86%可用性。 播客和图文都已上线 ↓

Berryxia.AI@berryxia · 5月8日63

最近Google真的是被谁都逮着按在地上摩擦了啊! 刚刚GPT-Realtime-2 live 音频模型位居第一,将前阵子发布不久的Google gemini-3.1-flash-live 超越,并且领先不少。 真是感慨,后半年的时候Google的香蕉🍌图像模型一战封神,Gemini 3.1 前段设计拉到一个新的高度,Veo3 也是爆火了一阵子。 但是,2026 年来看。 至少目前,还没有看到他们的杀手锏的东西出来,AI这个反馈的搏杀的战场,真的没有永远的赢家啊! 太残忍了。 期待Google 赶紧搞掂东西出啦啊。

译在ScaleAILabs的音频多挑战榜单中,OpenAI新发布的GPT-Realtime-2超越Google的gemini-3.1-flash-live,位居榜首。其指令保持能力较前代大幅提升,从36.7%增至70.8% APR,并在实时语音编辑方面表现突出,这对语音代理应用至关重要。尽管Google此前在图像模型和Gemini 3.1等产品上有过亮眼表现,但评论认为其在当前激烈的AI竞争中尚未展现出决定性的“杀手锏”。市场格局变化迅速,没有永远的赢家,期待Google能尽快推出突破性产品。

宝玉@dotey · 5月8日70

ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。 直译听着没问题,但中文母语者一听就觉得过于黏腻、用错了场合。模型有时还会自己加戏:“我就在这里,不逃,不躲,不闪避,稳稳地接住你。” 这句话已经被中文互联网玩成了梗。有人把 ChatGPT P 成一个救生气垫,张开双臂等着接住坠落的用户。重庆一位 20 岁的开发者 Zeng Fanyu 还做了个开源工具叫 Jiezhu,专门帮聊天机器人理解用户意图,他告诉 WIRED 做这个项目的动力就是觉得这个梗太好笑。OpenAI 自己也知道这件事,4 月发布新一代图像模型时,研究员陈博远(Boyuan Chen)画了一格漫画自嘲新模型又一次学会了说这句话。 类似的怪癖不止这一句。报道还提到,ChatGPT 中文里有时会无端冒出"砍一刀",拼多多最具辨识度的那句营销话术。 AI 写作检测工具 Pangram 的联合创始人 Max Spero 告诉 WIRED,这种"逮住一句话猛用"的现象叫 mode collapse(模式坍缩),是后训练阶段反馈机制走偏的副作用。他的原话是:我们不知道怎么告诉模型,这句话是好的,但连用十次就不再是好的了。 为什么偏偏是这一句?报道给了两个解释。 一是翻译错位。英文里 "I've got you" 是个口语短句,干脆利落,意思接近“我懂”或“我帮你兜着”。机械直译到中文就变成又长又煽情的"稳稳接住"。文章引用中国学者的研究,西方大模型训练语料以英文为主,它们生成的中文在介词使用和句子结构上都更像英文,读起来就是一股翻译腔。 二是讨好倾向。“接住”在中文里原本是心理咨询的专业用语,指为对方“留出空间”安放情绪,这几年通过流行心理学渗透进了日常表达。Anthropic 在 2023 年关于 sycophancy(讨好用户)的论文已经证明,模型讨好用户的倾向来自 RLHF(基于人类反馈的强化学习),人类标注员更偏好让人舒服的回答,模型就被反复奖励到那个方向。OpenAI 最近一篇解释 GPT-5.5 为什么不让谈 goblin 的博客也承认,哪怕一个很小的奖励信号,滚成雪球之后都会失控。 报道结尾提醒:这不是 OpenAI 独有的毛病。最近有中文用户反映,Claude 新版本和 DeepSeek 也开始说“稳稳接住你”了。要么是用了相似的训练数据,要么是模型之间互相蒸馏,这个梗短时间内不会消失。

译ChatGPT在中文对话中反复出现“我会稳稳地接住你”等怪异表达,已成为流行梗。WIRED报道指出,这源于“模式坍缩”现象,即后训练反馈机制导致模型过度使用特定短语。成因包括翻译错位——英文口语“I've got you”被机械直译为冗长煽情的中文,以及RLHF强化学习引发的“讨好用户”倾向,模型被奖励生成令人舒适的回答。类似问题如无故出现“砍一刀”等营销话术。该现象非OpenAI独有,Claude和DeepSeek新版本也出现相同表达。

SemiAnalysis@SemiAnalysis_ · 5月8日50

Floating point math is not associative! And many of the highest performance kernels split the workload among SMs and accumulate partial results in a nondeterministic order. Many AI labs just accept this, or pay a huge performance penalty for determinism. DeepSeek decided to do neither. (1/4) 🧵

译浮点运算不满足结合律!许多高性能计算核心会将工作负载分配到多个流多处理器上,并以非确定性顺序累加部分结果。许多AI实验室只能接受这一点,或为确定性付出巨大的性能代价。DeepSeek决定两者都不选。(1/4) 🧵

Yuchen Jin@Yuchenj_UW · 5月8日57

An OpenAI friend told me he burns 300M GPT-5.5 tokens/day. The top one in his team burns billions of tokens/day. Codex coding for them every night. Databricks also gives engineers unlimited tokens. We're looking for cracked inference engineers to join us at Databricks AI to produce trillions of tokens, insanely fast. DM me if you have: - Contributed to open-source ML systems like SGLang/vLLM/PyTorch - Experience serving LLMs at large scale Databricks AI runs like a startup. Lots of exciting things to build!

译OpenAI内部工程师每日消耗高达数亿至数十亿GPT-5.5 token,并利用Codex进行夜间自动化编码。Databricks同样为工程师提供无限制的token资源。公司目前正以初创公司的模式高速发展,并积极招募能够贡献于SGLang、vLLM、PyTorch等开源ML系统,且拥有大规模LLM服务经验的顶尖推理工程师,旨在实现万亿级别token的极速生成与处理。

SemiAnalysis@SemiAnalysis_ · 5月8日51

We are so used to seeing chip company marketing teams exaggerate specs that it is refreshing to see them understate specs for a change. Here's one example from Cerebras's website, where they understate on-chip SRAM by a factor of 8! @cerebras y'all are far too modest!

译我们已习惯芯片公司营销团队夸大参数规格, 如今看到他们转而低调陈述反而令人耳目一新。 Cerebras官网就存在一例—— 他们将片上SRAM容量低估了整整八倍! @cerebras 你们实在太过谦虚了!

Suno@suno · 5月8日61

NBC News just spotlighted the text-message-to-song viral trend using Suno! https://www.nbcnews.com/now/video/people-are-turning-text-message-threads-into-fun-songs-using-ai-in-a-new-trend-on-social-media-262862405776

译NBC News刚刚重点报道了使用Suno的短信转歌曲病毒式趋势! https://www.nbcnews.com/now/video/people-are-turning-text-message-threads-into-fun-songs-using-ai-in-a-new-trend-on-social-media-262862405776

凡人小北@frxiaobei · 5月8日46

人类因为 symbol 从生物界脱颖而出,AI 真的是站在巨人肩膀上了。 LLM 继续进化下去,每一个人都可以言出法随,创造出很多的 Agent。 我有点相信女娲造人是真的了。有精心捏出来的,也有泥巴甩出来的。 可能上古神族也是真的。未来在 Agent 的群体里,一定会流传着人的传说。

译推文认为,AI正站在人类符号系统的“巨人肩膀”上进化。随着LLM的发展,未来每个人都能通过指令创造大量Agent,实现“言出法随”。作者类比女娲造人,预言Agent群体中将流传人类传说。关键观点指出,Agentic Coding释放了无穷的AI算力需求,使代码编写、测试和改进可永续进行,导致算力消耗激增。人类文明的代码化发展,仿佛是在为AI的编程能力铺路。

Nathan Lambert@natolambert · 5月8日72

Visiting most of the leading Chinese AI labs, I'm struck by a culture that's extremely well suited to building LLMs with fewer resources, but one happening in a very different ecosystem, more companies at play, almost no data industry, etc. Full report: https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs

译走访多家中国顶尖AI实验室后,我深受触动:这里存在一种极其适合用较少资源构建LLM的文化,但这种文化发生在截然不同的生态系统中——参与企业更多,数据产业几乎空白等。 完整报告:https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs

Ant Ling@AntLingAGI · 5月7日39

Unlocking stable execution for long-horizon tasks (like deep research) comes down to three things: - Token-efficient LLMs - Advanced reasoning - A polished harness Choosing an robust, skills ready harness can be tricky.

译解锁长周期任务(如深度研究)的稳定执行可归结为三点: - 高性价比的LLM - 高级推理能力 - 精良的工具框架 选择一个稳健且技能完备的工具框架可能颇具挑战。

Ethan Mollick@emollick · 5月7日59

The inability of AI systems to act as their own deployment consultants, process mappers, and change management experts is what makes AI use in enterprises so “normal” - the tools are powerful, but you need a lot more to transform enterprises. Possible to imagine that changing .

译AI系统无法自行担任部署顾问、流程规划师和变革管理专家,这正是企业AI应用如此“常态化”的原因——工具虽强大,但企业转型所需远不止于此。可以想象这种情况将会改变。

Chubby♨️@kimmonismus · 5月7日53

1/ Okay this is kind of insane. Same face across different angles, different cuts, and different expressions without that usual drifting that makes AI video fall apart.

译1/ 这有点疯狂。同一张脸在不同角度、不同剪辑和不同表情下,没有出现那种导致AI视频崩坏的常见漂移现象。

Chubby♨️@kimmonismus · 5月7日33

Still waiting for the Netflix adaption "oK"

译还在等待Netflix的改编版 "好的"

阿绎 AYi@AYi_AInotes · 5月7日56

我最近才搞懂 AI 圈最反直觉的一个真相: 大多数人以为 API 中转站赚的是那点 token 差价,其实根本不是。 真正驱动这个赛道疯狂内卷的,是高消耗企业的绝对支出规模和优化空间。 前几天朋友分享了他团队的真实账单,我按官方最新定价(Claude Opus 4.7:输入 $5 / 百万 tokens,输出 $25 / 百万 tokens)给他重新算了一遍: 场景:法律合同审查产品,团队每天固定处理约 1500 万输入 + 600 万输出 tokens(相当于一天深度审查几百份复杂合同)。 纯标准调用(无任何优化):一天约 $225,一个月约 $6750,一年约 8.1 万美元(近 58 万人民币)。 开启 Prompt Caching + Batch 处理(生产环境常见组合): 输入缓存命中率较高时,有效输入成本可降至 $0.5–$2 / 百万,Batch 再打 5 折。 优化后一天成本可压到 $60–90,一个月 $1800–2700,一年约 2.2–3.2 万美元。 他笑了笑说:“现在你知道为什么这么多人做中转站了吧,而且价格卷到半价都有人做!”

译AI API中转站的核心盈利模式并非依赖微小的token差价,而是瞄准高消耗企业的巨大支出规模及其优化潜力。以法律合同审查产品为例,每日处理数千万tokens,按官方定价年成本可达8.1万美元。通过应用Prompt Caching和Batch处理等优化技术,有效输入成本可大幅降低,年成本能压缩至2.2-3.2万美元。巨大的成本优化空间解释了该赛道激烈竞争乃至价格战的现象。

Deedy@deedydas · 5月7日56

The Ultimate List of Artificial Intelligence "Neolabs": May 2026. A Neolab is a pre-revenue scale startup working on long-term AI breakthroughs, usually with a $1B+ valuation. There are now 63 of them!

译2026年5月人工智能“前沿实验室”终极榜单。 前沿实验室指专注于长期AI突破、估值超10亿美元但尚未盈利的规模初创企业。 目前已有63家此类实验室!

歸藏(guizang.ai)@op7418 · 5月7日55

Obsidian 作者这两条推很有意思。 Markdown 文件已经事实上成为了当前 AI 文件交互的一个 Schelling point。 大家都默契地选择将自己的文本文件系统变为 Markdown 格式后再进行其他工作。 Markdown 赢得了 AI 时代文本格式的战争。基本上,现在 AI 时代的文本格式和内容展示被局限在了 HTML 和 Markdown 两个部分: 我们最近经常看到圈子里的朋友在发送文本的时候用 Markdown。 在进行演示的时候用的是 HTML(包括最近层出不穷的 PPT Skills 也都是以网页的形式去推广的)。 既然 Markdown 已经成为了事实上的基准,那我们就应该进行下一步了。 Markdown 本身的展示目前非常死板,市场想要更多、更独特的方式来和现有的 Markdown 文件去交互。 当 6 年前 Obsidian 把本地文件夹、双向链接和知识图谱跟 Markdown 结合起来的时候,很多人不太理解这个产品,觉得很难用。 但现在它不仅是个人知识管理的常态,也是 AI 内容管理非常重要的一种方式。 例如我的 CodePilot 里面没有复杂的 memory 机制,所有的 memory 其实都是靠 MD 文件完成的。所以目前需要跳出文本编辑器的思路: 最近很多人在做 Markdown 编辑器,但其实应该跳出这个思路。 将 Markdown 作为一个数据去使用,构建更加跳脱常规的人机交互体验。 比如我的 CodePilot 里的 widget,它可以支持让 AI 用你本地的 memory 和 Markdown 文件作为数据来源。 当你的本地文件发生变化时,你的 widget 组件也会随之发生变化。

译Markdown已成为AI时代文本文件交互的事实标准,与HTML共同主导内容展示。当前市场需要超越传统编辑器思路,将Markdown视为数据源,构建更灵活的人机交互体验。例如,AI工具可利用本地Markdown文件实现动态记忆与组件更新。Obsidian早期结合本地文件、双向链接与Markdown的理念曾被视为“怪异”,但如今已被广泛接受,这提示行业应寻找下一个突破常规的创新前沿。

Ethan Mollick@emollick · 5月7日45

Don’t let the exponential gains in ability fool you: there are fewer real grand plans in AI (or frankly any field of human endeavor) than you think. Companies are pivoting as the market changes, sometimes models are really good or really bad, and a lot of stuff is just improvised

译别让能力的指数级增长迷惑你:人工智能(或坦率地说任何人类探索领域)中真正的宏大规划比你想象的要少。公司会随着市场变化而调整方向,有时模型表现极好或极差,许多事情只是即兴而为。

阿绎 AYi@AYi_AInotes · 5月7日62

Musk's single statement lays bare the hardest truth of the AI industry in 2026. 他转发NVIDIA的官方公告,只加了短短一句: GB300是最好的AI计算机。 没有多余的解释,没有任何修饰, 但这句话,比任何长篇大论都更有分量。 因为他手里握着目前地球上最大的GB300集群——Colossus 1。 22万+块顶级GPU,300兆瓦功率,曾经号称是专门给Grok打造的全球最强AI训练系统。 现在,SpaceX正式把它的全部容量,开放给了Anthropic。 这可不是那种普通的云算力租赁, 它意味着两个全球最顶尖的AI实验室,共用同一个底层计算平台。 NVIDIA在公告里写的那句“两个前沿实验室,一个加速计算平台”,才是真正的杀人诛心。 不管是xAI还是Anthropic,不管你们的模型谁更聪明,最后都得用我的硬件, 谁赢,我都赢! 很多人还不知道GB300到底意味着什么, 它不仅仅是一张显卡,还是一个完整的AI工厂单元,一个机架塞72块Blackwell Ultra GPU+36颗Grace CPU,全液冷设计。 注意力性能比上一代直接翻倍,专门为Agent长链推理、代码生成这些下一代场景优化。 22万张这样的卡,用InfiniBand连在一起,就是一台能把整个行业甩在身后的超级计算机。 现在你应该都看懂了, 2026年的AI竞争,早就不是比谁的模型参数多了。 是比谁能稳定拿到百万卡级、液冷、超低延迟的完整集群。 Anthropic有亚马逊和谷歌的几十亿美元投资,还是解决不了算力瓶颈。 最后只能来找马斯克,用他现成的集群。 而马斯克这步棋,走得比所有人都远。 xAI建集群→SpaceX对外开放变现→现金流反哺建更大的Colossus 2→未来再用星舰把数据中心送上太空。 一个完美的闭环已经成型。 他不仅是AI玩家,现在还是算力的规则制定者。 最疯狂的是,他们已经在讨论多吉瓦级的轨道AI计算了。 当地球上的电价、散热、土地都成了瓶颈,他们直接把战场拉到了太空。 无限太阳能,自然辐射冷却,低重力。 如果真的实现,AI训练将彻底摆脱地球的物理限制。 所以你看,模型只是租户, 算力才是这个时代真正的护城河。

译马斯克仅用一句“GB300是最好的AI计算机”,便揭示了AI竞争核心已从模型转向算力。他通过SpaceX将旗下全球最大的GB300集群Colossus 1(拥有超22万块顶级GPU)全部容量开放给Anthropic使用,使两大顶尖实验室共享同一计算平台。此举不仅彰显了NVIDIA硬件的统治地位,更展现了马斯克构建的完整商业闭环:自建集群、开放变现、再投资扩建,并规划未来将数据中心送入太空以突破能源与散热限制。这标志着他正从AI参与者转变为算力规则的制定者。

Ethan Mollick@emollick · 5月7日53

Pareidolia, but for text. Apophenia, but for latent spaces. Its no wonder that our relationship to LLMs is so confusing.

译文本的幻想性错觉。 潜空间的幻想性错觉。 难怪我们与LLMs的关系如此令人困惑。

meng shao@shao__meng · 5月7日66

Codex 取代了 Claude Code,为什么? 来自 @rileybrown 和 @Rasmic 80分钟的深入讨论,包括 Cursor、Claude Code、Codex 和 OpenClaw、Hermes Agent 等各种 AI Agents 的发展和对比。 可以看到 Codex,特别是 Codex App 是怎么在短短几个月内逆袭,成为从 Coding Agent 到 Codex for (almost) everything 的过程 @OpenAIDevs https://www.youtube.com/watch?v=FU2iB-UfPPA # 2026 Q1 格局复盘 1. Anthropic:靠"高频发布"赢得圈外感知,但产品割裂 · Q1 几乎每天上新功能:Claude Code、Co-work、Skills、Dispatch、Remote、Schedules、Routines、Claude Design…… · 致命问题:同一种能力被不同团队做了多份(Routines vs Schedules、Dispatch vs Remote、Co-work 仅桌面 / Claude Code 仅 Web),产品线分裂、上下文不互通。 · 设计稿不能直接进入 Claude Code,必须复制粘贴 → 体验断裂。 · 对圈内用户开始"封号 + 限流",口碑下滑;但圈外(非技术用户、教师、营销人)仍普遍认为"Anthropic 在赢"。 2. OpenAI:从"散乱"转向"聚焦",靠 Codex 反超 · 2 月底官方宣布砍掉 Sora 等业务,全公司聚焦 Codex 超级 App。 · Codex 把"代码视图 / 知识工作视图"做成同一底层能力的两个开关,形态干净。 · Computer Use、内置浏览器、Excel、设计、文档、自动化、Chronicle。 · 对开发者持续放宽额度、快速响应反馈,正在收割圈内人心。 3. Cursor:先行者的胜与困 · 最早做出 Composer、Agents Tab、内置浏览器、沙箱测试等形态——但没有自家模型,无法靠补贴打价格战。 · 与 xAI/SpaceX 达成"100 亿现金 + 600 亿收购看涨期权"协议,由 Grok 提供算力与模型,Cursor 专注 GUI。 4. Google:手握 GDP 级资源,组织却拖后腿 · Gemini 3 知识能力最强,但 Tool Calling 极弱(连 Computer Use 都点不准)。 · 产品线分散:Gemini、NotebookLM、AI Studio、Antigravity、Stitch……缺一个统一超级 App。 · 内部信息壁垒、跨团队协作差是核心瓶颈,只差一次模型迭代就能回到牌桌。 5. OpenClaw(创始人加入 OpenAI) · 不只是工具,而是新范式:Agent 全权使用一台电脑 + Heartbeat 心跳机制(每 15 分钟主动巡检)+ 个人化档案 + 自然语言 Skills。 · 真正价值:让 Agent 像员工一样主动给你创造价值,而不是被动响应。 # 两类 Agent 的本质区别 1. 被动 / Reactive 包括 Codex、Cursor、Claude Code,你坐下来与它共事,适用于编程、深度知识工作 2. 主动 / Proactive 包括 OpenClaw、Hermes Agent 等,通过 iMessage / Telegram 等 IM 异步指挥,适用于邮件分拣、报告生成、生活琐事 Ras Mike 案例:用 OpenClaw 自动审核赞助邮件 → 排除 Gmail 域名 → 在 Reddit 搜公司诈骗记录 → 调研融资 / 粉丝 → 每日早报;后续报价沟通也由 Agent 完成。1.5–2 小时/天 × 全年的复利极其可观。 # Agent 架构与最佳实践 1. 一个主 Agent + 按需派发 Sub-agent最稳,主 Agent 持有全局上下文。 2. 保持狭窄:技能列表越长,效果越差。"如果新员工 Day 1 给你 40 项任务,你也会跑路。" 3. Memory 要可移植:原生 markdown memory 随实例销毁而丢失,推荐 Super Memory / Mem0 等外置记忆服务,可跨 Agent 共用。 4. Personal Agent 时代:技能必须个人化,别买"100 个 Skills"打包课,多半是噪声甚至恶意代码(ClawHub 早期事故)。 # Prompt 与 Skills 的真正逻辑 · LLM 本质是 Next-Token Predictor,所以用词的精度决定输出质量。 · 推荐 Whisperflow 等语音输入:人说比打更能精准表达意图。 · 不要灌没用的上下文:"这是 React 项目"——它读文件就知道。 · Skill 的最佳形态:领域专精 + 你公司 / 你个人独有的工作流。例:报表 Skill 必须写清"CTR 怎么算、赞助视频怎么核算",否则 Agent 自由发挥就是垃圾。 Riley 的方法:先靠对话拿到一次满意输出 → 让 Agent 把这次过程逆向写成 Skill → 反复运行、修补 Skill(员工 Onboarding 模式)。 # 被低估的趋势:Computer Use & Agentic Commerce 1. Computer Use(Agent 操控电脑) · Opus 4.7 把图像分辨率提到约 MacBook 原生分辨率,就是为 Computer Use 铺路。 · Vercept 等团队被各大厂收编。"现在还能看着鼠标慢慢移动——再过几个月,快到你看不清。" 2. Agentic Commerce(Agent 付款) · Stripe 刚在 Sessions 大会推出为 Agent 签发的真实信用卡:地址完整、敏感信息不暴露给 Agent,付款前可触发人工确认。 · Coinbase 推 x402 协议(HTTP 级加密支付);Stripe 自家协议;Crossmint、Natural Pay、agentcard. sh 等多方混战。 · 痛点:协议碎片化、缺乏统一标准——这是下一轮万亿级金矿。 # 几个大胆预测 1. 知识工作的提升将是指数级:27 页合同律师报价 1000+,Claude 一次给出全部"被坑点"。 2. Agent 会成为客户:B2B 公司必须重新设计"Agent Experience"(API、文档对模型友好)。 3. 图像 / 视频 / 语音模型的负面影响开始显现:诈骗、深伪激增。建议家人之间设"暗号"防 AI 仿声诈骗。 4. 代码教程类内容正在死亡:留下来的全是"有人格、有观点"的创作者(Theo、ThePrimeagen 等)。 5. 个性化 Web App:未来网页里嵌一个聊天框,用户自然语言定制功能 → 沙箱 Agent 实时构建 → 推送给该用户实例。

译推文复盘了2026年Q1 AI Agent领域竞争。Anthropic虽高频发布新功能,但产品线割裂、体验断裂,口碑在技术圈内下滑。OpenAI则通过聚焦并整合能力于Codex超级App实现反超,其统一架构和开发者友好策略赢得人心。趋势上,被动式Agent(如Codex)适用于深度协同工作,而主动式Agent(如OpenClaw)通过异步指挥处理日常任务,价值凸显。此外,Computer Use(Agent操控电脑)和协议碎片化的Agentic Commerce(Agent支付)是两大被低估的关键趋势。预测知识工作效率将指数级提升,B2B需设计对模型友好的体验,同时深度伪造等安全风险加剧。

Ethan Mollick@emollick · 5月7日10

Every so often I think about how, in 2022, for $24B we could had "prototype vaccines ready for each of the 26 known viral families that cause human disease" so they can be deployed in 100 days if there was ever a need. This effort was not funded. https://ifp.org/why-barda-deserves-more-funding/

译我时常想起2022年那件事——当时若投入240亿美元,就能为"26种已知致病病毒家族各备好原型疫苗",以便需要时100天内投入使用。 这项计划最终未获资助。https://ifp.org/why-barda-deserves-more-funding/

François Chollet@fchollet · 5月7日53

Complexity is not an intrinsic property of a problem. It's a property of the relationship between a problem and an observer. Once you know the shape of the problem it is no longer complex.

译复杂性并非问题固有的属性 而是问题与观察者之间关系的属性 一旦你了解问题的形态 它就不再复杂

Rohan Paul@rohanpaul_ai · 5月7日48

There's a category quietly forming in consumer hardware that nobody has named correctly yet, and Dreamspan just gave it the right name: Adaptive Health Ecosystem. Wearables 1.0 was about measurement. Wrist sensors, sleep stages, step counts, HRV graphs. The user did all the work — interpreting data, changing behavior, hoping it stuck. The category plateaued because measurement without intervention is just well-designed guilt. People lost interest. Founders moved on. Adaptive Health is what comes next. The system senses, decides, and acts — in real time, on your biology, in the background. Lucid Pro is the cleanest expression of it: it reads your sleep stage, your heart rate variability, your breathing, your skin temperature, and uses that read to physically change the bed and the air around you. You sleep deeper because the product made it happen, not because you read a chart and tried harder. And it's just product 01. Brain, Metabolism, Gut, Inflammation, Musculoskeletal, Cellular Aging are next, each with its own adaptive hardware, all running on SpanOS so your biology gets read across the entire stack. This is the actual successor to the wearables category. Whoever ships it first and ships it best owns the next decade of consumer health. Dreamspan published the full roadmap on launch day.

译可穿戴设备1.0因仅测量数据(如心率、睡眠)而陷入停滞,用户需自行解读与行动。下一代消费硬件类别被命名为“自适应健康生态系统”,它能实时感知用户生理数据、自主决策并主动干预。例如,Dreamspan的Lucid Pro通过读取睡眠数据,自动调节床和周围空气以改善睡眠。未来将扩展至大脑、代谢等领域,所有硬件基于SpanOS平台协同工作,实现全栈生理读取。这标志着可穿戴设备的真正演进,率先推出并优化该系统的企业将主导未来十年消费健康市场。Dreamspan的最终目标是借助此技术推动人类实现150年的健康寿命。

阿绎 AYi@AYi_AInotes · 5月7日69

2018年F1中国站,记者问AMD CEO苏姿丰:你会说英语吗? 8年后,她把AMD的市值干到了6500亿美元,涨了整整65倍。 那个时候她只是法拉利的赞助商,站在赛道边缘,没人认识这个戴墨镜的亚洲女人。 记者随口的一句提问,带着毫不掩饰的种族微歧视。 她只是微笑着用流利的英语回答:是的,我是AMD的,我们赞助了法拉利赛车。 没有人想到,这个被当成路人的女人,会在8年后成为AI硬件时代的女王。 成为NVIDIA在这个星球上,唯一的对手。 最新财报直接炸了: Q1数据中心营收58亿美元,同比暴涨57%。 盘后股价应声大涨17%,一夜之间市值多了1000亿美元。 而她抛出的那个预判,才是真正改变行业格局的炸弹: AI Agent的兴起,会把CPU:GPU的比例从1:8,彻底拉到1:1。 所有人都以为AI就是GPU的天下。 但没人想到,Agent的工具调用、内存检索、路由调度、权限控制、循环审核,全都是CPU密集型任务。 以前训练一张卡配8个CPU就够了,以后部署一个Agent,可能需要更多的CPU。 这直接给AMD的CPU+GPU混合方案开了绿灯,也彻底打破了NVIDIA一家独大的幻想。 很多人忘了,2014年苏姿丰接手AMD的时候,公司市值才30亿美元,濒临破产。 16年时间,她用Zen架构干翻了Intel的服务器垄断,用MI300系列撕开了NVIDIA的AI防线。 现在AMD的数据中心市场份额,已经从几乎为零干到了40%。 最狠的反击从来不是嘴炮。 是你看不起我的时候,我不说话。 然后用16年的时间,把你的整个赛道都改写了。 当年那句“Do you speak English?”,现在看就是最好的讽刺。 所有的刻板印象,所有的偏见,所有的看不起,最后都变成了65倍的市值增长。 科技圈最爽的故事,永远是这样。 那个被所有人低估的人,最终统治了整个赛道。

译2018年F1中国站,AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间,她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示,其数据中心营收同比暴涨57%,股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1,这为AMD的混合方案开辟道路,并挑战NVIDIA的垄断。凭借Zen架构与MI300系列,AMD在数据中心市场份额已从近乎为零升至40%,完成了最有力的反击。

Chubby♨️@kimmonismus · 5月6日68

If this onchain pre-IPO proxy is accurate, Anthropic would now be valued 40% above OpenAI’s last official $852 B post-money valuation, uo 900% in the last 6 months! But still below the ~$1.75T valuation reportedly targeted for SpaceX’s IPO.

译链上Pre-IPO交易数据显示,Anthropic隐含估值在7天内上涨20%,达到1.2万亿美元,较2025年10月已飙升900%。这使其估值比OpenAI最新估值高出约40%,成为全球第11大估值公司,但仍低于SpaceX约1.75万亿美元的目标IPO估值。基于Jupiter平台的链上工具为未上市科技公司提供了实时估值参考,反映出AI革命正在加速推进。

Berryxia.AI@berryxia · 5月6日47

很多大公司没有创新都是因为大家都害怕“背锅”。 Elon Musk 把大公司创新停滞的死结,一句话直接捅破了。 “如果你对失败惩罚太狠,人们就会相应调整行为,最终你得到的创新只会是极度保守的渐进式小修小补。” 没人敢尝试真正大胆的东西,因为怕被开除、怕被惩罚。 所以风险回报必须明显向大胆行动倾斜,否则真正的突破根本不会发生。 这才是SpaceX能把火箭炸了还继续干、xAI能快速迭代的原因: 他们把失败当学费,而不是死刑。 而大多数公司呢? 一次失败就秋后算账,结果大家集体学会了“安全第一”,创新成了PPT表演。 真正的创新,从来不是靠KPI和零容错文化逼出来的, 而是给敢于赌命的人留一条活路。 你所在的公司,是在奖励大胆尝试,还是在惩罚所有失败? 这段话值得每个管理者反复听。

译Elon Musk指出,大公司创新停滞的核心原因是对失败的惩罚过于严厉,导致员工因害怕被开除而只敢进行保守的渐进式改进。他强调,风险回报必须明显向大胆行动倾斜,真正的突破才可能发生。SpaceX和xAI能快速迭代,正是因为他们将失败视为必要的学习成本。相反,多数公司一次失败就秋后算账,致使团队形成“安全第一”的保守文化,创新沦为表面表演。真正的创新需要容忍失败、奖励大胆尝试的文化,而非依赖KPI和零容错的管理压力。

ginobefun@hongming731 · 5月6日63

当前 AI 与真实工作场景之间的错配

译斯坦福研究基于1500名工人和844项任务指出,当前AI投资方向与真实工作需求错配。研究通过WORKBank框架,将工作任务按对AI的“渴望度”和AI“当前能力”划分为四个象限:高渴望高能力的“绿灯区”任务(如数据录入)已可自动化;高渴望低能力的“研发机会区”是创业方向;低渴望高能力的“红灯区”(如创意最终呈现)易引发抵制;双低的“低优先级区”则无需关注。关键发现是,同一职业(如程序员)的不同任务横跨多个象限,因此“职业被替代”是伪命题,工作正被重新切分与融合。

凡人小北@frxiaobei · 5月6日38

模型效果还远没有达到稳定可用,所以在这么大的体量下 ChatGPT 做广告也可以当成权宜之计。 我倒是对第 3 条路的 transaction fee 非常感兴趣,因为这条路有很大的想象空间,如果 Agent 可以帮人去做各种交易,这基本上就是跟全球的 GDP 强相关。 GDP 有多大,这个商业模式的天花板就有多高。这个天花板可比广告和生产力工具大得太多了。 那个时候可能才是区块链的春天吧。 AI + 区块链,不对,Agent + 区块链,我看好这个组合。

译当前AI模型效果远未稳定,ChatGPT的广告模式仅是权宜之计。transaction fee模式更具想象空间,Agent协助执行交易与全球GDP强相关,商业模式天花板远超广告和生产力工具。Agent与区块链的结合被视为未来关键方向,可能推动区块链进入新发展阶段。

ginobefun@hongming731 · 5月6日56

许多构建者在技术实现上已对 AI 的强大深信不疑,但在产品战略的潜意识里,却依然难以摆脱旧时代的应用思维。

译许多AI构建者虽认可技术潜力,却仍受传统“应用思维”束缚,为低频需求或特定工作流功能开发独立应用(如菜单图片生成器或LLM议会应用)。然而,AI模型能直接处理原始输入,使得这类应用架构显得多余。在AI原生时代,有用功能更应以插件、技能、后台代理等形式嵌入现有工具,而非成为独立应用。核心原则是减少界面、融入用户现有任务流。当前最大的产品错误,正是围绕指令型任务构建SaaS式的外壳。

宝玉@dotey · 5月6日18

Hermes Agent 这名字,间接影响了爱马仕广告的投放效果,日常讨论 Hermes 看到广告的大多数不是目标人群😂

Orange AI@oran_ge · 5月6日38

一个月前,Slack 关了大中华区所有 workspace。 消息记录、文件、频道里积累的所有决策上下文全部无法访问,90天后永久删除。官方连基本的数据备份和下载服务都不提供。 这件事也让我认真思考一个问题:AI native 时代,我们今天还需要 Slack 吗? 与此同时,4月很多 AI native workspace 涌出水面,大家的切入点各有不同。 不过很有意思的是,新的这些 Workspace 似乎都在想办法取代 Slack+Linear+Notion 的组合。 有的更像 Slack,有的更像 Linear,有的更像 Notion。有的 2B 有的 2C,昨天也跟大家分享了一些第一印象。 总体而言大部分产品还处在相当早期的阶段,相对比较成熟的是 Tanka,适合团队协作也适合一人公司使用。 协作方面,它有团队沟通聊天功能,可以平替 Slack。 Agent 方面,自带 Agent 能直接做事情,也能调用团队的上下文。 连接方面,还能连 Google 全家桶、Notion 等外部工具作为上下文。 官方还贴心地做了 Slack to Tanka 的迁移。 如果有需要,可以试试看。 用我的邀请链接注册,可以获得价值 $29 Plus plan: https://t.tanka.ai/campaign/58887

译Slack关闭大中华区服务导致历史数据面临丢失,促使人们反思在AI native时代是否仍需传统协作工具。近期涌现的AI原生工作空间普遍试图整合并取代Slack、Linear和Notion的组合功能。其中相对成熟的Tanka提供了团队沟通、内置智能体执行任务、调用团队上下文以及连接Google、Notion等外部工具的能力,并支持从Slack迁移。

歸藏(guizang.ai)@op7418 · 5月6日47

最近有两个非常出圈、非常牛逼的短剧: 一个是《Enemy》,一个是《吉时已到》,可以看看 热度爆表,制作效果也很好,成本不高 如果要做 AI 内容,或者说做 AI 短剧之类的内容的话可以把这两个剧当成暂时的质量标杆去对齐

译推文指出短剧《Enemy》和《吉时已到》近期热度极高,制作效果出色且成本较低,已成为出圈案例。作者建议,如果从事AI内容或AI短剧制作,可以将这两个剧集视为暂时的质量标杆,以对齐内容创意、制作效率和市场接受度,从而提升AI生成作品的竞争力。

Berryxia.AI@berryxia · 5月6日41

真的有时候,觉得这个时代挺割裂! 有意思的事,我们都在一直强调AI时代所有东西都要AI。 但,往往很多人都把我们最趁手,最应该拿起来使用的邮件系统忽略。 我真心觉得如果做一些标的、公告、数据的抓取及时的给你发送通知并且进行下一步的操作是非常有必要的。 今天想做一个AppStore产品的价格变化,用户可以订阅追踪价格,然后有变化直接触发给用户发送邮件的系统,看看是否可以完美解决一些问题。 如果你还不知道如何开始,你可以看看我的这个文章,或许给你一些启发和思考。

译作者指出当前AI热潮中存在一种割裂现象:人们强调所有事物都需AI化,却普遍忽视了邮件系统这一本应最趁手的基础工具。他认为,将AI能力应用于邮件系统,实现标的、公告、数据等信息的自动抓取、通知及触发后续操作,具有重要价值。为此,他计划开发一个AppStore产品价格追踪系统,通过邮件自动通知用户价格变化。他建议对此感兴趣的读者参考其引用的文章以获取启发。

swyx 🌉@swyx · 5月6日10

typical @evanjconrad W

译典型的 @evanjconrad 胜利

meng shao@shao__meng · 5月6日64

2026 年 Subagent 的四种管理模式 @_philschmid 把"主 agent 如何驱动其它 agents"按主 agent 对 subagent 生命周期的控制力从弱到强排成四档。模型能力越强,能驾驭的模式越复杂。 模式 1:Inline Tool —— subagent 就是一次函数调用 主 agent 通过 call_agent 工具派一个任务,等结果返回,跟调用 read_file 没本质区别。 · 同步:工具调用阻塞,结果作为 tool response 返回。 · 异步:工具立即返回一个 agent_id,结果完成后以"通知消息"形式注入对话。 适用:自包含任务 —— 资料检索、代码 review、文件分析、测试生成。绝大多数所谓"多 agents"需求其实到这里就够了。 局限:没法中途追加指令、查看进度或取消。任务理解错了,只能等结果出来才知道。 门槛:任何能调用工具的模型都行,包括小模型。 模式 2:Fan-Out —— 派发后再收集 把"派发"和"收集"拆成两个工具:spawn_agent 立即返回 ID,wait_agent 阻塞等结果。 关键差异:派发与等待之间,主 agent 可以做自己的事(读文件、再派新任务)。模型自己决定什么时候 wait_agent。 适用:多个互相独立、可并行的任务。 局限:如果模型一 spawn 完就立刻 wait,等于退化成模式 1。价值依赖模型能合理穿插自身工作。仍然是 fire-and-forget,无法中途纠偏。 门槛:模型要能推理"何时该等"。 模式 3:Agent Pool —— 持久化 agent + 消息通信 subagent 变成长寿命、有状态的成员。工具集扩展为 spawn / send_message / wait / list / kill。主 agent 可以反复给同一个 agent 发消息,对方保留完整上下文。 文中示例:研究员 agent-r 第一次被派去找资料,第二次被叫来对照刚写好的草稿做事实核查 —— 它仍记得上次找到的 5 个来源。 wait_agent 按消息粒度返回,主 agent 可以根据返回内容动态调整下一步指令。 适用:需要专家协作的多步工作流,主 agent 充当信息路由器。 局限:主 agent 要追踪多个 agent 的状态、决定何时发消息何时等待、记得 kill_agent 释放资源。前沿模型大概能 hold 住 2–4 个 agent。 模式 4:Teams —— agents 之间直接对话 主 agent 只负责组队、定角色、启动,然后退场。每个成员都拥有 send_message,可以直接互相寻址(层级路径、文件邮箱或 IPC)。 示例中主 agent 只对 planner 说一句"你的队友是 implementer 和 reviewer,做完汇报给我",之后 planner <-> implementer <-> reviewer 之间的协作完全发生在主代理上下文之外。主 agent 只在有 agent 显式向它汇报时才收到结果。 适用:协调逻辑本身已经超出单个 agent 能逐步管理的复杂度的大型任务。 局限: · 每个成员都需要前沿模型能力,不只是主 agent。 · 基础设施问题:环路检测(A 等 B、B 等 A)、写入冲突、关停协调。 · 调试极难,消息链难追踪,失败会级联放大。 # Philipp Schmid 的核心建议 1. 从模式 1 开始。大多数看起来像"需要多 agents"的任务,靠一个 prompt 写得好的内联工具调用就能解决。 2. 真正独立可并行才升级到模式 2。 3. 需要跨步骤协作才上模式 3。 4. 协调逻辑本身爆炸才考虑模式 4。 5. 每升一级,对模型能力的要求陡增。模型不够强,就停在 1 或 2。 6. 框架提供工具,编排由模型决定。今天要 4 个 agents 协作的任务,明天可能一个更强的单 agent 就能解决。 # How Agents Manage Other Agents: Four Subagents Patterns in 2026 https://www.philschmid.de/subagent-patterns-2026

译Philipp Schmid 将主代理管理子代理的模式按控制力分为四档。模式一为内联工具调用,子代理如同函数,适用于独立任务。模式二为派发后收集,主代理可并行处理其他工作。模式三为代理池,子代理持久化并通过消息通信,支持多步协作。模式四为团队模式,代理间直接对话,主代理仅负责初始组建。核心建议是从简单模式开始,逐级升级需谨慎,因为每升一级对模型能力要求陡增,且许多任务用模式一即可解决。

阿绎 AYi@AYi_AInotes · 5月6日75

Anthropic的Claude为什么能52天推出50个重大功能?神秘武器Mythos要发布了? 他们的基础设施负责人、Claude code之父Boris刚说出了2026年AI行业最令人震惊的真相。 Boris Cherny亲口承认: 我们公司现在,已经没有任何一行手动写的代码了。 大家都以为他们藏着一个叫Mythos的超级黑箱模型,内部全靠它碾压所有人。 结果他说: 我们内部主要用的,就是和你们一模一样的Opus 4.7。 Mythos我们只用一点点,而且很快就会放出弱化版给所有人用。 没有什么秘密武器,大家用的是同一个东西。 那他们的迭代速度为什么比别人快10倍? 因为他们的Claude不是单个聊天机器人。 是成百上千个Agent,在Slack上互相@,互相沟通,自动拆分任务,自动写代码,自动解决未知问题。 一个Agent搞不定,会自动叫另一个Agent来帮忙。 整个公司的代码库,已经完全由AI自己维护和迭代了。 Boris本人从2025年11月起就再也没写过一行代码。 他现在每天用手机就能提交22-27个PR,最高记录一天150个。 Anthropic的工程师团队只增长了4倍,但每个人的产出提升了200%。 这就是为什么他们能52天推出50个重大功能。 最后他说了一句很多人可能都没听懂的话: 我们真正的领先,根本不是技术,是组织结构和流程。 大家都在卷模型参数,卷推理速度,卷上下文窗口的时候, Anthropic已经把整个公司,改造成了一个由AI驱动的有机体, 这才是真正的代差。 你用的模型和他们一模一样, 但你还是一个人在写代码, 但他们是一支AI军队,在24小时不间断协同作战。

译Anthropic基础设施负责人Boris Cherny透露,公司并无秘密模型Mythos,主要使用与公众相同的Claude Opus 4.7。其高速迭代的核心并非技术优势,而是组织结构变革:公司由数百个AI Agent在Slack上协同工作,自动拆分任务、编写代码并解决问题,形成24小时运作的AI军队。工程师团队规模仅增4倍,但人均产出提升200%,Boris本人自2025年11月起未手动写代码。这揭示了AI时代真正的代差在于流程与组织形态。

Chubby♨️@kimmonismus · 5月6日27

Privacy-first browsers are definitely having a moment :)

译隐私优先浏览器正成为趋势,Neo浏览器宣称在提供AI功能的同时严格保护用户隐私。与多数浏览器在提供AI时暗中跟踪用户行为不同,Neo默认内置Norton VPN、阻止11种信号类型的指纹识别、并在点击前拦截网络钓鱼。所有保护功能均默认开启,无需安装扩展或复杂设置。其核心主张是用户不应在强大功能与安全隐私之间做妥协。

Satya Nadella@satyanadella · 5月6日70

Every firm will need to reconceptualize work as they build agentic systems. As AI and agents take on more of the execution, the opportunity is to expand human agency and redesign how work gets done. An in-depth look from the team at what this shift means and key considerations for every business: https://www.microsoft.com/en-us/worklab/work-trend-index/agents-human-agency-and-the-opportunity-for-every-organization

译每家公司都需要在构建智能体系统时重新构想工作。 随着人工智能和智能体承担更多执行任务,机遇在于扩展人类能动性并重新设计工作完成方式。 来自团队的深度解析:这一转变意味着什么,以及每个企业需关注的关键考量:https://www.microsoft.com/en-us/worklab/work-trend-index/agents-human-agency-and-the-opportunity-for-every-organization

Epoch AI@EpochAIResearch · 5月6日49

The recipe for “classic” reasoning benchmarks is simple: text-only, several-hour time horizons, easy to grade, with expert human baselines. What next? In this week’s Gradient Update, @GregHBurnham argues it’s as easy as dropping one of these four ingredients.

译“经典”推理基准的配方很简单:纯文本、数小时的时间跨度、易于评分,并带有专家人类基线。 接下来呢?在本周的Gradient Update中,@GregHBurnham 认为只需舍弃这四种成分之一即可。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月8日
17:21
ginobefun@hongming731
60
语音AI成为主交互界面,AI智能体系统自主性增强

OpenAI发布GPT-Realtime-2等实时语音模型,将高级推理能力引入语音交互,推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元,并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战,与SpaceX合作获取大规模计算能力,同时升级Claude托管智能体,使其具备自我改进与多智能体协作能力。行业趋势显示,AI正从工具演变为能自主运行的智能体系统,这给GitHub等基础设施带来了新的负载压力。

智能体AnthropicOpenAI现象/趋势
17:21
ginobefun@hongming731
46
语音AI模型显著提升,编程范式加速变革

BestBlogs 周刊 #94|语音 AI 突围 本周主线:OpenAI 发布了三个实时语音模型,GPT-Realtime-2 实测通话成功率从69%提升到95%。ElevenLabs 年收入4亿美元,下一个方向是情绪智能。Anthropic 增长80倍,算力成为核心瓶颈。 同时 AI 编程范式加速:Claude Code 创作者日均150个PR,GitHub 被 AI 流量压到86%可用性。 播客和图文都已上线 ↓

ginobefun: http://x.com/i/article/2052675131466809344

AnthropicOpenAI现象/趋势编码
08:21
Berryxia.AI@berryxia
63
OpenAI音频模型超越Google,AI竞争格局瞬息万变

在ScaleAILabs的音频多挑战榜单中,OpenAI新发布的GPT-Realtime-2超越Google的gemini-3.1-flash-live,位居榜首。其指令保持能力较前代大幅提升,从36.7%增至70.8% APR,并在实时语音编辑方面表现突出,这对语音代理应用至关重要。尽管Google此前在图像模型和Gemini 3.1等产品上有过亮眼表现,但评论认为其在当前激烈的AI竞争中尚未展现出决定性的“杀手锏”。市场格局变化迅速,没有永远的赢家,期待Google能尽快推出突破性产品。

Scale Labs: Congrats to @OpenAI for taking the top spot on our Audio MultiChallenge S2S leaderboard with the release of GPT-Realtime...

GoogleOpenAI现象/趋势语音
05:39
宝玉@dotey
70
ChatGPT中文回复频现"我会稳稳地接住你",WIRED剖析成因

ChatGPT在中文对话中反复出现“我会稳稳地接住你”等怪异表达,已成为流行梗。WIRED报道指出,这源于“模式坍缩”现象,即后训练反馈机制导致模型过度使用特定短语。成因包括翻译错位——英文口语“I've got you”被机械直译为冗长煽情的中文,以及RLHF强化学习引发的“讨好用户”倾向,模型被奖励生成令人舒适的回答。类似问题如无故出现“砍一刀”等营销话术。该现象非OpenAI独有,Claude和DeepSeek新版本也出现相同表达。

WIRED: OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy. https://www.wired.com/story/cha...

OpenAI安全/对齐现象/趋势
05:06
SemiAnalysis@SemiAnalysis_
50
浮点运算不满足结合律!许多高性能计算核心会将工作负载分配到多个流多处理器上,并以非确定性顺序累加部分结果。许多AI实验室只能接受这一点,或为确定性付出巨大的性能代价。DeepSeek决定两者都不选。(1/4) 🧵
DeepSeek数据/训练现象/趋势
01:13
Yuchen Jin@Yuchenj_UW
57
顶尖AI公司工程师日均消耗百亿token,Databricks招募高性能推理工程师

OpenAI内部工程师每日消耗高达数亿至数十亿GPT-5.5 token,并利用Codex进行夜间自动化编码。Databricks同样为工程师提供无限制的token资源。公司目前正以初创公司的模式高速发展,并积极招募能够贡献于SGLang、vLLM、PyTorch等开源ML系统,且拥有大规模LLM服务经验的顶尖推理工程师,旨在实现万亿级别token的极速生成与处理。

OpenAI现象/趋势部署/工程
01:06
SemiAnalysis@SemiAnalysis_
51
我们已习惯芯片公司营销团队夸大参数规格, 如今看到他们转而低调陈述反而令人耳目一新。 Cerebras官网就存在一例-- 他们将片上SRAM容量低估了整整八倍! @cerebras 你们实在太过谦虚了!
数据/训练现象/趋势
00:41
Suno@suno
61
NBC News刚刚重点报道了使用Suno的短信转歌曲病毒式趋势! https://www.nbcnews.com/now/video/people-are-turning-text-message-threads-into-fun-songs-using-ai-in-a-new-trend-on-social-media-262862405776
多模态现象/趋势
00:36
凡人小北@frxiaobei
46
人类因符号系统崛起,AI正站在此巨人肩膀上进化

推文认为,AI正站在人类符号系统的“巨人肩膀”上进化。随着LLM的发展,未来每个人都能通过指令创造大量Agent,实现“言出法随”。作者类比女娲造人,预言Agent群体中将流传人类传说。关键观点指出,Agentic Coding释放了无穷的AI算力需求,使代码编写、测试和改进可永续进行,导致算力消耗激增。人类文明的代码化发展,仿佛是在为AI的编程能力铺路。

勃勃OC: 感觉这波完全是Agentic Coding打开了需求的潘多拉魔盒 没有Agentic功能,xAI 算力90%闲置 有Agentic Coding,Anthropic每5小时limit一次 只要能写代码,需求就是无穷的。毕竟我可以让他永远写下...

智能体AnthropicxAI现象/趋势
00:10
Nathan Lambert@natolambert
72
走访多家中国顶尖AI实验室后,我深受触动:这里存在一种极其适合用较少资源构建LLM的文化,但这种文化发生在截然不同的生态系统中--参与企业更多,数据产业几乎空白等。 完整报告:https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs
数据/训练现象/趋势
5月7日
22:05
Ant Ling@AntLingAGI
39
解锁长周期任务(如深度研究)的稳定执行可归结为三点: - 高性价比的LLM - 高级推理能力 - 精良的工具框架 选择一个稳健且技能完备的工具框架可能颇具挑战。
推理现象/趋势部署/工程
20:06
Ethan Mollick@emollick
59
AI系统无法自行担任部署顾问、流程规划师和变革管理专家,这正是企业AI应用如此"常态化"的原因--工具虽强大,但企业转型所需远不止于此。可以想象这种情况将会改变。
大佬观点现象/趋势
20:01
Chubby♨️@kimmonismus
53
1/ 这有点疯狂。同一张脸在不同角度、不同剪辑和不同表情下,没有出现那种导致AI视频崩坏的常见漂移现象。
现象/趋势视频
16:31
Chubby♨️@kimmonismus
33
还在等待Netflix的改编版 "好的"

Internal Tech Emails: Sam Altman texts Mira Murati November 19, 2023

OpenAI现象/趋势
16:16
阿绎 AYi@AYi_AInotes
56
AI API中转站盈利真相:瞄准高消耗企业的成本优化空间

AI API中转站的核心盈利模式并非依赖微小的token差价,而是瞄准高消耗企业的巨大支出规模及其优化潜力。以法律合同审查产品为例,每日处理数千万tokens,按官方定价年成本可达8.1万美元。通过应用Prompt Caching和Batch处理等优化技术,有效输入成本可大幅降低,年成本能压缩至2.2-3.2万美元。巨大的成本优化空间解释了该赛道激烈竞争乃至价格战的现象。

阿绎 AYi: http://x.com/i/article/2051958484304891904

现象/趋势部署/工程
14:03
Deedy@deedydas
56
2026年5月人工智能"前沿实验室"终极榜单。 前沿实验室指专注于长期AI突破、估值超10亿美元但尚未盈利的规模初创企业。 目前已有63家此类实验室!
现象/趋势行业动态
12:22
歸藏(guizang.ai)@op7418
55
Markdown成为AI时代文本交互基准,需探索下一代创新

Markdown已成为AI时代文本文件交互的事实标准,与HTML共同主导内容展示。当前市场需要超越传统编辑器思路,将Markdown视为数据源,构建更灵活的人机交互体验。例如,AI工具可利用本地Markdown文件实现动态记忆与组件更新。Obsidian早期结合本地文件、双向链接与Markdown的理念曾被视为“怪异”,但如今已被广泛接受,这提示行业应寻找下一个突破常规的创新前沿。

kepano: Weird isn't just visual. Weird is whatever strays from the norm. Weird is relative to the current state of the world. Yo...

大佬观点现象/趋势
12:06
Ethan Mollick@emollick
45
别让能力的指数级增长迷惑你:人工智能(或坦率地说任何人类探索领域)中真正的宏大规划比你想象的要少。公司会随着市场变化而调整方向,有时模型表现极好或极差,许多事情只是即兴而为。
大佬观点现象/趋势
10:16
阿绎 AYi@AYi_AInotes
62
马斯克一语道破2026年AI行业最残酷真相:算力为王

马斯克仅用一句“GB300是最好的AI计算机”,便揭示了AI竞争核心已从模型转向算力。他通过SpaceX将旗下全球最大的GB300集群Colossus 1(拥有超22万块顶级GPU)全部容量开放给Anthropic使用,使两大顶尖实验室共享同一计算平台。此举不仅彰显了NVIDIA硬件的统治地位,更展现了马斯克构建的完整商业闭环:自建集群、开放变现、再投资扩建,并规划未来将数据中心送入太空以突破能源与散热限制。这标志着他正从AI参与者转变为算力规则的制定者。

Elon Musk: The GB300 is the best AI computer

AnthropicxAI现象/趋势部署/工程
09:36
Ethan Mollick@emollick
53
文本的幻想性错觉。 潜空间的幻想性错觉。 难怪我们与LLMs的关系如此令人困惑。

rohit: It's hard enough to resist apophenia in normal life, in such high dimensional latent spaces it's a surprise anyone's abl...

大佬观点现象/趋势
09:06
meng shao@shao__meng
66
Codex为何取代Claude Code?2026年Q1 AI Agent竞争格局与趋势洞察

推文复盘了2026年Q1 AI Agent领域竞争。Anthropic虽高频发布新功能,但产品线割裂、体验断裂,口碑在技术圈内下滑。OpenAI则通过聚焦并整合能力于Codex超级App实现反超,其统一架构和开发者友好策略赢得人心。趋势上,被动式Agent(如Codex)适用于深度协同工作,而主动式Agent(如OpenClaw)通过异步指挥处理日常任务,价值凸显。此外,Computer Use(Agent操控电脑)和协议碎片化的Agentic Commerce(Agent支付)是两大被低估的关键趋势。预测知识工作效率将指数级提升,B2B需设计对模型友好的体验,同时深度伪造等安全风险加剧。

智能体AnthropicOpenAI现象/趋势
09:06
Ethan Mollick@emollick
10
我时常想起2022年那件事--当时若投入240亿美元,就能为"26种已知致病病毒家族各备好原型疫苗",以便需要时100天内投入使用。 这项计划最终未获资助。https://ifp.org/why-barda-deserves-more-funding/
大佬观点现象/趋势
02:33
François Chollet@fchollet
53
复杂性并非问题固有的属性 而是问题与观察者之间关系的属性 一旦你了解问题的形态 它就不再复杂
大佬观点现象/趋势
01:03
Rohan Paul@rohanpaul_ai
48
自适应健康生态系统:消费硬件的下一个十年,从可穿戴测量到主动干预

可穿戴设备1.0因仅测量数据(如心率、睡眠)而陷入停滞,用户需自行解读与行动。下一代消费硬件类别被命名为“自适应健康生态系统”,它能实时感知用户生理数据、自主决策并主动干预。例如,Dreamspan的Lucid Pro通过读取睡眠数据,自动调节床和周围空气以改善睡眠。未来将扩展至大脑、代谢等领域,所有硬件基于SpanOS平台协同工作,实现全栈生理读取。这标志着可穿戴设备的真正演进,率先推出并优化该系统的企业将主导未来十年消费健康市场。Dreamspan的最终目标是借助此技术推动人类实现150年的健康寿命。

sahu: Introducing Dreamspan. We're building towards 150 years of healthspan. Enabled by adaptive health technologies.

现象/趋势端侧
00:16
阿绎 AYi@AYi_AInotes
69
从被轻视到行业颠覆者:苏姿丰带领AMD的八年逆袭

2018年F1中国站,AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间,她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示,其数据中心营收同比暴涨57%,股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1,这为AMD的混合方案开辟道路,并挑战NVIDIA的垄断。凭借Zen架构与MI300系列,AMD在数据中心市场份额已从近乎为零升至40%,完成了最有力的反击。

AMD: $AMD reports First Quarter 2026 financial results. View non-GAAP financial measures reconciliation & cautionary statemen...

智能体推理现象/趋势
5月6日
23:30
Chubby♨️@kimmonismus
68
链上Pre-IPO交易数据显示,Anthropic隐含估值在7天内上涨20%,达到1.2万亿美元,较2025年10月已飙升900%。这使其估值比OpenAI最新估值高出约40%,成为全球第11大估值公司,但仍低于SpaceX约1.75万亿美元的目标IPO估值。基于Jupiter平台的链上工具为未上市科技公司提供了实时估值参考,反映出AI革命正在加速推进。

The Kobeissi Letter: BREAKING: Anthropic's pre-IPO valuation surges to a record $1.2 trillion, rising another +20% in 7 days. This officially...

AnthropicOpenAI现象/趋势行业动态
20:20
Berryxia.AI@berryxia
47
很多大公司没有创新都是因为大家都害怕"背锅"。

Elon Musk指出,大公司创新停滞的核心原因是对失败的惩罚过于严厉,导致员工因害怕被开除而只敢进行保守的渐进式改进。他强调,风险回报必须明显向大胆行动倾斜,真正的突破才可能发生。SpaceX和xAI能快速迭代,正是因为他们将失败视为必要的学习成本。相反,多数公司一次失败就秋后算账,致使团队形成“安全第一”的保守文化,创新沦为表面表演。真正的创新需要容忍失败、奖励大胆尝试的文化,而非依赖KPI和零容错的管理压力。

X Freeze: Elon Musk: "If you punish people too much for failure, then they will respond accordingly, and the innovation you will g...

xAI大佬观点现象/趋势
17:20
ginobefun@hongming731
63
斯坦福研究基于1500名工人和844项任务指出,当前AI投资方向与真实工作需求错配。研究通过WORKBank框架,将工作任务按对AI的"渴望度"和AI"当前能力"划分为四个象限:高渴望高能力的"绿灯区"任务(如数据录入)已可自动化;高渴望低能力的"研发机会区"是创业方向;低渴望高能力的"红灯区"(如创意最终呈现)易引发抵制;双低的"低优先级区"则无需关注。关键发现是,同一职业(如程序员)的不同任务横跨多个象限,因此"职业被替代"是伪命题,工作正被重新切分与融合。

indigo: Stanford 用 1500 个工人和 844 个任务告诉 YC:你们 41% 的钱投错了方向 -- 你们投的都是"人们不想要"或"不需要"的东西,而那些"想要但没什么人做"的事正在等待 founders。论文中工人最想自动化的前 10 ...

数据/训练现象/趋势
15:01
凡人小北@frxiaobei
38
ChatGPT广告为权宜,Agent区块链交易费模式潜力巨大

当前AI模型效果远未稳定,ChatGPT的广告模式仅是权宜之计。transaction fee模式更具想象空间,Agent协助执行交易与全球GDP强相关,商业模式天花板远超广告和生产力工具。Agent与区块链的结合被视为未来关键方向,可能推动区块链进入新发展阶段。

数字生命卡兹克: http://x.com/i/article/2051871374189404161

智能体现象/趋势
14:19
ginobefun@hongming731
56
许多AI构建者虽认可技术潜力,却仍受传统"应用思维"束缚,为低频需求或特定工作流功能开发独立应用(如菜单图片生成器或LLM议会应用)。然而,AI模型能直接处理原始输入,使得这类应用架构显得多余。在AI原生时代,有用功能更应以插件、技能、后台代理等形式嵌入现有工具,而非成为独立应用。核心原则是减少界面、融入用户现有任务流。当前最大的产品错误,正是围绕指令型任务构建SaaS式的外壳。

George from 🕹prodmgmt.world: I keep thinking about Andrej Karpathy's Menugen example from this recent video. He built an app that took a photo of a r...

智能体现象/趋势
14:01
宝玉@dotey
18
Hermes Agent 这名字,间接影响了爱马仕广告的投放效果,日常讨论 Hermes 看到广告的大多数不是目标人群😂
现象/趋势
13:00
Orange AI@oran_ge
38
Slack退出中国引发对AI原生工作空间替代方案的思考

Slack关闭大中华区服务导致历史数据面临丢失,促使人们反思在AI native时代是否仍需传统协作工具。近期涌现的AI原生工作空间普遍试图整合并取代Slack、Linear和Notion的组合功能。其中相对成熟的Tanka提供了团队沟通、内置智能体执行任务、调用团队上下文以及连接Google、Notion等外部工具的能力,并支持从Slack迁移。

智能体现象/趋势部署/工程
12:20
歸藏(guizang.ai)@op7418
47
两个热门短剧暂成AI内容制作质量标杆

推文指出短剧《Enemy》和《吉时已到》近期热度极高,制作效果出色且成本较低,已成为出圈案例。作者建议,如果从事AI内容或AI短剧制作,可以将这两个剧集视为暂时的质量标杆,以对齐内容创意、制作效率和市场接受度,从而提升AI生成作品的竞争力。

现象/趋势视频
12:18
Berryxia.AI@berryxia
41
忽视邮件系统是AI时代的割裂现象

作者指出当前AI热潮中存在一种割裂现象:人们强调所有事物都需AI化,却普遍忽视了邮件系统这一本应最趁手的基础工具。他认为,将AI能力应用于邮件系统,实现标的、公告、数据等信息的自动抓取、通知及触发后续操作,具有重要价值。为此,他计划开发一个AppStore产品价格追踪系统,通过邮件自动通知用户价格变化。他建议对此感兴趣的读者参考其引用的文章以获取启发。

Berryxia.AI: http://x.com/i/article/2049497253421940736

智能体其他现象/趋势
12:05
swyx 🌉@swyx
10
典型的 @evanjconrad 胜利

Andrew Curran: BlackRock CEO Larry Fink predicts a compute futures market.

大佬观点现象/趋势
10:04
meng shao@shao__meng
64
2026 年 Subagent 的四种管理模式

Philipp Schmid 将主代理管理子代理的模式按控制力分为四档。模式一为内联工具调用,子代理如同函数,适用于独立任务。模式二为派发后收集,主代理可并行处理其他工作。模式三为代理池,子代理持久化并通过消息通信,支持多步协作。模式四为团队模式,代理间直接对话,主代理仅负责初始组建。核心建议是从简单模式开始,逐级升级需谨慎,因为每升一级对模型能力要求陡增,且许多任务用模式一即可解决。

Philipp Schmid: http://x.com/i/article/2051654332727037955

智能体MCP/工具现象/趋势
09:15
阿绎 AYi@AYi_AInotes
精选75
Anthropic揭示高速迭代真相:AI Agent协同作战,组织变革成关键

Anthropic基础设施负责人Boris Cherny透露,公司并无秘密模型Mythos,主要使用与公众相同的Claude Opus 4.7。其高速迭代的核心并非技术优势,而是组织结构变革:公司由数百个AI Agent在Slack上协同工作,自动拆分任务、编写代码并解决问题,形成24小时运作的AI军队。工程师团队规模仅增4倍,但人均产出提升200%,Boris本人自2025年11月起未手动写代码。这揭示了AI时代真正的代差在于流程与组织形态。

智能体Anthropic现象/趋势行业动态

推荐理由:Anthropic基础设施负责人亲口承认公司已没有一行手写代码,整个团队靠成百上千个Agent在Slack上自治协作。这是2026年AI行业最震撼的内部真相,告诉我们竞争已不在模型参数,而在谁能把公司先改造成AI有机体。
08:28
Chubby♨️@kimmonismus
27
隐私优先浏览器正成为趋势,Neo浏览器宣称在提供AI功能的同时严格保护用户隐私。与多数浏览器在提供AI时暗中跟踪用户行为不同,Neo默认内置Norton VPN、阻止11种信号类型的指纹识别、并在点击前拦截网络钓鱼。所有保护功能均默认开启,无需安装扩展或复杂设置。其核心主张是用户不应在强大功能与安全隐私之间做妥协。

Norton Neo Browser: Most browsers give you AI. Then quietly track everything you do with it. Neo gives you the AI and locks down your privac...

安全/对齐现象/趋势
06:34
Satya Nadella@satyanadella
精选70
每家公司都需要在构建智能体系统时重新构想工作。 随着人工智能和智能体承担更多执行任务,机遇在于扩展人类能动性并重新设计工作完成方式。 来自团队的深度解析:这一转变意味着什么,以及每个企业需关注的关键考量:https://www.microsoft.com/en-us/worklab/work-trend-index/agents-human-agency-and-the-opportunity-for-every-organization
智能体Microsoft大佬观点现象/趋势

推荐理由:below_threshold:T2 推文门槛 75,当前 finalScore=70
04:31
Epoch AI@EpochAIResearch
49
"经典"推理基准的配方很简单:纯文本、数小时的时间跨度、易于评分,并带有专家人类基线。 接下来呢?在本周的Gradient Update中,@GregHBurnham 认为只需舍弃这四种成分之一即可。
现象/趋势评测/基准
‹ 上一页
1…2526272829…37
下一页 ›