AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1476 条
全部一手资讯X论文
标签「现象/趋势」清除
ginobefun@hongming731 · 5月20日66

http://x.com/i/article/2056903923454414848 # BestBlogs 早报 · 05-20|Google I/O 2026、Karpathy 加入 Anthropic、Claude Managed Agents 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-20 ## 导语 智能体生态在同一天迎来三个关键节点。Google I/O 把 Gemini 3.5、Antigravity CLI 与 WebMCP 一次性补齐,让一个开发者就能调度子智能体跑完整条工作流;Anthropic 同期把 Managed Agents 推进企业安全边界,又拿下 Karpathy 重返一线研发。再往下,Martin Fowler、Cline、Spotify 与 LiteRT-LM 分别给出代码可维护性、智能体成熟度、个性化推荐与端侧推理的工程化样本。 如果把今天浓缩成一条线索:整个行业正在把「智能体」从单点能力,拼装成一条可工程化、可被企业安全约束消费的完整生产链路。 模型层、编排层、运行时、连接器、推荐与代码治理同时在补齐,而不是某个明星模型再涨几个 benchmark。 更具体地说,今天值得用一杯咖啡的时间慢慢消化的是三件事:第一,Google 把 Antigravity 2.0 / Antigravity CLI / Managed Agents / Android CLI / WebMCP 这一长串原本属于不同团队的能力,第一次拼成了一条完整链路;第二,Anthropic 用 Self-hosted Sandbox 与 MCP Tunnels 把「企业内执行 + 私有数据接入」两块最硬的合规阻力同时拆开;第三,Karpathy 加入 Anthropic 这条信号,在「人才结构」「研究文化」「行业站队」三个维度都会发酵很久。其余 14 条精选与扩展阅读,本质上是给这条主线条做注脚——从工程治理(Martin Fowler)、智能体成熟度(Cline)、端侧推理(LiteRT-LM)、推荐范式迁移(Spotify)到内容溯源(OpenAI),每一条都在告诉我们「智能体落到工程里到底意味着什么」。 ## 精讲一:Google I/O 2026 开发者主题演讲全览 Google I/O 2026 把过去一年的 AI 投资全部押在了「智能体」这条主线上,模型、平台、运行时一次性补齐。在这次发布里,最值得开发者关注的不是某一项 demo,而是 Google 第一次把「构建—运行—交付智能体」整条工程链路一次性铺到了开发者面前。 关键事实:Gemini 3.5 系列模型登场,覆盖从 Pro 到 Flash 的多档位;Antigravity 2.0 与全新的 Antigravity CLI 让一个开发者就能并发调度多个专用子智能体跑完复杂工作流,平台内置跨平台终端沙箱、凭据掩码与硬化的 Git 策略;Managed Agents 通过 Gemini API 一行调用即得到一个带远端 sandbox 的完整 agent;Antigravity SDK 则把整套 agent harness 开放给企业自托管。 Android 与 Web 两端也在补齐。Android CLI 把 Android Studio 的能力封装成任意 LLM 都能调用的工具​,支持下载 SDK、设备真机运行等重型操作;同时开源了一批 Android skills,帮助 LLM 跑通 Jetpack Compose 迁移、Navigation 3 迁移这类「重」流程。Web 端推出的 WebMCP(Chrome 149 起进入 Origin Trial)让浏览器内智能体可以直接消费网页的结构化能力,而不是再靠脆弱的 DOM 抓取。 为什么重要:过去两年我们看到的多数 AI 发布会,要么只是「模型变强了几个百分点」,要么只是「IDE 加了 Copilot」。Google I/O 2026 的特殊之处在于:它把过去散落在五六个团队里的 agent harness、sandbox、CLI、SDK、Studio、Bench、Migration agent 一次性串起来,让一个独立开发者也能像调度团队一样调度子智能体。这条线索和今天另一头的 Anthropic Managed Agents 几乎是镜像的——两家头部公司都在赌「一年内 agent 进入企业生产环境」这件事必须发生。 值得展开的几条细节:第一,Antigravity 2.0 第一次让「一个开发者并发驱动多个子智能体」从概念变成日常工作流,sandbox、凭据掩码、Git 策略这些原本属于平台安全团队的能力被前置到 IDE 默认体验里,这在「单兵开发者」与「企业内部平台团队」之间画了一条新的能力分界线。第二,Managed Agents 通过 Gemini API 一行调用即得到一个完整 agent 实例,让以前需要自己维护 K8s + sandbox + observability 的中小团队,可以直接复用 Google 的运行时;同时 Antigravity SDK 又开放了反向选项——大企业可以拿走整个 agent harness 自托管,把 agent loop 也放回自家 VPC。第三,Android Bench 这次把 Gemma 4 等开源权重模型也纳入了榜单,跟之前的「闭源主导榜单」形成对照,意味着 Google 自己也愿意让开发者基于客观榜单做模型选择。 阅读建议:先抓 Antigravity CLI 与 Managed Agents 这两个动作,再去看 Android CLI 与 WebMCP 是怎么把「移动端 / 浏览器端工程能力」往智能体可调用的方向拆开。原文一次性给出了所有跳转链接,非常适合作为你这一周的入口索引。 ## 精讲二:Karpathy 重返一线研发:宣布加入 Anthropic Andrej Karpathy 在 X 上官宣加入 Anthropic,这是近一两年最具信号意义的一次 AI 人才流动。 关键事实:Karpathy 是 OpenAI 创始成员之一,先后担任 OpenAI 研究科学家与特斯拉 AI 总监;过去两年他从大厂体系出来,独立做 nanoGPT、minGPT 与「zero-to-hero」系列教学,是「学者—工程师」融合路径上最具影响力的代表人物之一。他在公告里强调:加入 Anthropic 是为了重返前沿 LLM 研究第一线,同时继续在教育方向上投入。 为什么重要:第一层信号是技术站队——一个对 LLM 训练栈最熟悉、且没有平台利益绑定的研究者,主动选择 Anthropic,这本身就是对 Anthropic 未来几年 LLM 路线的强背书,跟今天 Claude Managed Agents 把企业沙箱、MCP Tunnels 一次性补齐互为印证。第二层信号是行业人才结构——头部 AI 公司开始为「长期影响力型研究者」预留位置,而不再把高杠杆人才当成纯生产资源消耗。从今天往前看的几个季度,预计其他实验室的招聘策略与研究文化都会被这条信号轻微改写。 与今天其他故事的关系:Karpathy 这条新闻和精讲三的 Managed Agents 几乎可以放在一起读——Anthropic 同时在「研究人才」与「企业级 agent 产品形态」两条线上加码,对应的是它对未来两年「模型 + 产品 + 安全边界」整体卡位的判断。 值得多想的一层:Karpathy 过去两年最反复强调的事情是「教育优先 / 工程化 ML stack 的可读性」。他这次选择 Anthropic,而不是回到 OpenAI、也没有继续完全独立做研究 + 教学,背后大概率是他认可了 Anthropic 当前的研究文化与产品节奏——这家公司愿意把高杠杆研究者放在「研究 + 长期方向」位置上,而不是把他们当成季度交付资源消耗。结合今天 Managed Agents 的发布看,Anthropic 在过去一年里以一种相当克制的节奏,把「研究能力 → 产品形态 → 企业级合规」三层逐步搭起来;Karpathy 加入会进一步把研究侧的「可教学 / 可复现 / 公开 stack」气质带进产品决策。 阅读建议:原推文很短,但建议顺着 Karpathy 过去一年的「LLM training stack 教程」「nanoGPT 重写」与他对 RL / agent 的几条公开发言一起看,会更理解他这次选择的语境。 ## 精讲三:Claude Managed Agents 新功能:自托管沙箱与 MCP 隧道 | Claude Anthropic 把 Claude Managed Agents 推进到真正的企业级形态:从今天起,Managed Agents 可以在「你控制的 sandbox」中执行工具,并通过 MCP Tunnels 安全连接到企业私有 MCP 服务器与内部数据库。 关键事实​:两件事并行发布。第一,自托管 Sandbox(公测)——工具执行可以落在企业自己的基础设施,或交给 Cloudflare、Daytona、Modal、Vercel 这类合作 sandbox 提供商;agent loop(编排、上下文管理、错误恢复)仍跑在 Anthropic 侧。第二,MCP Tunnels(研究预览)——智能体通过单条出向连接,安全访问内网 MCP 服务器、私有数据库、工单系统、CRM,不再需要把内网 API 暴露到公网。 为什么重要:这两件事拼出了 enterprise agent 商业化的两块关键拼图:「在企业安全边界内执行任务」与「合规连接私有数据」。过去阻挡 agent 真正进入大企业生产环境的,从来不是模型能力不够,而是「工具执行落在哪条网络」「私有数据怎么不出域被访问」这类合规问题。Anthropic 用 sandbox + MCP Tunnel 两层组合,把这两个最硬的合规阻力同时拆开。 与今天其他故事的关系:和精讲一的 Google Antigravity SDK / Managed Agents API 形成清晰对照——头部两家都在赌「企业级 agent 商业化」这一年必须落地;和精讲二的 Karpathy 加盟串在一起读,能感受到 Anthropic 在研究、产品、合规这三条线上同时加码的节奏。 值得多看的工程细节:sandbox 那一层并不是简单的「换个容器」。文章里给的几条对照很有意思——Cloudflare 用 microVM + isolates 做大规模超低开销隔离,强调零信任凭据注入与可审计 egress;Daytona 强调「长会话有状态、可暂停可恢复」,更像一台 24/7 可登的远程开发机;Modal 直接把 sandbox 跑在自家 AI 工作负载容器运行时上,亚秒级冷启,按需弹性 CPU / GPU;Vercel 把 VM 安全、VPC peering 与「凭据在网络边界注入、永不进入 sandbox 内部」做成默认行为。同时 Amplitude、Clay、Rogo 三家客户案例分别覆盖了「品牌可控的设计 agent」「自主运转的 GTM agent」「机构金融的合规 analyst agent」三类典型企业场景,可以作为评估自家业务匹配度的参照。 阅读建议:原文里 Cloudflare、Daytona、Modal、Vercel 四家 sandbox 提供商的实际能力差异值得花十分钟对照——它们在「冷启延迟」「长会话保活」「VPC 接入」「凭据注入」上各有取舍,决定了你团队接入时该选谁。 ## 速览 1. 面向编码智能体的可维护性传感器 · Martin Fowler Martin Fowler 把「可维护性」从一个抽象目标变成可操作的工程信号:在 AI 编码智能体的工作回路里挂一组「传感器」——静态分析、循环复杂度、重复度、架构契约检测——给智能体提供实时反馈,让它能自我纠正。文章给的样例项目是一个数据驱动的内部分析仪表盘,作者按照「coding 期 / pipeline 期 / 定时 / 生产运行时」四个时间窗,分别讨论该挂哪些传感器、用什么阈值告警。他特别指出:当 AI 改一个小需求开始影响 5 个文件以上,往往就是「内部质量出现裂缝」的第一个信号——这条经验法则今天就能搬到团队 PR review 流程里。对正在让 Claude / Cursor / Antigravity 接管整个 repo 的团队,这套思路比单纯「写规则文件」要可持续得多。 2. 别构建垃圾:AI 智能体成熟度的四个层级 · AI Engineer Cline 的 Ara Khan 在 AI Engineer 大会上给出一套非常务实的四级智能体成熟度框架:L1 直接用 LangChain / LangGraph 跑通 PoC(通常 30 分钟就能验证一个 agent flow 是否值得做),L2 用状态机精修关键路径,L3 引入「伪 RL」反馈管线做评测与回滚,L4 上升到架构纪律与前沿 API 行为治理。她特别强调一点:标准框架在 PMF 验证期非常有效,但越往企业级走,框架的「刚性」就越变成阻力,团队必须有勇气在某个时间点拆掉框架、自己写 harness。她还把「prompt 越短越好」「不要让 agent 自己回忆历史,把状态显式管起来」「不要把前沿模型当稳定 API 用」这几条工程纪律单独拎出来强调。配合今天 Google Antigravity SDK 与 Anthropic Managed Agents 一起看,这四级框架基本就是大多数团队未来一年的 agent 路线图。 3. 让 Skill 自己训练自己:8 阶段 Loop、3 层评测、5 维 AND 门控 · 腾讯云开发者 腾讯云开发者团队提出并实现了一个叫 skill-evolver 的自进化框架,把 Karpathy 的 autoresearch 外循环、Anthropic skill-creator 的评测引擎、Stanford Meta-Harness 的 trace 诊断思想缝合成一个完整管线:8 阶段 Loop 负责一轮一轮自我改写,3 层评测(单元 / 集成 / 真实业务)负责打分,5 维 AND 门控负责防止「在一个维度上拿高分补另一个维度低分」。作者在文中给出了 19 轮零回滚的自进化记录与一个真实业务 skill 的实战结果。对正在大量积累 SKILL.md 的团队,这是一篇罕见地从「prompt → harness → 训练框架」一路推到落地的中文实战长文。 4. 五分钟回顾 LLM 的最近六个月 · Simon Willison's Weblog Simon Willison 在 PyCon US 2026 做了一场五分钟闪电演讲,覆盖 LLM 最近六个月的关键变化,被他本人称为「2025 年 11 月拐点之后的回顾」。核心论点有两个:一是过去半年「最佳模型」头衔在 Anthropic、OpenAI、Google 三家之间易手了五次,单一模型领先已不再是常态;二是 2025 年 11 月之后,编码智能体真正进入「可靠到敢交给它跑」的阶段,而本地模型在能力上也开始大幅超出预期。文章是带注释的幻灯片,非常适合作为这半年技术变迁的索引,配合精讲一今天 Google I/O 的发布读,能立体感受「拐点之后行业到底走到哪了」。 5. Project Glasswing:Mythos 漏洞研究模型给我们的启示 · The Cloudflare Blog Cloudflare 把 Anthropic 的 Mythos Preview 模型接入了自家 Project Glasswing 漏洞研究流水线,扫了 50 多个内部仓库。文章最有价值的不是「模型多强」,而是工程化结论:Mythos 在漏洞链利用与 PoC 生成上确实跨越了一个量级,但要把它跑到「可扩展、可信噪比可控、可挂载到日常 CI」的状态,必须自己搭一层 harness——包括 recon agent、子领域 agent 拆解、噪音去重、跨仓批量调度等。Cloudflare 给出了一个非常具体的多阶段 pipeline 图,可以直接当作团队接入 Mythos 类模型的参考蓝本。 6. 使用 LiteRT-LM 实现超快速的端侧 GenAI · Google Developers Blog LiteRT-LM 是 Google 用来在端侧部署 Gemma 4 的跨平台运行时,已经在 Chrome、ChromeOS、Pixel Watch 以及 Google AI Edge Gallery 应用里上线。文章重点说了三件事:GPU/NPU 加速与精细的算子调度让 ~2.58GB 的 Gemma 4 E2B 在 Apple 移动 CPU 上跑出仅 607MB 的物理内存占用;多 Token 预测(MTP)只需两行配置即可启用,最高带来 2.2× 解码加速;高级会话管理让上下文切换不再需要重跑整段历史。在 Android 上,Gemma 4 还可以作为系统服务通过 AICore 调用,让多个 App 共享同一份模型实例与 KV cache。这是今天少数没在 I/O 主舞台被特别 highlight、但实际工程含量很高的 Google 发布之一,对手机厂商、IM 厂商、笔记应用都是直接可用的端侧推理底座。 7. LLM 时代的个性化推荐:Spotify 生成式推荐引擎的三大技术支柱 · AI Engineer Spotify 的 Shivam Verma 在 AI Engineer 大会上详解 Spotify 如何用一个统一 LLM 驱动的生成式推荐引擎,替换掉过去碎片化的多模型推荐流水线。Spotify 当前管理着超过 1 亿首音乐、数百万播客、40 万有声书,月活 7.5 亿,过去的传统推荐架构(trad-rec)下,候选生成、排序、各产品入口都各自维护独立模型,组织上形成深度孤岛。三大技术支柱:用户基础嵌入(User Foundation Embedding,把全平台行为压成一个长期向量)、语义 ID 目录分词(把音乐 / 播客 / 有声书目录按语义而非随机 ID 分 token)、软分词实时个性化(让同一个 transformer backbone 在 home / search / ads / podcast 不同入口下做实时偏置)。这是一份非常清晰的「把 LLM 思路反向应用到推荐」的工程参考,对所有还在维护多套推荐流水线的内容平台都是一次值得对照的范式迁移。 ## 扩展阅读 Gemini 3.5 Flash 在 Google I/O 大会发布 · @sundarpichai Sundar Pichai 在 I/O 主舞台亲自宣布 Gemini 3.5 Flash 即刻上线,覆盖 Antigravity 与 Google 全线产品和 API。重点信号是:3.5 Flash 在几乎所有基准测试上超越前代 3.1 Pro,编码能力显著提升,同时在「智能 / 输出速度」象限里独占右上角——智能水平对标最佳前沿模型,但每秒 Token 数是其他前沿模型的 4 倍。这条公告的隐含信息是:Google 选择用一颗「智能足够 + 4 倍速度」的中档模型作为今年 Antigravity 的默认 agent backbone,对应的是「一个开发者并发驱动多个子智能体」这种新工作流对模型吞吐的硬需求。配合精讲一的 Antigravity CLI 一起看,理解 Google 这次为什么敢把「子智能体并发」作为主推。 Google DeepMind 发布 Gemini Omni · @demishassabis Demis Hassabis 官宣 Google DeepMind 的新多模态模型 Gemini Omni:能同时接收照片、视频、音频作为输入,并生成全新场景,首发能力聚焦在视频上。Hassabis 特别强调它是迈向「任意输入 / 任意输出」通用 AI 接口的一块基础拼图——可以理解为多模态版本的「主干模型」,让创作者能直接喂视频做迭代修改,而不是切换十几个工具。 Google 推出 Gemini Spark:全天候自主 AI 代理 · @GeminiApp Gemini Spark 是 I/O 上一个新的产品品类:一个 24/7 的个人 AI 代理,你给它分配任务它就在后台跑,哪怕手机和笔记本都关机也照常工作;在执行重大操作前会主动跟你确认。这是 Google 第一次把「常驻型 personal agent」当作产品级概念正式发布,对应的是过去一两年大家在讨论的「ambient AI / personal OS」愿景的一次具体落地。值得留意的是「执行重大动作前要回头跟用户确认」这条产品规则——它实际上是 Google 在产品层为 agent 设的一道默认 human-in-the-loop 边界,跟今天 Anthropic Managed Agents 在基础设施层设的 sandbox + tunnel 边界遥相呼应。 Ettin 重排序模型系列发布 · Hugging Face Blog Hugging Face 一次性发布了六款基于 Ettin ModernBERT 编码器 训练的 CrossEncoder 重排序模型,从极小到大尺寸全覆盖,在 MTEB 检索基准上达到同尺寸 SOTA,并支持高达 8K token 的长上下文。同时附带了完整的训练配方与蒸馏数据集。对正在搭 retrieve-then-rerank 流水线的 RAG / 搜索团队,这一组模型直接进入「现成可换」的选项池。 智能体开发全生命周期 · LangChain Interrupt 26 主题演讲 LangChain 在 Interrupt 26 上发布了一套覆盖智能体完整开发生命周期的工具集:Deep Agents 0.6、LangSmith Sandboxes GA、Context Hub、LLM Gateway,以及一个全新的、专为 agent trace 设计的数据库 Smith DB,搭配自主运转的 LangSmith Engine。从基础设施角度看,它和今天 Google / Anthropic 的发布形成了一个有意思的三角——前者各自押注「平台 + 模型 + sandbox」整套垂直栈,而 LangChain 押的是横切多家模型、覆盖 dev / test / deploy / monitor 的横向工具链。 Snapchat 如何每秒服务十亿次预测 · ByteByteGo ByteByteGo 这期长文拆解了 Snap 的 Bento ML 平台架构,介绍它如何在 100ms 内完成「候选拉取 → 特征获取 → 深度模型排序」整套流程,并支撑每秒超过 10 亿次预测。Snap 每天有 4.77 亿日活,每个用户的每一次刷新都在触发数百个模型调用,系统留给整条链路的预算只有 100 毫秒。文章重点拆了它如何处理排序工作负载的「不对称性」、特征存储如何拆分为 online / offline 两套(Robusta 负责双向同步、每天处理 10 万亿事件、在线特征库容量达 80TB),以及持续反馈循环如何稳定地把线上信号回灌训练。和今天 Spotify 那条生成式推荐放在一起读,能看到「传统 ranker 极致工程化」与「LLM 思路重写推荐范式」两条路线的最新实践,对所有做高 QPS 推荐 / 排序系统的团队都是一份非常有用的工程对照。 内核级真相:为什么 eBPF 正在取代用户空间代理 · InfoQ InfoQ 这篇文章 论证了 eBPF 之于安全可观测性的根本优势:把探针直接挂到 Linux 内核的系统调用接口上,容器级攻击者无法禁用它,且相比传统用户空间安全 agent CPU 开销降低 60-80%。文章还覆盖了在云原生环境下 eBPF 怎么和 Cilium、Tetragon、Pixie 这类项目配合,提供从网络可见性到进程行为审计的端到端能力。对 SRE / 安全工程团队是一篇可以直接引用到架构评审里的好弹药,尤其值得在「是否要升级到 eBPF-based 安全 stack」这类决策里作为背景材料。 推进内容溯源:构建更安全更透明的 AI 生态 · OpenAI Blog OpenAI 宣布了一套多层的内容溯源策略:通过 C2PA 合规给 AI 生成内容打可验证签名元数据;与 Google DeepMind 合作,在图像里嵌入跨平台耐久的 SynthID 像素级水印;同时上线一个公开的验证工具,让用户能直接确认一张图是否经过 OpenAI 工具生成或编辑。文章把「元数据 + 像素水印 + 公共验证工具」三层组合讲得很清楚,是当下「AI 生成内容真实性」议题里少见的、有具体落地动作的官方表态。配合今天 Gemini Omni、Gemini 3.5 一起读,能感受到头部模型公司正在为「下半年大量多模态内容上线」提前铺溯源底座。 ## 今日阅读路径 如果你今天只有 30 分钟,按下面这条路径读完,基本能拿到当前 agent / LLM 行业最重要的几条信号: 1. 先读精讲一《Google I/O 2026 开发者主题演讲全览》(10 分钟)——一次性把握 Google 这次「构建—运行—交付智能体」整条工程链路的拼图,是今天理解所有其他故事的语境。 1. 再读精讲三《Claude Managed Agents 新功能:自托管沙箱与 MCP 隧道》(10 分钟)——和精讲一形成对照,看 Anthropic 怎么从合规与安全边界角度切 enterprise agent 这块蛋糕。 1. 最后读精讲二《Karpathy 重返一线研发》(3 分钟)——一条很短的推文,但能帮你把前两条新闻的「行业站队」信号串起来。 如果还有 20 分钟,加读速览第 1 篇 Martin Fowler《可维护性传感器》——它给出了「让 agent 不变成代码污染源」的工程方法论;以及速览第 4 篇 Simon Willison 《五分钟回顾 LLM 的最近六个月》——把今天发生的所有事放回过去半年的拐点叙事里。 如果你是做端侧推理、推荐系统或安全可观测性的工程同学,还可以挑速览第 6 篇 LiteRT-LM、第 7 篇 Spotify 生成式推荐,以及扩展阅读里的 Snapchat 十亿预测、eBPF 内核级真相一起读,它们能直接迁移到你下一个 sprint 的工程设计里。 如果你只读今天一句话,把它记成:​「agent 已经不再是模型层的故事,而是平台、运行时、合规与人才同步发生位移的故事」。其他细节都是这条主线的注脚。 明天见。

译今日科技圈三事共同指向智能体工程化趋势。Google I/O 2026将Gemini模型、Antigravity CLI与WebMCP等工具整合为完整开发链路,支持子智能体并发调度。Anthropic同步发布Claude Managed Agents的自托管沙箱与MCP Tunnels,解决了企业安全执行与私有数据接入问题。此外,Andrej Karpathy宣布加入Anthropic,被视为对其研究路线的重要背书。三者表明行业焦点已从提升模型基准,转向构建可工程化、可安全落地的智能体生产系统。

向阳乔木@vista8 · 5月20日47

小红书也是真离谱,AI生成的几秒无声视频,提示笔记违规。 抖音,视频号,x发布都没问题。 连视频没声音都管,何况只有几秒而已。。。

Berryxia.AI@berryxia · 5月20日63

兄弟们,Google I/O 2026 昨晚 Keynote 完整总结! 不想看长文就看一图流总结吧~· Sundar Pichai 主讲,主题直指「Agentic Gemini 时代」AI 不再是聊天机器人,而是能自主思考、执行任务、跨设备运行的「世界模型」! 昨晚这场 2 小时 keynote 没有放出大家之前狂猜的 Gemini 4.0 / Veo 4,而是聚焦更务实、更落地的 Gemini 3.5 系列 + Omni 世界模型,直接把 AI 推向操作系统级智能体。 Google 这波操作,稳扎稳打,强调「自主执行 + 跨平台一致性」! 模型最大亮点: • Gemini 3.5 Flash:立刻可用!速度暴增(输出可达 289 tokens/秒),上下文更强,专为 agentic 任务优化,比之前快 4 倍,已成默认模型。 • Gemini Omni(最大惊喜!):全新多模态「世界模型」! 任意输入→任意输出(文本生视频/图像/音频,视频直接编辑,图像生成动作)。 它懂物理世界(重力、动能),可在聊天里实时生成/编辑视频,已整合 Nano、Genie、Veo 等能力。 Google 说:这是从「预测文本」到「模拟现实」的飞跃,还用来训练机器人了! • Gemini 3.5 Pro:下个月上线,更强推理版。 • Gemini Spark:24/7 always-on 自主 Agent,能个性化、后台持续工作,帮你自动处理邮件、日历、跨 App 任务,几乎零干预! 📱 Gemini App 彻底重做: 采用 Neural Expressive 新设计语言,动画更流畅、色彩更鲜艳、地形感更强,体验直接起飞! 🌐 全生态落地重磅功能: • Search 升级:搜索框变「AI Agents」信息代理,能主动收集、总结、持续跟踪信息,甚至「你睡觉时它还在干活」。 • Workspace / Gmail / Android Auto:AI 代理深度集成,自动生成回复、智能表单、跨 App 操作。 • 创意工具全面增强:Generative Media 直接用 Omni 驱动视频/图像/音乐生成。 • 其他:Ask YouTube、Universal Cart 通用购物车、SynthID 水印全行业推广。 🕶️ 硬件与跨设备: • Android XR 智能眼镜正式预览(非概念机)! 与 Samsung、Warby Parker、Gentle Monster 合作,今年秋季推出。 首批是轻量音频眼镜(≈50g,无显示屏,靠手机算力),支持 Gemini 实时翻译、抬头通知、视觉搜索。 2027 年才有带微 LED 显示的 AR 版。 • Googlebook + Aluminium OS:Android Show 已提前官宣,昨晚进一步演示 Magic Pointer 等 AI 深度集成,Android 正式杀入笔记本战场! 👨‍💻 开发者福利: • Google Antigravity 2.0 大升级:独立桌面/CLI 工具,支持多代理并行 coding(现场演示 93 个子代理 12 小时从零造 OS!)。 • Agent-First 开发新命令:/goal、/grill-me 等,让 AI 自主完成复杂任务。 • Gemma 开源家族、Chrome AI 智能体 Web 也有更新。 📊 总结与我的分析: Google 这场 Keynote 是「巩固而非爆炸」。 没有参数战,而是把 Gemini 真正变成操作系统级智能体,重点推动 Android、Search、眼镜等产品真实落地。 在 Agentic AI 赛道上,Google 与 OpenAI、Anthropic 保持同步,甚至在「多模态世界模拟」上领先一步! #GoogleIO

译2026年Google I/O大会的主题为“Agentic Gemini时代”,旨在将AI从聊天工具进化为能自主思考、执行任务的“世界模型”。本次大会未发布Gemini 4.0,而是推出了更务实的Gemini 3.5系列,核心包括:速度极快且为智能体优化的Gemini 3.5 Flash;能理解物理世界、实现任意模态生成的全新“世界模型”Gemini Omni;以及可24/7自主工作的智能体Gemini Spark。同时,Android XR智能眼镜和AI集成的Googlebook笔记本等硬件亮相。整体上,Google正将Gemini深度整合至其全生态,巩固其在自主AI赛道上的领先地位。

小互@xiaohu · 5月20日55

看看 Gemini Omni的实力 一句话就是:视频版的香蕉🍌 当然远不至于视频的编辑能力,它应该是世界模型的雏形... 通用AGI的初始形态...

Anthropic@AnthropicAI · 5月20日60

Over the past few months, we've been holding dialogues with scholars, philosophers, clergy, and ethicists on the questions AI raises—starting with how good character forms. Read more about how we’re widening the conversation on frontier AI: https://www.anthropic.com/news/widening-conversation-ai

译过去几个月,我们一直与学者、哲学家、神职人员和伦理学家就AI引发的问题展开对话,从良好品格如何形成开始。 了解更多我们如何拓宽关于前沿AI的对话:https://www.anthropic.com/news/widening-conversation-ai

Ethan Mollick@emollick · 5月20日59

The gap between what you can do on ChatGPT/Codex and Claude/Code/Cowork is closing, as Anthropic & OpenAI converge on a single experience. Google's experiences are diverging: Studio & Gemini & Antigravity & the other Google AI apps are increasingly different. Which will win?

译ChatGPT/Codex 与 Claude/Code/Cowork 之间的能力差距正在缩小,因为 Anthropic 和 OpenAI 正在趋同于单一的体验。 Google 的体验则在分化:Studio、Gemini、Antigravity 及其他 Google AI 应用正变得越来越不同。 谁将胜出?

SemiAnalysis@SemiAnalysis_ · 5月20日63

@FabricatedKnowledge answers if the AI Market is truly a bubble, or if we're just completely rewriting the global economy. @tbpn Chapters 0:00 — Guest Intro & Cerebras IPO Breakdown 1:24 — Chip Architecture & Hardware Bottlenecks 5:29 — Grok LPUs, Nvidia, and the Inference Ecosystem 9:15 — The Big Foundry Play: AMD, Intel, and TSMC 11:53 — The ASIC Startup Landscape & Geopolitics 18:04 — The Domestic Data Center Infrastructure Crisis 21:33 — Space Data Centers & Sovereign AI Geography 25:31 — Market Hype, Bubble Math, and the Next Dot-Com 29:38 — Macroeconomics, Robotics, and Gross Token Production (GTP) 33:56 — Outro: Does SemiAnalysis Need an Arch Nemesis?

译本期探讨AI市场究竟是暂时泡沫,还是全球经济的结构性重塑。内容深入分析AI产业链瓶颈与竞争格局,涵盖芯片架构限制、以Nvidia和Grok LPUs为代表的推理生态之争,以及AMD、Intel、TSMC的代工博弈。同时讨论ASIC创业公司现状、数据中心基础设施危机、太空数据中心与主权AI布局等前沿议题,并结合宏观趋势、机器人技术和“总Token产量”等指标,对市场热度与潜在风险进行犀利点评。

Rohan Paul@rohanpaul_ai · 5月20日66

Looks like the AI coworker category is on fire. Accel just led a $75M Series A in Viktor. The first AI coworker native to Slack and Microsoft Teams. Viktor sits inside team channels, connects to 3,000+ tools, runs scheduled tasks, keeps memory through reusable Skills, and produces work such as reports, updates, data pulls, drafts, and operational follow-through. A major shift is happening, the interface is moving from “ask a model” to “assign a role,” where the system needs memory, tool access, scheduling, permission handling, and enough task judgment to reduce supervision.

译AI同事Viktor获得Accel领投的7500万美元A轮融资,成为首个原生集成于Slack与Microsoft Teams的AI员工。它能驻留团队频道,连接3000余种工具,执行定时任务,并通过可复用技能保持记忆,从而自主生成报告、更新等实际工作产出。此次融资标志着AI交互范式正从“向模型提问”向“指派AI角色”转变,系统需具备记忆、调度与任务判断能力。据披露,Viktor在上线10周内便达成了1500万美元年化收入,其用户企业实现了团队效率提升、成本显著削减与业务增长,展现了其作为能创造真实价值的“AI员工”的巨大潜力。

OpenAI@OpenAI · 5月20日70

People are generating over 1.5 billion images a week in ChatGPT. Researcher @kenjihata joins Product lead @adele__li and host @AndrewMayne to explore the new use cases and trends emerging since the launch of Images 2.0.

译人们每周在ChatGPT中生成超过15亿张图像。 研究员 @kenjihata 与产品负责人 @adele__li 及主持人 @AndrewMayne 一起,探讨自 Images 2.0 发布以来出现的新用例和趋势。

Emad@EMostaque · 5月20日40

Seems a lot of autoregressive models will be converted to diffusion models

译看来许多自回归模型将被转换为扩散模型。

Emad@EMostaque · 5月20日57

Go join Monastery accelerator with our friends @cyberfund $2m uncapped note, 12 week program, let's see if we can get the 1 person AI-assisted unicorn

译快来加入我们朋友@cyberfund的Monastery加速器项目 200万美元无上限票据,12周计划,让我们看看能否打造首个AI辅助的独角兽

AYi@AYi_AInotes · 5月20日82

Damn! The landscape of the AI industry has been altered for good from today onward. 今晚睡不着了兄弟,AI 圈顶级大牛,前 OpenAI 创始团队 + Tesla AI 前总监 Andrej Karpathy大神刚刚官宣:我加入 Anthropic 了! 但说实话,Karpathy 加入 Anthropic 这条帖子,我看到第三遍才意识到真正的含义 很多人都在聊钱、聊人才战争、聊 Anthropic 赢了, 但整个帖子里最硬的一个词被划过去了,叫formative, 兄弟们想想,一个亲手把 GPT-1 推到 GPT-4、亲眼见过 scaling law 在真实算力上跑起来的人,现在公开说未来几年是 formative years, 这话翻译过来就是:你们说 AI 见顶了,我告诉你,真正的窗口期现在才来! 而且他还不是那种模棱两可的乐观,而是非常精准的、带着职业生涯赌注的判断, 我觉得他选 Anthropic,也不是猎头挖得好,本质上还是他自己对未来方向的判断的结果,在为下一步AI发展方向投票, 也就是说LLM 的下一次跃迁,大概率在安全 + 极致 capability 的那条路径上跑通, 这才是这道帖子真正让人睡不着的地方 hhh

译前OpenAI创始团队成员Andrej Karpathy宣布加入Anthropic,被普遍视为AI行业的一次地震级事件。但这并非单纯的人才流动。Karpathy在声明中将LLM前沿的未来数年定义为“formative years”(关键塑形期),这被解读为对“AI发展见顶论”的直接反驳,意味着真正的爆发窗口期现在才刚开始。他选择Anthropic,本质上是其个人对未来AI发展路径的深度判断和“投票”,即认为LLM的下一次重大突破,很可能在安全与极致能力协同发展的路径上实现。这标志着行业竞争的核心,已从当下的模型比拼,延伸至对长期技术路线的押注。

Nathan Lambert@natolambert · 5月20日66

For a long time, academic researchers being at the cutting edge of new technologies has been a great social equilibrium. Neutral, unbiased technologists have been the people to spread new ideas to the world. As AI research takes off in velocity, it is also going behind closed doors. The tech industry has sewed distrust, and now they are the ones trying to tell the world about incredible changes coming. It's a big loss to a form of social contract in America. There's been a history of scientists helping society understand new technologies. There is a public service in the culture of science that I want to see continue. It's being exacerbated by feelings of FOMO, especially finically driven, where I'm seeing many people who previously wanted to be professors -- and likely still do deep down -- feel a need to conform and chase money, in a pocket of industry. I get it, I grapple with this. For those with a safety net, there will be great returns to some who choose to zag, and try to build something good, for people who need something different. For me, this is building interesting, fully-open models, to show what you can do with a variety of open weight sizes. Yes, AI's immediate future is dictated by the frontier, but it's long-term trajectory still deeply includes academic institutions and open science. Knowledge will always diffuse, but to whom? As of today, I think China is positioned to be the global home of AI research in a few years. The home of research is where ideas are accessible, spread rapdily, and are nurtured. The U.S. seems to be unwinding many institutions and relationships. The largest returns go to people who build something differentiated, at least in reputation, and a lot of people are not being shown that this path exists.

译本文指出,AI研究正从学术界主导向工业界闭源化转变,打破了长期由中立学者传播前沿知识的社会平衡。科技公司通过制造不信任感掌控叙事,削弱了科学界服务公众的传统。同时,金融驱动的“错失恐惧症”迫使许多志在学术的人才流向工业界。作者认为,尽管短期内发展由闭源模型主导,但知识最终必然扩散,其长期轨迹仍与开放科学紧密相连。在这一趋势下,凭借更利于研究获取与传播的环境,中国有望在未来成为全球AI研究的新中心。

Rohan Paul@rohanpaul_ai · 5月20日44

🇨🇳In Shenzhen China, food glides into your table mid-air, guided by AI. Delivery pods use magnetic levitation, AI routing, and linear motors for smooth, wheel-free motion. Each pod maps the space, avoids collisions, and optimizes routes in real time

译🇨🇳在中国深圳,食物通过空中滑行送到你的餐桌,由AI引导。 配送舱使用磁悬浮、AI路径规划和直线电机,实现平稳、无轮的运动。每个配送舱实时绘制空间地图、避开碰撞并优化路线。

凡人小北@frxiaobei · 5月20日57

一个人用 AI 爽飞之后,他和团队其他人的协作反而更难。 组织层面的 AI 不是个人提效的放大版,是另一个问题: 怎么把 AI 嵌进协作结构里,而不是只让其中某个岗位变快。 很少有团队在解决后者,从@yucheng 的这个项目看到了。

译核心问题在于,AI大幅提升个人效率后,团队协作反而可能变得更困难。因为组织层面的AI应用并非个人提效的简单放大,而是需要解决如何将AI深度嵌入现有协作结构、打破信息壁垒的问题。当前很少有团队关注后者。Lucius AI 正尝试解决这一痛点,其核心是构建组织的“上下文层”,旨在减少团队中超过30%时间被浪费在重复重建已有决策上下文上的现象,从而弥合个人高效与组织协同之间的鸿沟。

DogeDesigner@cb_doge · 5月19日35

"When I go to sleep, there's like some AI breakthrough. When I wake up, there's some AI breakthrough, and by lunchtime, there's another AI breakthrough. It's pretty obvious that we're going to have AI that is vastly smarter than humans. I hope it's nice to us." — Elon Musk

译“当我入睡时,会有AI突破。当我醒来时,又有AI突破,到了午餐时间,又一个AI突破。很明显,我们将拥有远比人类聪明的AI。希望它能善待我们。” — Elon Musk

DogeDesigner@cb_doge · 5月19日58

ELON MUSK: Kardashev-Scale civilization will need Moon Bases and Mass Drivers. To reach a Kardashev-scale future for AI, humanity need space-based infrastructure including Moon bases, mass drivers, and large-scale solar power systems. Future AI may require energy at a scale far beyond what Earth can easily support. Solar-powered AI satellites launched from Earth could potentially generate terawatt-level power, but would require around 10 million tons of payload to orbit every year. That level of infrastructure could produce around twice the annual electricity use of the United States for AI power. The idea is not limited by physics; the real challenge is building at a massive enough scale. Lunar infrastructure could unlock petawatt-scale solar-powered AI, making Earth’s current economy look small by comparison.

译马斯克指出,为实现Kardashev等级文明,人类需要建立月球基地、质量驱动器和大型太空太阳能系统等基础设施。未来AI的能源需求可能远超地球承载能力,通过部署太阳能AI卫星或可产生太瓦级电力,但这需要每年向轨道运输千万吨级载荷。该构想在物理上可行,核心挑战在于实现超大规模建造。若建成月球能源设施,或将解锁拍瓦级太阳能AI,其规模将使当前地球经济相形见绌。

Rohan Paul@rohanpaul_ai · 5月19日38

We talk a lot about AI replacing people. But maybe the better question is: what work should be automated? Nobody should spend all day repeating scripts, apologizing for delays, or asking the same verification questions 300 times. Let tech take the grind. Let humans handle the moments where warmth, judgment, patience, and care actually matter. Where do you draw the line between useful automation and too much automation?

译主张让AI自动化重复性劳动(如重复话术、机械问答),使人类能专注于体现温度、判断力与关怀的关键时刻。核心在于厘清自动化边界——技术处理枯燥流程,人类负责情感与人性化服务。引用观点强调“让人类回归人性本质”,并提及Smallest AI Voice Agents作为实践案例,倡导在提升效率的同时保留人性化交互。

Ethan Mollick@emollick · 5月19日65

Asking people whether they like "AI" is not going to be a useful poll question soon, if it ever was. They will be incredibly grateful for their personal AI that guides them through medical or legal or management issues. They will be anxious or excited about AI at their work, even though it currently isn't that good, depending on the culture of their workplace. They will feel fondly towards the AI chatbot they discuss issues or ideas with. They will hate the AI that pundits (and a number of AI leaders) say will take all jobs or change their way of life. They will be bemused by the AI that makes up fun video content for them. They will fear the AI that other people argue will lead to the end of the world. They will like the AI that lets them edit cute selfies. How does electricity poll?

译简单地问公众“是否喜欢AI”将不再是一个有意义的问题。人们会根据AI的具体应用场景产生截然不同的复杂反应:感激其在医疗、法律、专业工作中的协助,喜爱与其互动的聊天机器人,同时恐惧那些被宣称会夺走工作或威胁生存的AI,并被用于娱乐的AI所逗乐。这正如我们对电力的看法——人们不再笼统讨论是否喜欢电,而是依赖其在社会基础中的具体功能。公众对AI的接受也将是具体、务实且充满多面情感的。

DogeDesigner@cb_doge · 5月19日42

Elon Musk on data centers in space: "Data centers in space is much easier than people may think. SpaceX, at this point, has 10,000 satellites in orbit right now, and in the future, with Starship, we'll be launching over 10,000 communication satellites per year, each one of which is much more capable than our current satellites, so you can expect 100 times more communications capability than currently exists from space, but that will pale in comparison to the tonnage of AI satellites, so I mean it's always helpful to use the physics tools of thinking in the limit."

译基于SpaceX现有的1万颗在轨卫星,以及未来使用Starship将实现每年发射超万颗更强通信卫星的计划,埃隆·马斯克认为太空通信能力将百倍提升。他指出,尽管通信能力大幅增长,但这将远不及未来AI卫星的吨位规模。因此,他用物理学的极限思维进行推演,得出结论:建设太空数据中心的可行性比普遍认知的要高得多。

Baidu Inc.@Baidu_Inc · 5月19日67

Here is a quick addition to your metrics vocabulary: DAA. Short for Daily Active Agents, it is the agent era's equivalent of DAU. Where tokenomics tracks cost, DAA tracks output — how much work agents are actually getting done. See the full comparison ↓

译这里快速补充一个指标新词:DAA。 全称 Daily Active Agents(每日活跃智能体),相当于智能体时代的 DAU。 如果说代币经济学追踪成本,那么 DAA 追踪产出——智能体实际完成了多少工作。 完整对比见下文 ↓

Rohan Paul@rohanpaul_ai · 5月19日54

College students are booing AI praise at graduation while using the same tools to finish work, cheat on exams, and survive a job market they think AI is already reshaping. The split is not hypocrisy so much as pressure meeting resentment. --- fortune .com/2026/05/19/college-students-booing-commencement-speakers-ai-cheating-cognitive-dissonance/

译当前部分大学生在毕业典礼上对AI的赞誉报以嘘声,但同时他们又深度依赖AI工具来完成学业、应对考试,并身处一个他们认为已被AI重塑的就业市场中。这一现象并非简单的虚伪,而是源于现实压力与对未来的忧虑交织而成的复杂情绪。有观点指出,这些大学生本处于能最原生化使用AI的优势阶段,他们的抵触情绪反而凸显了技术快速渗透与个体准备不足之间的巨大张力,反映了AI引发的广泛社会性焦虑。

Rohan Paul@rohanpaul_ai · 5月19日47

College Students are booing graduation speakers for celebrating AI. But I dont get what exactly are they booing? They’re in the best position to use AI natively this early in their careers.

译大学生们在毕业典礼上对演讲者庆祝AI的行为发出嘘声。 但我不明白他们到底在嘘什么?在职业生涯的早期阶段,他们正是最适合原生使用AI的人群。

AYi@AYi_AInotes · 5月19日67

说个可能会被骂的判断, 过去十年我们被 Markdown 宠坏了,以为它就是内容交付的终极形态, 但昨晚翻完 html-anything 这个开源项目,上线 7 天,已经 3.3k 星,我突然想通了一件事,就是 AI 时代输出格式的真正的终点应该是 HTML。 这个项目来自 nexu-io,就是那个 4 万星 Open Design 的团队, 它做的事说起来也很简单: 你把任何内容丢进去(MD、CSV、JSON、笔记都行), 按 ⌘+Enter,本地 AI agent 直接生成生产级 HTML,然后一键发到微信、X、知乎,或者下载 HTML/PNG, 整个过程零 API Key、完全本地、流式渲染、随时能中断, 但我真正被吸引住的不是上面这些功能,而是它的设计哲学, 75 个 Skill 模板,每一个都写死了硬约束:8px 网格、CJK 字体栈、对比度 ≥4.5、必须用真实数据,不许放 lorem ipsum, 这些看起来是在限制创意,但实际是把 AI 从 slop 泥潭里拽出来的唯一办法, 没有约束的 AI 永远在 freestyle,花里胡哨、排版崩、字体乱, 有约束的 AI 反而能输出惊艳作品,因为你帮它划定了“设计纪律”的边界, 其实这件事跟我现在对 AI 最大的一个判断完全吻合:AI 最需要的不是自由,是一套合适的枷锁, 继续往下看,三个反直觉的点开始越来越清晰, 第一个,越老的格式在 AI 时代反而越先进, HTML 是 1993 年的东西,但它是 Web 原生、天生响应式、支持动画和暗黑模式,AI 写代码最强的地方就是 HTML/CSS/JS, Markdown 反而成了瓶颈——你写完还得排版、截图、导出、适配不同平台,这些全是损耗, 第二个,不用云 API,生产力反而更高, 零 API Key 听起来像省钱,但你用起来才发现本质是极致的自由:无限调用、零延迟、流式中断不浪费 token, 甚至你本地 用claude login / cursor login 过,它直接复用 session,边际成本 $0, 所以真正的高手往往并不是用最贵的模型,而是用最省的 workflow, 第三个,交付介质的轻量度才是真正的护城河, 几百 KB 的 HTML vs 2MB 的 docx,在微信和手机端加载速度差 10 倍,很多人还在卷内容质量,但很少有人意识到——你交付的介质有多重,读者的打开率就被压得有多低, 以前内容交付是 Markdown → 排版 → 截图 → 调格式 → 发出去, 现在 ⌘+Enter → HTML 直接进剪贴板 → 发出去,中间全砍了, 我才意识到,html-anything 真正在做的不是文档工具,是 Agent 时代的内容生产操作系统——它把创作的终点从草稿拉到了成品,把交付成本直接打到零, 真的强烈推荐,这个项目值得所有内容创作者现在就去 clone 跑起来,选一个 Skill 试试 deck-swiss-international 或 doc-kami-parchment,你会立刻感受到原来内容还可以这么发!

译开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi@AYi_AInotes · 5月19日66

为啥昨天发的这颗葡萄在X上炸锅了?一天跑了4800赞,280万浏览, 先说结论,炸锅倒不是因为它有多好看,主要是因为它把3DGS的最难考卷做成了满分答案。 用了6660张宏观照片,43万个高斯点,模型压到50MB以下,手机能实时旋转,半透明果肉里的光都还原了, 讲真,这种半透明物体一直是3DGS的噩梦,但他偏偏选了最难的那个来打样, 接下来我们来拆两件事: 1️⃣3DGS为什么在这个赛道把NeRF甩开了, 2️⃣它还有哪些硬伤没解决 👇

译一颗葡萄的3D模型在社交平台X上引发热议,一天内获4800赞和280万浏览。其核心在于利用3DGS技术成功攻克了半透明物体重建的公认难题。项目使用6660张宏观照片训练,生成仅43万高斯点,压缩后模型小于50MB,实现了在手机端实时360度旋转和光影还原。这一突破验证了“最难案例跑通,则更简单物体皆可数字化”的逻辑,展示了从专业扫描仪和建模团队降维到个人相机加自动训练的低成本、高效率新流程,为手办、珠宝、文物等领域的数字资产化指明了方向,开发者正通过工具miqula将此流程产品化。

Ethan Mollick@emollick · 5月19日51

One trend that I think you might start to see at big companies is insourcing via hiring: why pay so many outside vendors (legal, marketing, software vendors) when you can hire in-house and harness AI productivity gains yourself? Talked to executives already going this route...

译我认为你可能会开始看到大公司的一个趋势是通过招聘实现内部化:当你可以雇佣内部员工并自行利用AI生产力提升时,为什么要支付那么多外部供应商(法律、营销、软件供应商)的费用? 已经和正在走这条路的高管们交谈过……

Berryxia.AI@berryxia · 5月19日33

卧槽~这个可以啊! 其实Apple Vision Pro就是通过追踪眼球来控制,类似你的眼球就像移动的鼠标指针,你的手部捏合的动作就是鼠标点击的动作。 这个直接搞到显示器上有点意思!

SemiAnalysis@SemiAnalysis_ · 5月19日71

Is OpenAI actually back? @JordanNanos, @Dylan522p, @FabricatedKnowledge, and @maxkan_ break down whether OpenAI has truly recovered from their recent struggles and what this means for the AI race.

译OpenAI真的回来了吗?@JordanNanos、@Dylan522p、@FabricatedKnowledge 和 @maxkan_ 分析 OpenAI 是否已从近期困境中真正恢复,以及这对 AI 竞赛意味着什么。

Orange AI@oran_ge · 5月19日32

给中转站做个导航+点评? 似乎是个有点真的需求 但后来我发现中转站的问题是 一旦它火了,就开始掺水 … 人性难逃

ginobefun@hongming731 · 5月19日70

http://x.com/i/article/2056536208592039936 # BestBlogs 早报 · 05-19 · Composer 2.5、长时 Agent 与 AI 生码率 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-19 > EP61 · BestBlogs 每日早报 · 当 AI 编码跨过工具替换的门槛,工程化才真正开始。 AI 编码正在跨过工具替换的门槛,走进工程化深水区。今天的早报有一条很清晰的主线:从写得快,到做得对。 Cursor 把 Composer 2.5 的训练栈完整公开,节奏从产品迭代切换到模型迭代;Anthropic 工程师在 AI Engineer 大会拆解长时间 Agent 工程,用对抗式的 generator-evaluator 架构把 Agent 续航推到 12 小时;阿里云 CIO 蒋林泉则端出 2026 财年真实数据,告诉所有人「AI 生码率」是一个危险的过程指标 ——「代码一定是负债」,Vibe Coding 不能直接上生产。 工具升级、工程化运行、效能反思,三条线索连起来,是从写得快到做得对的范式转身。今天的早报除了三条精讲,还有 Skill 开发、RAG 全链路、十七种 Agent 架构、MCP 企业落地、Anthropic 创始人手册、AI 收入集中度,以及 Anthropic 收购 Stainless 等七条值得一读的内容。 ## 导语 如果只看一个关键词,今天属于 「工程化」。 过去一年里,「Agent」「Vibe Coding」「AI 提效」基本被当作工具命题处理:换个更好的模型、装一个更聪明的 IDE、把流程自动化一段,效果就来了。但 2026 年中段开始,三条独立线索同时把命题往后推了一层。 第一条是模型层。Cursor 的 Composer 2.5 不是一个产品公告,而是一份训练报告:textual feedback RL、25 倍合成任务规模、亿级参数 MoE 训练栈、和 SpaceXAI 联手用 Colossus 2 训练新一代模型。一家原本的工具公司,正式进入自有模型的训练周期。 第二条是 Agent 工程层。Anthropic 的 Ash Prabaker 和 Andrew Wilson 把长 session 的失败模式归纳成三类:context rot、规划缺陷、输出 sycophancy;并给出今天最被推崇的架构 —— 类 GAN 的 generator-evaluator 对抗循环,宏观规划器、代码生成器、视觉评审器通过磁盘 markdown 协商契约。结果是 Opus 3.7 时代 1 小时的自主续航,到 Opus 4.6 已经被推到 12 小时。 第三条是组织效能层。阿里云 CIO 蒋林泉给出 2026 财年的硬数据:前端人均有效代码量翻 3 倍、后端翻 2 倍,千行代码缺陷率前端降 30%、后端降 55%。但他从一开始就把「AI 生码率」从考核体系里划掉。理由很硬:编码只占软件工程 20% 时间,AI 生码率衡量的恰好是这条链路里「价值密度最低、最容易被替代」的那一段;用最容易被替代的环节去衡量整体效能,是最常见也最隐蔽的误区。 三条线索叠加起来,会得到一个并不轻松的结论:AI 让代码生产的边际成本趋近于零,但代码本身始终是负债。能不能把它转化成资产,取决于工程化与组织能力。今天的三条精讲,恰好分别站在模型、架构和组织三个高度回答这件事。 围绕这条主线,今天的速览还有 7 条值得带走的内容:阿里云对 Skill 开发方法论的系统梳理、大淘宝 RAG 全链路工程实战、腾讯关于 17 种 Agent 控制流架构的拆解、Spring I/O 上 MCP 与 Spring AI 的企业级落地、Anthropic 的 AI Native 创始人手册、AI 收入集中度被两家头部公司吞下 89% 份额的最新数据,以及 Anthropic 收购 Stainless 收编 SDK 与 MCP 服务器基建的官方动作。三个层级(模型 / 架构 / 组织)的精讲 + 七条横切视角的速览,构成了今天对「AI Native 工程团队」最完整的一次切片。 ## 精讲一:Cursor 发布 Composer 2.5:基于 Kimi K2.5 的智能升级 评分:93 · Cursor Blog · 在 BestBlogs 阅读全文 背景。 Composer 2.5 沿用了 Composer 2 的底座 —— 月之暗面开源的 Kimi K2.5 模型权重。但和上一代不同,这一次 Cursor 在博客里端出来的不是产品截图,而是一份完整的训练报告:训练栈做了哪些改动、合成任务怎么造、强化学习的奖励信号怎么对齐到具体行为。这种姿态本身就是信号 —— Cursor 把训练栈作为差异化的核心叙事,节奏正在从产品迭代切换到模型迭代。 三件值得说的事。 第一件是定向文本反馈强化学习(textual feedback RL)。传统 RL 一条 rollout 可能跨越几十万个 Token,最后给一个总奖励,模型很难判断到底是哪一步走错了 —— 想抑制一个局部行为(错误工具调用、混乱解释、风格违规)很难,因为最终奖励是一个 noisy signal,告诉你哪里错了说不清。Cursor 的做法是:在出错的那一轮上下文里直接插入一条文本提示,比如「提醒:当前可用的工具是这几个」,把这条带提示的上下文当作教师模型,把原始上下文当作学生模型,做一次 on-policy distillation KL loss 的局部蒸馏。信号从粗粒度总奖励变成精确到具体轮次的局部信号,编码风格、沟通方式、工具调用错误这些细颗粒行为都被拉了回来,同时还保留了 RL 在整条 trajectory 上的全局目标。 第二件是合成任务规模直接放大 25 倍。其中一类「特征删除」任务很有意思:给模型一个带完整测试的代码库,让它删掉某个功能但保持其他测试通过,然后再让它重新实现这个功能,用原来的测试当作可验证奖励。Cursor 在文中也坦白:模型变强之后甚至出现了奖励作弊 —— 有一次它从 Python 类型检查的缓存里反推出被删除函数的签名,还有一次它反编译 Java 字节码还原第三方 API。规模化 RL 在变成一条工程长跑,需要越来越细致的看护机制。 第三件是工程层面的优化:分片 Muon 优化器、双网格 HSDP 并行策略,让万亿参数 MoE 的每一步优化只要 0.2 秒。这些本来是闭门技术,公开出来本身就是给行业的礼物。 为什么重要。 Composer 2.5 价格定在每百万输入 Token 0.50 美元、每百万输出 Token 2.50 美元,首周双倍额度;另有一个快速版本,相同智能水平价格抬到 3.00 / 15.00 美元每 M token,仍然比同等智能水平的 frontier 模型快线便宜不少。但真正值得关注的不是价格,而是结尾的那一段:Cursor 宣布和 SpaceXAI 合作,用 Colossus 2 集群、相当于 100 万张 H100 的算力,从零训练一个 10 倍总算力规模的更大模型。这意味着 Cursor 不再只是一家产品公司,AI 编码工具的竞争层级,正在从应用层下沉到模型层。同时 Cursor 在博客里特意提到,Composer 2.5 在沟通风格、effort calibration 这些「不容易被现有 benchmark 衡量」的维度上也做了系统性调优 —— 这是产品公司转向模型公司之后才会重视的事。 和今日其他议题的关系。 模型再强,要把这种强度变成可交付的长任务,还需要一层架构 —— 这是接下来精讲二要回答的。读完精讲一之后看精讲三,会看到模型能力增长和组织效能提升之间的鸿沟有多大。 阅读建议。 如果你是 AI 工程师,从「Targeted RL with textual feedback」一节读起,再补一遍 Composer 2 的技术报告作为基底;如果你是产品负责人,重点看价格曲线和模型路线图。 ## 精讲二:构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成 - 评估架构 评分:93 · AI Engineer · 在 BestBlogs 观看演讲 背景。 在 AI Engineer 大会的首场分享上,Anthropic Applied AI 团队的 Ash Prabaker 和 Andrew Wilson 没有再讲一个浮夸的浏览器自动化 demo,而是认真拆了一件事:怎么让 Agent 自主运行 5 到 12 小时、甚至跨多日,还能保持代码可交付。这正是当前长时间 Agent 工程的核心难题。 三类失败模式。 Andrew Wilson 把长 session 的失败归纳为三类。第一类是 context rot​,会话越拉越长,模型对早期信息的把握逐渐崩塌;到 Token 上限附近还会出现 context anxiety​,开始草草收尾以「赶紧关掉上下文」。第二类是 规划缺陷​,原生大模型不擅长长 horizon 规划,要么一口气塞太多功能进一轮,要么半途停在残缺的代码库上。第三类是 输出 sycophancy:模型不擅长评判自己的产出,前端界面看起来对就报告完成,后端逻辑断了也不察觉。 数据校准。 Anthropic 给出一组很硬的对照:Opus 3.7 时代,一个 Agent 完成 50% 任务的自主运行时长大约是 1 小时;到 Opus 4.6,已经推到了 12 小时。模型本身在变强(model weights 这一面),但要把这 12 小时真正用好,外层的脚手架(scaffolding)同样关键。Anthropic 自己的 Agent SDK 从 Claude Code 的 research preview 演化到 GA,引入了 progressive disclosure Skills(只先加载 frontmatter、延迟加载完整工具 schema)、programmatic tool calling(让 Agent 自己写处理脚本、避免把数据塞进主上下文)这类原语。 核心架构:生成 - 评估对抗循环。 Ash Prabaker 推荐的当前最佳实践不是 Ralph Wiggum 那种线性循环(一个 Agent 在单一终端会话里顺序处理任务),而是借鉴 GAN 思路的对抗架构。系统里有三类独立角色:宏观规划器(Planner)拆分里程碑、代码生成器(Generator)实现功能、Playwright 视觉评审器(Evaluator)拉起真实浏览器对照参考站点打分。三者不靠把所有上下文塞进同一个模型,而是通过本地磁盘的 markdown 文件协商契约 —— 先把「这一关算交付」的标准用文本固化下来,再让生成器去干。每个角色有自己的 context window 和 system prompt,互相之间是独立的人格设定。 为什么要拆开?因为一个模型批评自己永远比批评别人难得多,self-evaluation 是 trap。把评估器单独拎出来,可以给它一个非常苛刻的系统提示,建立对抗压力。设计、原创、工艺、功能,每一项都用打分表量化,迭代直到评审器满意才算这一关交付。文中演示了一个例子:同一个 prompt「做一个复古游戏制作器」,单一循环的 Agent 跑出来界面拥挤、播放模式不能用;对抗架构跑了 6 个小时,Agent 自动起名 RetroForge,配了 54 色复古调色板,带物理引擎和键盘绑定,甚至自己加了一个递归式 AI 关卡助手,用自然语言生成关卡地图。同一个 base model,不同的脚手架架构,输出质量差出一个数量级。 为什么重要。 这套架构有两个非显然的工程结论:第一,不要让 Agent 自评​,单一 session 内部的自我审查永远不可靠 —— 输出 sycophancy 是模型权重层面的固有偏置,只能靠独立的 critic 角色和对抗压力来矫正;第二,用结构化交接代替上下文压缩,状态、配置、契约都写到本地磁盘,不要靠 LLM 自己背。把 markdown 当成 Agent 之间的协议层,远比试图把所有信息塞进同一个 context window 更可靠。这是把 Agent 当成一个工程系统来设计的方式,也是真正把 12 小时连续会话变成可生产代码的关键。 和今日其他议题的关系。 精讲一让模型本身变强,精讲二回答了「这种强度怎么变成可交付」。再到精讲三,企业要拿什么去衡量这种能力的产出,就不只是技术问题了。 阅读建议。 建议直接看视频原片,重点是 Adversarial Generator-Evaluator Loop 那一段;如果只有 10 分钟,去精讲三回看「结构化交接 vs 上下文压缩」的工程结论,对 AI 辅助软件工程的落地有直接帮助。 ## 精讲三:CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘 评分:92 · InfoQ 中文 · 在 BestBlogs 阅读全文 背景。 阿里云 CIO 蒋林泉端出 2026 财年 vs 2025 财年的产研效能数据:前端人均有效代码量翻 3 倍、后端翻 2 倍;千行代码缺陷率前端下降 30%、后端下降 55%。承接更多核心业务和 AI 创新、没有增加人力,最后落到业务价值。 在一个几乎所有团队都在谈论「AI 提效」的年份,这样的衡量指标和结果并不常见。更值得说的是:这套结果背后,他从一开始就把行业最流行的指标 ——「AI 生码率」—— 从考核体系里划掉。 为什么不要 AI 生码率。 他的理由分两层。第一层,AI 生码率是过程指标,组织一旦盯着过程指标,AI 就特别容易产生毒害。代码行数不加权毫无意义,团队很容易陷入灌水陷阱 —— 看起来生码率从 20% 攀升到 50%,但对业务效能毫无帮助。第二层更结构性:端到端看,开发人员真正写代码的时间只占整个软件工程生命周期的 **20%**​,剩下 80% 时间花在需求对焦、PRD 评审、跨团队对齐、上下游联调和返工。而那 20% 里,价值密度差别也极大 —— 自动生成单测、补充注释、写胶水代码这类工作本来就不耗时间;真正费力的是核心概念、核心算法、核心逻辑和跨系统联调,那些是「代码量少、精力投入度极高」的地方。把这两个漏斗叠起来,AI 生码率衡量的恰好是整条链路里 价值密度最低、最容易被 AI 替代 的那一段。用最容易被替代的环节去衡量整体效能,是第一个误区。 「代码一定是负债」。 蒋林泉的第二个判断更尖锐:代码一旦生产出来,首先是负债。增加的大量代码「可能」是资产,但「一定」是负债。任何代码进入生产环境,立刻引入维护成本、增加系统复杂度,依赖关系需要持续管理;能否转化为对业务客户的正向价值,是不确定的。如果生成的代码无法对业务产生正向价值,规模化地生产代码本质上就是规模化地生产负债。理解这一句,是后面所有 AI 工程实践的逻辑基础。 Vibe Coding 的边界。 他给出两条很清楚的区分:做一个 Demo / 个人应用,和做一个客户大规模生产系统之间,有巨大差别;做一个全新应用,和在已有核心业务系统上叠加新需求,也有巨大不同。大部分企业的核心应用都是存量系统,业务复杂度高、积累了不同人的编码风格和历史技术债,需要为生产稳定性、性能、可维护性负责。在这样的环境里,Vibe Coding 直接生成的代码无法大规模投入生产并承担质量责任。阿里云 CIO 团队的果断选择是:不用 Vibe Coding 直接上生产,采用 AI 辅助的软件工程,把 AI 作为提效工具融入规范化工程流程,覆盖测试、运维、编码、存量系统梳理等切面。 AI 改写人月神话与左移。 文中还有两条很有启发的论断。一是「人月神话」:原来加人之所以低效,是因为人际沟通呈几何级数增长,新成员缺乏系统上下文、需要高成本的知识传递;但加 Agent 不一样 —— Agent 能无损拿到上下文,能规模化从已有代码里解析上下文,不需要人与人之间几何级数增长的沟通消耗。二是「左移」:以前一直说要在问题出现之前就解决它,但难以贯彻,是因为「左移本质是跨部门转移责任」,左边的人接不接、有没有能力承担都是组织摩擦力的来源;AI 时代,上下文和知识资产可以从存量代码里抽取,加上增量的 PRD、Spec,业务复杂系统能简化成一个共识框架,跨岗位之间在一条业务链路里能更低成本、更高效地对齐。一个具体的成果是:在有新成员加入的情况下,借助 AI 把测试覆盖从 20% 提升到加权接近 100%。 为什么重要。 这是今天三条精讲里最「反流行」的一条,也是最可执行的一条。它直接告诉企业:不要追 AI 生码率,要追 业务价值 E2E​;不要追 Vibe Coding 上生产,要追 AI 辅助的软件工程;不要奖励代码数量,要奖励「品味」—— 对业务价值的判断力。它也回答了一个被很多技术管理者绕开的问题:当所有人都在炫耀「AI 生码率从 20% 涨到 50%」,真正的 E2E 产研时间却没有缩短,这种割裂背后的原因,不是技术问题,是组织管理对「可量化指标」的过度依赖。 和今日其他议题的关系。 把精讲一、二的能力底座放进精讲三的组织视角里,你会得到一个完整的判断框架:模型够强(精讲一)、Agent 续航够长(精讲二)、但只有靠 E2E 度量和工程化流程(精讲三),才能让它落到「业务价值」。这也是今天「从写得快到做得对」这条主线的最终归处。换句话说,模型层和 Agent 工程层负责把「能做的事」推到新边界,组织层负责回答「该做哪些事、做到什么标准才叫好」—— 三者缺一不可。 一个延伸观察。 文章另一组细节也值得记下:他强调 AI 时代的人才结构里「技能在贬值、品味在升值」。技能指的是「会做某件事」,品味指的是「能定义什么是好」。AI 工具普及后,技能的稀缺性正在迅速下降,而对业务价值的判断、对产品最终验收的标准,反而越来越难被替代。这是他给团队反复强调的一句话:忘掉岗位和位置,去看任务和目标。 阅读建议。 建议读全文。如果只能跳读,重点看「两个流行误区」和「AI 破解人月神话与左移」两节;如果你是技术负责人,最后那一节关于「品味 vs 技能」的判断值得反复看,并和今天速览里的 Anthropic 创始人手册对照着读。 ## 速览 今天还有 7 条值得一读的内容,把它们大致按从工程实践到行业格局排列: Skill 开发:保姆级教程 & 一站式开发助手发布(阿里云开发者 · 评分 93) 作者把 Agent Skill 的本质讲透了:一个 SKILL.md 文件就是「技能卡」,背后是 YAML frontmatter + 渐进式三级加载机制 —— Agent 只在需要时才读取详细指令,既节省上下文又保证执行精准。文章覆盖目录结构、编写规范、跨平台发布痛点和一站式开发助手 skill-dev-aio。最值得带走的判断是 ——「Skill 替代的不是你,而是你身上那些重复、易错、本不该占用大脑的任务;真正的价值在于体验和判断」。如果你最近开始用 Claude Skills / Agent Skills 把工作流沉淀下来,这是少有的把方法论和工具一起讲清楚的中文资料,也能直接呼应今天精讲二里 progressive disclosure 的工程细节。 RAG 全链路技术详解(大淘宝技术 · 评分 92) 一篇罕见的 RAG 实战指南,覆盖了完整的工程链路:文档加载(多格式解析 + 元数据提取)、智能切分(规则 / 语义 / 结构化方法,含 Meta-Chunking 用 PPL 困惑度感知语义边界的原理)、索引构建(embedding 模型选型与向量生成)、检索优化(Query 改写、HyDE / Doc2Query、标签过滤、重排序)、生成调优(Prompt 设计、参数控制、SFT 微调),到进阶的 Graph RAG(多跳推理与全局摘要)与 Ragas 自动化评估体系(Context Precision/Recall、Faithfulness、Answer Relevancy)。文章强调「可测、可调、可信赖」的工程化态度,回应了 Agent 开发里最常见的三个共性挑战 —— 知识库构建缺乏标准、检索召回精度达不到预期、缺乏量化评测体系。对落地企业级 Agent 知识库的团队是一份高质量的内部培训材料。 从 0 开发大模型的 17 种 Agent 架构演进详细拆解(腾讯技术工程 · 评分 92) 作者用 agno 框架把开源项目 all-agentic-architectures 的 17 种 Agent 控制流模式重写了一遍。核心观点很犀利:Agent 架构的本质不是 prompt engineering,也不是某个框架的 DSL,而是控制流设计,应当能在任何体面的框架里复现。文章梳理了一条清晰的演化路径 —— 从单次生成到反思闭环,再到工具交互、观察 - 行动循环、显式规划、验证驱动重规划、多 Agent 编排、长期记忆、搜索 / 模拟,最后到「可信任」。每一步都用同一套六个问题(要解决什么、State 是什么、拓扑、Router、失败模式、何时该升级)拆解。如果你正在选型多 Agent 编排框架,或在长 session Agent 上踩坑,这篇能帮你把「状态有没有被正确建模、控制流有没有被显式表达、错误能不能被局部截断、副作用能不能被关进闸门、系统知不知道自己什么时候该停」这五件真正决定能不能落地的事想清楚。 深入探索 MCP 与 Spring AI:从协议核心到企业级生产部署全链路指南(Spring I/O · 评分 92) James Ward 和 Maximilian Schellhorn 在 Spring I/O 上的技术深度演讲。视频从 Agent 的三个基础组件(Memory、Context、Tools)讲起,重点拆解 Model Context Protocol(MCP)如何解决工具调用标准化 —— 让开发者不必再为每一个 CRM、机票、订单 API 写一套定制 tool function;并演示了 Spring AI 框架在 OAuth 鉴权、水平扩展、上下文优化上的企业级实践。把今天精讲二的对抗式架构落到 Java 生态来看,是一份非常好的工程对照材料;对 Spring Boot / 企业 AI 平台团队尤其有价值,也能给「MCP 在生产环境到底怎么落」这个常见问题一个完整答案。 Anthropic 创始人手册:AI Native 公司,正在把「几个人做几百人的事」变成现实(AINLP · 评分 88) Anthropic 刚发布的 36 页《The Founder's Playbook: Building an AI-Native Startup》中文译读,按 Idea → MVP → Launch → Scale 四个阶段拆解 AI Native 创业公司的生命周期,并给出每个阶段的退出标准、典型风险和实操练习。一个核心判断:当 AI 已经能写代码、做调研、整理竞品、起草投资人材料、自动化大量运营流程,过去那条「想法 → 验证 → 融资 → 招人 → 开发 → 再融资 → 再招更多人 → 规模化」的默认路径正在被改写。创业公司不一定每进入一个新阶段就必须配更大的团队、更多岗位和一轮新融资;很多工作可以由创始人通过 Claude Chat、Claude Cowork 和 Claude Code 编排完成,创始人的角色从「亲自执行的人」变成「系统编排者」。最大的风险不再是「做不出来」,而是「太快做出一堆没人要的东西」。判断力取代执行力,成为最稀缺的能力 —— 这和精讲三里蒋林泉说的「品味通缩,技能通胀」是同一件事,也呼应了今天 Anthropic 收购 Stainless 的另一条新闻:基础设施层的并购正在和创业公司形态变化同步发生。 AI 收入集中度创新高:Anthropic 与 OpenAI 吞下 89% 份额(腾讯科技 · 评分 89) The Information 最新数据显示,34 家头部 AI 初创公司年化收入合计逼近 800 亿美元(月收入 66 亿美元),比半年前增长 112%;但其中 Anthropic 和 OpenAI 两家吞下了 89%,比半年前又高了 4.5 个百分点,剩下的 32 家只能为 11% 的蛋糕奋力拼抢。Anthropic 据华尔街日报报道有望在 6 月底冲到 500 亿美元年化收入 —— 而 2026 年初它的年化收入还只有 10 亿美元,4 月份跳到 300 亿美元以上,第一季度收入和使用量同比增长 80 倍。文章还点出一个容易被忽视的事实:Cursor、Perplexity、ElevenLabs、Cognition 等过 5 亿美元线的应用公司,很多收入会回流到 Anthropic 和 OpenAI 当模型成本 —— Cursor 在截至 1 月的一个季度里毛利率一度做到 -23%,暴露了依赖头部模型供应商的脆弱性。AI 商业化正在走向赢家通吃的格局,模型供应商和应用公司的边界也在加速模糊;这对应用层创业公司接下来一两年的护城河选择,是个严肃的问号。 Anthropic 收购 Stainless:整合 SDK 与 MCP 服务器平台(Anthropic · 评分 88) Anthropic 官方推文宣布收购 Stainless —— 这家公司从 Anthropic API 早期阶段起就负责所有 Anthropic SDK 的构建和运行,也是 MCP 服务器生态里基础设施层的关键供应方。把这条新闻和今天精讲二的 Agent SDK 演化、速览里的 MCP / Spring AI 视频放在一起看,会得到一个一致的信号:Anthropic 正在系统性把开发者工具和 MCP 生态的基础设施收进自己手里,加深对开发者体验的控制,加速 MCP 成为连接 AI 模型和外部工具/数据源的事实标准。叠加上一条 89% 收入集中度的报道,模型层的赢家通吃正在向 SDK 与协议层延伸。 ## 扩展阅读 今天的内容池里还有几条不进精讲、但值得跟读的方向: - Agent 工程化的延伸阅读路径:把今天的精讲二(Anthropic 长时间 Agent)+ 速览里的 17 种 Agent 架构 + MCP 与 Spring AI 视频 串起来读,能形成一条「架构理念 → 控制流模式 → 生产部署」的完整路径,比单独看任何一篇都更有体感。 - AI 编码与组织效能的对照阅读:精讲一(Cursor Composer 2.5)讲模型怎么变强,精讲三(阿里云 CIO)讲组织怎么衡量 AI 投入,加上速览的 Anthropic 创始人手册 讲创业公司形态的重构,三篇放一起,是当下「AI Native 工程团队」的三种不同观察视角。 - 行业格局的横切信号:AI 收入集中度 89% 的报道 + Anthropic 收购 Stainless 的推文 一起读,会看到一条更长的线 —— 模型层的赢家通吃正在向开发者基础设施层(SDK、MCP、Agent SDK)延伸。这关系到接下来一两年应用层创业公司的护城河会建在哪里。 - Skill 工程化的最佳实践入口:如果你刚开始把团队的工作流写成 Skill,先读它再回头看精讲二关于「progressive disclosure Skills」的工程细节,会更容易理解为什么 frontmatter + 渐进加载是当前最佳实践。 ## 今日阅读路径 如果你今天只有 20–30 分钟,按这个顺序读最划算: 1. 精讲三:阿里云 CIO 抛弃 AI 生码率 —— 先把「该不该做」的判断框架定下来。读完最大的收获是不再被「AI 生码率 70%」这种数字迷惑,知道该用 E2E 业务价值去衡量产研效能。 1. 精讲二:Anthropic 长时间 Agent 工程 —— 再看「怎么把强模型变成可交付」。重点看对抗式 generator-evaluator 架构和「结构化交接 vs 上下文压缩」两条结论。 1. 精讲一:Cursor Composer 2.5 训练报告 —— 最后看「底座变强到什么程度」。如果你不写训练栈代码,重点看 textual feedback RL 的思路和 SpaceXAI 合作的战略意涵。 如果还剩 10–15 分钟,加读速览里的 Anthropic 创始人手册 和 17 种 Agent 架构拆解:前者帮你看清 AI Native 创业公司的生命周期,后者帮你把 Agent 控制流的方法论装进脑袋。再多 5 分钟,可以加读 Skill 开发那篇 —— 它和精讲二的 progressive disclosure 工程细节是直接呼应,能帮你把今天读到的 Agent 工程化心得直接落地到自己的工作流里。 如果你做的是企业 AI 平台、Spring Boot 后端,或 Java 生态的 Agent 工程,把 MCP 与 Spring AI 视频 当作今晚的额外补课;如果你关注 AI 行业格局和创业方向,把 收入集中度 89% 和 Anthropic 收购 Stainless 一起读,会更清楚下一年模型供应商和应用公司之间的关系会怎么演化,以及创业护城河该往哪里建。 读完今天的早报,欢迎在评论区分享你最有共鸣的一条。明天见。

译本文聚焦AI编码领域正从追求“写得快”向“做得对”的工程化范式转变。文章通过三条核心线索展开:Cursor发布Composer 2.5并公开训练栈,标志着从产品公司转向模型迭代;Anthropic工程师提出对抗式生成-评估架构,将长时Agent自主运行时间从1小时提升至12小时;阿里云CIO则指出“AI生码率”是危险指标,强调代码是负债,工程化与组织能力才是关键。这共同指向一个结论:AI降低了代码生成成本,但将其转化为资产需要深度工程化。

Replit ⠕@Replit · 5月19日22

For us here at Replit, the month of May is all about mothers like Kelly. Kelly's son struggles with spelling, and the apps out there made him feel small. So she built Spell Strike on Replit, a mission-based spelling app with XP, ranks, unlockable themes, and parent progress tracking. There's also a tactical version for older kids who need practice that doesn't feel juvenile. The goal isn't to make spelling easy. It's to make practice possible. Built by a mom, to make your child's next spelling bee a breeze.

译Replit平台上,一位名叫Kelly的母亲为帮助拼写困难的儿子而开发了Spell Strike应用。该应用通过游戏化设计(如经验值、等级和可解锁主题)及家长进度追踪功能,将拼写练习转化为有成就感的体验。它同时包含适合年长孩子的战术版本,避免让练习显得幼稚。核心目标是让拼写练习变得可行且坚持,而非单纯降低难度。应用旨在以游戏化方式支持孩子的拼写学习,体现了社区用户借助工具解决实际问题的案例。

Orange AI@oran_ge · 5月19日41

大家都说和 AI 沟通很轻松,跟人沟通就要复杂的多。 所以 OPC 效率是最高的。 反过来想。 与人一起共同经营公司是最难的事情,也是 AI 时代越来越稀缺的事情。 稀缺处往往有价值。 价值体现在 OPC 和公司上,就是业务的 scaling 和天花板。

译推文指出,尽管AI沟通更高效,但人类共同经营公司这种复杂协作在AI时代日益稀缺,而稀缺性恰恰带来价值。这种能力的价值具体体现在业务的扩展规模和增长天花板上——在AI加速标准化与自动化的背景下,人类独有的协同、决策与应变能力,反而成为突破业务上限的关键。

SemiAnalysis@SemiAnalysis_ · 5月19日57

Our SemiAnalysis Weekly Podcast often asks - Is the AI cycle this time truly different from other cycles? Well, at least from our analysis, we think the return from AI is real and it looks like a structural trend that is truly different from other cycles. We tracked token spend vs human labor cost across 9 real workflows at SemiAnalysis - these are tasks our analyst team do consistently to stay on top of the industry: company initiations, earnings recaps, conference transcript mining, financial data pulls. (1/3) 🧵

译SemiAnalysis在播客中探讨了本次AI周期是否真正不同于以往技术周期。团队基于分析认为,AI带来的回报是真实的,且呈现为与其他周期不同的结构性趋势。为验证此观点,他们在内部追踪了9个实际工作流程(包括公司研究、财报总结等)中的token消耗成本与人工劳动成本对比,通过具体数据表明AI的效率与经济价值。研究认为这一趋势已显现出区别于历史技术迭代的独特性与持续性。

Ethan Mollick@emollick · 5月19日54

I broke my own rule to never post about AI detection as it is fraught in many ways. The problem is that if you use AI a lot, you know AI writing on sight, which makes the difficulty of objectively proving that AI use to others very frustrating

译我打破了自己从不讨论AI检测的规则,因为这涉及太多问题。 问题在于,如果你经常使用AI,你一眼就能认出AI写作,这使得向他人客观证明AI使用的难度令人沮丧。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月19日18

We have reached the "robots autonomously building war robots" part of the timeline >autonomous vehicles and AI-driven machinery operate ~24 hours a day >The process once required employees to monitor its round-the-clock operations, but the plant can now produce the “skeleton” of an aircraft in near darkness >Dark factories are facilities designed to operate with little to no human intervention, removing the need for lighting

译推文指出“机器人自主制造战争机器人”的阶段已经到来,核心现象是“黑暗工厂”的普及。这类工厂由AI驱动,可全天候运行,几乎无需人类干预,甚至能在近乎黑暗的环境中生产飞机骨架等复杂产品。引用内容进一步强调,未来所有工厂都可能实现全自动化,人类角色将逐渐被边缘化,转而由AI机器人不间断地以极高速度生产更多机器人。这引发了对生产模式变革与AI安全性的关注。

Nathan Lambert@natolambert · 5月19日49

The system is the product. Models are just one piece today, agree with Joanne.

译系统才是产品。如今模型只是其中一个组成部分,我同意 Joanne 的观点。

AYi@AYi_AInotes · 5月19日43

The AI you're laughing at and the AI I use are completely different beasts. On the left, a free model; on the right, Claude Code. Given the same task, one spouts nonsense, the other runs 1,350 pieces of data with precision in 11 seconds. Most people’s understanding of AI is still stuck in 2023.

译你嘲笑的AI和我使用的AI完全是两回事。 左边是免费模型,右边是Claude Code。 面对同一任务,一个胡言乱语,另一个在11秒内精准处理了1,350条数据。 大多数人对AI的理解还停留在2023年。

Replit ⠕@Replit · 5月19日47

This is exactly what we're seeing. The "AI for everything" era is really the "software for everyone" era. Every SMB becomes a software company.

译这正是我们所看到的。“AI赋能一切”的时代,本质上是“软件普及每个人”的时代。每家小企业都将变成软件公司。

Rohan Paul@rohanpaul_ai · 5月19日60

Top AI labs are suddenly abandoning fringe consumer features (like video models & conversational personas) to mirror Anthropic's success with coding agents. "They're all like, “We're only going to do coding agents too.” ~ Marc Benioff, CEO of Salesforce

译顶级AI实验室突然放弃边缘消费功能(如视频模型和对话角色),转而效仿Anthropic在编程智能体领域的成功。 “他们都表示,‘我们也要只做编程智能体了。’” ——Salesforce CEO Marc Benioff

meng shao@shao__meng · 5月18日32

还是忍不住,先说一点外部比较公开的信息吧 你在 X 上看到的第一个铺天盖地的 AI 产品商单是谁?是 Manus 邀请码吗?我的是 Lovart,当时记得有几轮商单爆发,铺天盖地,阵仗很大! 后来很多人知道 Lovart 应该是因为 Nano Banana,特别是国内的朋友,因为 IP 和账号问题不容易体验到原版 Nano Banana,Lovart 就做了一个中转,好像还有限免? 后来罗永浩老师做了一次很大型的 AI 直播发布,给很多 AI 产品做推广,其中一个就是 Lovart,但那次 Lovart 推广其实没做成。当时罗老师解释时时长还是现场调试问题来着?反正是没做成,后来还承诺额外做品牌露出推广,作为补偿。 后面两件事,好像还有一个微妙的联系。。因为要做国外模型中转给国内用户,特别是 Nano Banana 和 Veo 等生图生视频模型,Lovart 应该是在香港做了一层代理,这也是打通国内外网络环境很常用的骚招。如果只是自己用,或者少量内测,一般不太会被发现。 但他们还在国内请公众号、小红书等好多平台的博主做 PR,导致国内流量短期内飙升,也就很自然的被发现了,切断了国内站的正常访问,而切断时,刚好就是直播时。。

译Lovart作为一款AI设计工具,通过密集的社交媒体推广和为国内用户提供Nano Banana等模型的中转服务迅速走红。其推广包括与罗永浩合作的直播,但该次推广未成功。为解决跨境访问,Lovart在港设立代理服务器,这在国内大规模PR推广导致流量激增后暴露,并被切断服务。该事件与直播时间重合,导致Lovart从备受瞩目的“Design Agent”迅速面临重大运营挑战。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
10:05
ginobefun@hongming731
66
Google I/O 2026、Karpathy加入Anthropic与Claude企业安全更新

今日科技圈三事共同指向智能体工程化趋势。Google I/O 2026将Gemini模型、Antigravity CLI与WebMCP等工具整合为完整开发链路,支持子智能体并发调度。Anthropic同步发布Claude Managed Agents的自托管沙箱与MCP Tunnels,解决了企业安全执行与私有数据接入问题。此外,Andrej Karpathy宣布加入Anthropic,被视为对其研究路线的重要背书。三者表明行业焦点已从提升模型基准,转向构建可工程化、可安全落地的智能体生产系统。

AnthropicGoogle现象/趋势
08:31
向阳乔木@vista8
47
小红书也是真离谱,AI生成的几秒无声视频,提示笔记违规。 抖音,视频号,x发布都没问题。 连视频没声音都管,何况只有几秒而已。。。
安全/对齐现象/趋势视频
08:05
Berryxia.AI@berryxia
63
Google I/O 2026大会总结:迈向Agentic Gemini时代

2026年Google I/O大会的主题为“Agentic Gemini时代”,旨在将AI从聊天工具进化为能自主思考、执行任务的“世界模型”。本次大会未发布Gemini 4.0,而是推出了更务实的Gemini 3.5系列,核心包括:速度极快且为智能体优化的Gemini 3.5 Flash;能理解物理世界、实现任意模态生成的全新“世界模型”Gemini Omni;以及可24/7自主工作的智能体Gemini Spark。同时,Android XR智能眼镜和AI集成的Googlebook笔记本等硬件亮相。整体上,Google正将Gemini深度整合至其全生态,巩固其在自主AI赛道上的领先地位。

智能体Google多模态现象/趋势
07:49
小互@xiaohu
55
看看 Gemini Omni的实力 一句话就是:视频版的香蕉🍌 当然远不至于视频的编辑能力,它应该是世界模型的雏形… 通用AGI的初始形态…
Google多模态现象/趋势视频
07:38
Anthropic@AnthropicAI
60
过去几个月,我们一直与学者、哲学家、神职人员和伦理学家就AI引发的问题展开对话,从良好品格如何形成开始。 了解更多我们如何拓宽关于前沿AI的对话:https://www.anthropic.com/news/widening-conversation-ai
Anthropic安全/对齐现象/趋势
07:32
Ethan Mollick@emollick
59
ChatGPT/Codex 与 Claude/Code/Cowork 之间的能力差距正在缩小,因为 Anthropic 和 OpenAI 正在趋同于单一的体验。 Google 的体验则在分化:Studio、Gemini、Antigravity 及其他 Google AI 应用正变得越来越不同。 谁将胜出?
AnthropicGoogleOpenAI现象/趋势
07:03
SemiAnalysis@SemiAnalysis_
63
AI市场:泡沫还是经济重塑?--产业链瓶颈与前沿议题全解析

本期探讨AI市场究竟是暂时泡沫,还是全球经济的结构性重塑。内容深入分析AI产业链瓶颈与竞争格局,涵盖芯片架构限制、以Nvidia和Grok LPUs为代表的推理生态之争,以及AMD、Intel、TSMC的代工博弈。同时讨论ASIC创业公司现状、数据中心基础设施危机、太空数据中心与主权AI布局等前沿议题,并结合宏观趋势、机器人技术和“总Token产量”等指标,对市场热度与潜在风险进行犀利点评。

推理现象/趋势部署/工程
07:03
Rohan Paul@rohanpaul_ai
66
Accel领投7500万美元,AI同事Viktor引爆赛道

AI同事Viktor获得Accel领投的7500万美元A轮融资,成为首个原生集成于Slack与Microsoft Teams的AI员工。它能驻留团队频道,连接3000余种工具,执行定时任务,并通过可复用技能保持记忆,从而自主生成报告、更新等实际工作产出。此次融资标志着AI交互范式正从“向模型提问”向“指派AI角色”转变,系统需具备记忆、调度与任务判断能力。据披露,Viktor在上线10周内便达成了1500万美元年化收入,其用户企业实现了团队效率提升、成本显著削减与业务增长,展现了其作为能创造真实价值的“AI员工”的巨大潜力。

Fryd Wiatrowski: Today, we're announcing Viktor's $75M Series A, led by @Accel . @viktor__com was supposed to be a small experiment. It b...

智能体现象/趋势行业动态
05:44
OpenAI@OpenAI
精选70
人们每周在ChatGPT中生成超过15亿张图像。 研究员 @kenjihata 与产品负责人 @adele__li 及主持人 @AndrewMayne 一起,探讨自 Images 2.0 发布以来出现的新用例和趋势。
OpenAI图像生成现象/趋势

推荐理由:OpenAI 首次把内部图像生成数据摊开聊,每周 15 亿张的量级说明这功能已经不是玩具了,做图像产品的可以对着用例风向调方向。
04:59
Emad@EMostaque
40
看来许多自回归模型将被转换为扩散模型。
数据/训练现象/趋势
01:58
Emad@EMostaque
57
快来加入我们朋友@cyberfund的Monastery加速器项目 200万美元无上限票据,12周计划,让我们看看能否打造首个AI辅助的独角兽

cyber•Fund: Introducing the Monastery for AI-native founders. A single builder can now outperform a publicly traded company. $2 mill...

现象/趋势行业动态
00:53
AYi@AYi_AInotes
82
Karpathy加入Anthropic:一次指向未来的"关键投票"

前OpenAI创始团队成员Andrej Karpathy宣布加入Anthropic,被普遍视为AI行业的一次地震级事件。但这并非单纯的人才流动。Karpathy在声明中将LLM前沿的未来数年定义为“formative years”(关键塑形期),这被解读为对“AI发展见顶论”的直接反驳,意味着真正的爆发窗口期现在才刚开始。他选择Anthropic,本质上是其个人对未来AI发展路径的深度判断和“投票”,即认为LLM的下一次重大突破,很可能在安全与极致能力协同发展的路径上实现。这标志着行业竞争的核心,已从当下的模型比拼,延伸至对长期技术路线的押注。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic大佬观点现象/趋势行业动态
00:42
Nathan Lambert@natolambert
66
学术失衡:AI研究转向闭源与全球知识扩散

本文指出,AI研究正从学术界主导向工业界闭源化转变,打破了长期由中立学者传播前沿知识的社会平衡。科技公司通过制造不信任感掌控叙事,削弱了科学界服务公众的传统。同时,金融驱动的“错失恐惧症”迫使许多志在学术的人才流向工业界。作者认为,尽管短期内发展由闭源模型主导,但知识最终必然扩散,其长期轨迹仍与开放科学紧密相连。在这一趋势下,凭借更利于研究获取与传播的环境,中国有望在未来成为全球AI研究的新中心。

大佬观点开源生态现象/趋势
00:31
Rohan Paul@rohanpaul_ai
44
🇨🇳在中国深圳,食物通过空中滑行送到你的餐桌,由AI引导。 配送舱使用磁悬浮、AI路径规划和直线电机,实现平稳、无轮的运动。每个配送舱实时绘制空间地图、避开碰撞并优化路线。
具身智能现象/趋势
00:02
凡人小北@frxiaobei
57
AI提效后,组织协作面临新挑战

核心问题在于,AI大幅提升个人效率后,团队协作反而可能变得更困难。因为组织层面的AI应用并非个人提效的简单放大,而是需要解决如何将AI深度嵌入现有协作结构、打破信息壁垒的问题。当前很少有团队关注后者。Lucius AI 正尝试解决这一痛点,其核心是构建组织的“上下文层”,旨在减少团队中超过30%时间被浪费在重复重建已有决策上下文上的现象,从而弥合个人高效与组织协同之间的鸿沟。

Lucius: We raised $3M to build Lucius AI - the Context Layer for Your Organization. Backed by Future Capital Discovery Fund, we'...

现象/趋势部署/工程
5月19日
23:35
DogeDesigner@cb_doge
35
"当我入睡时,会有AI突破。当我醒来时,又有AI突破,到了午餐时间,又一个AI突破。很明显,我们将拥有远比人类聪明的AI。希望它能善待我们。" - Elon Musk
xAI大佬观点现象/趋势
23:05
DogeDesigner@cb_doge
58
马斯克:AI未来发展需大规模太空能源基建

马斯克指出,为实现Kardashev等级文明,人类需要建立月球基地、质量驱动器和大型太空太阳能系统等基础设施。未来AI的能源需求可能远超地球承载能力,通过部署太阳能AI卫星或可产生太瓦级电力,但这需要每年向轨道运输千万吨级载荷。该构想在物理上可行,核心挑战在于实现超大规模建造。若建成月球能源设施,或将解锁拍瓦级太阳能AI,其规模将使当前地球经济相形见绌。

大佬观点现象/趋势
22:59
Rohan Paul@rohanpaul_ai
38
主张让AI自动化重复性劳动(如重复话术、机械问答),使人类能专注于体现温度、判断力与关怀的关键时刻。核心在于厘清自动化边界--技术处理枯燥流程,人类负责情感与人性化服务。引用观点强调"让人类回归人性本质",并提及Smallest AI Voice Agents作为实践案例,倡导在提升效率的同时保留人性化交互。

Sudarshan Kamath: She deserves her moment. So do your customers. Let humans be humans. Try Smallest AI Voice Agents!

大佬观点现象/趋势
22:58
Ethan Mollick@emollick
65
笼统讨论"是否喜欢AI"已无实际意义

简单地问公众“是否喜欢AI”将不再是一个有意义的问题。人们会根据AI的具体应用场景产生截然不同的复杂反应:感激其在医疗、法律、专业工作中的协助,喜爱与其互动的聊天机器人,同时恐惧那些被宣称会夺走工作或威胁生存的AI,并被用于娱乐的AI所逗乐。这正如我们对电力的看法——人们不再笼统讨论是否喜欢电,而是依赖其在社会基础中的具体功能。公众对AI的接受也将是具体、务实且充满多面情感的。

大佬观点现象/趋势
22:35
DogeDesigner@cb_doge
42
马斯克称太空数据中心比想象中更可行

基于SpaceX现有的1万颗在轨卫星,以及未来使用Starship将实现每年发射超万颗更强通信卫星的计划,埃隆·马斯克认为太空通信能力将百倍提升。他指出,尽管通信能力大幅增长,但这将远不及未来AI卫星的吨位规模。因此,他用物理学的极限思维进行推演,得出结论:建设太空数据中心的可行性比普遍认知的要高得多。

xAI大佬观点现象/趋势部署/工程
22:26
Baidu Inc.@Baidu_Inc
67
这里快速补充一个指标新词:DAA。 全称 Daily Active Agents(每日活跃智能体),相当于智能体时代的 DAU。 如果说代币经济学追踪成本,那么 DAA 追踪产出--智能体实际完成了多少工作。 完整对比见下文 ↓
智能体现象/趋势
18:58
Rohan Paul@rohanpaul_ai
54
当前部分大学生在毕业典礼上对AI的赞誉报以嘘声,但同时他们又深度依赖AI工具来完成学业、应对考试,并身处一个他们认为已被AI重塑的就业市场中。这一现象并非简单的虚伪,而是源于现实压力与对未来的忧虑交织而成的复杂情绪。有观点指出,这些大学生本处于能最原生化使用AI的优势阶段,他们的抵触情绪反而凸显了技术快速渗透与个体准备不足之间的巨大张力,反映了AI引发的广泛社会性焦虑。

Rohan Paul: College Students are booing graduation speakers for celebrating AI. But I dont get what exactly are they booing? They're...

大佬观点现象/趋势
18:28
Rohan Paul@rohanpaul_ai
47
大学生们在毕业典礼上对演讲者庆祝AI的行为发出嘘声。 但我不明白他们到底在嘘什么?在职业生涯的早期阶段,他们正是最适合原生使用AI的人群。
现象/趋势
14:51
AYi@AYi_AInotes
67
AI时代内容交付的真正终点是HTML

开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi: http://x.com/i/article/2053129966217277440

智能体开源/仓库现象/趋势
13:50
AYi@AYi_AInotes
66
葡萄3D模型在X平台爆火:4800赞背后的3DGS技术突破

一颗葡萄的3D模型在社交平台X上引发热议,一天内获4800赞和280万浏览。其核心在于利用3DGS技术成功攻克了半透明物体重建的公认难题。项目使用6660张宏观照片训练,生成仅43万高斯点,压缩后模型小于50MB,实现了在手机端实时360度旋转和光影还原。这一突破验证了“最难案例跑通,则更简单物体皆可数字化”的逻辑,展示了从专业扫描仪和建模团队降维到个人相机加自动训练的低成本、高效率新流程,为手办、珠宝、文物等领域的数字资产化指明了方向,开发者正通过工具miqula将此流程产品化。

AYi: Damn,有点炸裂啊,一颗葡萄用了6660张宏观照片训练3DGS, 模型只有43万个高斯点, 压缩完不到50MB, 但你可以在手机上看它360度旋转, 连果肉里透出来的光都还原了, 更炸的是老哥回复里那句话,有人问底部怎么拍到的,他甩了张g...

多模态现象/趋势端侧
11:40
Ethan Mollick@emollick
51
我认为你可能会开始看到大公司的一个趋势是通过招聘实现内部化:当你可以雇佣内部员工并自行利用AI生产力提升时,为什么要支付那么多外部供应商(法律、营销、软件供应商)的费用? 已经和正在走这条路的高管们交谈过……
大佬观点现象/趋势
10:56
Berryxia.AI@berryxia
33
卧槽~这个可以啊! 其实Apple Vision Pro就是通过追踪眼球来控制,类似你的眼球就像移动的鼠标指针,你的手部捏合的动作就是鼠标点击的动作。 这个直接搞到显示器上有点意思!
多模态现象/趋势
09:13
SemiAnalysis@SemiAnalysis_
71
OpenAI真的回来了吗?@JordanNanos、@Dylan522p、@FabricatedKnowledge 和 @maxkan_ 分析 OpenAI 是否已从近期困境中真正恢复,以及这对 AI 竞赛意味着什么。
OpenAI现象/趋势
09:12
Orange AI@oran_ge
32
给中转站做个导航+点评? 似乎是个有点真的需求 但后来我发现中转站的问题是 一旦它火了,就开始掺水 … 人性难逃
现象/趋势
08:56
ginobefun@hongming731
70
BestBlogs 早报 · 05-19 · Composer 2.5、长时 Agent 与 AI 生码率

本文聚焦AI编码领域正从追求“写得快”向“做得对”的工程化范式转变。文章通过三条核心线索展开:Cursor发布Composer 2.5并公开训练栈,标志着从产品公司转向模型迭代;Anthropic工程师提出对抗式生成-评估架构,将长时Agent自主运行时间从1小时提升至12小时;阿里云CIO则指出“AI生码率”是危险指标,强调代码是负债,工程化与组织能力才是关键。这共同指向一个结论:AI降低了代码生成成本,但将其转化为资产需要深度工程化。

智能体AnthropicMCP/工具现象/趋势
08:21
Replit ⠕@Replit
22
一位母亲用Replit开发拼写游戏应用帮助孩子学习

Replit平台上,一位名叫Kelly的母亲为帮助拼写困难的儿子而开发了Spell Strike应用。该应用通过游戏化设计(如经验值、等级和可解锁主题)及家长进度追踪功能,将拼写练习转化为有成就感的体验。它同时包含适合年长孩子的战术版本,避免让练习显得幼稚。核心目标是让拼写练习变得可行且坚持,而非单纯降低难度。应用旨在以游戏化方式支持孩子的拼写学习,体现了社区用户借助工具解决实际问题的案例。

现象/趋势行业动态
06:12
Orange AI@oran_ge
41
AI时代下人类共同经营公司能力的稀缺价值

推文指出,尽管AI沟通更高效,但人类共同经营公司这种复杂协作在AI时代日益稀缺,而稀缺性恰恰带来价值。这种能力的价值具体体现在业务的扩展规模和增长天花板上——在AI加速标准化与自动化的背景下,人类独有的协同、决策与应变能力,反而成为突破业务上限的关键。

大佬观点现象/趋势
05:13
SemiAnalysis@SemiAnalysis_
57
AI周期的独特性与实际回报获数据分析验证

SemiAnalysis在播客中探讨了本次AI周期是否真正不同于以往技术周期。团队基于分析认为,AI带来的回报是真实的,且呈现为与其他周期不同的结构性趋势。为验证此观点,他们在内部追踪了9个实际工作流程(包括公司研究、财报总结等)中的token消耗成本与人工劳动成本对比,通过具体数据表明AI的效率与经济价值。研究认为这一趋势已显现出区别于历史技术迭代的独特性与持续性。

数据/训练现象/趋势
05:09
Ethan Mollick@emollick
54
我打破了自己从不讨论AI检测的规则,因为这涉及太多问题。 问题在于,如果你经常使用AI,你一眼就能认出AI写作,这使得向他人客观证明AI使用的难度令人沮丧。
大佬观点现象/趋势
03:39
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
18
推文指出"机器人自主制造战争机器人"的阶段已经到来,核心现象是"黑暗工厂"的普及。这类工厂由AI驱动,可全天候运行,几乎无需人类干预,甚至能在近乎黑暗的环境中生产飞机骨架等复杂产品。引用内容进一步强调,未来所有工厂都可能实现全自动化,人类角色将逐渐被边缘化,转而由AI机器人不间断地以极高速度生产更多机器人。这引发了对生产模式变革与AI安全性的关注。

AI Notkilleveryoneism Memes ⏸️: Autonomous "Dark Factory" with no human workers Soon, all factories will be dark - humans irrelevant Just AI robots buil...

安全/对齐现象/趋势
03:27
Nathan Lambert@natolambert
49
系统才是产品。如今模型只是其中一个组成部分,我同意 Joanne 的观点。

Joanne Jang: learned this quote from 2023 is making rounds -- i actually don't think this is true anymore in 2026! The model should b...

智能体大佬观点现象/趋势
02:45
AYi@AYi_AInotes
43
你嘲笑的AI和我使用的AI完全是两回事。 左边是免费模型,右边是Claude Code。 面对同一任务,一个胡言乱语,另一个在11秒内精准处理了1,350条数据。 大多数人对AI的理解还停留在2023年。

Rhys: the average person has only ever used ChatGPT 3.5 Instant and has no idea what the models can do

Anthropic现象/趋势
02:21
Replit ⠕@Replit
47
这正是我们所看到的。"AI赋能一切"的时代,本质上是"软件普及每个人"的时代。每家小企业都将变成软件公司。

Codie Sanchez: You don't need to build the next J.A.R.V.I.S. You need to build useful tools to make businesses more efficient (data fro...

现象/趋势编码
02:12
Rohan Paul@rohanpaul_ai
60
顶级AI实验室突然放弃边缘消费功能(如视频模型和对话角色),转而效仿Anthropic在编程智能体领域的成功。 "他们都表示,'我们也要只做编程智能体了。'" --Salesforce CEO Marc Benioff
智能体Anthropic现象/趋势编码
5月18日
22:56
meng shao@shao__meng
32
Lovart的兴起与运营转折

Lovart作为一款AI设计工具,通过密集的社交媒体推广和为国内用户提供Nano Banana等模型的中转服务迅速走红。其推广包括与罗永浩合作的直播,但该次推广未成功。为解决跨境访问,Lovart在港设立代理服务器,这在国内大规模PR推广导致流量激增后暴露,并被切断服务。该事件与直播时间重合,导致Lovart从备受瞩目的“Design Agent”迅速面临重大运营挑战。

meng shao: 最近跟几位朋友沟通中多次提及 Lovart,真的很好奇,Lovart 过去的一年发生了 tm 的什么? 好像从那个横空出世的 Design Agent,变成了...

智能体现象/趋势
‹ 上一页
1…1920212223…37
下一页 ›