AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1476 条
全部一手资讯X论文
标签「现象/趋势」清除
Greg Brockman@gdb · 5月22日65

the model alone is no longer the product

译模型本身已不再是产品

宝玉@dotey · 5月22日77

Cloudflare CEO Matthew Prince 在《华尔街日报》发了一篇专栏,标题是:《我是怎么选择用 AI 替换哪些员工的》 Cloudflare 刚裁掉约 1100 人,占全员五分之一,是这家公司 16 年来第一次大规模裁员。然后Cloudflare 今年招了 1111 名实习生,基本上和裁员的人数相当,等于是腾笼换鸟了。 而且夸张的是, Cloudflare 今年收到了将近 100 万份实习申请,录取率只有千分之一,就业环境可见一斑,也难怪毕业典礼上 CEO 们吹 AI 下面嘘声一片! 至于裁员的理由,当然是归结为 AI 了。为了说清楚裁员的理由,Prince 搬出了管理学家彼得·德鲁克 1954 年的《管理的实践》,把公司里的人分成三类: 1. 建造者(builder) 2. 销售者(seller) 3. 以及“度量者”(measurer),负责其余一切,包括财务、审计、法务、合规、中层管理、运营、市场。 AI 不动前两类。工程师效率翻十倍,他说有多少招多少;销售也安全,因为掏钱的是人,人愿意跟懂自己需求的人打交道。 会被 AI 顶掉的是第三类“度量者”,因为他们做的统计业绩、出报表、跑审计,正是结构化、可重复、AI 最擅长的活。这次裁的,绝大多数就是这批人。 他举了几个具体例子:Cloudflare 的内部审计以前每个季度只能抽查几个业务风险领域,现在转向全业务持续审计;财务关账更快了,错误更少了;中层管理者被大幅裁减,因为 AI 让每个经理可以直接管更多人。 而且用来替代这些人的实习生,Matthew Prince 的话来说:是天生的 AI 原生代。他们无一例外,全都是“建造者”或者“销售者”。 财报和裁员一起公布后,Cloudflare 股价一度跌掉二十多个百分点;公司这一季其实还亏了 6200 万美元,光遣散和重组就要花 1.4 到 1.5 亿美元。一边说不是省钱,一边背着上亿重组开支,投资人显然没全买账。

译Cloudflare裁员约1100人,同时招聘近似数量的实习生。CEO在《华尔街日报》撰文,引用德鲁克理论,指出AI主要替代从事审计、财务、中层管理等结构化工作的“度量者”,而工程师与销售人员影响较小。公司已将审计转向AI驱动,财务流程得以优化。大量实习岗位被视为面向“AI原生代”。财报显示公司当季亏损,且因裁员产生高额重组费用,消息公布后股价一度大跌超20%。

karminski-牙医@karminski3 · 5月22日43

之前翻译软件&翻译API仅存优势是速度快(比如玩旮旯给木一目十行), 但现在这么小的模型完全能扔显卡里拉到200tps, API就没优势了.

译翻译软件和翻译API的核心优势曾在于速度快,但当前小模型在显卡上可达到200tps的运行速度,使其速度优势不再明显。同时,用户如@chenerTR指出,只要通用大语言模型(如GPT 5.5)速度满足需求,他们更愿意用其进行翻译,而非依赖专用翻译工具。这表明通用模型正逐步替代传统翻译软件,改变了翻译技术的使用格局。

meng shao@shao__meng · 5月22日70

AI 补贴时代终结了吗? @HedgieMarkets 认为:AI 服务的"包月时代"正在结束,按 token 计费正在成为行业默认 · 微软取消内部 Claude Code:理由是基于 token 的计费模式让成本"难以承受",即便对一家拥有近乎无限云资源的公司也是如此。 · Uber 的 CTO 内部备忘录:警告公司在四个月内烧光了 2026 年全年的 AI 预算。 · 行业定价层面的变化:美国 AI 软件价格上涨 20%–37%,GitHub 正在全线产品中放弃固定费率套餐,转向按用量计费。 摆在面前的两条路,都不太好走 路径 A:维持当前价格 · 企业缩减 AI 用量以适配预算 · AI 公司收入增长放缓,而 labs 正需要营收来支撑 IPO 前的估值 路径 B:AI 公司降价 · 企业用量恢复 · 单位经济性进一步恶化,亏损扩大 Hedgie 用了一张典型的"利润剪刀差"图 · 绿色曲线(Per-Seat Revenue):按席位收费的订阅收入,呈温和上升; · 红色曲线(Per-Token AI Compute Cost):按 token 计的算力成本,呈指数式上扬; · 两线在右侧拉开巨大缺口,标注为 "Profit Collapse(利润崩塌)"。 只要定价单位(per-seat)和成本单位(per-token)不匹配,使用量越大,亏损越深。这正是 Claude Code、Codex、Cursor 等"包月制 AI 编程工具"目前面临的结构性问题,也解释了为什么 GitHub 要放弃 flat-rate。

译AI服务定价正从包月制转向按用量计费,微软、Uber等企业因成本压力缩减AI预算。行业面临两难:维持价格将抑制使用量并影响AI公司收入增长,降价则会加剧亏损破坏经济性。核心矛盾在于固定订阅收入与指数增长的算力成本不匹配,形成利润剪刀差,这是AI编程工具及整个行业面临的结构性挑战。

Berryxia.AI@berryxia · 5月22日57

Optimus V2.5 走路的样子已经明显变了。 视频里它迈步时有了清晰的节奏和自信,动作连贯自然,不再像之前那样带着明显的机械感和谨慎。 这个进步不是小事。 行走一直是人形机器人最难解决的动态平衡问题之一。 现在它能走得像一个真正知道自己要去哪里的人,说明整个感知、控制和执行系统的协同能力又上了一个台阶。 当 Optimus 连走路都已经开始带上人的姿态时。 我们真正该关注的,已经从它能不能走稳,变成了它什么时候能真正进入工厂、仓库和家里开始干活。

译Tesla Optimus V2.5的行走动态展现出显著提升,动作更连贯、自然,充满自信。这一进步反映了其感知、控制与执行系统的协同能力达到了新高度,解决了人形机器人动态平衡的核心难题。讨论焦点已从其能否走稳,转向何时能真正进入工厂、仓库等实际场景工作。

ginobefun@hongming731 · 5月22日63

http://x.com/i/article/2057600777791913984 # BestBlogs 早报 · 05-22|Agent 记忆原语、Qwen3.7-Max、自动化与人类专家 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-22 ## 导语 今天的早报围绕一个核心问题:AI Agent 真正「成熟」意味着什么? Anthropic 工程师首次公开了两项平台级原语——Memory 与 Dreaming,把 Agent 的跨会话记忆问题从理论变成了工程事实,Rakuten 的 97% 错误率下降数据让所有人意外。与此同时,Qwen3.7-Max 在 35 小时连续压测中以 1158 次工具调用零中断,把国内大模型竞争的焦点彻底从问答分数拉向长程稳定性。Every 创始人 Dan Shipper 则提出了一个反直觉的论断:AI 越普及,能「评判对错」的人类专家反而越稀缺。 今天速览部分涵盖了 Daytona 与 Railway 两家 Agent 基础设施公司的产品哲学,以及腾讯 Hy-MT2 翻译模型开源、AMD 苏姿丰上海演讲、ZCube 组网架构突破等多个值得关注的进展。补充阅读部分包括 OpenAI 推翻 80 年数学猜想、多篇 Harness Engineering 工程实践,以及 Martin Fowler 关于 Agent 代码可维护性传感器的最新思考,内容横跨 AI 科学发现、工程化落地与系统架构多个维度,建议根据今日阅读路径选读。 ## 精讲一:用于自学习自主 Agents 的 Memory 与 Dreaming 来源: Claude(Anthropic 官方频道) 阅读链接: 在 BestBlogs 观看 背景:Agent 记忆的工程瓶颈 在 AI Agent 承担越来越复杂的企业任务时,最大的工程障碍之一是「历史执行上下文的管理」。没有持久化的记忆基础设施,Agent 每次收到新指令时几乎都是「空白状态」——频繁重复错误、重复工作,无法在多 Agent 团队之间共享领域知识。 Anthropic 的 Ravi 在一场公开演讲中首次披露了两项专为云端托管 Agent 设计的基础设施原语:Memory 与 Dreaming。这是 Anthropic 在「长程自主智能体」方向上迄今最具体的架构路径。 Memory:把经验建模为虚拟文件系统 Memory 系统的设计出发点很务实:不强迫模型使用限制性的内部 API,而是把知识显式建模为标准虚拟文件系统,暴露给 AI 模型。 现代大语言模型(如 Opus 4.7)在操作文件路径和目录结构方面具备相当强的原生能力。通过把过去的经验和共享知识表示为标准目录,Agent 可以使用熟悉的 bash、grep 等终端工具来检查、修改和组织历史记录。这消除了不必要的软件层,让模型自己决定哪些会话内容值得保存。 企业控制层级与并发控制: 在大型企业环境中部署共享记忆时,读写冲突是一个现实风险。Anthropic 通过三项架构约束来解决这个问题: 1. 作用域层级(Scoped Hierarchies): Agent 同时访问不同层次的记忆空间——包括只读的企业知识库(如 SLO 策略、运行指南)和可读写的本地任务存储。 1. 乐观并发控制(OCC): 防止多个并发 Agent 在同时写入时互相覆盖状态。 1. 独立 REST API: 使外部工程团队可以方便地执行 CRUD 操作、触发数据导出或进行合规删除。 Rakuten 的早期部署数据非常惊人:引入生产级 Memory 后,首次执行错误率下降了 97%。Wise Docs 也消除了文档验证流程中的跨会话处理瓶颈。 Dreaming:全局优化的异步整合 如果说 Memory 是 Agent 的「知识存储」,那么 Dreaming 就是 Agent 的「夜间整理」。 Dreaming 原语在后台异步运行,对碎片化的记忆进行整合与去重,消除多 Agent 团队的重复学习。它类似于人类睡眠中大脑对白天经验的整理与固化,帮助整个 Agent 组织在不中断任务的情况下持续优化共享知识库。 为什么这很重要 这两项原语的意义不只在于技术层面。它们标志着 Agent 基础设施从「单次任务工具」向「持续学习系统」的关键跃升。当 Rakuten 的数字从 97% 这个量级给出时,它提示了一件事:Agent 的真正价值边界,可能不在于单次任务的表现,而在于是否能从每次执行中积累并共享经验。 与今日其他内容的关联 Memory 与 Dreaming 这两项原语,和今天精讲二中 Qwen3.7-Max 的「长程策略连贯性」指向了同一个问题的两个层面:一个是在基础设施层解决 Agent 的跨会话记忆问题,另一个是在模型层解决长程执行中的策略稳定性问题。这两个方向的进展,共同构成了「AI Agent 从工具到协作者」这一演化的基础条件。 从今天精讲三 Dan Shipper 的视角来看,Memory 与 Dreaming 的意义还不止于此:当 Agent 具备了持久化学习能力,它们在特定领域的执行质量会随时间不断提升,这进一步强化了「人类评委」在整个系统中的战略价值——因为需要有人来判断 Agent 积累的「经验」是否正确、是否值得保留。 如果你正在构建企业级 Agent 或多 Agent 协作系统,这篇内容值得深读。 ## 精讲二:Qwen3.7-Max 重新定义 AI Agent 基座 来源: 通义大模型 阅读链接: 在 BestBlogs 阅 问题的起点:Demo 很惊艳,一上生产就崩溃 很多开发者对 AI Agent 的真实体验是:任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始「自我循环」。Qwen3.7-Max 试图正面回应这个痛点。 极限压力测试:35 小时、1158 次工具调用零中断 通义实验室为 Qwen3.7-Max 设计了一场极限压力测试:在训练期从未见过的硬件平台(平头哥真武 M890 PPUs)上,自主优化 SGLang 的 Extend Attention 生产级 Kernel。 没有硬件文档,没有性能分析数据,起点只有任务描述、官方 Triton 参考实现和一个评估脚本。 在约 35 小时的连续运行中,模型共产出 432 次 Kernel 评估,跨越 1158 次工具调用,完全自主地: - 编写、编译、性能分析并迭代推理算子 - 诊断编译报错、修复正确性 Bug - 通过运行时测量定位瓶颈,多次重构底层架构 最终,在多个工作负载上相对 Triton 参考实现几何平均加速 10.0x,而对比同期测试的其他模型最高仅 7.3x,且多数因连续 5 轮无行动而主动退出。 更关键的数据是:模型在 30 小时后仍在持续发现实质性改进点,证明了它的「长程策略连贯性」。 解耦训练架构:跨框架泛化的底层设计 Qwen3.7-Max 的训练架构采用了「任务 - 运行框架 - 验证器」正交解耦设计。在强化学习阶段,模型被强制在不同框架、不同验证器组合下处理同源任务,学到的是通用的解题策略与工具调用范式,而非「某个框架的快捷键」。 这意味着:无论使用 Claude Code、OpenClaw、Qwen Code,还是自研 Tool Use 框架,Qwen3.7-Max 都能即插即用,性能表现高度一致。在 QwenClawBench 与长链路 CoWorkBench 评测中,无论切换何种运行环境,性能均稳定领先上一代。 国内大模型竞争的焦点转移 这次发布的真正意义在于:它把国内大模型的竞争焦点,从「问答分数」拉向了「长程 Agent 稳定性」。在综合 Agent 评测中,Qwen3.7-Max 位列前三,性能逼近行业顶尖水平,在长程 Agentic 稳定性上超越了 Claude 3.7 Sonnet 与 GPT-4.1。 实际应用场景 Qwen3.7-Max 已经在三类真实场景中展示了能力: 编程 Agent — 从一条 prompt 生成包含 Three.js 3D 场景、Canvas 动画的交互式 Web 应用。 MCP 办公助手 — 通过 MCP 工具集成,读取高校学位论文格式规范,自动修复排版混乱的论文,包括页面布局、标题样式、字体字号、页边距、目录生成和参考文献格式,全程通过 office-cli 工具自主完成。 多智能体协作 — 支持主 Agent 规划调度、子 Agent 垂直执行的多智能体编排,同时基于 Tool Use 可直接操控具身设备完成物理环境中的理解、规划与决策。 如果你需要在生产环境中部署长程 Agent,Qwen3.7-Max 即将通过阿里云百炼提供服务,完整兼容 OpenAI 与 Anthropic API 协议。 ## 精讲三:自动化之后 来源: Every 阅读链接: 在 BestBlogs 阅读 悖论的起点:自动化越多,人类工作越多 Every CEO Dan Shipper 在这篇文章里记录了一个令他本人也感到困惑的现象:公司已经把所有能自动化的工作都交给了 AI——用 Codex 和 Claude Code 写代码、设计、客服——但他们没有裁员,反而还在扩张。团队接近 30 人,人类工作似乎比以前更多了。 这和主流叙事截然相反。Dario Amodei 警告过 AI 可能消灭一半入门级白领工作,Meta 裁员 8000 人,GDPVal 评测显示前沿模型在真实经济任务上已经达到 85% 的人类水平。但 Shipper 的实地经验是:「越自动化,需要做的人类工作越多。」 核心机制:AI 商品化了人类专业知识的「遗留物」 Shipper 的解释是:AI 商品化的是人类专业知识中「能被显式表达并训练的部分」。一旦某个技能被大量自动化,这类技能的「默认产出」价值就崩塌了,但「与众不同」的需求反而上升了。 而「与众不同」的需求,本质上是对人类专家的需求——即使我们已经接近 AGI。 举个具体例子:Codex 可以写代码,但能评判「这段代码写得对不对」的工程师变得更值钱,因为 AI 产出了大量同质化的代码需要被审查。AI 批量制造内容,「评估哪篇更好」就成了新稀缺。 人类三明治:设定框架、AI 执行、人类评判 Kieran(Every 的作者)把这种新工作模式称为「人类三明治」:人类设定任务框架 → AI 执行任务 → 人类评判并延伸结果。在 Every 内部,AI 已经回复了 Shipper 95% 的工作邮件,但他仍然在审阅每一封。管理者开始写代码,工程师开始直接接触客户。 没有临界点,只有新常态 Shipper 的结论是反直觉但有据可查的:不会有一个「临界点」让所有工作都消失。真正的新常态是:自动化越多,对专家判断力的需求越高。自动化的终点不是消灭工作,而是把人类角色推向「评委与压舱石」这个最后被商品化的层级。 这和今天的其他内容有什么关联 Qwen3.7-Max 的极限测试,恰好印证了 Shipper 的逻辑:1158 次工具调用之后,仍然需要工程师来评判最终的 10x 加速是否真的「正确」——模型没有硬件文档、没有先验知识,但评估脚本由人类设计,验证标准由人类设定。AI 做了 35 小时的执行工作,而「定义什么是成功」的工作依然是人类的。 Memory 与 Dreaming 的案例同样如此:Rakuten 的 97% 错误率下降,需要人类来确认「错误」的定义、设计评估标准、判断哪些经验值得被 Dreaming 保留。专家判断力不是 AI 自动化的副产品,而是前提条件。 如果你在思考「AI 会不会取代我」,这篇文章提供了一个不同的分析框架,值得仔细阅读。 ## 速览 为智能体配备计算机 — Ivan Burazin,Daytona(来源:Latent Space) Daytona CEO Ivan Burazin 的核心论点是:AI 智能体需要的不仅仅是可丢弃的代码执行沙箱,而是可组合、有状态的「计算机」。他将公司从人类开发环境转型为 Agent 基础设施提供商的历程,以及「localhost 的终结」这一长期判断,对理解 Agent 基础设施赛道的产品逻辑很有帮助。Daytona 不是在构建另一个 sandbox,而是在重新定义 Agent 与计算环境之间的关系。开发者和基础设施产品经理适合阅读。 Railway:面向智能体的原生云平台 — Jake Cooper(来源:Latent Space) Railway 创始人 Jake Cooper 分享了从「零激活能量上线」的产品哲学,到构建裸金属数据中心、实现 70% 利润率的商业路径,再到为 AI Agent 时代重新设计基础设施的全过程。值得关注的是,Railway 在 2026 年 5 月经历了一次 GCP 大规模故障(即使采用了多 AZ、多 zone 架构),其事后复盘对理解 Agent 基础设施的高可用挑战很有参考价值。适合关注云基础设施和 Agent 平台建设的读者。 腾讯混元全新翻译模型 Hy-MT2 开源,小程序「腾讯 Hy 翻译」开放体验(来源:腾讯混元) Hy-MT2 支持 33 种语言互译,7B 和 30B-A3B 模型达到开源最佳效果,超越几十倍参数量的模型。最有意思的是 1.8B 轻量版:得益于 AngelSlim 1.25-bit 极端量化,仅需 440MB 存储空间,可在手机芯片上本地推理,比 Hy-MT1.5 推理速度提升 1.5 倍,同时翻译质量超越微软等主流商业 API。已上线「腾讯 Hy 翻译」小程序,iOS 和安卓 APP 即将发布。 选择正确模型:LLM Evals 与优化的数据驱动指南(来源:Claude) Anthropic 的 Lucas 分享了一套生产级 LLM 选型框架:核心包括自定义 eval 而非依赖公开 benchmark、过程级评分(不只看最终结果)、prompt caching、context hygiene,以及按「成功结果成本」而非「单次调用成本」来优化选型决策。对在生产环境做模型选型的工程师有直接参考价值。 Google 推出 Android CLI,让 Android 工具链对 AI 智能体更友好(来源:InfoQ) Google 重新设计了 Android CLI,引入了结构化 Skills(SKILL.md 格式的模块化指令集)和集成知识库,使 AI 智能体能够更高效地访问 Android 工具链。声称与 Android Studio 内的 Agent 相比,构建速度提升 3 倍,Token 使用量减少 70%。兼容 Claude Code、Codex 等第三方 Agent。这个设计思路与 BestBlogs 自身的 skill 体系颇为相似,值得关注。 下一代大模型推理网络架构:ZCube 如何有效破解网络瓶颈?(来源:智谱) 智谱、驭驯网络与清华大学联合提出的 ZCube 组网架构,在 GLM-5.1 coding 生产环境中实现了成本降低 33%、吞吐提升 15%、TTFT P99 降低 40.6%。核心思路是用全网扁平化拓扑 + 单/多轨混合接入,替代传统 ROFT 架构,从结构层面解决 PD 分离推理中的不对称流量拥塞问题。GPU、软件栈和应用均未改动,纯粹靠架构调优实现跨越。运行大规模推理集群的工程团队值得参考。 苏姿丰上海开讲:AI 正在重新定义计算的每一层(来源:量子位) AMD CEO 苏姿丰在 AMD AI 开发者大会上海站的核心判断:AI 竞争正从模型能力转向系统工程与全栈优化,Agent 时代的成本结构是指数级而非线性的,开发者需要的是「可落地、可优化、可持续演进的工程体系」。AMD 以开放生态和 ROCm 平台应对这一趋势。量子位现场报道,信息密度较高。 ## 补充阅读 OpenAI 模型推翻 80 年数学猜想,AI 首次实现科学发现(来源:Wes Roth) OpenAI 内部推理模型自主推翻了 Paul Erdős 于 1946 年提出的平面单位距离猜想,通过桥接代数数论与初等几何构造出完整的反例族。这是 AI 驱动原创科学发现的一个里程碑时刻。关注 AI 在数学研究领域能力边界的读者值得一看。 OpenAI 单位距离问题突破:完整技术报告(来源:OpenAI Blog) 上一条 Twitter 所对应的 OpenAI 官方完整技术报告。模型构造的点集配置在多项式级别上超越了此前最优的方格构造,顶级数学家 Noga Alon 参与了同行评审。想了解技术细节的读者可以直接读原报告。 QQ 音乐 Harness Engineering 实践(来源:腾讯云开发者) 把 AI 协作从不可控的对话式编码升级为可控、可审计、可复用工程化过程的实践分享。在大仓多服务场景下,如何让 AI 具备自主验证能力是核心挑战。配合下面两篇「Harness Engineering」相关内容一起读效果更好。 构建最强 Agentic Analytics Harness:由 Claude 驱动,用 Claude Code 打造(来源:Claude) Omni CTO 讲解如何构建 Blobby 智能分析系统,涵盖语义层设计、evals 框架、split-brain agent 与直接 SQL 生成等架构经验。关注 AI 数据分析 Agent 工程化落地的读者适合观看。 A²I² 的讽刺性悖论(来源:InfoQ) 探讨自动化和 AI 在事件响应中的结构性困境:AI 提供了自主性和权威性,但缺乏定向注意力、可重定向性和可互预测性——而这些恰恰是人类协调最关键的特质。在高压情境下,这种缺失可能导致严重失败。对 SRE 和运维工程师有现实意义。 提示工程还不够——我构建了一个可在生产环境中运行的控制层(来源:Towards Data Science) 作者在第三次调试同一个崩溃后意识到:问题不在模型,在系统。他构建了一个包含 InputGuard、TokenBudget、PromptBuilder、ResponseValidator、CircuitBreaker、RetryEngine、FallbackRouter、AuditLogger 八个组件的控制层,将结构化输出基准测试通过率从 0% 提升到 100%。69 个测试、5 个可运行 demo,有完整代码。 都是 AI Coding,为什么 Java 体验差了一个量级?五条方法论帮你构建自己的 Harness 环境(来源:阿里云开发者) 深入分析了 Java 微服务项目在 AI Coding 中体验差的根本原因(本地跑不起来,AI 无法自主验证),并提出了通过 Harness Engineering 构建本地可运行环境的五条方法论。有 Checklist 和具体工程方案,对 Java 后端开发者非常实用。 发布 ADK for Kotlin 和 ADK for Android 0.1.0(来源:Google Developers Blog) Google 发布 Agent Development Kit for Kotlin 和 ADK for Android,使开发者可以构建混合 AI Agent,在云端模型(如 Gemini)和设备端 LLM(如 Gemini Nano)之间协调任务。Android 开发者和移动端 AI 应用方向值得关注。 合成人格预训练:从零标记开始的对齐(来源:LessWrong) 通过在预训练文档中附加带有价值判断的道德反思,从训练伊始就植入所需的 AI 助手人格,实现了攻击成功率降低 63%。这是一项 AI 安全领域的早期研究,证明预训练阶段植入的价值观能够在后训练阶段泛化到未见过的安全场景。关注 AI 对齐研究的读者适合阅读。 编码智能体的可维护性传感器(来源:Martin Fowler) Martin Fowler 通过实验多种传感器——从静态分析到 AI 驱动的模块化审查——帮助编码 Agent 自我修正并维护代码库的可维护性。当 Agent 生成代码的速度越来越快时,如何确保长期可维护性是一个值得认真对待的工程问题。 来自 Codex 官方团队的分享:如何把 Codex 用到极致(来源:宝玉的分享) 系统介绍如何利用 Codex 的持久对话流、语音输入、任务干预、自动化、目标设定和侧边栏等高级功能,将其从编程助手升级为全能工作流引擎。Jason 原文的中文翻译版,内容实用。 Ramp 工程师如何借助 Codex 加速代码审查(来源:OpenAI Blog) Ramp 使用 GPT-5.5 驱动的 Codex 将 PR 代码审查时间从数小时缩短至数分钟,核心价值在于「能捕捉人类和其他 AI 工具都遗漏的问题」。配合上一条 Codex 使用指南一起看效果更佳。 当 Agent 真正走进复杂数据分析场景:DataClawBench(来源:AI 前线) 基于 492 个真实金融智库任务的数据分析评测基准,通过保留未清洗数据和隐藏数据源先验,对前沿大模型进行过程级评估。结论是:当前 Agent 在开放式真实数据分析场景中的能力边界,远比 demo 演示的要窄。 LLM 主题并非观察结果(来源:Towards Data Science) LLM 从文本中提取的主题是「生成的变量」而非直接观察结果。在因果分析中,若未解决选择偏差、测量误差等问题而直接用作协变量,会引入严重偏差。对做数据分析和因果推断的研究者有直接警示意义。 在 VS Code 中烹饪 Agents(来源:AI Engineer) Microsoft 的 Liam Hampton 讲解 VS Code 如何成为 local、background 和 cloud agents 的统一控制平面,把 multi-agent workflow、安全边界、MCP 上下文和开发者监督结合起来。VS Code 用户和 Agent 开发者适合观看。 会自动交易的交易信号:在系统化投资中规模化受治理的 AI(来源:Claude) Man Group 数据与 AI 负责人讲解一家管理超过 2000 亿美元资产的受监管投资机构,如何在系统化交易中构建可治理的 AI——包括生产级 AI 交易信号、skills 治理框架,以及「组织上下文作为 AI 护城河」的战略视角。高度监管行业的 AI 落地案例,视角独特。 ## 今日阅读路径 今天内容量偏大,如果你时间有限,建议按照以下路径选读: 第一优先:如果你只有 20 分钟 先读「精讲三:自动化之后」。Dan Shipper 的文章是今天最具思想冲击力的一篇,它提供了一个反直觉但有大量实地数据支撑的分析框架——关于 AI 与人类工作的关系,这是比大多数预测文章都更诚实的一个视角。 第二优先:如果你是 Agent 工程师 读「精讲一:Memory 与 Dreaming」,然后搭配速览中的 Daytona 和 ZCube 两篇。这三篇合在一起,覆盖了 Agent 的记忆层(Anthropic 原语)、计算环境层(Daytona)和网络基础设施层(ZCube),是一条完整的 Agent 基础设施视角。 第三优先:如果你关注国产大模型竞争 读「精讲二:Qwen3.7-Max」。35 小时 1158 次工具调用零中断这个数字,已经足够说明问题的性质——这不是 benchmark 刷分,而是真实硬件上的生产级验证,代表着国内大模型竞争正式进入了一个新的阶段。 补充:如果你是开发者,在用 AI Coding 工具 补充阅读中的 Java Harness Engineering、Codex 官方使用指南、QQ 音乐 Harness 实践这三篇可以组合成一个「AI Coding 工程化」专题,非常实用,适合在上下班通勤时集中阅读。

译本期早报聚焦AI Agent的成熟化。Anthropic首次发布Memory与Dreaming基础设施原语,将跨会话记忆工程化,Rakuten部署后首次执行错误率下降97%。通义实验室的Qwen3.7-Max通过35小时极限压力测试,在未知硬件平台上自主优化Kernel,实现1158次工具调用零中断,凸显长程稳定性,将国内大模型竞争焦点从问答分数转向Agent可靠性。与此同时,Every创始人观察到,随着AI自动化普及,能评判执行质量的人类专家价值反而凸显。这些进展共同指向Agent成熟的基础设施、模型基座与人类协作新范式。

SemiAnalysis@SemiAnalysis_ · 5月22日62

AI is not the first technology to drop prices by multiple orders of magnitude. When screws were handmade, output was counted in hundreds or thousands. Today output is in the trillions. The revolution is not from making the few screws we used to use cheaper, but from building a modern world that was unimaginable when screws cost 1500x more.

译AI并非首个价格下降多个数量级的技术。当螺丝还是手工制作时,产量以百或千计。如今产量已达万亿。 这场革命并非来自让过去使用的少量螺丝变得更便宜,而是来自构建一个在螺丝价格高出1500倍时无法想象的现代世界。

X.PIN@thexpin · 5月22日58

China now accounts for 43.7% of top AI researchers globally. The US is at 31.9%. Tsinghua alone (6.2%) produces more top AI talent than Stanford, MIT, and Carnegie Mellon combined. Most of the policy debate around AI competitiveness focuses on chips and compute. This chart suggests the more structural question might be about people: where they're trained, and where they end up working.

译中国目前占全球顶尖AI研究人员的43.7%。美国为31.9%。仅清华大学(6.2%)培养的顶尖AI人才就超过了斯坦福、麻省理工和卡内基梅隆大学的总和。大多数关于AI竞争力的政策辩论都集中在芯片和算力上。这张图表表明,更结构性的问题可能在于人才:他们在哪里接受培训,以及最终在哪里工作。

François Chollet@fchollet · 5月22日36

We are moving toward a world where the concept of an "app" or a "user interface" disappears. Apps become services and UIs become text boxes.

译我们正走向一个“应用”或“用户界面”概念消失的世界。应用将变为服务,界面将变为文本框。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月22日73

Not only are AIs suddenly solving the hardest math problems in history, they're winning fiction writing awards "AIs can't write" is obvious cope, sorry. The biggest tell of AI writing (besides a few overused ticks) is that it's TOO well-written, too articulate

译AI不仅能解决史上最难数学题,还在小说写作比赛中获奖 “AI不会写作”显然是自欺欺人,抱歉。 AI写作最大的破绽(除了几个过度使用的习惯用语)是它写得**太好**,表达**太清晰**。

Rohan Paul@rohanpaul_ai · 5月22日63

"Not all tokens are created equal, and there is a way to look at token value. There are two key factors that impact token value. One is the intelligence embedded in the token, and the other is how fast does it arrive." Tokenomics begins with the customer’s tolerance for uncertainty, latency, and cost, not with the model menu. A slow token can be expensive even when compute is cheap, because delay changes the product experience before the invoice arrives. A fast token can also be wasteful if it carries shallow reasoning, redundant context, or output nobody uses. A medical triage assistant, a coding agent, and a shopping chatbot do not need the same kind token, even when they all speak fluent English. --- Shruti Koparkar from our Accelerated Computing of Nvidia

译该推文探讨了评估AI Token价值的新视角,核心在于Token的“智能含量”与“传输速度”。快速的Token若缺乏深度推理可能造成浪费,而缓慢的Token即使算力廉价也会因延迟影响用户体验。不同应用场景如医疗分诊、代码编写和购物客服对Token需求各异。因此,构建有效的“Token经济学”不应从模型菜单出发,而应从客户对不确定性、延迟和成本的容忍度开始,以具体用例为起点进行反向优化。NVIDIA的Shruti Koparkar强调,这关系到AI应用是规模化扩展还是停滞不前。

Ethan Mollick@emollick · 5月22日69

I don't think anyone has a good intuitive sense about what this means, and that failure of imagination is a generally bad thing for planning, investment, and policy. I also don't have an easy solution (funnily enough, AIs are cliche at imagining the AI future, so no help there)

译我认为没有人能直观地理解这意味着什么,而这种想象力的缺失对规划、投资和政策制定通常都是不利的。 我也没有简单的解决方案(有趣的是,AI在想象AI未来方面已经老套了,所以也帮不上忙)

Epoch AI@EpochAIResearch · 5月22日65

OpenAI kicked off the AI compute buildout in 2023. But today it uses ~10% of the world's compute, and the top labs together are probably under half. In this week's newsletter, @justjoshinyou13 discusses how much that share may change, and when it could hit a ceiling. 🧵

译OpenAI在2023年开启了AI算力建设浪潮。但如今它仅占全球算力的约10%,顶尖实验室的总和可能也不到一半。 在本周的通讯中,@justjoshinyou13 探讨了这一份额可能如何变化,以及何时会触及天花板。 🧵

AYi@AYi_AInotes · 5月22日20

AI裁员时代,打工人最后的核武器诞生了🤖 这个推文之所以这么爆,我理解是因为它说出了所有打工人不敢说的话。 它的真正威力从来不是按下的那一刻,而在于它存在的那一刻, 在于你的老板知道你桌子底下有这么一个按钮的那一刻。 从此所有的裁员谈话,最起码都会多一分尊重。

Rohan Paul@rohanpaul_ai · 5月21日72

Standard Chartered just made AI job replacement an official banking strategy. Will replace "lower-value human capital" with AI, with 7,500+ jobs at risk as it cuts more than 15% of back-office roles by 2030. The target is not the bank teller or the client banker first, but the large internal machine that checks documents, routes approvals, handles compliance files, reconciles records, and keeps banking systems moving. Banks are especially exposed because much of their back office is structured language work, where LLMs can read forms, compare policies, flag missing data, summarize cases, and pass clean tasks to humans. --- news. sky. com/story/standard-chartered-to-replace-lower-value-human-capital-with-ai-13545809?dcmp=snt-sf-twitter

译渣打银行正式将AI工作替代列为官方战略,计划到2030年通过AI自动化超过15%的后台支持岗位,影响逾7500个职位。该银行的目标并非直接替代柜员或客户经理,而是首先针对内部处理文档、审批流程、合规档案及系统运营的庞大支持机器。银行业因其后台工作多为结构化语言任务而尤为脆弱,大语言模型能够高效处理表单阅读、政策比对、数据校验及案例总结等工作,从而接管大量此类规则化流程,实现运营自动化。

凡人小北@frxiaobei · 5月21日47

已经彻底放弃 claude cowork 转向 claude code 了。 原因:沙盒内权限控制太死了,稍微做点复杂的,就拿不到系统权限。 还是 claude code 和 codex,给了权限跟一匹脱缰野马一样。

译用户宣布从Claude cowork全面转向Claude Code,核心原因是Claude cowork的沙盒权限控制过于严格,难以支持复杂任务。相比之下,Claude Code与Codex提供了更开放的权限,允许更自由的系统级操作,被形容为“脱缰野马”般灵活。

Rohan Paul@rohanpaul_ai · 5月21日66

"I think we'll be hiring more AI people and quite less bankers in certain categories, and they'll make them more productive." Jamie Dimon, CEO of JPMorgan "So when you get up in the morning and you want to interview someone, it'll lay out what I've said in 14 different places, it'll give you questions. Your job will be the same. You'll just be much smarter in how you execute that job" --- From "Bloomberg Podcasts" YT channel

译"我认为我们将在某些类别中雇佣更多AI人才,而减少银行家数量,并让他们更高效。" ——摩根大通CEO杰米·戴蒙 "所以当你早上起床想面试某人时,它会整理出我在14个不同场合说过的话,并提供问题。你的工作职责不变,只是执行工作时会变得更聪明。" ——来自"Bloomberg Podcasts" YouTube频道

Rohan Paul@rohanpaul_ai · 5月21日60

Every bank you talk to, AI is right at the top of their agenda. Blackstone President and COO Jon Gray made it very clear. Any rule-based businesses, like accounting, legal, finance, will be completely disrupted by AI.

译你与每家银行交谈,AI都位居其议程首位。 黑石集团总裁兼首席运营官乔恩·格雷明确指出。 任何基于规则的业务,如会计、法律、金融,都将被AI彻底颠覆。

Berryxia.AI@berryxia · 5月21日27

刚刚去书店呆了一会,喝了杯咖啡。 Vibe Coding了 一会,发了一会呆。 找了点灵感~ 转头看到这里面很多的大学生或者附近上班or OPC的人,80%的人使用的苹果电脑或者iPad ! 对一半的人在使用AI工具进行学习或者工作,有几个零零散散的人在使用chatgpt。 而且就是纯chat模式~ 没有看到有人使用大家每天日常使用的Claude or Codex! 所以AI的发展还很早期…

译作者在书店观察到,苹果设备(Mac/iPad)是用户主流选择。约半数用户在使用AI工具,但绝大多数仅使用ChatGPT基础对话功能。现场未见到人们日常提及的Claude或Codex等工具。这一现象说明,尽管AI已进入大众视野,其应用仍主要停留在初级阶段,专业级工具的普及和深度使用远未到来。

ginobefun@hongming731 · 5月21日27

创作的门槛在降低,吸引注意力的难度在飙升

Berryxia.AI@berryxia · 5月21日49

学生的反感完全能理解。 现在就业形势本来就不好,而站在台上劝他们拥抱AI、说机会无限的,恰恰是推动这场变革、也在用AI砍岗位的那批人。 Gallup上月调查显示,美国人对AI的兴奋和期待正在降温,愤怒在上升。 出社会即牛马,真的是太难了。

译近期美国多所大学毕业典礼上,演讲嘉宾提及AI技术时遭遇学生强烈嘘声,引发关注。前Google CEO Eric Schmidt等高管将AI比作“火箭船票”并鼓励学生拥抱变革,但台下反应冷淡甚至反感。这一现象反映出,在当前就业压力下,年轻群体对科技行业领袖宣扬AI机遇的同时也在利用其削减岗位的矛盾立场感到不满。Gallup最新调查也显示,美国公众对AI的情绪正从期待转向愤怒。

Orange AI@oran_ge · 5月21日28

为什么大家一说到 ai 就要聊到赚钱呢? ai 是未来的水电煤 你在用电的时候会考虑这次用电能不能帮你赚钱吗?

Orange AI@oran_ge · 5月21日60

看晚点对豆包的报道,还是挺感慨的 豆包赢下了 AI chatbot 的胜利 只是这场胜利的价值几何,没有人能衡量 一些有趣的点: 朱骏在 2024 年 5 月的演讲中特意提到,豆包已经拥有 800 万个智能体。这次尝试没过多久便失败了。一段时间过后,团队发现除了 “豆包” 这个主智能体以外,其它智能体的用户活跃度都不高。 他们做了一次实验,将豆包以外的智能体全部下架,结果用户活跃、留存没有受到任何影响。 2024 年上半年,豆包的 “多 bot” 尝试受挫后,团队一度陷入迷茫,开始寻找新的突破口。他们曾考虑根据用户在豆包对话中表达的兴趣进行主动的内容推荐,推荐内容包括抖音短视频,类似后来 ChatGPT 做的 Pulse,但最终决定不上线。 一位知情人士说,当时豆包对用户留存不满,所以想借抖音这款公司留存最好的产品来提高数据,“有些病急乱投医”。 抖音的单用户日均使用时长曾经从 30 分钟涨到 120 分钟,而豆包仍稳定在 10 分钟以内,尚不足以对传统的互联网产品造成威胁。

译豆包在AI聊天机器人市场赢得了用户规模上的胜利,但这场胜利的实际价值与可持续性存疑。其早期尝试的百万智能体生态活跃度极低,移除后对核心数据毫无影响,显示用户需求仍高度集中于主智能体。在“多bot”策略受挫后,团队曾迷茫地考虑借助抖音内容来提升豆包用户留存,但并未执行。目前,豆包的用户日均使用时长仍远低于抖音,尚未对传统互联网产品形成实质威胁。

凡人小北@frxiaobei · 5月21日66

医生侧的 AI 一直在解决这样一个问题, 怎么让医生问诊时不用自己去 EHR 里扒过敏史、用药记录、过往手术…… 特别是 OpenEvidence,这一步更是割裂。 OpenEvidence + Cedars-Sinai 今天发布的 patient-aware 临床 AI,解决的就是这个。 但是 context 的源头还没解决,患者自己历史说了什么、记了什么、上次问了哪些问题还是全靠口述。 看到 Kin Health 的一个创业项目,在做的就是这层,帮患者录诊、整理摘要、生成下次要问的问题。 所有的数据跟着患者走,不锁定在任何一个医院系统里。 两个拼在一起,整条链才算通。 https://techcrunch.com/2026/05/18/kin-health-raises-9m-to-build-an-ai-notetaker-for-patients/

译OpenEvidence与Cedars-Sinai合作推出患者感知型临床AI,使医生能在Epic系统中直接调取完整病历(如过敏史、用药记录),并生成个性化诊疗建议,解决医生手动整理病史的痛点。但患者侧的病史信息仍依赖口述,形成信息缺口。Kin Health通过AI工具帮助患者录制问诊、整理摘要并生成待问问题,数据由患者自主携带,不绑定医院系统。二者结合,形成从医生到患者的全链路医疗AI支持,真正实现诊疗信息的双向流通与协同。

凡人小北@frxiaobei · 5月21日55

- 在我们的领域专长上深入 - 在相邻技能和领域上扩展 - 在此基础上学会很好地使用 AI

Orange AI@oran_ge · 5月21日50

直到今天,还是有很多人把做产品和赚钱划等号 有产品=能赚钱 为什么会有这么天真的想法呢? 做过独立开发者的都知道,最难的根本不是开发,是卖出去 要卖出去就得学自媒体营销,甚至到后面终于发现: 能自己赚钱的人怎么都能赚钱,并不依赖做产品这一件事 对,赚钱和做产品根本上是两件事,产品只是赚钱的一个交付物的选项 做产品是工程问题,能赚钱是商业问题 工程问题已经基本快被 AI 彻底解决了 商业问题,对不起,AI 还没到入门阶段 所以下次看到别人vibe做出一个产品的时候不要再问对方收入了 问就代表你还没有从这个【有产品=能赚钱】思想钢印里走出来

译推文核心观点指出,将“做产品”与“赚钱”直接等同是一种常见误区。对于开发者而言,真正的难点并非开发产品本身,而是如何将其成功销售出去。这本质上是商业问题,而非工程问题。当前,AI技术已能基本解决工程层面的挑战,但商业变现能力尚未被AI攻克。因此,产品只是实现商业价值的交付方式之一,能否赚钱更多取决于独立的商业运作能力,而非单纯依赖产品。

meng shao@shao__meng · 5月21日68

Forward Deployed Engineering (FDE) 是什么?为什么 OpenAI、Anthropic 等 AI 顶流都在力推 FDE,它会是下一个值得转型的职业吗? 为什么 AI 公司疯抢 FDE? @vasuman 这个判断很直接:如果智能本身正在被商品化,那么唯一的竞争优势就是"如何用、用在哪"。 模型能力会被 Anthropic、OpenAI 等拉平,套壳产品也会被复制。真正难复制的是——把 AI 嵌入到某家具体公司的具体业务流里。这件事没法用通用产品解决,只能派人去干。 所以 Applied AI 公司的商业模式是:把 FDE 派驻到客户现场,做"AI 转型外包",客户为效率提升付费。一个能独立完成"理解客户问题 → 写进陌生代码库 → 向非技术高管讲清商业价值"的人,vas 称之为 "million-dollar hire"。 角色的核心要求:必须 On-site! 这一点借用了 Palantir 的传统(FDE 的定义来源): · 2010 年 Palantir 的 FDE 跟着美军特种部队驻阿富汗,白天部队执行任务、晚上 FDE 改代码。 · Palantir CTO 的原话:"你无法为一个你不在其中的环境构建产品。" 迁移到 AI 场景的含义是:真正的效率提升需要"围绕 AI 重建公司",这不可能远程完成,必须坐在客户身边,基于公司专有数据和上下文构建定制 Agent。 FDE 的工作三阶段 1. Audit(审计 / 诊断):以原型 Demo 收尾 驻场轮岗各部门(例如 RevOps 两周、采购一周、财务一个月),目标是: · 摸清每个团队的工作流 · 找到瓶颈 · 判断哪些该自动化、哪些不该 三条"是否上 Agent"的判断原则,非常实用: · 规则可抽象,但输入形态多样(邮件 / PDF / 扫描件),且需要调工具?上 Agent! · 规则和输入都可预测?写普通代码,更快更便宜! · 需要模式识别 + 领域专家判断?保留人工! 另外两条经验法则: · 量要够大:一个月跑 5 次的流程,ROI 撑不起来。 · 别滥用 AI:大多数任务用"一串工具调用 + 一次 LLM 编排"就够了,过度用 AI 会带来 token 成本和质量下降。 2. Evals(评估) 客户砸百万美金做 AI 部署,必须有办法证明"它真的在工作"。好的 eval 不是只看最终答案对不对,而是验证 AI 是否像人一样思考。两个方法: · 拆解人的步骤逐步打分:人解决问题是多步的,把 checkpoint 列出来,看 AI 是否每一步都过关。 · 从黄金样本反向锚定:和资深员工一起把"完美答案"写出来 20 个,作为标尺度量所有产出。 Evals 的真正用途是让怀疑 AI 的高管敢签字——它是商业信任工具,不只是工程工具。 3. Deployment(部署) 几条非常反直觉但很务实的原则: · 不要做大规模数据迁移。在现有数据层(SharePoint、数据库)之上建 API,让模型作为 orchestrator 去查询。客户花了几年几百万上 ERP,不会让你再拆一次。 · 先搭沙箱执行环境,在客户基础设施里安全测试。 · 从最小自治单元起步,再逐步给权限。例:先让 Agent 只做"发现 bug → 调查 → 写工单",跑稳了再允许它"写代码 + 提 PR"。 如何在 30 天内成为 FDE?! vas 认为三类背景最容易切入:咨询顾问、PM、软件工程师。 咨询/PM 的短板:工程能力 解法是用作品集补齐。从下面四个项目里挑两个深做: · 一个能跑通你前公司某个完整流程的生产级 Agent(调 API、记录思考、有失败兜底)。 · 一个面向特定行业数据集(法律 / 医疗 / 财报)的 RAG pipeline。 · 一个自己写的 eval 框架,多维打分(正确性、格式、成本、延迟)。 · 一个把 LLM 接入到不支持 AI 的遗留系统的 MCP。 vas 强调:"Do not outsource your understanding to AI"——别让 AI 替你理解,否则面试一聊就穿。 SWE 的短板:沟通 工程师做同样的项目,但必须能把每个组件、技术选型、迭代过程、商业结果讲清楚,并能回答"你为什么解这个痛点、真实客户场景里会怎么走"。 30 天路线图(角色无关) Week 1:Agent loop 基础(读 Anthropic Building Effective Agents)、tool use、guardrails、context vs 外部记忆、audit trail Week 2:结构化输出(JSON)、Demo → Prod 常见坑、checkpoint 机制 Week 3:重试与指数退避、成本优化(小模型做小事 / 缓存 / token 上限)、构建 golden dataset、多 Agent 并行架构 Week 4:复盘 + 大声讲出来,把每件事绑到商业指标上

译Forward Deployed Engineering (FDE) 是AI公司派驻客户现场的工程师角色,核心是将AI能力嵌入企业具体业务流。随着模型能力趋同,真正优势在于“如何用”,而FDE正是解决AI落地“最后一公里”的关键。该角色借鉴Palantir传统,强调必须现场工作,围绕企业专有数据重建流程。其工作涵盖业务审计、效果评估(Evals)与务实部署三阶段。咨询、PM及软件工程师可通过30天路线图与作品集转型,但需弥补各自短板——工程能力或商业沟通能力。FDE被视作“百万美金级人才”,是AI时代高价值的职业新方向。

SemiAnalysis@SemiAnalysis_ · 5月21日58

The full chat with Mishek Musa on how ADI is shrinking inference down to the edge and setting up physical leaderboards for the robotics community. Chapters: 0:00 — Introduction & ADI's Emerging Tech Hub 0:56 — Inside the Multimodal Tactile Sensor 1:52 — Automating Data Center Maintenance 2:28 — Open-Source Robotics Benchmarks 3:24 — High-Fidelity Simulation Assets 4:00 — The System-Level Product Strategy 4:37 — Data Collection & Minimizing the Sim-to-Real Gap 5:53 — Co-Innovation Hub Collaborations 6:30 — Distilling Large Models for Edge Inference 7:47 — Custom Co-Designed Silicon vs. Generic GPUs 8:59 — Wrap-Up & Concluding Thoughts

译ADI正在展示其将大型AI模型能力从云端下沉到边缘设备的技术路径,核心是通过模型蒸馏、定制化协同设计芯片等手段实现高效推理。同时,ADI正为机器人社区构建开源的基准测试与物理排行榜,并致力于开发多模态触觉传感器、高保真仿真资产等,以最小化仿真与现实之间的差距。这体现了其从系统层面推动硬件协同创新与数据采集的生态化产品战略。

Ethan Mollick@emollick · 5月21日72

June 2024: The latest general-purpose LLMs could not count the r's in strawberry. July 2025: The latest general-purpose LLMs get gold in the International Math Olympiad. May 2026: The latest general-purpose LLM solve one of the "best-known questions in combinatorial geometry"

译2024年6月:最新的通用大模型无法数清“strawberry”里有几个r。 2025年7月:最新的通用大模型在国际数学奥林匹克竞赛中获得金牌。 2026年5月:最新的通用大模型解决了“组合几何学中最著名的问题之一”。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月21日51

Why most alignment work is bullshit, in one image

译为何大多数对齐工作都是徒劳,一张图说明 [引用 @AISafetyMemes]:大多数对齐计划: 第一步)创造沙神 第二步)... 😈 欺骗沙神 😈 ... 第三步)沙神永远忠诚 “当前的对齐工作,不过是在沙王巨怪脸上涂口红。” -@romanyam

宝玉@dotey · 5月21日62

上周末好几场美国大学毕业典礼上,只要演讲嘉宾一夸 AI,台下就开始嘘。 被嘘得最惨的是前 Google CEO Eric Schmidt。他在亚利桑那大学的演讲里把 AI 比作一张火箭船的船票,说毕业生可以“组建一支 AI agent 团队”去完成一个人做不到的事,结果嘘声越来越大,一度逼得他停下来。他改口安抚:"我知道你们在担心什么,这种恐惧是合理的。"但核心意思没变,AI 会塑造世界,你们要去引导它。台下不买账。 被轰的不止他一个。中佛罗里达大学,一位地产公司高管把 AI 称为“下一次工业革命”,当场被嘘;中田纳西州立大学,唱片公司 Big Machine Records 的 CEO Scott Borchetta 说 AI 正在改写整个行业,面对嘘声直接甩了句“接受现实吧,这就是个工具”。 学生的反感完全能理解,毕竟现在就业形势不算好,而站在台上劝他们拥抱 AI、说机会无限的,恰恰是推动这场变革、也在用 AI 砍岗位的那批人。Gallup 上月的调查显示,美国人对 AI 的兴奋和期待正在降温,愤怒在上升。 视频来源:https://www.nbcnews.com/video/multiple-commencement-speakers-booed-for-ai-comments-during-graduation-speeches-263486021518

译近日,美国多所大学毕业典礼上,嘉宾赞扬人工智能的言论引发学生集体嘘声。前谷歌CEO埃里克·施密特在演讲中将AI比作“火箭船票”,鼓励毕业生组建AI团队,却遭遇持续哄场,他承认恐惧合理但坚持AI将塑造世界。其他演讲者称AI为“工业革命”或“改写行业”也引发类似反应。学生不满源于就业压力,认为鼓吹AI变革的嘉宾正是推动自动化、可能导致岗位减少的群体。民调显示美国人对AI热情降温,愤怒情绪上升。

Chubby♨️@kimmonismus · 5月21日63

„We are only a few years away from AGI (…) we can start feeling it now. 2026,2027 is when it’s starting.“ Demis Hassabis has never been known for trying to generate hype. Hearing him say that we are on the path to AGI really excites me.

译“我们距离AGI只有几年之遥(……)现在就能开始感受到。2026、2027年就是它开始的时候。” Demis Hassabis从未以制造炒作闻名。听他说我们正走在通向AGI的道路上,真的让我很兴奋。

Rohan Paul@rohanpaul_ai · 5月21日64

Nvidia CEO Jensen Huang: "There's a belief that the world's GDP is limited at $100 tn. What's likely to happen is AI is going to cause that $100 tn to become $200 tn, $300 tn, $500 tn. There's no fundamental limit to the size of the GDP."

译英伟达CEO黄仁勋:"有人认为全球GDP上限是100万亿美元。但更可能发生的是,AI将使这100万亿变成200万亿、300万亿、500万亿。GDP的规模没有根本性的上限。"

AYi@AYi_AInotes · 5月21日68

AI时代最恐怖的事情不是AI取代你,而是你亲手教AI取代你,然后你自己被裁🤯 扎克伯格4月30号的内部音频泄露了, 他直白地告诉所有员工,公司正在收集你们的键盘鼠标屏幕数据,训练AI。 因为Meta员工的平均智力远高于外包,这些数据能让Llama的编码能力实现戏剧性超越。 然后20天之后,也就是今天凌晨4点,8000名员工收到了裁员邮件。 这哪是为了AI转型啊,分明就是企业食人主义, 好家伙,你教AI怎么干活, AI学会了, 然后你滚蛋。 你以为这就完了? 还有更狠的, 以前资本剥削你的时间, 现在资本剥削你的智慧, 以前你996是为了给自己挣工资, 现在你996是为了训练一个能完美取代你的AI, 而且你还不能划水, 你划水训练出来的AI不够强,你还是会被裁🤣 扎克伯格在效率上肯定是赢了, 他找到了AI时代最暴利的商业模式, 用自己的员工当免费的高质量训练数据, 用完就扔, 但他也输掉了所有信任。 以后再也不会有员工愿意全力以赴了, 因为所有人都知道, 你越优秀, 你被榨干的速度就越快。 你被裁掉的日子就越近。 #Meta #AI #裁员

译近日,Meta CEO扎克伯格的内部音频泄露,他承认公司秘密收集员工键盘、鼠标和屏幕数据,用于训练Llama等AI模型,因Meta员工智力高可提升模型能力。然而,数据收集约20天后,Meta裁员8000人,引发“企业食人主义”批评:员工在不知情下训练可能取代自己的AI,资本剥削从时间升级到智慧。这损害了员工信任,揭示了AI时代高效但冷酷的用人逻辑——员工越优秀,其价值被快速榨取并抛弃的风险越高。

SemiAnalysis@SemiAnalysis_ · 5月21日34

If you’ve joined the vibe-coding wave (we certainly have!), one bottleneck you might have noticed is that the “just rent a cheap CPU box” step is no longer as routine as it used to be. (1/3) 🧵

译如果你已加入氛围编程浪潮(我们当然也加入了!),你可能注意到一个瓶颈:曾经“租个便宜CPU盒子”的步骤,如今已不再像过去那样简单常规了。(1/3) 🧵

swyx🛬 SFO@swyx · 5月20日60

very belated but in retrospect i think @sama's mythical "build a business that gets better when models get better" is basically what I called Agent Labs here. seeing a very direct correlation with model performance and agent lab revenue, discontinuity in Q4 2025 (clip from @patrickc's stripe sessions)

译虽然迟了很久,但现在回想起来,我认为@sama那句富有传奇色彩的“构建一个随模型进步而变得更好的业务”,基本上就是我在这里所说的Agent Labs。 看到模型性能与Agent Labs收入之间存在非常直接的关联,在2025年第四季度出现断层。 (摘自@patrickc的Stripe Sessions)

meng shao@shao__meng · 5月20日36

Claude Design 发布一个月了,还有朋友记得它吗? 从 Google Trends 看,Claude Design 在进入 5 月后,迅速回落到发布前的数值。。

meng shao@shao__meng · 5月20日49

最近面试过程中,用 AI 辅助的候选人,明显多起来了 😄 不太清楚他们用的是什么 AI Agent,不过整体效果都不太好,主要体现是上下文不太对,说的答案都偏泛泛,没有针对性。 比如简历中提到在项目中负责记忆系统,我觉得这部分挺重要的,就想深入探讨一下做记忆系统时遇到的问题,结果候选人等了大概 3-5 秒(应该是 Agent Thinking...)后,开始从记忆系统的基本概念介绍给我复述了,当时好想打断他,告诉他前面这段不用念,跳过 😂 其实我倒也不排除你用 AI 辅助面试,如果问到一些基本概念、原理啥的,让 AI 来回答也没什么,反正随时都能查得到;但真的涉及到工程中遇到的问题,特别是坑,AI 是回答不上来的,因为你没有把工程中的实际问题输入给它,或者说,你没有经历过这些坑。 那我只能认为,如果你过来,这些坑会在我这挖。。

译面试中AI辅助效果不佳,回答泛泛缺乏针对性。深入项目经验时,AI只复述概念,不分享实际工程问题。面试官指出,AI能应对概念提问,但实战经验如工程“坑”无法替代,候选人需依赖真实能力。

Berryxia.AI@berryxia · 5月20日44

想做爆款就做“元内容”:别只发干货,要发“关于干货的干货”..... AI越带我越原始了,什么都要追求元XX😁

Rohan Paul@rohanpaul_ai · 5月20日69

FT: Google DeepMind founder Demis Hassabis was an early angel investor in Anthropic. While Google later put billions into the same company through cloud and AI deals. DeepMind diaspora is actually super strong: former researchers have built more than a dozen AI companies and raised at least $14B since 2021. DeepMind has really become less like one company and more like an AI school whose graduates now compete with, supply, and pressure Google at the same time. --- ft. com/content/8f2a529e-7a1b-4d8e-95be-338d0c4c98f5

译据英国《金融时报》报道,Google DeepMind创始人德米斯·哈萨比斯曾是Anthropic的早期天使投资者,而Google随后也通过云服务与AI合作向该公司投入了数十亿美元。更值得关注的是DeepMind显著的“人才外溢”效应:自2021年以来,其前研究人员已创立超过十家AI公司,累计融资至少140亿美元。这表明DeepMind正逐渐从一个研究机构演变为一所顶尖的AI人才“学校”,其“毕业生”同时在与Google竞争、为其提供技术,并对整个市场施加压力。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月22日
12:05
Greg Brockman@gdb
65
模型本身已不再是产品
OpenAI大佬观点现象/趋势
10:12
宝玉@dotey
77
Cloudflare裁员千人换AI,CEO撰文解释"腾笼换鸟"逻辑

Cloudflare裁员约1100人,同时招聘近似数量的实习生。CEO在《华尔街日报》撰文,引用德鲁克理论,指出AI主要替代从事审计、财务、中层管理等结构化工作的“度量者”,而工程师与销售人员影响较小。公司已将审计转向AI驱动,财务流程得以优化。大量实习岗位被视为面向“AI原生代”。财报显示公司当季亏损,且因裁员产生高额重组费用,消息公布后股价一度大跌超20%。

大佬观点现象/趋势行业动态
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)
10:12
karminski-牙医@karminski3
43
翻译软件和翻译API的核心优势曾在于速度快,但当前小模型在显卡上可达到200tps的运行速度,使其速度优势不再明显。同时,用户如@chenerTR指出,只要通用大语言模型(如GPT 5.5)速度满足需求,他们更愿意用其进行翻译,而非依赖专用翻译工具。这表明通用模型正逐步替代传统翻译软件,改变了翻译技术的使用格局。

chener: @karminski3 感觉很久不用翻译软件了,只要gpt5.5 速度还行我都愿意用通用模型来做翻译

现象/趋势
08:42
meng shao@shao__meng
70
AI 补贴时代终结了吗?

AI服务定价正从包月制转向按用量计费,微软、Uber等企业因成本压力缩减AI预算。行业面临两难:维持价格将抑制使用量并影响AI公司收入增长,降价则会加剧亏损破坏经济性。核心矛盾在于固定订阅收入与指数增长的算力成本不匹配,形成利润剪刀差,这是AI编程工具及整个行业面临的结构性挑战。

Hedgie: 🦔Microsoft canceled its internal Claude Code licenses this week after token-based billing made the cost untenable, even...

AnthropicMicrosoft现象/趋势
08:13
Berryxia.AI@berryxia
57
Optimus V2.5 步态更自信,人形机器人迈向实用化

Tesla Optimus V2.5的行走动态展现出显著提升,动作更连贯、自然,充满自信。这一进步反映了其感知、控制与执行系统的协同能力达到了新高度,解决了人形机器人动态平衡的核心难题。讨论焦点已从其能否走稳,转向何时能真正进入工厂、仓库等实际场景工作。

Nic Cruz Patane: Tesla Optimus V2.5 walking dynamics are now much more human-like. Huge improvement over previous versions. It's walking ...

具身智能现象/趋势
07:30
ginobefun@hongming731
63
BestBlogs 早报 · 05-22|Agent 记忆原语、Qwen3.7-Max、自动化与人类专家

本期早报聚焦AI Agent的成熟化。Anthropic首次发布Memory与Dreaming基础设施原语,将跨会话记忆工程化,Rakuten部署后首次执行错误率下降97%。通义实验室的Qwen3.7-Max通过35小时极限压力测试,在未知硬件平台上自主优化Kernel,实现1158次工具调用零中断,凸显长程稳定性,将国内大模型竞争焦点从问答分数转向Agent可靠性。与此同时,Every创始人观察到,随着AI自动化普及,能评判执行质量的人类专家价值反而凸显。这些进展共同指向Agent成熟的基础设施、模型基座与人类协作新范式。

智能体AnthropicOpenAI推理
05:05
SemiAnalysis@SemiAnalysis_
62
AI并非首个价格下降多个数量级的技术。当螺丝还是手工制作时,产量以百或千计。如今产量已达万亿。 这场革命并非来自让过去使用的少量螺丝变得更便宜,而是来自构建一个在螺丝价格高出1500倍时无法想象的现代世界。
现象/趋势部署/工程
03:38
X.PIN@thexpin
58
中国目前占全球顶尖AI研究人员的43.7%。美国为31.9%。仅清华大学(6.2%)培养的顶尖AI人才就超过了斯坦福、麻省理工和卡内基梅隆大学的总和。大多数关于AI竞争力的政策辩论都集中在芯片和算力上。这张图表表明,更结构性的问题可能在于人才:他们在哪里接受培训,以及最终在哪里工作。
其他现象/趋势
02:56
François Chollet@fchollet
36
我们正走向一个"应用"或"用户界面"概念消失的世界。应用将变为服务,界面将变为文本框。
大佬观点现象/趋势
02:32
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
73
AI不仅能解决史上最难数学题,还在小说写作比赛中获奖 "AI不会写作"显然是自欺欺人,抱歉。 AI写作最大的破绽(除了几个过度使用的习惯用语)是它写得**太好**,表达**太清晰**。

Pangram Labs: We tested every Commonwealth Short Story Prize winner since 2012. We found three more AI-generated stories -- two among ...

现象/趋势
02:26
Rohan Paul@rohanpaul_ai
63
AI Token价值评估:智能含量与传输速度

该推文探讨了评估AI Token价值的新视角,核心在于Token的“智能含量”与“传输速度”。快速的Token若缺乏深度推理可能造成浪费,而缓慢的Token即使算力廉价也会因延迟影响用户体验。不同应用场景如医疗分诊、代码编写和购物客服对Token需求各异。因此,构建有效的“Token经济学”不应从模型菜单出发,而应从客户对不确定性、延迟和成本的容忍度开始,以具体用例为起点进行反向优化。NVIDIA的Shruti Koparkar强调,这关系到AI应用是规模化扩展还是停滞不前。

NVIDIA: Token economics determine whether your AI scales or stalls. The key to optimizing AI tokenomics? Start with the customer...

推理现象/趋势
02:13
Ethan Mollick@emollick
69
我认为没有人能直观地理解这意味着什么,而这种想象力的缺失对规划、投资和政策制定通常都是不利的。 我也没有简单的解决方案(有趣的是,AI在想象AI未来方面已经老套了,所以也帮不上忙)

Santi Ruiz: The models are just going to keep getting better and better and better and better. It's not easy to get one's head aroun...

大佬观点现象/趋势
00:37
Epoch AI@EpochAIResearch
65
OpenAI在2023年开启了AI算力建设浪潮。但如今它仅占全球算力的约10%,顶尖实验室的总和可能也不到一半。 在本周的通讯中,@justjoshinyou13 探讨了这一份额可能如何变化,以及何时会触及天花板。 🧵
数据/训练现象/趋势
00:11
AYi@AYi_AInotes
20
AI裁员时代打工人的终极威慑武器

AI裁员时代,打工人最后的核武器诞生了🤖 这个推文之所以这么爆,我理解是因为它说出了所有打工人不敢说的话。 它的真正威力从来不是按下的那一刻,而在于它存在的那一刻, 在于你的老板知道你桌子底下有这么一个按钮的那一刻。 从此所有的裁员谈话,最起码都会多一分尊重。

Pankaj: ai layoffs are getting out of hands so I built "I GOT FIRED" button 🚨 one click, and it makes entire company codebase p...

现象/趋势行业动态
5月21日
23:26
Rohan Paul@rohanpaul_ai
72
渣打银行将用AI大规模替代后台岗位,逾7500职位受影响

渣打银行正式将AI工作替代列为官方战略,计划到2030年通过AI自动化超过15%的后台支持岗位,影响逾7500个职位。该银行的目标并非直接替代柜员或客户经理,而是首先针对内部处理文档、审批流程、合规档案及系统运营的庞大支持机器。银行业因其后台工作多为结构化语言任务而尤为脆弱,大语言模型能够高效处理表单阅读、政策比对、数据校验及案例总结等工作,从而接管大量此类规则化流程,实现运营自动化。

Rohan Paul: StanChart is using AI to automate rule-based support work like compliance screening and customer data updates. plans to ...

现象/趋势行业动态
23:00
凡人小北@frxiaobei
47
AI编程工具转向:权限自由度成关键

用户宣布从Claude cowork全面转向Claude Code,核心原因是Claude cowork的沙盒权限控制过于严格,难以支持复杂任务。相比之下,Claude Code与Codex提供了更开放的权限,允许更自由的系统级操作,被形容为“脱缰野马”般灵活。

Anthropic现象/趋势编码
21:26
Rohan Paul@rohanpaul_ai
66
"我认为我们将在某些类别中雇佣更多AI人才,而减少银行家数量,并让他们更高效。" --摩根大通CEO杰米·戴蒙 "所以当你早上起床想面试某人时,它会整理出我在14个不同场合说过的话,并提供问题。你的工作职责不变,只是执行工作时会变得更聪明。" --来自"Bloomberg Podcasts" YouTube频道
大佬观点现象/趋势
18:26
Rohan Paul@rohanpaul_ai
60
你与每家银行交谈,AI都位居其议程首位。 黑石集团总裁兼首席运营官乔恩·格雷明确指出。 任何基于规则的业务,如会计、法律、金融,都将被AI彻底颠覆。

Rohan Paul: StanChart is using AI to automate rule-based support work like compliance screening and customer data updates. plans to ...

现象/趋势行业动态
17:10
Berryxia.AI@berryxia
27
书店观察:AI工具普及但使用深度有限

作者在书店观察到,苹果设备(Mac/iPad)是用户主流选择。约半数用户在使用AI工具,但绝大多数仅使用ChatGPT基础对话功能。现场未见到人们日常提及的Claude或Codex等工具。这一现象说明,尽管AI已进入大众视野,其应用仍主要停留在初级阶段,专业级工具的普及和深度使用远未到来。

OpenAI现象/趋势
16:27
ginobefun@hongming731
27
创作的门槛在降低,吸引注意力的难度在飙升

Lenny Rachitsky: Creating is becoming easier. Getting people's attention is getting harder.

大佬观点现象/趋势
16:10
Berryxia.AI@berryxia
49
美国毕业生集体嘘AI演讲引热议

近期美国多所大学毕业典礼上,演讲嘉宾提及AI技术时遭遇学生强烈嘘声,引发关注。前Google CEO Eric Schmidt等高管将AI比作“火箭船票”并鼓励学生拥抱变革,但台下反应冷淡甚至反感。这一现象反映出,在当前就业压力下,年轻群体对科技行业领袖宣扬AI机遇的同时也在利用其削减岗位的矛盾立场感到不满。Gallup最新调查也显示,美国公众对AI的情绪正从期待转向愤怒。

宝玉: 上周末好几场美国大学毕业典礼上,只要演讲嘉宾一夸 AI,台下就开始嘘。 被嘘得最惨的是前 Google CEO Eric Schmidt。他在亚利桑那大学的演讲里把 AI 比作一张火箭船的船票,说毕业生可以"组建一支 AI agent 团队...

现象/趋势行业动态
15:59
Orange AI@oran_ge
28
为什么大家一说到 ai 就要聊到赚钱呢? ai 是未来的水电煤 你在用电的时候会考虑这次用电能不能帮你赚钱吗?
现象/趋势
14:27
Orange AI@oran_ge
60
豆包赢了,但代价是什么?

豆包在AI聊天机器人市场赢得了用户规模上的胜利,但这场胜利的实际价值与可持续性存疑。其早期尝试的百万智能体生态活跃度极低,移除后对核心数据毫无影响,显示用户需求仍高度集中于主智能体。在“多bot”策略受挫后,团队曾迷茫地考虑借助抖音内容来提升豆包用户留存,但并未执行。目前,豆包的用户日均使用时长仍远低于抖音,尚未对传统互联网产品形成实质威胁。

智能体现象/趋势
13:19
凡人小北@frxiaobei
66
医疗AI的全链路闭环:从医生到患者的数据整合

OpenEvidence与Cedars-Sinai合作推出患者感知型临床AI,使医生能在Epic系统中直接调取完整病历(如过敏史、用药记录),并生成个性化诊疗建议,解决医生手动整理病史的痛点。但患者侧的病史信息仍依赖口述,形成信息缺口。Kin Health通过AI工具帮助患者录制问诊、整理摘要并生成待问问题,数据由患者自主携带,不绑定医院系统。二者结合,形成从医生到患者的全链路医疗AI支持,真正实现诊疗信息的双向流通与协同。

OpenEvidence: Until now, physicians using AI in clinic had to assemble the patient's context themselves. Allergies, comorbidities, med...

现象/趋势行业动态
12:48
凡人小北@frxiaobei
55
在我们的领域专长上深入 在相邻技能和领域上扩展 在此基础上学会很好地使用 AI

Zara Zhang: Great slide from the "How to thrive as an AI-era developer" session at Google I/O today I think this T-shape will apply ...

教程/实践现象/趋势
10:49
Orange AI@oran_ge
50
做产品≠能赚钱:商业认知大于技术能力

推文核心观点指出,将“做产品”与“赚钱”直接等同是一种常见误区。对于开发者而言,真正的难点并非开发产品本身,而是如何将其成功销售出去。这本质上是商业问题,而非工程问题。当前,AI技术已能基本解决工程层面的挑战,但商业变现能力尚未被AI攻克。因此,产品只是实现商业价值的交付方式之一,能否赚钱更多取决于独立的商业运作能力,而非单纯依赖产品。

大佬观点教程/实践现象/趋势
09:22
meng shao@shao__meng
68
Forward Deployed Engineering (FDE):AI落地的"最后一公里"关键与新兴职业方向

Forward Deployed Engineering (FDE) 是AI公司派驻客户现场的工程师角色,核心是将AI能力嵌入企业具体业务流。随着模型能力趋同,真正优势在于“如何用”,而FDE正是解决AI落地“最后一公里”的关键。该角色借鉴Palantir传统,强调必须现场工作,围绕企业专有数据重建流程。其工作涵盖业务审计、效果评估(Evals)与务实部署三阶段。咨询、PM及软件工程师可通过30天路线图与作品集转型,但需弥补各自短板——工程能力或商业沟通能力。FDE被视作“百万美金级人才”,是AI时代高价值的职业新方向。

vas: http://x.com/i/article/2057172544277606401

智能体教程/实践现象/趋势部署/工程
05:06
SemiAnalysis@SemiAnalysis_
58
边缘AI推理与开源机器人生态

ADI正在展示其将大型AI模型能力从云端下沉到边缘设备的技术路径,核心是通过模型蒸馏、定制化协同设计芯片等手段实现高效推理。同时,ADI正为机器人社区构建开源的基准测试与物理排行榜,并致力于开发多模态触觉传感器、高保真仿真资产等,以最小化仿真与现实之间的差距。这体现了其从系统层面推动硬件协同创新与数据采集的生态化产品战略。

具身智能现象/趋势
04:33
Ethan Mollick@emollick
72
2024年6月:最新的通用大模型无法数清"strawberry"里有几个r。 2025年7月:最新的通用大模型在国际数学奥林匹克竞赛中获得金牌。 2026年5月:最新的通用大模型解决了"组合几何学中最著名的问题之一"。
大佬观点推理现象/趋势
04:06
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
51
为何大多数对齐工作都是徒劳,一张图说明 【引用 @AISafetyMemes】:大多数对齐计划: 第一步)创造沙神 第二步)… 😈 欺骗沙神 😈 … 第三步)沙神永远忠诚 "当前的对齐工作,不过是在沙王巨怪脸上涂口红。" -@romanyam

AI Notkilleveryoneism Memes ⏸️: Most alignment plans: Step 1) Create sand gods Step 2) ... 😈 Trick the sand gods 😈 ... Step 3) Sand gods remain loyal ...

安全/对齐现象/趋势
03:48
宝玉@dotey
62
美国大学毕业典礼嘉宾鼓吹AI遭学生强烈嘘声

近日,美国多所大学毕业典礼上,嘉宾赞扬人工智能的言论引发学生集体嘘声。前谷歌CEO埃里克·施密特在演讲中将AI比作“火箭船票”,鼓励毕业生组建AI团队,却遭遇持续哄场,他承认恐惧合理但坚持AI将塑造世界。其他演讲者称AI为“工业革命”或“改写行业”也引发类似反应。学生不满源于就业压力,认为鼓吹AI变革的嘉宾正是推动自动化、可能导致岗位减少的群体。民调显示美国人对AI热情降温,愤怒情绪上升。

现象/趋势行业动态
03:35
Chubby♨️@kimmonismus
63
"我们距离AGI只有几年之遥(……)现在就能开始感受到。2026、2027年就是它开始的时候。" Demis Hassabis从未以制造炒作闻名。听他说我们正走在通向AGI的道路上,真的让我很兴奋。
DeepMind大佬观点现象/趋势
02:36
Rohan Paul@rohanpaul_ai
64
英伟达CEO黄仁勋:"有人认为全球GDP上限是100万亿美元。但更可能发生的是,AI将使这100万亿变成200万亿、300万亿、500万亿。GDP的规模没有根本性的上限。"
大佬观点现象/趋势
01:56
AYi@AYi_AInotes
68
Meta泄露音频:员工培训AI后遭裁员,信任危机

近日,Meta CEO扎克伯格的内部音频泄露,他承认公司秘密收集员工键盘、鼠标和屏幕数据,用于训练Llama等AI模型,因Meta员工智力高可提升模型能力。然而,数据收集约20天后,Meta裁员8000人,引发“企业食人主义”批评:员工在不知情下训练可能取代自己的AI,资本剥削从时间升级到智慧。这损害了员工信任,揭示了AI时代高效但冷酷的用人逻辑——员工越优秀,其价值被快速榨取并抛弃的风险越高。

More Perfect Union: LEAKED AUDIO: In an all-hands meeting on April 30, Mark Zuckerberg tells employees that he's training AI on them ahead o...

Meta数据/训练现象/趋势
01:06
SemiAnalysis@SemiAnalysis_
34
如果你已加入氛围编程浪潮(我们当然也加入了!),你可能注意到一个瓶颈:曾经"租个便宜CPU盒子"的步骤,如今已不再像过去那样简单常规了。(1/3) 🧵
现象/趋势编码
5月20日
23:45
swyx🛬 SFO@swyx
60
虽然迟了很久,但现在回想起来,我认为@sama那句富有传奇色彩的"构建一个随模型进步而变得更好的业务",基本上就是我在这里所说的Agent Labs。 看到模型性能与Agent Labs收入之间存在非常直接的关联,在2025年第四季度出现断层。 (摘自@patrickc的Stripe Sessions)

swyx🛬 SFO: New @latentspacepod Essay: why Agent Labs are clearly emerging in 2025 as a complement to Model Labs' all becoming AI Cl...

智能体大佬观点现象/趋势
21:47
meng shao@shao__meng
36
Claude Design 发布一个月了,还有朋友记得它吗? 从 Google Trends 看,Claude Design 在进入 5 月后,迅速回落到发布前的数值。。
Anthropic产品更新现象/趋势
21:16
meng shao@shao__meng
49
最近面试过程中,用 AI 辅助的候选人,明显多起来了 😄

面试中AI辅助效果不佳,回答泛泛缺乏针对性。深入项目经验时,AI只复述概念,不分享实际工程问题。面试官指出,AI能应对概念提问,但实战经验如工程“坑”无法替代,候选人需依赖真实能力。

智能体现象/趋势
17:07
Berryxia.AI@berryxia
44
想做爆款就做"元内容":别只发干货,要发"关于干货的干货"….. AI越带我越原始了,什么都要追求元XX😁
大佬观点现象/趋势
15:05
Rohan Paul@rohanpaul_ai
69
DeepMind创始人曾投资Anthropic,其"人才外溢"重塑AI格局

据英国《金融时报》报道,Google DeepMind创始人德米斯·哈萨比斯曾是Anthropic的早期天使投资者,而Google随后也通过云服务与AI合作向该公司投入了数十亿美元。更值得关注的是DeepMind显著的“人才外溢”效应:自2021年以来,其前研究人员已创立超过十家AI公司,累计融资至少140亿美元。这表明DeepMind正逐渐从一个研究机构演变为一所顶尖的AI人才“学校”,其“毕业生”同时在与Google竞争、为其提供技术,并对整个市场施加压力。

AnthropicGoogle现象/趋势行业动态
‹ 上一页
1…1819202122…37
下一页 ›