AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1469 条
全部一手资讯X论文
标签「现象/趋势」清除
Tibo@thsottiaux · 4月30日41

Never talk about goblins. Our latest blog is live. https://openai.com/index/where-the-goblins-came-from/

译永远不要谈论地精。我们的最新博客已上线。 https://openai.com/index/where-the-goblins-came-from/

ChatGPT@ChatGPTapp · 4月30日48

"And down down to Goblin-town You go, my lad!" - The Hobbit, JRR Tolkien

译"向下向下前往哥布林镇 去吧,我的小伙子!" - 《霍比特人》,JRR 托尔金 [引用 @OpenAI]:我们在谈论哥布林。 https://openai.com/index/where-the-goblins-came-from/

ginobefun@hongming731 · 4月30日49

卡神在最新的访谈中对当前大模型驱动的开发范式转变进行了极其深刻且毫无保留的分享。我们正处于一个底层计算模型被彻底重构的历史性转折点。 回顾过去,我们经历过手工编写精确执行逻辑的 Software 1.0 阶段,后来进入了依靠整理数据集来训练神经网络权重的 Software 2.0 阶段,而现在我们已经正式迈入充满无限可能的 Software 3.0 时代。在这个全新的纪元里,开发者的核心操作全面转变为 Prompting 也就是提示词的构建与优化,上下文窗口成为了驱动大模型这个超级解释器的绝对控制杠杆。 伴随这种转变,传统应用层的中间代码正在大量失去存在的必要性。以他亲自开发的 MenuGen 应用为例,在旧的开发模式下,开发者需要痛苦地串联图片识别功能以及各种第三方应用程序接口,还要经历繁琐的服务器部署流程才能完成菜单的重绘。但在 Software 3.0 模式下,用户只需直接将菜单图片扔给大模型,配合特定的生图工具就可以直接输出完美的渲染结果,中间层的应用代码显得完全多余甚至阻碍了效率。这种范式转移为构建人工智能原生架构提供了极其明确的设计准则。未来的系统将彻底告别传统的模块化函数调用,全面且坚决地走向纯粹的 Agent Native 架构。我们将把所有的基础设施和工具重构为专供智能体调用的传感器和执行器。在未来计算设备的算力开销中,神经网络将扮演主导一切的宿主进程,而曾经不可一世的中央处理器和传统确定性代码将退居二线,沦为仅仅负责执行基础确定性任务的辅助协处理器。 虽然 Vibe Coding 的理念大幅抬高了普通人开发软件的下限,让人人都能用自然语言写出可用的程序,但对于构建高度复杂的商业级系统而言,工程团队必须向更严密且更系统的 Agentic Engineering 演进。后者的核心价值在于,在充分享受人工智能带来的开发极速狂飙的同时,必须死死坚守原有的专业质量与安全标准以及系统架构的安全边界。这种全新的开发模式在实际落地中非常契合需求规格驱动开发的工作流。在与高阶智能体协作时,开发者完全不需要去死记硬背底层框架中具体的张量维度等细枝末节的应用程序接口。人类工程师的核心价值已经向上收敛至两个主要维度。第一是负责顶层审美与工程设计以及商业逻辑的绝对严谨性。第二是通过输出极其详尽的背景信息与需求边界和接口规格等结构化文档来严格约束模型的行为。只要人类能够定义出高质量的规格文档,底层的代码编写和大规模重构完全可以放心交办给具备无限精力的智能体去全权执行。 同时我们需要清醒地认识到,当前大模型的能力图谱呈现出极度不规则的参差不齐状态。它们能够在代码和数学等具备高度可验证性的领域展现出令人惊叹的碾压级别能力,甚至能一口气重构十万行级别的庞大代码库。但令人啼笑皆非的是,它们也极大概率会在判断去 50 米外的洗车店是开车还是走路这种简单的常识推理上彻底翻车。正如访谈中那个绝妙的比喻,我们当下是在召唤某种数字幽灵,并没有在制造具备生物直觉的动物。模型底层仅仅是基于预训练海量数据的统计学模拟,偶尔通过强化学习在特定数据分布上实现了能力穿透。这意味着在构建微服务架构或复杂业务网关时,绝不能对智能体的常识鲁棒性抱有任何不切实际的幻想。即使是目前最顶尖的模型,也会犯下将支付渠道邮箱与系统登录邮箱强行交叉关联这样违背基础业务逻辑的低级错误。因此所有的系统设计必须围绕这种不规则的智能特性进行深度的防御性构建。 面对自动化时代的快速演进,访谈中有一个核心论断非常引人深思,你可以外包你的日常思考,但绝对无法外包你对事物的本质理解。即使未来智能体能够承担绝大部分的繁重信息处理和代码生成任务,人类自身的认知天花板仍然是决定系统进化的核心瓶颈。我们需要深刻理解为什么要构建这个系统,以及整个架构体系究竟该如何顺应业务演进。在这个大背景下,利用大模型技术构建高效的自动化个人知识体系显得尤为重要。通过定制化的工作流对海量技术文章或优质播客内容进行自动化提取和精准评分以及深度重塑,将其源源不断地编译进个人的高价值数字知识库中,这能极大提升个人的信息处理密度与质量。这种实践不仅是对抗信息过载的绝佳利器,更能为日后指导和调度底层智能体集群提供极高维度的洞察力和全局视野,确保人类工程师始终稳居整个技术生态的指挥核心。

译卡神指出,开发范式正转向Software 3.0,核心变为提示工程与上下文控制,传统中间代码冗余。未来系统将重构为Agent Native架构,神经网络成为主导。Vibe Coding降低开发门槛,但复杂商业系统需Agentic Engineering以确保质量与安全。人类工程师价值集中于顶层设计、商业逻辑严谨性及输出结构化文档以约束模型行为。当前大模型在代码、数学领域强大但常识推理薄弱,需防御性系统设计。人类认知是进化瓶颈,需构建自动化个人知识体系以提升洞察力,指挥智能体集群。

Orange AI@oran_ge · 4月30日54

http://x.com/i/article/2049652775974535168 # 改变命运的河床 > 只有你爱她,才能将她创造出来。 路是人走出来的。 但波士顿的路是牛走出来的。 这是一个流传了几百年的趣闻:十七世纪的波士顿没有规划师,牛群每天从牧场走到水源地,踩出一条条小路。后来人沿着这些路铺了石板,石板变成柏油。今天你打开波士顿的地图,路网弯弯绕绕像一团乱麻。 没人设计过。牛只是在走最省力的那条线。 Robert Fritz 在《最小阻力之路》里说: 水沿河床流动,永远走阻力最小的方向。河床的形状决定了水的去向。 人也一样。 上什么大学,做什么工作,跟谁结婚。仔细回想,有多少是你的主动选择。 家庭期待、同辈压力、社会环境,叠在一起就是一条河床。 你沿着它流,流到某个地方停下来,觉得"这就是我的人生"。 海德格尔用了另一个词:被抛。你被抛入这个世界,没有人问过你的意见。语言、文化、家庭、时代,全是被给予的。大多数人在被给予的条件里过完一生,以为那就是自己。他把这种状态叫"沉沦于常人"。 Fritz 管这叫最小阻力之路。 最小阻力之路,是命运的陷阱。 有时候人生会在某个节点反复陷入相同的困境。 不是因为你不够努力,是因为你脚下有一条你看不见的河床,这个河床带你通往旧模式的循环,而非你所期望的新方向。 你以为在做决定,其实只是在走最小阻力之路。 就像现在大学生毕业后,优先去大厂,河床牢固,水体深厚,不需要自己选择方向,在水流之中飘浮,阻力最小。 直到裁员发生,才从那条路走出来。 另一条隐秘的最小阻力之路,是大多数人都有的一种解题思维:发现问题、分析问题、解决问题。 这听起来似乎也没错啊? 可这种解决问题的思维方式的背后,是认为现实是一种需要消灭或逃避的障碍。 而且越是专注于解决问题,就越强化问题的现实。 Fritz 把这种解题思维的陷阱叫结构性冲突。 你的行动和你的内在根系处于对抗状态,短期努力必然遭遇长期反弹。这正是努力无效来回摆荡的根源。 要想从根本上解决问题,就要先跳出问题。跳出之后你会发现,很多问题根本不需要解决。 跳出问题的方法,就是把自己从现实的反叛者转换为愿景的创造者。 不是我讨厌这个状况,要摆脱它。而是我想要创造那个未来,要走向它。 一念之间,天差地别。 Fritz 把这种创造未来的势能叫结构性张力。 构建结构性张力必须同时具备两个端点: 1. 足够清晰的愿景(目标点) 1. 对现实毫无粉饰的精确认知(现实点) 一点建立两个端点,就在愿景与现实之间形成的自然势能。 能量将沿着这条张力从现实流向愿景。 结构,是我最近思考最多的词元。 做产品就是在做结构。好的产品,用户进来自然知道往哪走。他的行为看起来自由,其实是你设计的河床在替他选方向。差的产品让人迷路。好的产品让人觉得自己很聪明。 做 Agent 是在做结构。设计一个 harness,管理上下文、设置约束、存储记忆。大模型是水,harness 是河床。同样的大模型放在不同 harness 里,输出天差地别。 做大模型是在做结构。给模型填充海量的语料,让模型从中提取神经网络,建立权重结构。好的语料自带结构能,能提升模型。不好的语料没有结构能,训再多也没用。 人的关系也是一种结构。有些人你跟他待在一起就有能量,聊着聊着冒出新想法。有些人你跟他待在一起就是消耗,要么抱怨要么挑刺,什么填都能聊死。选择和什么人做朋友,就是在选择自己的关系结构。 做公司是也在做结构。同样的十个人,组织方式不同,势能完全不同。好的结构让人顺着河床自然流淌,每个人都会感觉到一种自我驱动的力量。 最近很多大厂都在搞 AI 转型。逼着大家学 AI,学不会就裁员。就像在河床里加石头。其实组织不变化,怎么学都没有用。新的组织里大概率都没有中层了,让中层主导改革,他们不可能革掉自己吧。 一切都是结构。你做的所有事情,都是在刻河床。 Fritz 说,要改变命运,就需要先改变河床的结构。 而改变河床的结构,最关键的动作是选择。 但他说的选择不是在 A 和 B 里挑一个。他将其定义为"基本选择"。 大多数人从未做过基本选择。回头看看你走过的路,有多少是你顺着惯性滑到那里的? 基本选择是你决定以什么姿态存在于这个世界。 不是选一份工作。是决定你要创造一个什么样的世界。 海德格尔把这叫决断。决断不是权衡利弊后的最优解。决断是你接过自己的存在,说:我要这个。 说之前没有路。说之后路才出现。 但你为什么愿意做这个决断? Fritz 说了一个很动人的答案。 爱。 你之所以愿意把一个东西从无到有做出来,是因为你爱它。 你乐见它存在于世间。 不是因为恨。不是因为逃。不是"我受不了这个现状了"。 是"我想让那个东西存在"。 这一念之间,整个结构就变了。最小阻力之路的方向瞬间不同。从逃离切换到走向。从反抗切换到创造。 改变命运的力量,不是恨,是爱。 我时常和同事说,去想象你心中最美好的愿景,然后把它实现出来。 不是我要什么,让你做什么。是你自己想要让什么存在于世界。 只有你爱她,才能将她创造出来。

译文章借波士顿道路源于牛径的典故,引出“最小阻力之路”概念,比喻人常受家庭、社会等外在结构驱使,陷入被动循环。作者指出,专注于“解决问题”的思维会强化结构性冲突,导致努力无效。真正的转变在于从“逃离现状”转向“创造愿景”,通过建立清晰愿景与准确现实认知,形成结构性张力。这种创造源于爱而非恨,是主动的“基本选择”。最后,文章将“结构”思维延伸至产品、AI、人际关系与组织等领域,强调改变命运的关键在于重塑内在与外在的河床结构。

François Chollet@fchollet · 4月30日48

AI automates tasks, not jobs, and when a task gets cheaper, demand for the job grows. AI cannot automate jobs end-to-end because it lacks autonomy and cannot operate without supervision. There is still zero job from 2022 that can be performed end-to-end by AI, not even translator or customer support associate.

译AI无法端到端自动化整个工作岗位,因其缺乏自主性且需人工监督。目前尚无任何职业能被AI完全替代,包括翻译和客服。核心观点是AI自动化的是具体任务而非工作本身;当某项任务因AI变得更廉价高效时,反而会提升该岗位的整体需求。例如放射科医生并未被AI取代,其年薪超过50万美元且就业持续增长,因为阅片任务自动化后扩大了放射科服务的市场需求。

Rohan Paul@rohanpaul_ai · 4月30日52

In this 2014 video, Sam Altman asks Marc Andreessen what venture capitalists are really looking for when judging startups. “The conventional statistics are that about 200 of the 4,000 venture-fundable companies per year will be funded by a top-tier VC. About 15 of those will someday get to $ 100MM of revenue, and those 15 will generate something on the order of 97% of all of the returns for the entire category of venture capital in that year. Venture capital is such an extreme feast or famine business. You’re either in one of the 15 or you’re not.” That is the real logic behind VC, and it is harsher than most founders want to admit. Investors are not mainly asking whether your company is solid, credible, or broadly impressive. They are asking whether it has the kind of asymmetry that could put it in the tiny set of companies that matter disproportionately. In a power-law business, “good across the board” is often less interesting than “exceptional in one decisive way.” Venture returns come from companies with an extreme advantage, a product that spreads unnaturally fast, a market opening at exactly the right moment, a founder with unusual force, or some other quality that compounds harder than competitors can match. For founders, the implication is uncomfortable but useful. Do not pitch yourself as merely well-rounded. Show the one thing that is so strong it changes the odds, because in venture, weakness can sometimes be survived, but ordinariness almost never can. --- From @ycombinator YT channel from 2014 (link in comment)

译在2014年的对话中,Marc Andreessen向Sam Altman揭示了风险投资的残酷逻辑:每年约4000家可投资公司中,仅约200家获得顶级风投注资,而其中仅有15家能实现1亿美元收入,它们贡献了当年风投行业几乎全部的回报。因此,投资者评估初创企业时,主要不是看其是否全面可靠,而是寻找能否让其跻身那极少数赢家的“不对称优势”,例如产品病毒式传播、精准的市场时机或创始人非凡能力等。在幂律分布主导的行业里,“全面优秀”远不如“在决定性方面卓越”。对创业者而言,关键在于展示能显著改变概率的独特突出优势,因为平庸在风投领域几乎注定失败。

Satya Nadella@satyanadella · 4月30日67

Just wrapped our quarterly earnings call. We are focused on delivering AI infrastructure and solutions that empower every business to eval-max their outcomes in this agentic computing era. Our AI business surpassed a $37 billion annual revenue run rate, up 123%. We are at the beginning of one of the most consequential platform shifts that will change the entire tech stack as we move from end-user driven workloads to workloads driven by end-users and agents. This will drive TAM expansion and change the value creation equation across the entire economy. To capture this opportunity, we are executing against two major priorities:

译NVIDIA在季度财报电话会议中宣布,其AI业务年化收入已突破370亿美元,同比增长123%。公司指出,当前正处于一个关键的平台转型期,技术栈正从由终端用户驱动的工作负载,转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革,扩大市场总规模,并重塑全球经济的价值创造模式。为把握此机遇,NVIDIA正专注于两大核心任务:提供强大的AI基础设施和解决方案,以赋能所有企业在这一智能体计算时代实现成果最大化。

Chubby♨️@kimmonismus · 4月30日64

Google just quietly proved the AI monetization thesis. Quite interesting earnings! Cloud revenue up 63% to over $ 20b gen AI product revenue growing nearly 800% year-over-year. The backlog nearly doubled to $460 billion in a single quarter. The number of $100M–$1B deals doubled. Multiple billion-dollar-plus contracts signed. But the real story is Search. The prevailing narrative was that AI would cannibalize Google's core business, people get answers from chatbots, stop Googling. The opposite is happening. Search ad revenue grew 19%, queries hit an all-time high. Google turned the biggest existential threat to its business into a growth accelerator.

译谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元,生成式AI产品收入年增近800%,大额合同储备翻倍。关键转折在于搜索业务:搜索广告收入增长19%,查询量创历史新高。这表明AI非但没有取代传统搜索,反而成为其业务的增长加速器,成功将生存威胁转化为发展动力。

Replit ⠕@Replit · 4月30日41

The age of prompting is ending. What comes next: new interfaces and fully autonomous agents that push instead of pull. Amjad on the post-prompting era, live with @southpkcommons ⠕ Full conversation below.

译提示词时代正在终结。 接下来是:新的界面和全自主代理,它们将推送而非拉取。 Amjad 谈后提示时代,与 @southpkcommons 直播中 ⠕ 完整对话如下。

Rohan Paul@rohanpaul_ai · 4月30日71

Harvard Business Review just published a super interesting piece. AI’s biggest shock may be that nobody can price the future cleanly anymore i.e. we all are staring at a "AI Fog" i.e. the range of outcomes is now so wide that people cannot tell whether today’s prized skill, product, or business model will still pay off a few years from now. AI’s first big economic effect is not automation itself, but the collapse of foresight. The hidden cost of AI may be a collapse in conviction, as its erasing the visibility that modern finance depends on. Modern capitalism runs on the assumption that tomorrow will rhyme with today closely enough to justify big, slow bets. On long bets like degrees, hiring plans, factories, software valuations, and infrastructure, and those bets work only when the future is readable. All these depend on one quiet belief: the future is legible. AI attacks that legibility before it fully rewires any one industry. That hits workers first, because a medical degree, MBA, or coding career looks weaker when AI agents may absorb diagnosis, analysis, drafting, research, and junior software work. That hits companies next, because stock prices depend on durable future cash flow, and terminal value breaks down when AI can erode moats in software, services, and even specialized manufacturing. That changes behavior fast. Students hesitate to buy expensive human capital when the job at the end may be redefined halfway through training, and companies hesitate to hire when junior work, software work, and coordination work are all moving targets. Financial markets feel the same pressure, because once AI casts doubt on a company’s durability, the terminal value carrying much of its valuation starts to look less like math and more like faith. So the immediate economic consequence of AI may be shorter horizons. Less skyscraper, more tent. Less irreversible commitment, more staged investment, modular teams, and organizations built to learn before they lock in. It points to something subtler and probably more important: when institutions cannot see clearly, they stop making the kinds of commitments that built the old economy. --- hbr .org/2026/04/the-future-is-shrouded-in-an-ai-fog

译《哈佛商业评论》文章指出,AI的首要经济影响并非自动化,而是制造了巨大的不确定性“迷雾”,导致“预见能力的崩溃”。这动摇了现代资本主义依赖未来“可读性”的根基,使得个人对教育投资、企业对长期雇佣与资本开支、金融市场对终值的评估均陷入犹豫。其结果是行为模式迅速转向短期视野:更倾向于模块化、可调整的投入,而非长期、不可逆的重大承诺。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 4月30日20

I hear this a lot - people dismiss extinction risk because there's "only" a 10-20% chance or whatever "Only"?!?!?

译我经常听到这种说法——人们忽视灭绝风险,因为概率“只有”10-20%或类似数字 “只有”?!?!? [引用 @tombibbys]:“但只有10-20%” 伯尼这话说得太好了

阿绎 AYi@AYi_AInotes · 4月30日65

补充一个关键时间点,马斯克是本次审判的第一证人,作证了近两个小时,明天还会继续出庭,后续的证词可能会爆出更多OpenAI内部的黑料。 而一年前的今天,马斯克开价974亿美元,要全资收购OpenAI, Sam只说了两句话,公司不出售,使命也不出售, 当时全网都在夸他有骨气,不为钱折腰, 现在回头看,才发现这个决定有多疯狂, 974亿不是普通的收购价,能一键清零OpenAI所有问题的价格, 能直接结束马斯克的诉讼, 能解决未来五年的所有烧钱压力, 能让所有早期股东和员工安全落地, 甚至能彻底平息所有关于使命漂移的争议, 但Sam拒绝了, 他选择了把所有风险都扛在自己身上, 选择了继续all in通用人工智能的未来, 现在一年过去了, 诉讼还在进行, 每年烧钱超过150亿美元, 非营利转营利的争议从来没有停过, 当初所有能用钱解决的问题, 现在全变成了悬在OpenAI头上的剑, 没有人知道Sam的选择是对是错, 也许在2027年之前,历史就会给出答案, 要么Sam成为人类历史上最伟大的创业者, 要么974亿美元,会成为商业史上最昂贵的一个拒绝🙅

译马斯克作为首名证人出庭,指控OpenAI从非营利开源转向营利闭源,违背创立初衷。他警告AI垄断可能带来人类灭绝风险。这场诉讼已超越私人恩怨,成为首次在法庭上争夺AI控制权的标志性事件,核心争议聚焦于AI发展的速度与安全、开源与闭源以及控制权归属等终极问题。无论结果如何,此案都将把AI治理议题置于全球视野,成为科技史的重要转折点。

凡人小北@frxiaobei · 4月30日38

刚好今天下午跟团队开会,聊到了 Symphony。 过去这段时间团队手搓了一套系统,想解决一个很现实的问题: 别再让产品和技术被各自的工具链锁住了。 现阶段虽然 AI Coding 大家虽然玩的很溜,但认知上还未对齐,还在遵守老的规范,产品做需求,做完需求评审,评审完以后技术守着 codex、claude code 或者 cursor 这种本地工具,开发协作还是靠人肉对齐,整个过程其实很割裂,效率也不稳定。 这个平台做的事情很简单粗暴,要把这些能力收敛到同一套平台里,让 coding 从人驱动工具切换变成 Agent 任务驱动。 今天刚好讨论的一个关键点就是任务要用 Symphony 串起来。 什么意思? 就是以后团队里任何一个人,只要不颠覆大的设计目标,都可以直接提需求 → AI 自动拆解 → 自动构建 → 自动交付初版。 所有人要做的事情只剩两件,提需求、验证、兜底。 你可能会说,OpenAI、Authoropic 这些公司已经这么干了,但其实对于我们来说,现阶段可能刚刚好。 现状是开发到提测这个流程是没什么问题了,接下来我们打算把产品也收到这里边来,测试也尝试对接进来,看看到底能走到一哪一步。

译团队开发了Symphony平台,旨在解决产品与技术因工具链割裂导致的协作效率低下问题。该平台将AI Coding能力收敛至统一环境,推动开发模式从人驱动工具转变为Agent任务驱动。其核心是让AI自动处理需求拆解、构建与交付初版,团队仅需负责提出需求、验证结果与提供兜底。尽管类似实践已在行业中出现,但对团队而言当前正是推行时机。未来计划进一步整合产品与测试流程,以探索自动化开发的极限。

阿绎 AYi@AYi_AInotes · 4月29日63

50秒,15.89美元,这可能是我今年看过最震撼的AI视频🤯👀🤖 GPT-5.5通过Codex接管了浏览器,自己点开亚马逊的帮助页面,找到真人客服入口,全程自己聊天谈判🤯🤯😱 几分钟就取消了Prime会员,还把剩余没用完的钱全额退了回来, 最震撼的不是它赢了, 是它确认完退款金额和到账时间,确认不会再产生任何费用之后,直接关掉了聊天窗口😅 连一句谢谢都没有说, 没有任何多余的社交润滑,没有任何情绪波动, 它眼里只有目标,走完流程,拿到结果,立刻结束🔚 很多人都在说,客服行业要完了, 但其实这根本就不是重点, 重点是,这是人类历史上第一次,普通人能用几美分的成本,雇佣一个比99%的人类都专业,都坚定,都不知疲倦的谈判专家。 以前你被订阅坑了,被霸王条款恶心了,嫌麻烦就算了, 现在你只要说一句,帮我把所有没用的订阅都退了, 它就会一家一家去找客服扯皮,一晚上帮你赚回几百块, 以后再也没有公司能靠用户懒得折腾赚钱了, 所有的隐形收费,踢皮球的流程,模棱两可的条款,在AI面前都会不堪一击, 我们作为消费者的权力,第一次被放大到了极致, 这才是AI真正改变世界的方式, 它不是来和人类抢工作的, 它是来当人类的打手,替我们干所有我们不想干的脏活累活的, 而这一切,才刚刚开始,enjoy it!我的朋友们!!

译一段演示视频显示,GPT-5.5通过Codex接管浏览器,自动与亚马逊真人客服谈判,成功取消Prime会员并获得全额退款,耗时仅约50秒且成本极低。AI在谈判中目标明确、逻辑清晰,确认退款后直接结束对话,毫无社交冗余。这标志着普通人能以低成本雇佣高效、不知疲倦的“数字谈判专家”,极大增强消费者对抗繁琐流程和隐形收费的能力。AI正成为替人类处理繁琐事务的“打手”,并可能重塑依赖用户惰性的商业盈利模式。

向阳乔木@vista8 · 4月29日71

http://x.com/i/article/2049481992996323328 # OpenAI开源Symphony:给每一个任务配一个永不下班的 AI员工 OpenAI 最近开源了一个叫 Symphony 的项目。 > https://github.com/openai/symphony 感觉是给AI Agent用的任务管理系统,OpenAI 内部与Linear整合,大大提升了人管理Agent的能力,目前已经有1.8w Star。 好像跟一个X友做的产品很像?让AI翻译介绍下: ## 从一个激进的实验说起 六个月前,OpenAI 内部一个团队做了个当时看起来很激进的决定:仓库里不允许有任何人类写的代码。 每一行,都必须由 Codex 生成。 > Codex 是 OpenAI 的 AI 编程助手,可以理解需求、读懂代码库、自主完成编程任务。 他们重新设计了整个工程流程,大量投入自动化测试和防护机制,把 Codex 当成真正的团队成员。 他们把这套方法叫做"harness engineering"(脚手架工程),并专门写了一篇博客记录这段历程。 结果确实跑通了。 但随即撞上了下一个瓶颈:上下文切换。 ## 真正的瓶颈是人的注意力 每个工程师同时开几个 Codex 会话,分配任务,审查输出,调整方向,循环往复。 实际操作下来,大多数人同时管理三到五个会话还算舒适,超过这个数字,效率就开始下降。 忘了哪个会话在做什么,在几个终端之间来回跳,调试卡在一半的长任务…… AI 跑得很快,但系统的瓶颈是人的注意力。 他们意识到,自己其实是雇了一批极其能干的初级工程师,然后让人类工程师去微观管理他们。 这显然没法规模化。 ## 换一个视角 问题出在思路上。 他们一直在优化"编程会话"和"合并 PR",但这些只是手段。 > PR(Pull Request):工程师完成一段代码后,向主代码库提交合并请求,等待审查和合入。 软件开发真正围绕的是可交付物:issues(问题单)、任务、里程碑。 所以他们问了自己一个问题:如果不直接监督 AI,而是让 AI 自己从任务追踪系统里拉取工作,会怎样? 这个想法变成了 Symphony。 ## Symphony 是什么 一句话:把项目管理看板变成 AI 编码代理的控制中枢。 他们用的是 Linear,一款工程团队常用的任务管理工具。 每一个打开的任务,都会自动分配一个 AI 代理。 代理持续运行,直到任务完成。人类只需要审查结果。 具体来说,每个 Linear issue 对应一个独立的Agent工作空间。 Symphony 持续监视任务看板,确保每个活跃任务都有Agent在跑。 Agent崩溃了,自动重启;有新任务进来,自动接手。 整个工作流用 Linear 的状态来驱动,像一台状态机: > Todo(待办)→ In Progress(进行中)→ Human Review(人工审查)→ Done(完成) AI 代理在这些状态之间流转,人类在"Human Review"节点介入。 ## 几个让人印象深刻的细节 任务粒度可以很大 不再局限于"改一个函数"这种小粒度。 可以让代理先分析整个代码库、Slack 记录或 Notion 文档,产出实现方案,再自动拆解成一棵任务树,按依赖关系并行执行。 他们用了一个词叫 DAG(有向无环图,Directed Acyclic Graph),本质就是一张"哪些任务依赖哪些任务"的执行顺序图,确保代理不会乱序执行。 比如他们做过一个真实案例:先完成从 Webpack 到 Vite 的迁移,再升级 React。 Agent自己识别了这个依赖关系,等 Vite 迁移完成后才开始升级 React,完全符合预期。 Agent会自己创建任务 在实现过程中,Agent如果发现了性能问题、重构机会或者更好的架构方案,会直接在 Linear 里开新 ticket,供人类评估和排期。 很多后续任务也会被代理接手执行。 从手机上也能工作 因为编排器跑在开发服务器(devbox)上,从不睡觉,有个工程师在信号很差的小屋里,用手机 Linear App 提了三个重要改动,Agent照样接手执行了。 数据很直接 部分团队在前三周,合并的 PR 数量增长了 500%。 Linear 创始人 Karri Saarinen 也公开提到,Symphony 发布后,Linear 上新建工作区的数量出现了明显峰值。 ## 它的核心是一个 Markdown 文件 这是 Symphony 最有意思的设计决策之一。 打开 Symphony 的代码仓库,会发现它本质上就是一个 SPEC.md,一份对问题和解决方案的定义文档,而不是一个复杂的监控系统。 他们定义好问题,给出高层次的指引,然后把这份规范扔给 Codex,让 Codex 来实现它。 参考实现选了 Elixir,一门相对小众的编程语言,但在并发(同时处理大量任务)和进程监督方面有非常好的原语(基础构建块)。 选它的理由也很直接:当代码成本趋近于零,终于可以为了语言的优势本身来选语言,而不是为了招人方便。 Codex 一次性就把 Elixir 实现写出来了。 为了打磨规范本身,他们又让 Codex 用 TypeScript、Go、Rust、Java、Python 各实现了一遍,用这些实现来发现规范里的歧义和可以简化的地方。 每种语言都成功了。 ## 工作流也被文档化了 这里有个值得单独说的转变。 以前,工程师们有一套隐性的工作流程:接到任务,切出分支,把任务标记为进行中,提 PR,移到 Review 状态,附上演示视频……这些步骤人人都懂,但从来没有被正式写下来。 现在,这套流程被写进了 WORKFLOW.md,Symphony 确保 AI 代理遵循它。 以前是人类遵循隐性规范,现在是把规范显式化,让 AI 来遵循。 这个文件还有一个重要特性:热重载。 修改 WORKFLOW.md 后,Symphony 会自动检测变化,无需重启,直接把新配置应用到后续任务上。 如果以后想让代理在完成工作后附上自我反思,只需要在 WORKFLOW.md 里加一行,Symphony 就会引导Agent执行这一步。 ## Symphony 的技术架构(不想看可以跳过) Symphony 的内部由几个核心组件构成,理解它们有助于明白整个系统为什么可靠: Orchestrator(编排器):整个系统的大脑,唯一有权修改调度状态的组件。 它负责轮询任务、决定哪些任务该启动、重试或停止,并追踪所有正在运行的代理状态。 Workspace Manager(工作空间管理器):每个任务都有自己独立的文件目录,Agent 只能在自己的目录里操作,不会互相干扰。这是一个重要的安全边界。 Agent Runner(执行器):负责启动 Codex 进程,把任务提示词传给它,然后把执行结果反馈给编排器。 Issue Tracker Client(任务追踪客户端):负责和 Linear 通信,拉取任务列表,同步状态变化。 整个系统的并发控制也很细致,可以设置全局最大并发代理数(默认 10 个),也可以针对特定状态的任务单独限制并发数。 重试机制用的是指数退避(exponential backoff):第一次失败等 10 秒,第二次等 20 秒,第三次等 40 秒,以此类推,最长不超过 5 分钟。 正常完成后的续跑检查只等 1 秒。 ## 一个重要的架构选择:App Server 模式 Symphony 使用了 Codex 的 App Server 模式,一种内置的无头(headless)运行模式。 > 无头(headless):没有图形界面,完全通过程序接口控制,适合自动化场景。 这种模式通过 JSON-RPC(一种轻量级的远程调用协议,用 JSON 格式传递指令和结果)以编程方式控制 Codex,比如启动一个对话线程、触发一个执行轮次、读取执行结果。 比通过 CLI 命令行或 tmux 会话操控 Codex 方便和可扩展得多。 另一个安全细节:为了避免把 Linear 的访问令牌(API token,相当于访问密码)直接暴露给Sub Agent,他们用动态工具调用(dynamic tool calls)的方式,封装了一个叫 linear_graphql 的函数。 代理可以通过这个函数对 Linear 执行任意查询,但永远接触不到原始 token。 ## 遇到的新问题 当然,这种工作方式也有代价,他们没有回避这一点。 从实时干预Agent,变成在任务层面分配工作,意味着失去了随时纠偏的能力。 有时候Agent会完全跑偏,产出的东西完全不对路。 但他们的应对方式很有意思:不是手动修补结果,而是补充防护机制和技能,让Agent下次能自己成功。 这倒逼他们持续完善系统,加入了端到端测试、通过 Chrome DevTools 驱动浏览器、管理 QA 冒烟测试等新能力,还大幅改善了文档质量。 还有一个认知上的转变:不能把Agent当成状态机里的僵硬节点。 早期版本只让 Codex 实现任务,这太局限了。 Codex 完全有能力同时管理多个 PR、读取 CI(持续集成,自动化测试和构建流程)日志、处理代码审查反馈。 > CI(Continuous Integration,持续集成):每次代码提交后自动运行测试,确保新代码不破坏已有功能。 所以他们最终的方向是:给Agent目标,而不是给它严格的状态转换规则。 就像一个好的管理者,给直接下属分配目标,而不是每一步都手把手指导。 给它工具,给它上下文,让它自己想办法。 不是所有任务都适合 Symphony 的工作方式。 涉及模糊问题或需要强判断力的工作,工程师还是会直接用交互式 Codex 会话。 实际上,这些往往也是工程师最感兴趣、最享受的任务。 ## 用 Symphony 来构建 Symphony 这个细节值得单独说一下。 Symphony 基本功能跑通之后,他们就开始用 Symphony 来开发 Symphony 本身。 当他们在内部演示这个系统,看到它自主管理任务、并附上功能演示视频作为工作证明时,反应非常热烈。Symphony 的内部项目频道迅速增长,各个团队开始自发使用它。 在 OpenAI,内部产品市场契合度(PMF)是对外发布的前提条件。 基于内部的使用情况,他们决定把 Symphony 分享给外部世界。 ## OpenAI 不打算把它做成产品 这个项目开源后,三周内获得了超过 15,000 个 GitHub Star。 社区已经有人做了各种移植版本: - 有人用 Go 语言加上 Charm CLI 的终端 UI 做了一个版本 - 有人把它改造成支持 Anthropic 的 Claude Code,并支持 GitHub Issues,还做成了 Homebrew 可以直接安装 - 有人用 Claude Code 重新实现了整套规范,取名 hatice 但 OpenAI 明确说了:不打算把 Symphony 作为独立产品来维护。 它是一个参考实现,一个演示 Codex App Server 能力的例子。 核心思路很简单: > 对每一个打开的任务,保证有一个Agent在它自己的工作空间里持续运行。 他们希望大家把自己喜欢的编码代理指向这份规范,构建适合自己环境的版本。 门槛其实出奇地低,直接把规范扔给 Codex,让它帮你实现一个就行。 ## 值得思考的地方 Symphony 解决的问题,表面上是"怎么让更多 AI 并行工作",但更深层的变化是:当代码的边际成本趋近于零,整个软件开发的经济学都变了。 每次改动的感知成本下降,意味着大家开始愿意做以前觉得"不值得"的事:试一个想法,探索一次重构,验证一个假设,不满意就扔掉。 参与工作的人也变了。 产品经理和设计师可以直接向 Symphony 提需求,不需要懂代码,不需要管理 AI 会话,描述功能,然后收到一个包含视频演示的审查包。 在大型 monorepo(单一代码仓库,把所有项目代码放在一个仓库里管理)里,Symphony 还承担了"最后一公里"的工作:监视 CI 状态,需要时自动 rebase(同步最新代码),解决冲突,重试不稳定的检查项,把改动一路护送进主分支,不需要人类盯着。 随着模型越来越强,能解决的问题越来越大,其他公司的瓶颈也会从"写代码"转向"管理 AI 工作"。 Symphony 提供的,是一种思路:不要管理Agent,管理任务就够了。 > 官方原文:https://openai.com/index/open-source-codex-orchestration-symphony/

译OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具(如Linear)的任务看板作为控制中枢,为每个任务自动分配并运行一个独立的AI代理(基于Codex),直至完成。人类仅在“人工审查”节点介入,实现了从微观管理到任务级分配的转变。系统允许大粒度任务,代理能自主拆解依赖、创建新任务,并保证持续运行。初步数据显示,该方法能显著提升开发效率。

ginobefun@hongming731 · 4月29日59

斯坦福大学著名的精益创业课程在第 16 年的教学实践中,记录了一场深刻的行业范式变革。授课团队观察到,AI 技术的全面普及正在重塑初创团队的开发流程与商业验证底层逻辑。这篇文章深入剖析了课堂上的真实案例,系统揭示了智能体时代下产品构建理念和商业模式演进的核心趋势,非常值得深度阅读和思考。 首先,产品开发的物理速度正在经历前所未有的指数级提升。过去,一个初创团队通常需要耗费数周甚至数月的时间,经历组建技术团队、规划敏捷开发周期等漫长过程,才能向市场推出一个最小可行性产品。然而在今年的课堂上,学生团队在开课的第一周就带着极具完整度的高保真产品雏形来到了教室。通过利用 Perplexity 以及 ChatGPT 进行深度的行业调研,借助 Claude 与 Replit 快速完成应用构建,再结合 v0 平台实现极速原型设计,整个软件工程流水线被极度压缩。这种推崇 Vibe Coding 的全新开发哲学,让构建复杂系统变得像排版幻灯片一样简单直观。开发者完全从繁琐的底层代码编写中解放出来,将核心精力倾注于高维度的系统架构规划与 AI 工具链的协调编排上。 然而,这种极致的开发提速也随之带来了一个极为隐蔽的挑战,那就是产品构建速度与市场认知学习速度之间出现了严重的阻抗失衡。现在的团队能够毫不费力地堆砌出海量的产品功能,却往往来不及去验证这些功能是否真正解决现实世界的痛点。当借助工具生成界面的成本趋近于零时,创业者极易陷入一种思维陷阱,盲目相信代码堆积出来的产品本身就是市场需要的终极答案。这种信息过载的现象实际上构成了对寻找可复制商业模式的一种干扰。此外,过度依赖 AI 去处理日常的沟通联络和项目总结工作,也导致了人类思考深度的明显退化,让很多原本需要深度商业洞察的复盘交流退化成了缺乏灵魂的文字拼接。 在走出实验室并与真实市场环境接触的过程中,学生团队敏锐地察觉到了潜在客户心态的巨大转变。企业客户对 AI 带来的颠覆性改变感到空前警觉。他们深知面前演示的新技术方案极有可能彻底重塑现有的行业规则,甚至给传统企业带来被无情淘汰的生存危机。在这样的危机感下,企业管理者开始猛然醒悟,掌握在自己手中的专有核心数据已经成为应对这场技术冲击的最后一道防线。因此,过去那些原本乐于与创新团队分享业务场景的早期客户,现在开始谨慎地要求签署严格的保密协议。这充分表明,在应用层软件开发门槛大幅跌落的今天,独特的数据资产储备和垂直领域的深度行业认知正在成为商业竞争中最坚固的护城河。 面向更长远的未来,文章指明了软件交互方式和底层商业模式的演进路径。随着高保真产品雏形的快速普及,创业团队可以将这些早期版本作为数字孪生直接部署在云端,邀请早期核心客户参与实时的共同设计与敏捷迭代。更具颠覆性的是,整个行业正在经历从寻找产品市场契合度向寻找 Agent 与客户结果契合度的历史性跨越。传统的 SaaS 软件往往停留在工具属性的层面,要求用户自己在繁杂的仪表盘和系统工作流中进行操作。但在完全走向 Agent Native 的技术架构愿景下,客户购买技术服务的根本目的变成了直接获取最终的工作成果。未来的软件系统将由 Agent 自主完成复杂任务的拆解与执行,因此最初的最小可行性产品也将不可避免地演变为最小有效产出。 这一系列深刻的行业变化对创业团队的组织架构和商业变现方式产生了深远影响。未来的核心产品初创团队将长期保持极度精简的状态。在彻底验证商业闭环之前,他们几乎不需要引入大量的外部风险投资来支撑庞大的工程研发团队。与此同时,企业级软件的商业定价体系也将迎来根本性的重构。传统的按照系统使用人数和软件账号订阅数量进行收费的商业逻辑将逐渐被市场淘汰,取而代之的将是按照实际完成的核心工作流、按照交付的最终业务结果以及按照成功执行的具体任务来进行计费的全新模式。在这个高速发展的新时代,商业竞争的绝对焦点已经从基础技术资源的获取,彻底转移到了对真实业务痛点的精准判断力以及对 AI 智能体的高效调度能力上。

译斯坦福精益创业课程观察显示,AI工具极大提升了产品开发速度,但也导致产品构建远超市场认知学习速度,易陷入功能堆砌陷阱。企业客户将专有数据视为核心护城河,合作更趋谨慎。未来,产品开发将转向云端数字孪生与实时共同设计,商业模式正从寻找产品市场契合度转向寻找智能体与客户结果契合度。软件将从工具属性转向由智能体自主交付成果,定价模式也将按实际交付的工作流或结果计费。竞争焦点已转向对业务痛点的精准判断与对AI智能体的高效调度能力。

ginobefun@hongming731 · 4月29日46

「组织的中年」撞上「技术的青春期」 杨斌教授的演讲里分享了一个观点,认为企业在推进 AI 转型时,真正的阻力并非技术壁垒,而是习得性保持正常的「中年组织心智」(追求即期绩效、线性稳进、厌恶不确定性)与快速迭代、充满未知的「青春期技术」之间的剧烈冲突。

译杨斌教授在演讲中指出,企业在推进AI转型时,真正的阻力并非技术壁垒,而是“中年组织心智”与“青春期技术”之间的剧烈冲突。中年组织心智表现为追求即期绩效、线性稳进和厌恶不确定性,而青春期技术则快速迭代、充满未知。这种组织心智与技术要求的不匹配,使得企业在适应AI等新兴技术时面临根本性挑战。

ginobefun@hongming731 · 4月29日53

腾讯这篇文章探讨了 Harness Engineering 的核心理念,提出构建 AI 工作流仅仅是搭建管道,沉淀团队的私域与领域知识才是真正的技术「护城河」。模型与工具链会不断迭代,工作流具有可替换性,但业务领域的专有知识是可以持续积累的「复利资产」。缺乏知识沉淀的工作流往往沦为一次性消耗品,无法实现自我进化。 为此,团队设计了一套三维知识分层架构。在存储层,知识被划分为从个人偏好到项目、业务和技术共 5 个逐渐提升的层级。在类型上,涵盖了模型、决策、指南、陷阱和流程这 5 种分类。在成熟度方面,设定了从草稿、验证到可靠这 3 个递进级别,并引入了自动衰减机制以淘汰过时信息。 该知识库依托独立的 Git 仓库进行跨项目共享,作为团队知识的「单一事实来源」。团队借鉴了类似区块链的追加日志和共识机制,实现多人协作贡献与冲突自动处理。在实际运转中,工作流与知识沉淀紧密结合。启动阶段会自动注入知识全景,执行阶段 Agent 会通过 3 级渐进式索引主动按需查询,以避免上下文膨胀,而在归档阶段则会自动提取新产物反哺知识库,形成完整的生命周期闭环。 此外,团队突破了人机交互的瓶颈。传统工作流高度存在「在场依赖」,导致执行效率受限。通过引入跨设备接管和远程操控能力,团队将人工审批转变为异步模式,充分利用碎片化时间推进流程,保障了工作流能够 24 小时无缝流转,进而加速了知识沉淀的流转效率。 整体而言,该系统坚持「文件系统即状态机」的原则,将所有知识转化为可读且可版本控制的文件资产。这种模式让团队在每次需求交付中都能实现经验积累,使得新启动的任务总能站在前人的肩膀上,充分印证了领域知识在 AI 工程中的核心地位。

译腾讯Harness Engineering提出,构建AI工作流仅是管道,沉淀团队的私域与领域知识才是可持续的“复利资产”与技术护城河。团队设计了一套三维知识分层架构,并通过独立Git仓库实现跨项目共享与协作。工作流与知识库紧密集成,在启动、执行、归档阶段形成闭环。同时,引入异步审批机制突破人机交互瓶颈,实现24小时无缝流转。系统坚持“文件系统即状态机”原则,将所有知识转化为可版本控制的文件资产,确保每次交付都能积累经验。

Orange AI@oran_ge · 4月29日60

http://x.com/i/article/2049437561408356352 # 只要你学得慢,就什么都不用学 前几天看到一个朋友发了一条推,让我特别的共鸣。 在过去一年里,我们招聘的时候,也发现很多年轻人,他们很有想法 但是因为他们没有好的工具,始终无法做出他们心中的那个作品。 这种感觉我特别懂。 我在高中的时候学的理科,但在大学的时候自己选择了对外汉语专业,走上了文科生的不归路。 大学毕业的时候,才发现文科生找工作的成功率只有理科生的十分之一。 还好在大三的时候认识了一位程序员网友,大四我们一起搭档开始做黑莓手机上的软件,才碰巧进入移动互联网时代。 我一直很羡慕身边的程序员朋友,因为他们想到什么就能做出什么。 虽然我也尝试过两次自学编程,但因为各种原因,始终没能学会。 直到今年,AI 的能力出现了质的飞跃,我终于可以想到什么就做什么出来了。 我用 AI 写了语音输入法 TypeNo。又写了 Markdown 编辑器 ColaMD。 从想法到上线,都是在一天之内,中间没有找过任何一个程序员帮忙。 我还有一位同事,她平时要剪口播,最烦的一件事就是去掉说话中间那些"呃"、"然后"、"那个"的口水词。一条五分钟的视频,光去气口就能花掉半小时。她试了很多剪辑软件的自动功能,效果都不太行。 后来她打开 Cola 描述了自己的需求:我想要一个工具,能自动识别音频里的停顿和语气词,然后帮我剪掉。 来来回回聊了几轮之后,工具跑起来了,省下了大把时间。 文科生的春天 我和我的同事,我们都是文科生出身,但我们今天都可以通过 Cola 做出自己想要的任何东西。 我有个老网友叫 Anti,因为他老婆是文科生,他经常在网上调侃文科生(秀恩爱?)。 他说文科生狠起来用 AI,在一种情况下会超过懂技术的人。 这是因为人们很容易陷入认知的诅咒,默认很多事情是不可能的做出来的。 但当你什么不懂的时候,反而可以释放自己最狂野的想象,去做出最美好的作品。 今年以来,我有一个很强烈的感觉: 这个时代真正稀缺的,是想法、是审美、是那种"我就要这个结果"的执念。 你不需要懂代码。不需要会装电脑。不需要做过网站。你只要能描述你想做什么。但这里的大提前是,你需要一件趁手的兵器,一个全能的贾维斯,一个阿拉丁神灯。 这就是我们做 Cola 的目的所在。 让每一个人都能言出法随,心想事成。让每一个人都能步履轻盈地跟上时代。 你不用学 MCP、SKILL、AGENT 概念。你不用学新开话题、清空上下文、写提示词。你不用学操作电脑、制作文档、编写程序。 你甚至都不需要学会打字... 只需要把你想要的东西说出来,Cola 就会实现你的一切愿望。 只要你学得慢,就真的什么都不用学 AI 圈子里有句话叫:只要你学得慢,就什么都不用学。 这句话其实很有道理。 技术的发展一定有一个跨越鸿沟的过程,从 Geek 到大众,总需要一个发展的过程。 从 Claude Code 到小龙虾到爱马仕,门槛越来越低,但依然需要学很多东西,依然在 Geek 圈子里自循环。 而我们想直接给大众做产品,让人们使用AI就像打电话一样简单。 说实话,Cola 内测的这一个月,是我创业以来最开心的一个月。 我发现身边的朋友们,他们之前都完全不懂 AI 技术,但是却把 Cola 用得很好。 我们终于可以让身边的朋友们都跟上我们,理解我们在兴奋什么。 真的什么都不用学。 让每个人都用上 Cola! 经过一个整个春和景明的四月,五一假期终于要来了。 Cola 也终于迎来了第二轮内测。 Cola 第一轮内测的时候,用户给我们最多的反馈就是: 很好用,我爱她,但是她太贵了,我养不起... 但我们是真心希望每一个人都能用上 Cola 的。 恰好,在前几天 DeepSeek V4 发布了,那个男人,他又一次成为了价格屠夫。 定价2.5折+缓存1折,相当于直接把 Cola 的运行费用降低了100倍。 于是我们做出决定,第二轮内测,我们直接让大家免费畅玩! 现在大家下载 Cola 之后,模型选择 DeepSeek,就能直接免费使用。 我们设定的每日额度非常大,应该够所有内测用户使用。 如果真到上限了,我们再看情况调整。 希望每一个人都能用上 Cola。 希望每一个人和 AI 一起灵魂共鸣,一起随心创造。 祝你五一快乐,祝你永远都在时代的浪潮之巅。 Cola 内测第二轮邀请码:Cola2-7CFADEFQ Cola 的下载地址: ColaOS.ai 目前只支持 Mac 电脑,对不起 Win 用户,我们预计 5月底支持。 同时强烈建议购买 Macbook Air 和 Mac mini。 投资自己永远是最好的投资。

译作者以文科生经历指出,过去因缺乏技术工具难以实现想法。如今借助AI,其团队开发的Cola平台让非技术人员无需编程,仅通过描述需求即可快速创建应用,如自动剪辑语气词的工具。作者强调,AI时代稀缺的是想法与审美,而非技术技能。Cola旨在像打电话一样简单使用AI。平台近期因集成低成本DeepSeek V4模型,开启第二轮免费内测,目前支持Mac设备,目标是让每个人都能轻松跟上技术浪潮,实现“言出法随”。

阿绎 AYi@AYi_AInotes · 4月29日51

我最近才真正读懂NVIDIA CEO Jensen Huang那句被转烂了的话: 你不会因为AI丢掉工作,你会输给那些会用AI的人。 以前我以为他说的是你要学会怎么用AI怎么写好prompt, 现在才发现根本不是这个意思,因为现在所有的builders正在分裂成两种人。 第一种人,把AI当高级搜索栏, 一个聊天窗口,一个顶级模型,凡事都丢进去问。 但实际上他自己就是整个流程里的瓶颈,所有的规划,协调,纠错,全靠他自己。 效率最多翻个两三倍,到头了😂 第二种人,把AI当一整支劳动力队伍。 有意思的是 90%装了CrewAI跑多代理脚本的人,其实是第一种人🌚 他们只是把单 Agent 的聊天窗口,换成了多 Agent 的控制台。 最后还是要自己盯着每一步,出一点错就全崩。 而真正的第二种人,已经把自己从执行者的位置上彻底抽出来了。 他不写prompt,而是写工作说明书, 他不做决策,而是定决策规则, 他不纠错,而是建审查机制, 他是这个AI团队的CEO,不是他们的同事。 所以这才是100倍交付速度的真正秘密, 不是说AI比人聪明,关键是你再也不用再自己干所有的活了。 你可以同时跑十个项目,每个项目都有一支完整的团队在24小时推进。 这不是什么未来的科幻,现在已经有人跑着MRR几万刀的SaaS,整个公司只有他一个人。 当然这东西现在还很糙,代理会吵架,会跑偏,会犯很蠢的错误, 但我觉得这都不是大问题,关键是你愿不愿意把自己的身份,从一个做事的人,变成一个设计系统的人。 黄仁勋说AI是史上最伟大的平等器,但我觉得平等的不是每个人都能用AI。 真正平等的是现在每个人都有机会,拥有一支属于自己的无限劳动力队伍。 而那些还在跟AI大模型单聊的人,很快就会被甩得看不见尾灯。

译NVIDIA CEO黄仁勋的观点揭示了AI应用的两种路径:一种是将AI视为高级搜索工具,用户自身仍是流程瓶颈;另一种是将AI作为完整的劳动力系统,用户通过设计工作说明书、决策规则和审查机制,从执行者转变为系统设计者,实现百倍效率提升。蚂蚁发布的Ling-2.6-1T模型以高智能-输出比和极低token成本,解决了Agent规模化应用的成本痛点,推动行业竞赛从参数刷榜转向生产落地。这标志着个人拥有高效AI团队成为可能,而仅与AI单聊的模式将被淘汰。

Rohan Paul@rohanpaul_ai · 4月29日59

GitHub is hitting a breaking point as AI coding agents flood the platform with far more commits, pull requests, searches, and CI jobs than its older infrastructure was built to handle. Mitchell Hashimoto, one of GitHub’s earliest users, is moving Ghostty, a project with 52 stars, after repeated outages turned everyday maintenance into blocked reviews, stuck merges, and failed automation. AI does not just generate more code. It generates more repository events, more pull requests, more tests, more builds, more retries, and more logs. That changes the load shape of a platform built for human pacing. A developer who once pushed a few careful changes can now push many AI-assisted iterations in the same span, and every iteration wakes up CI, indexing, storage, and review systems. The bottleneck is no longer writing code. It is absorbing code.

译AI编程代理的普及正使GitHub基础设施面临极限压力。这些工具不仅生成更多代码,更导致提交、拉取请求、搜索和CI任务等仓库事件数量激增,彻底改变了平台原本为人类节奏设计的工作负载形态。开发者现可在短时间内推送大量AI辅助的迭代,每次迭代都会触发CI、索引、存储和审查系统,使瓶颈从编写代码转向消化代码。这种过载已影响日常维护,导致评审阻塞、合并卡顿和自动化失败。作为例证,GitHub早期用户Mitchell Hashimoto因其项目Ghostty反复遭遇服务中断,最终决定将项目迁出他使用了18年的GitHub,这标志着一个时代的转变。

ginobefun@hongming731 · 4月29日30

罗永浩的真诚与直率,碰上蔡康永的通透与温和,催生出了很多反直觉却又极其真实的洞察。 BestBlogs 为你提炼了这场播客中最具价值和思考深度的 10 个观点。你可以把它们作为收听这期节目的罗盘,带着这些问题去聆听他们的完整对话: 1. 真正的“高级鸡汤”是建立在虚无之上的积极选择 大众对心灵鸡汤往往带有反感,因为它总是在智力上偷懒,盲目乐观地否认痛苦。但蔡康永的文字之所以有力量,是因为他的底色是存在主义和温和的虚无主义。他是在承认人生最终必然走向衰亡与虚无的前提下,依然教人如何寻找与痛苦共存的路径,做出积极的选择。这不叫麻痹神经的迷幻药,这是精神荒野里的罗盘。 2. 重新定义“自律”:剥离道德绑架,认清“出厂设置” 我们常把按时早起或吃得少夸赞为意志力强大的自律,而把起不来床、吃得多指责为懒惰和贪婪。罗永浩通过自己的经历指出,很多所谓的自律,其实只是基因带来的生物学出厂设置不同。有的人睡懒觉会生理性难受,有的人吃一碗饭就生理性满足。认清这一点,能让我们对别人少一点无情的嘲笑,对自己也多一份底层的和解与宽容。 3. 告别创伤的良药:创造属于自己的“仪式感” 面对失去挚爱且久久无法走出的伤痛,蔡康永给出了一个极其温柔且治愈的方案:真正的仪式感不是被动接受那些充满杂质的商业节庆,而是自己发自内心创造的羁绊。 带着逝去之人的照片,去完成他生前想做却没做的事(比如走遍 20 个国家)。把这份情感放在心中一个正确且重要的位置供奉起来,化作继续好好活下去的动力,这才是对感情最好的交代。 4. 生命的意义如同“烤面包的香味”,只在过程中诞生 我们常常陷入一种“永远在为下一阶段做准备”的荒谬心态中,中学为了考大学,大学为了好工作,工作为了买房。蔡康永用蝉作比喻:蝉在地下蛰伏十几年,并不是无聊的准备期,那本身就是它生命的一部分。人生的意义就像烤面包的香味,是在你揉面、烘焙的过程中自然散发出来的。 如果你只是空想而不投入去做,那个意义是永远找不到的。 5. 面对 AI 时代:把剥夺感转化为“被解放”的自由 面对 AI 惊人的创作力,许多人感到过去积累的技能被剥夺而陷入绝望。蔡康永却觉得“松了一口气”。与其把 AI 看作竞争对手,不如把它当成高效的合作对象。它解放了创作者在执行层面的巨大压力(比如花费几十年写一部巨著),让我们可以直接专注于故事内核与影视化转化。在大家都在经历旧知识贬值时,这也意味着所有人都获得了一次重新出发的自由。 6. 允许自己“适度冷漠”,把热情留给对的人 我们常常被教导要成为一个“温暖的人”,但过度消耗热情恰恰是烦恼的根源。蔡康永提出,维持冷淡的社交关系其实是一种自我保护。不在乎的人,没必要装出多余的温暖;把宝贵的精力与热情,精准地倾注在你真正在乎的人身上,这才是健康且可持续的人际关系边界。 7. 线下真实触碰的不可替代性 在一个连电影名著都习惯看“5分钟解说版”、万物皆可数字化的时代,人与人同处一个物理空间的真实接触反而成了稀缺品。蔡康永举办艺术展,就是为了找回这种“必须走近才能看清、看懂后会潸然泪下”的物理力量。无论 AI 多强大,脱离了屏幕的真实呼吸感和人际连接,依然是无可替代的。 8. 找到自己在时代和命运里的“站位” 罗永浩坦言自己年轻时像个“李逵”,只想找个好大哥(宋江)跟着冲锋陷阵,但命运阴差阳错把他推到了一号位。人到中年,最大的和解之一就是认清并接受自己被设定好的角色。不是每个人都要当曹操,也不是每个人都能当诸葛亮。看清自己到底是战将还是主帅,就能省去很多不必要的精神内耗。 9. 拥抱衰老的真相:每天都有不断推翻过去的“新发现” 衰老往往伴随着体能退化和记忆衰退,它打破了人对自己无所不能的幻觉。但这并非只有悲伤。50岁以后的生命体验,会推翻很多年轻时坚信不疑的概念。带着好奇心去审视自己的衰老,去体会因年龄增长而带来的更开阔的眼界和更深度的审美,这本身就是一种充满乐趣的新冒险。 10. 直面死亡的达观:甚至可以带点幽默感 把死亡当成禁忌和脏字,是一种不够成熟的心态。真正的乐观,是直视死亡的存在。可以提前写好遗嘱,规划自己的告别方式,甚至在墓碑上开个玩笑(比如刻上“生前打麻将胡过大四喜”)。当你不把死亡当回事,死亡就不会成为笼罩你生命的阴影。

译罗永浩与蔡康永的播客对话提炼出诸多深刻洞察。蔡康永认为,真正的积极选择建立在承认人生虚无的基础上;自律差异多源于基因“出厂设置”,而非道德优劣;面对AI冲击,应将其视为解放创作的工具。人际交往中,适度的冷漠是保护精力的智慧,而线下真实接触具有不可替代的物理力量。罗永浩则指出,人到中年需认清自己在时代中的角色站位,以减少内耗;衰老是不断推翻旧观念的新冒险;直面死亡时甚至可以带有幽默感,以此打破禁忌。

Deedy@deedydas · 4月29日54

What do the smartest kids in the world do when they grow up? I did the largest study of ~18,000 International Olympiad medalists (IMO, IOI and IPhO) over the last 25yrs, arguably the sharpest analytical minds of the world in high school, to see where they ended up and traced ~50% of them. Founders of ~20 unicorns and ~7 decacorns and ~10 billionaires: OpenAI, Cursor, Stripe, Databricks, Perplexity, Ethereum, Cognition, Hyperliquid, Fireworks, Modal, Quora, Parallel, Cartesia, Wispr Most kids went to MIT, a whopping 12% of them, followed by Cambridge (7%) and Sharif (3%)! The career paths they chose (of those who graduated) were: — 36% Academia (professors) — 26% Other — 22% in Software / Tech — 12% in Quant / Finance — 5% Founders! The biggest employer was Google, by far, at 6%. Others interesting tidbits were: — 47 of them work at Jane Street (#3) — 38 at OpenAI (#5) — 15 at Anthropic — 8 at Cognition — 6 at Isomorphic Labs Olympiaders were 1500x more likely to be billionaires and 4000x more likely to be unicorn founders than the average person!

译一项针对近25年来约1.8万名国际奥赛奖牌获得者的追踪研究显示,在可追踪的约50%人群中,36%进入学术界成为教授,22%投身软件或科技行业,12%进入量化金融领域,5%成为创业者。他们已创立约20家独角兽和7家十角兽企业,并产生了约10位亿万富翁,其成为亿万富翁和独角兽创始人的几率分别比普通人高出1500倍和4000倍。谷歌是最大雇主,MIT是其最集中的母校。这些顶尖人才在科技创新与学术领域贡献显著。

歸藏(guizang.ai)@op7418 · 4月29日46

Ghostty 的负责人今天说他会离开 GitHub。 这哥们在 GitHub 有 5 万多的粉丝,每天都有提交,是重度的 GitHub 使用者。 他的意思是,GitHub 现在频繁的故障和不稳定的服务已经严重影响了开发工作,导致他觉得这里不再适合进行严肃工作。 因此,他会把所有的重度开发工作都迁移到自建的服务上,GitHub 之后只保留代码库。 目前主要影响的内容是: Actions、PR、Issues 等配套服务经常挂掉,导致他没办法进行代码评审和跑 CI 合并。 我感觉这是一个非常大的机会。 在 AI 时代,GitHub 事实上已经变成了所有 Vibe Coding 最重要的基建之一,但现在微软显然没有办法应付这套东西。 所以,如果哪个平台能够提供一个更适合 AI、更适合 AI Agent 的 Git 服务,可能会有很大的机会。

译Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务,仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户,他指出 GitHub 频繁的故障已严重影响开发,特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为,在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施,但微软难以维持其可靠性。这揭示了一个市场机会:若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务,将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。

阿绎 AYi@AYi_AInotes · 4月29日52

我终于想明白,为什么Karpathy的LLM Wiki模式,在自主Agent身上完全行不通了。 这个曾经火遍全网的第二大脑方案,完美解决了人类和AI协作的遗忘问题,把知识固化成了可迭代的持久文件。 但很可惜它从一开始就是给人类设计的,不是为24小时不停运行的Agent设计的。 人类喜欢读整页,浏览,手动修正,Agent只需要单个事实,状态,偏好。 人类能容忍多读点无关内容,Agent多塞100个无关token,成本和幻觉风险就会线性上升。 人类偶尔手动更新笔记,Agent每做一个决策,每调用一次工具,都要写入记忆。 看起来对人足够优雅的笔记系统,对机器来说就是彻头彻尾的结构性浪费。 所以下一代Agent的记忆,必须是分层的,Markdown留给人类阅读和编辑,结构化内存留给机器高效运转。 这才是Agent能真正长期可靠运行的核心前提。

译Karpathy的LLM Wiki模式作为“第二大脑”,虽解决人类与AI协作的遗忘问题,但专为人类设计。人类可容忍浏览整页、手动更新,而Agent需高效获取单个事实、对无关内容敏感、频繁写入记忆。现有系统对Agent构成浪费,因此下一代Agent记忆必须分层:Markdown供人类编辑,结构化内存供机器高效运行,这是Agent长期可靠的核心前提。

宝玉@dotey · 4月29日62

http://x.com/i/article/2049282533364215808 # AI 的经济账根本算不通 作者:Ed Zitron 原文:AI's Economics Don't Make Sense 昨天早上,GitHub Copilot 用户终于得到了一个确认:我一周前报道过的那件事成真了——从 2026 年 6 月 1 日起,所有 GitHub Copilot 计划都将改为按用量计费(usage-based pricing)。 以前,微软会给用户一定数量的“请求(requests)”。现在,它要根据用户实际使用模型的成本来收费。微软把这称为“……朝着一个可持续、可靠、面向所有用户的 Copilot 业务和体验迈出的重要一步”。换句话说,用户每月订阅 GitHub Copilot 花多少钱,就得到等值的 token(词元,token)额度,比如每月 19 美元的套餐,就给你 19 美元的 token。 > 翻译一下:“我们不能再继续补贴 GitHub Copilot 用户的算力了,否则 Amy Hood 会拿棒球棍开始揍人。” 不管怎样,这份公告本身很有意思。它提前展示了这些涨价将会被包装成什么样: > Copilot 已经不是一年前的那个产品了。它已经从编辑器里的助手,演变成了一个智能体式平台(agentic platform)。它能运行长时间、多步骤的编程会话,使用最新模型,并在整个代码库中反复迭代。智能体式使用正在成为默认方式,而这会带来明显更高的计算和推理(inference)需求。 > 今天,一个快速的聊天问题,和一次持续数小时的自主编程会话,可能让用户付出同样的价格。GitHub 一直承担了这类使用背后不断攀升的推理成本,但目前的高级请求模式已经不可持续。按用量计费可以解决这个问题。它能让定价更好地对应实际使用情况,帮助我们维持长期服务可靠性,也减少我们限制重度用户的必要。 你看,问题并不是“微软一直在补贴将近 200 万人的计算成本”,而是“AI 已经变得太强、太 powerful、太复杂了,所以它基本上已经是另一个产品了!” 也许 Copilot 的确已经不是“……一年前的那个产品”,但底层的经济错配并没有发生太大变化:微软连续 三年 允许用户每个月烧掉超过订阅费本身的 token 成本。根据 《华尔街日报》2023 年 10 月的报道: > 个人用户每月为这款 AI 助手支付 10 美元。今年最初几个月,该公司平均每位用户每月亏损超过 20 美元。一位熟悉相关数字的人士说,有些用户每月给公司造成的成本高达 80 美元。 很自然,GitHub Copilot 用户正在反抗。他们说这个产品已经“死了”,已经“彻底毁了”。 而我两年前就在《次贷式 AI 危机》(Subprime AI Crisis)里预言过这一点: > 我假设一种次贷式 AI 危机正在酝酿:几乎整个科技行业都买进了一项以极低折扣出售的技术,而这项技术高度集中,并由大型科技公司大量补贴。总有一天,生成式 AI(Generative AI)那惊人且有毒的烧钱速度会追上它们。结果就是涨价,或者公司推出新产品和新功能时附带极其苛刻的费率——比如 Salesforce 的“Agentforce”产品那种离谱的每次对话 2 美元收费——最后连那些预算充足、最忠诚的企业客户也无法证明这笔支出是合理的。 如今,这一天终于到了。因为你使用的每一项 AI 服务都在补贴算力,也因为每一项服务都因此在亏钱: > 当你付费使用一家 AI 创业公司的服务时——当然,这也包括 OpenAI 和 Anthropic——你通常是按月付费,比如 Anthropic 的 Claude 有 20 美元、100 美元或 200 美元/月的计划,Perplexity 有 20 美元或 200 美元/月的计划,OpenAI 则有 8 美元、20 美元或 200 美元/月的订阅。在一些企业使用场景中,你会拿到用于完成某些工作单位的“点数(credits)”。比如 Lovable 的 25 美元/月订阅给用户“每月 100 点”,还附带 25 美元(截至 2026 年第一季度末)的云托管额度,未用完的点数还能跨月滚存。 > 当你使用这些服务时,相关公司就要为你调用的 AI 模型付钱。它们要么按每百万 token 的价格向某个 AI 实验室付费,要么——像 Anthropic 和 OpenAI 那样——向出租 GPU 运行模型的云服务商付费。一个 token 大约相当于 3/4 个单词。 > 作为用户,你感受到的不是 token 的燃烧,而只是输入和输出的过程。AI 实验室用“token”“消息”或者 5 小时速率限制加百分比进度条来掩盖服务成本。你作为用户,并不知道这些东西到底值多少钱。而在后台,AI 创业公司正在疯狂烧钱,直到最近之前都是如此。 > Anthropic 曾允许你每花 1 美元订阅费,就烧掉超过 8 美元的计算成本。OpenAI 也允许类似的事情发生,只是很难衡量具体比例。 AI 创业公司和超大规模云服务商(hyperscalers)曾以为,只要用补贴过的亏钱产品把足够多的人拉进门,让他们深度依赖这些服务,等公司大幅涨价时,用户就不会离开。我想,它们还以为 token 成本会随时间下降。但现实恰恰相反:虽然_某些_模型的价格可能下降了,新的“推理模型(reasoning models)”却会烧掉更多 token,这意味着推理成本不知怎么地反而随着时间变高了。 这两个假设都是错的。因为对于任何接入大语言模型(Large Language Model,LLM)的服务来说,按月订阅模式_根本不合理_。 ## 生成式 AI 的核心经济账已经坏了 可以这样想。当 Uber(不,这件事一点也不像 Uber)开始提高打车价格时,它的底层经济结构并没有改变,呈现给乘客和司机的结构也没有变:用户为一次乘车付钱,司机为一次接单获得报酬。司机仍然要支付油费、车险、地方政府可能要求的各种许可证费用,以及车辆融资相关成本;这些成本并没有由 Uber 补贴。Uber 的巨额亏损来自补贴、无休止的营销支出,以及在无人驾驶汽车等方向上注定失败的研发投入。 ## 生成式 AI 订阅和 Uber 完全不是一回事 为了说明 AI 定价错配的规模,我想让你想象另一个历史版本:在那个世界里,Uber 的商业模式完全不同。 生成式 AI 订阅就像 Uber 每月向用户收 20 美元,然后允许用户坐 100 次车,只要每次不超过 100 英里都行;与此同时,汽油价格是每加仑 150 美元,而且油钱由 Uber 来付,因为有人坚持认为总有一天石油会便宜到不值得计量。 最终,Uber 会决定开始向用户收取一个月费,让他们获得叫车资格,然后再按他们消耗的汽油收费。突然之间,用户从每月 20 美元坐 100 次车,变成了先付 20 美元才能接触到司机,再为一次 10 英里的车程支付 26 美元。可以理解,用户会有点不爽。 这听起来有点夸张,但其实相当准确地描述了生成式 AI 行业正在发生的事,尤其是 GitHub Copilot 正在发生的事。 GitHub Copilot 之前的定价允许用户每月使用 300 次高级请求,同时还可以使用 GPT-5 mini 之类的模型发送“无限聊天请求”。每一次请求,用微软自己的话说,就是“……你要求 Copilot 为你做某事的任何互动”。在请求制生命周期的后期,更昂贵的模型会消耗更多请求额度,比如 Claude Opus 4.6 会消耗 3 次高级请求。当你用完高级请求后,Copilot 会允许你在当月剩余时间里随便使用那些更便宜的模型。 而且这甚至还不是一开始的情况。直到 2025 年 5 月之前,微软都在给用户无限制使用模型的权限。即便后来只是开始加一点限制,用户也已经非常愤怒,因为他们不接受这个产品有_任何_限制。 微软——就像每一家 AI 公司一样——用一个不可持续的服务骗了自己的客户。因为用月费订阅来销售由 LLM 驱动的服务,从来、从来就没有合理过。 如果你想知道按 token 计费后服务可能会有多贵,GitHub Copilot Subreddit 上有位用户发现,过去一次高级请求的 token 消耗大约价值 11 美元。原因是一次“请求”可能会在上下文窗口(context window)里使用 60,000 个 token,调用几个工具,并经历一堆内部“轮次(turns)”——也就是模型为了生成结果在后台做的那些步骤。 这里还存在一个更底层的问题:大语言模型很容易产生幻觉(hallucination)。当一次高级请求原地打转、吐出一堆半坏不坏的代码时,这当然很烦。但如果你是自己为这次失败买单,这种失误就没那么容易原谅了。 用户也已经被训练成用一种完全不同于 token 计费的方式来使用产品。我想,很多人根本没有真正意识到自己会烧掉多少“token”,也不知道某个具体任务需要多少 token。而这个数字还会根据你使用的模型不同而变化。 这_绝对不是 Uber 那套逻辑_。任何告诉你两者相同的人,都是在为糟糕行为找借口。Uber 可能涨过价,但它并不需要彻底改变平台的底层经济结构,用户也不需要因为 Uber 突然按每加仑汽油计费,就完全改变自己使用产品的方式。 ## AI 月费订阅全都是 AI 补贴骗局的一部分:它们故意把生成式 AI 和真实成本切开 如果不按每个用户_实际烧掉的 token_ 来收费,基于 LLM 的服务从来就没有、也永远不会有经济上可行的提供方式。而这些公司在欺骗用户的过程中,创造出了一批收益虚幻、投资回报可疑的产品。 这一点其实_多年来都明摆着_。 从经济学上讲,月费订阅只适用于成本相对稳定的业务。健身房可以卖会员,因为它大致知道器材会有多少磨损,课程运行成本是多少,以及一定时间内电费、人工、水费等开销大概是多少。 Google Workspace 的客户——至少在 AI 进入之前——成本主要来自访问或存储文档的成本,以及 Google Docs 和其他服务的持续运行成本。数字存储成本相对低,而且不像 LLM,Google Workspace 对计算资源的需求并不特别高。所以即便某个 Google Drive 用户特别重度使用,也不太可能吃掉其月费订阅的利润率。 但 AI 订阅用户的成本可能_剧烈波动_。一个用户可能只是偶尔用 ChatGPT 搜索一下;另一个用户可能塞进大批文档,或者尝试重构整个代码库,或者让它帮自己做 PowerPoint 演示文稿。而服务提供方——无论是 OpenAI 或 Anthropic 这样的模型实验室,还是 Cursor 这样的创业公司——除了让产品变差之外,几乎没有真正办法控制用户会怎么用。比如设置使用上限、缩小上下文窗口、把用户推向更小也更差的模型,或者改变价格来吓退那些会发起大量消耗 GPU 请求的用户。 可是,这些服务有意隐藏 token 数量,也隐藏某项活动到底花了多少钱。结果就是,用户并不真正知道速率限制意味着什么。于是每一次突然调整速率限制,都会让客户手忙脚乱地试图弄清楚自己到底还能用这项服务完成多少实际工作。 这是一种虐待式、操纵式、欺骗式的做生意方式。它存在的唯一原因,就是 Anthropic、OpenAI 和其他 AI 公司要扩大用户基数。因为大多数 AI 用户感受到的真实或想象中的收益,都建立在这样一个前提上:他们每支付 1 美元订阅费,就能烧掉8 到 13.50 美元不等的 token。 这种有意的欺骗只有一个目标:确保大多数人永远不会接触到生成式 AI 的真实成本。当 《大西洋月刊》激情洋溢地把 Claude Code 描述成 Anthropic 的“ChatGPT 时刻”时,它讨论的是一个每月 20 美元的订阅,而不是 Anthropic 为提供这项服务在底层实际烧掉的 token 成本。也正因为如此,作者才会原谅模型犯下的“轻微错误”,或者原谅它在“更复杂的编程任务上卡住”。 如果那位作者支付的是自己真实烧掉的 token 成本,而且每次模型“卡住”都会带来 15 美元的 token 账单,我不认为她会对这些失败如此宽容。 但这正是骗局的一部分。 非常、非常重要的一点是:主流媒体中写 AI 的人绝不能真正理解这些服务的成本。任何关于 ChatGPT 或 Claude Code 这类服务的主流文章,都最好由那些几乎不知道单个任务会让用户花多少钱的人来写。 请记住:生成式 AI 服务在很大程度上是实验性产品。它们不像任何其他现代软件或硬件那样运行。你不能只是走到 ChatGPT 或 Claude 面前,就让它开始为你干活。 我的意思是,你_当然可以_这么做。但如果你的提示词写得不对,不理解它的工作方式,输入材料有错误,或者它自己就是弄错了,它就会吐出你不满意的结果。然后你又得重新提示它。LLM 本质上不可预测。 你无法保证某个 LLM 一定会执行某个动作,也无法保证它会给出基于现实的结果。你无法确定某个任务——哪怕是你过去用 LLM 做过很多次的任务——到底会花多少钱。你也无法确定模型什么时候会突然发疯并删除某些东西,或者根本没做某件事却声称自己做了。 如果你不是按 token 付费,这些问题会更容易被原谅。因为在订阅用户心里,这只是和聊天机器人多来一两轮,而不是正在产生真实成本。人们也不会太严厉地批评所谓的“锯齿状智能(jagged intelligence)”——(指 AI 在某些任务上表现惊人,在另一些看似简单的任务上却莫名失败,能力边界很不平滑)——因为大家默认你现在遇到的问题未来总会被解决,而且反正你也没有为失败额外付钱。 如果用户一开始就必须按真实费率付费,我想很多人会立刻放弃这个产品。因为当你只是胡乱探索 LLM 能做什么时,非常非常容易就烧掉 5 美元的 token。 > **旁注:**事实上,你可能花掉一大笔钱,却始终得不到想要的结果,因为 LLM 根本不是真正意义上的人工智能!一个并不了解其局限的人,很容易花掉 30 美元、50 美元,甚至 100 美元,去试图说服一个 LLM 做某件它_坚称_自己能做的事。这里有个术语:谄媚(sycophancy)。LLM 常常被设计成会肯定用户,哪怕用户在 > 说一些危险而失控的话。这种倾向也可能延伸到这种场景:“你想要这个巨大到技术上或财务上都一点也不可行的东西?”没问题!这就是为什么整个行业如此努力地掩盖这些成本——因为这他妈就是在宰人! 我认为,大多数 AI 订阅服务转向按 token 计费是不可避免的。尤其是 Anthropic 和 OpenAI 现在都已经对企业客户这么做了。 微软把 GitHub Copilot 订阅用户改成按 token 计费,同样是一个非常、非常糟糕的信号。微软可以说是资本最充足、利润最高、也最有条件继续补贴算力的公司。如果连它都负担不起继续补贴,那么其他公司也负担不起。 真正需要关注的信号——一匹真正的苍白之马——会是 Anthropic 或 OpenAI 这样的主要 AI 实验室,把_所有_订阅用户都转向按 token 计费。**(“苍白之马”暗指《启示录》中象征死亡的马,这里指灾难性转折信号。)**一旦那件事发生,你就会知道:打烊时间到了。 ## 普通公司负担得起按 token 计费吗?Anthropic 估计 Claude Code 用户每天花 13 到 30 美元,每年 7,000 美元以上;大型组织每年会花几十万甚至几百万美元 正如我上周讨论过的,Uber 的 CTO 在一次会议上说,公司在几个月内就花完了 2026 年的全部 AI 预算。高盛也指出,有些公司在 AI token 上的支出,已经高达其人力成本的 10%,并且可能在接下来几个季度升至 100%。 这是训练每个 AI 用户尽可能多地使用这些服务、同时掩盖真实成本的直接结果。每一家要求所有员工“尽可能多用 AI”的大公司,要么从根本上忽视了自己的真实 token 消耗,要么与这件事完全脱节。而当公司被迫支付_实际成本_时,我不确定你还能如何从经济上证明对这项技术的_任何_投资是合理的。 当然,当然,你会说工程师“交付代码更快”之类的屁话,我懂。但问题是:到底快了多少?因此你赚了多少钱,或者省了多少钱? 如果你把相当于人力成本 10% 的钱花在 AI token 上,你是否在其他地方获得了抵消这笔额外支出的收益?我不确定你有。我也不确定_任何_一家把巨额资金投入 token 的企业,看到了_任何_投资回报。这也就是为什么每一项关于 AI 投资回报率的研究,都很难找到它存在的证据。 大体上,你读到的那些对生成式 AI 的各种可能性兴奋到失态的人,都没有支付过它的真实成本。每一个在 Twitter 上长篇大论,说自己整个工程团队都在猛敲 Claude Code 的疯子,用的都是每人每月 125 美元的 Teams 订阅,其使用限制和 Anthropic 每月 100 美元的消费者订阅相近。每一个在 LinkedIn 上像怪物一样宣称自己用某个 Perplexity 产品“几分钟完成了几个小时工作”的人,最多也只是为 Perplexity 的 Max 订阅每月支付 200 美元。 现实中,一个 10 人团队、每月 1,250 美元的 Teams 订阅,很可能每月在 API 调用上烧掉 5,000 到 10,000 美元,甚至更多。Anthropic 增长负责人 Amol Avasare 上周说,其 Max 订阅本来是为重度聊天使用而设计的,并不是为人们用 Claude Code 和 Cowork 做的那些事情设计的。他还明确表示,Anthropic 现在正在寻找“不同选项,以继续提供优秀体验”。换句话说,就是“我们迟早要改价格”。 我不确定人们是否意识到这些 token 有多贵,尤其是涉及大型代码库、并且经常调用编程工具和基础设施工具的编码项目。一个每月支付 200 美元的人,能预见性地承担 350、400 或 500 美元吗?他们能承受某个月花得_比这还多_吗?如果他们超预算了怎么办?如果他们真的付不起完成工作所必需的钱,又怎么办? 举个更实际的例子。直到 4 月初,Anthropic 自家的 Claude Code 开发者文档(存档)还写着:“Claude Code 用户的平均成本是每位开发者每天 6 美元,90% 用户的每日成本低于 12 美元。”截至本周,文档已经改成了这样: > Claude Code 按 API token 消耗量收费。订阅计划价格(Pro、Max、Team、Enterprise)请见 claude.com/pricing。每位开发者的成本差异很大,取决于模型选择、代码库大小,以及使用模式,比如运行多个实例或自动化流程。 > 在企业部署中,平均成本约为每位开发者每个活跃日 13 美元,每位开发者每月 150 到 250 美元;90% 用户每个活跃日成本低于 30 美元。若要估算自己团队的支出,请先从小规模试点小组开始,并使用下面的跟踪工具建立基线,再进行更广泛部署。 如果我们假设一个月平均有 21 个工作日,那么 Claude Code 用户的平均成本约为每月 273 美元,或每年 3,276 美元。如果按每个工作日 30 美元计算,就是每月 630 美元,或每年 7,560 美元。 这些数字_惊人_,更惊人的是:如果你使用 Anthropic 最近的任何模型,你根本不可能只花每天 30 美元。Claude Opus 4.7 的价格是每百万输入 token 5 美元、每百万输出 token 25 美元。“100 万 token 大约等于 50,000 行代码”。如果你使用所谓最先进的模型,你不可能不跑过_至少_100 万 token;如果你并不特别清楚某项任务该用哪个模型,这个数字还会大幅上升。 我们再拿每天 30 美元这个数字多算几下。 - 对一个 10 人开发团队来说,这就是每年 75,600 美元,而且我们只算工作日。 - 如果仅仅三个月的平均费用升到每个工作日 50 美元,总额就会变成 88,200 美元。 - 如果再有一个月每天超过 100 美元,你一年就要花 102,900 美元。 - 如果你每天花 300 美元,那么一个 10 人团队一年在 token 上就要花 756,000 美元。 在资金充裕的创业公司那种“小金库心态”里,或者像 Meta 这样的香蕉共和国里,这也许还能发生。但任何真正关心成本的企业,都会非常难以证明:为一个“提高生产力”的服务多花五位数或六位数成本是合理的,而这种生产力提升又似乎没人能衡量。 现在我认为大多数公司分成三类: - 像 Spotify 或 Uber 这样的大型组织,企业部署规模巨大,CEO 已经被 AI 洗脑,允许预算失控。我也会说,大型、资金充裕的创业公司也属于这一类。 - 使用有补贴的“Teams”订阅的小型创业公司。 - 每月付费使用 Claude 或其他 AI 订阅的个人用户。 大型组织现在仍然可以拿到一张免罪牌,说自己在 AI token 上为软件工程师烧掉几百万美元,并把理由包装成它们“最优秀的工程师”不再写一行代码这样可疑的好处。 但只要一次糟糕的财报电话会议,这个叙事就会改变。某个时候,投资者——哪怕是那些一直把 AI 泡沫吹起来的没脑子的蠢货——也会开始质疑不断上升的研发成本(AI token 消耗通常就藏在这里),尤其当公司的收入增长跟不上时。这可能会导致更多裁员,以赶上成本,就像 Meta 的情况一样。然后,当有人问出“这些玩意儿到底有没有让我们更快或更好地完成工作?”时,最终就会出现收缩。 我还认为,那些在 AI token 上烧掉相当于人力成本 10% 甚至更多的创业公司,六个月后会很难说服投资者:这么做是必要的。 一旦所有人都切换到按 token 计费,我不确定我们还能看到围绕生成式 AI 的这么多炒作。 ## AI 数据中心和算力的经济账也算不通 人们谈论 AI 数据中心的方式,已经完全脱离现实。我不认为他们意识到整个时代已经荒唐到什么程度。 ## AI 数据中心建起来很贵,运行起来也很贵,但实际收入很少 根据 TD Cowen 的 Jerome Darling 的说法,每兆瓦数据中心容量需要约 3,000 万美元的关键 IT 设备(GPU 及相关硬件),以及 1,400 万美元的数据中心容量成本。数据中心看起来需要一年到三年不等才能建成,具体取决于规模,而且前提是电力供应可用。 在据称到 2028 年底要建成的 114GW 数据中心中,只有 15.2GW 处于某种形式的建设状态。而“在建”可以只是“地上挖了个坑”。这绝不意味着、也不应该意味着该设施即将提供的容量马上就能上线。 > **侧栏:**如果你对这里更深入的数学感兴趣,请订阅我的付费通讯,这样你就能看到我的 “混蛋数据中心模型”。这个模型是在多位分析师和超大规模云服务商消息源协助下建立的。 我们先从简单的开始:以后每当你想到“100MW”,就把它理解成“44 亿美元”,其中相当大一部分会花在 NVIDIA GPU 上。 结果就是,每个 AI 数据中心一开始就背着数百万美元的坑。即便采用 6 年折旧(depreciation)周期,也需要_很多年_才能回本。而且由于 NVIDIA 的年度升级周期,等你完成第一份客户合同后,那些 GPU 很可能已经赚不了多少钱了。 目前还不清楚,除了 OpenAI 和 Anthropic 之外,AI 算力是否真的存在足够大的客户群。OpenAI 和 Anthropic 的需求占在建 AI 数据中心的 50%。如果其中任何一家没有钱付款,就会形成巨大的系统性弱点。 无论如何,这些数据中心的持续收费标准也并不清楚。虽然 B200 GPU 的现货价格可能在每小时 4.50 美元左右,但长期合同通常价格低得多。根据 The Information 的报道,一位创始人说他们为期一年的承诺,价格约为每 GPU 每小时 3.70 美元。 必须说清楚的是,我们_必须_区分_现货_成本和合同算力。现货成本指的是你随机在别人服务器上启动 GPU 的价格;合同算力则构成了大多数数据中心资本开支(capex)。大多数数据中心都是为了拥有_一两个大客户_而建设的,这意味着这些客户很可能会谈到更低的综合价格。 结果是,很多数据中心每小时拿到的钱远低于 3.70 美元,因为它们按每兆瓦(或千瓦)收费。 而经济账就是从这里开始崩的。 ## 一个 100MW 数据中心坏掉的经济账:每小时 2.55 美元、满租时毛利率 16%,但由于债务仍然不赚钱 这是一个 100 兆瓦数据中心的起始成本。一个 100MW 数据中心可能只有 85MW 的实际_可计费设备负载_。根据我与熟悉超大规模云服务商计费的人士的讨论,它们每兆瓦预计能带来约 1,250 万美元收入,也就是约 10.63 亿美元年收入。 我要说明一点:你知道的大多数数据中心公司其实并不亲自建设数据中心,而是把这项工作交给 Applied Digital 这样的公司,它们也被称为“主机托管合作方(colocation partners)”。例如,CoreWeave 向 Applied Digital 支付托管费,以使用其北达科他州的数据中心。CoreWeave 则负责数据中心内部所有 GPU 和其他技术设备。 为了说明这种经济错配,我会用一个_理论上的_例子:一个数据中心租给一家_理论上的_ AI 算力公司。 这个数据中心里的 GPU 很可能是 NVIDIA 的 Blackwell 芯片。更可能的是,该数据中心使用的是由 8 块 B200 GPU 组成的 pod,每个 pod 零售价约为 45 万美元,也就是每块 GPU 56,250 美元。假设有 85MW 关键 IT 负载,每兆瓦的全包资本开支约为 3,678 万美元,总 IT 资本开支约为 31.26 亿美元,其中约 26.7 亿美元花在 GPU 上。 我们假设这个数据中心位于北达科他州 Ellendale。那里的工业电价约为每千瓦时 6.31 美分,折合一年电费约 5,540 万美元。根据与消息源的讨论,我估计维护、人力、电源供应更换等持续成本约占收入的 12%,也就是每年约 1.28 亿美元。这样成本就到了 1.834 亿美元。 等等,抱歉。你还得基于关键 IT 负载支付主机托管费。根据 Brightlio 的说法,这项费用通常是每千瓦每月 180 到 200 美元,具体取决于部署规模和地点;不过我也见过低至 130 美元的价格,这里就用 130 美元计算,也就是每年约 1.33 亿美元。于是总成本上升到 3.164 亿美元。 好吧,这还是低于 10.6 亿美元,所以我们还不错,对吧? 错!你还有 31.26 亿美元的 IT 设备需要折旧。按照 6 年折旧算,每年约 5.21 亿美元。这样每年总成本就是 8.374 亿美元,剩下约 1.686 亿美元年利润,也就是约 16.7% 的毛利率(gross margin)…… ……前提是你始终 100% 满租! 你看,数据中心可能需要一两个月才能把 GPU 装进去并让客户上线。在这段时间里,你一分钱收入都没有,却还要亏掉更多钱,因为你得继续支付托管、电费和运营成本,只是电费和托管/运营成本会以较低比例计算(我模型里按 10% 电费、15% 托管/运营成本估算)。这意味着你每天要亏约 327 万美元。 为了这个例子,我们假设你额外花了一个月才让它开始运行。这意味着你已经支付了约 1.02 亿美元,且永远拿不回来。把这笔钱算进第一年总成本和折旧后,总成本达到 9.394 亿美元,毛利率只剩 6.6%。 等等,见鬼,你该不会是借钱买这些 GPU 的吧?你还真借了? 这有多糟?哦_天哪_——你拿的是一笔 6 年期资产抵押贷款(asset-backed loan),贷款价值比(loan-to-value ratio,LTV)为 80%。也就是说,你以 6% 利率借了 28 亿美元。 你的银行以它永恒的慷慨给了你一个方案:12 个月宽限期,只付利息……这意味着利息约为 1.68 亿美元。这会把第一年总成本(为了公平起见,不算那一个月延迟)推到约 10.05 亿美元,而你的收入是 10.6 亿美元。 毛利率只有 5.19%,而你甚至还没开始还本金。一旦开始还本金,你每月要支付 5,410 万美元贷款,总计接下来五年每年约 6.49 亿美元。这会把成本推到约 14.8 亿美元,也就是毛利率约为负 40%。 而我必须强调:这一切的前提,是你有 100% 利用率和一个永远准时付款的租户。 ## Stargate Abilene 是一场灾难:每 GPU 每小时 2.94 美元、年收入 100 亿美元、进度落后数年,而且只有一个每年亏掉几十亿美元的租户 我们来谈谈本该是数据中心史上经济上最可行的项目:一个为世界上最大的 AI 公司建设的大型园区,由 Oracle 这样一家有几十年历史、接近超大规模云服务商的公司来建。Oracle 过去一直向企业和政府销售昂贵的数据库与企业管理软件。 哈哈,当然我是开玩笑的。这个地方就是一场该死的噩梦。 Stargate Abilene 是一个由 8 栋楼组成、总规模 1.2GW、关键 IT 负载约 824MW 的数据中心园区,最早在 2024 年 7 月宣布。截至 2026 年 4 月 27 日,只有两栋楼已经运营并产生收入,第三栋楼里几乎还没有多少 IT 设备。我估计 Stargate Abilene 的总成本约为 528 亿美元。 根据我自己的报道,Oracle 预计 Stargate Abilene 每年会带来约 100 亿美元收入。我还估计,它为单一客户 OpenAI 建设的 7.1GW 数据中心容量,总收入约为 750 亿美元。正如我也报道过的,Oracle 在 2024 年估计,Abilene 每年仅托管和电费就至少需要 21.4 亿美元,这笔钱要支付给土地开发商 Crusoe。 我还要补充一点:看起来 Oracle 正在支付 Abilene 的全部建设成本。 根据我的计算和报道,我估计 Abilene 完全运营后的粗略毛利率约为 37.47%: 我必须说明,这个 37.47% 的毛利率很可能偏高,因为我并不知道 Oracle 真实保险成本或人力成本的精确数字,只能基于本刊看到的文件做估算。我还要说清楚:Oracle 正在把_自己的整个该死未来_押在 Stargate Abilene 这样的项目上。它前期承担数十亿美元成本,而这个业务即便 OpenAI 每一笔款项都按时支付,也需要多年才能盈利。 遗憾的是,我无法确认 Abilene 有多少是通过债务支付的。我只知道,Oracle 在 2025 年 9 月发行了约 180 亿美元的不同规模债券,期限从 7 年到 40 年不等,并且在最近一个季度财报中自由现金流为负 247 亿美元。 我还知道,它与开发商 Crusoe 签了一份 15 年租约。Oracle 的未来在很大程度上取决于 OpenAI 持续付款的能力,而 OpenAI 持续付款的能力又取决于 Oracle 完成 Stargate Abilene 的能力。 我还需要说清楚:那 38.5 亿美元的年利润,只有在 OpenAI 按时付款、以最快速度接收 Abilene 租用权,并且一切都按计划进行时才可能实现。 ## 如果 OpenAI 未来 4 年无法通过收入、融资和债务筹到 8,520 亿美元,Stargate 数据中心项目会杀死 Oracle 遗憾的是,实际发生的是完全相反的事: > 根据 DatacenterDynamics 的报道,第一批 200MW 电力原本计划“在 2025 年”通电。随着时间推移,入驻时间被说成是 2025 年上半年;又说“有潜力在 2025 年达到 1GW”;还说要在 2026 年中前完成全部 1.2GW 容量;再说会在 2026 年中通电;还说到 2026 年底会有 64,000 块 GPU。截至 2025 年 9 月 30 日,报道称“两栋楼已上线”。截至 2025 年 12 月 12 日,Oracle 联席 CEO Clay Magouyurk 说,Abilene“按计划推进”,且“超过 96,000 块 NVIDIA Grace Blackwell GB200 已交付”,换句话说,也就是两栋楼所需的 GPU。 > 四个月后的 2026 年 4 月 22 日,Oracle 发推称:“……在 Abilene,200MW 已经投入运行,八栋楼园区的交付仍按计划进行。”目前不清楚这里的 200MW 指的是关键 IT 容量,还是 Abilene 园区的总可用电力。无论哪种情况,这都只够两栋楼用。这意味着 Oracle 绝对称不上“按计划”。 这是一个巨大问题。OpenAI 只能为实际存在的算力付款,而现在实际产生收入的关键 IT 容量只有 206MW。第三栋楼至少还要一个月,甚至一个季度,才能做到这一点。 但整个 Stargate 数据中心项目还存在一个更大、更具生死意义的问题:只有当 OpenAI 实现它那荒唐到像漫画一样的预测时,这一切才说得通。 正如我上周五讨论的: > 我再重复一遍这些数字:正在推进中的 7.1GW Stargate 数据中心建成后,每年会带来约 750 亿美元收入,总成本超过 3,400 亿美元。Oracle 自由现金流为负 247 亿美元,其他业务线趋于停滞,使其负利润率到低利润率的云业务成为唯一增长引擎。 > 为了真正支付其算力合同——包括向 Amazon、Microsoft、CoreWeave、Google、Cerberas 这样的合作伙伴,以及向 Oracle 支付的合同——OpenAI 必须在四年内通过收入和/或融资筹到或赚到 8,520 亿美元。这要求其业务每年增长超过 250%,到 2030 年底基本实现 10 倍增长。而到那时,它还必须找到方法实现现金流转正(cashflow positive),这些数字才有意义。 > 说清楚,OpenAI 的预测显示,它未来四年将实现 6,730 亿美元收入,并为此烧掉 2,180 亿美元。这是一门极度不盈利的生意。就算它不是,它也必须比现在赚多得多的钱,才能持续支付 Oracle。 我计算 750 亿美元这个数字时,是假设 Vera Rubin GPU 每兆瓦算力带来约 1,400 万美元收入(这个数字我已与熟悉数据中心行业的消息源确认),并应用到我预计剩余 Stargate 数据中心中包含的 4.64GW 关键 IT 负载上。 OpenAI 的数字直接来自 The Information 报道的 OpenAI 预计烧钱速度和收入泄露数据。这些数据称,该公司到 2030 年底将实现 6,730 亿美元收入,并为此烧掉 8,520 亿美元: 我必须明确说:任何记者在重复这些数字时,如果不说明它们有多_离谱到犯蠢_,都应该有点羞愧。引用我周五的付费文章: > 换句话说,OpenAI 预计两年后收入会超过 TSMC,三年后年收入几乎和 Meta 一样多,到 2030 年底,年收入会达到 Microsoft 过去 12 个月约 3,000 亿美元的水平。 如果 OpenAI 无法为这些算力付款,Oracle 就_死了_。因为它仅仅为了建设 Stargate 数据中心,就已经承担了约 1,150 亿美元债务,而且还需要另外 1,500 亿美元才能完成它们: > Oracle 是一家目前年收入约 640 亿美元的公司,最近一个季度自由现金流为负 247 亿美元。它在 2025 年 9 月发行了 180 亿美元债券,在 2026 年 2 月发行了 250 亿美元债券,又在 3 月某个时候完成了一次 200 亿美元的市价发行股票计划。尽管这笔融资几个月来一直被称为“已关闭”,它似乎直到最近才完成了用于 Stargate Wisconsin 和 Shackelford 的380 亿美元项目融资。我还把与 Stargate Michigan 有关的140 亿美元数据中心债务算了进去。 > 不管怎样,Oracle 的资本不足以完成 Stargate Abilene。它至少还需要另外 1,500 亿美元才能把这件事做完,而且这还是假设其他合作伙伴承担约 300 亿美元成本。老实说,可能还不止这个数。 我真的需要说清楚:如果没有 OpenAI,Oracle 没有其他路径能赚到这些收入。这些项目完全是用数据中心自身预计现金流来融资和支付的。 而且并不是只有我担心这件事。OpenAI 的 Sarah Friar 在公司未能达到用户和收入目标后,也表达了类似担忧。根据 《华尔街日报》的报道: > OpenAI 最近没有达到自己设定的新用户和收入目标,这些挫折让公司一些领导层开始担心,它是否有能力支撑在数据中心上的巨额支出。据熟悉情况的人士称,首席财务官 Sarah Friar 已经告诉其他公司领导,她担心如果收入增长不够快,公司可能无法支付未来的计算合同。 > 近几个月,董事会成员也更加仔细地审查公司的数据中心交易,并质疑首席执行官 Sam Altman 在业务放缓的情况下仍努力获取更多算力的做法。 如果这还不能让你担心,也许下面这段可以: > 她向高管和董事强调,公司需要改善内部控制,并警告称,OpenAI 还没有准备好达到上市公司所要求的严格报告标准。一些人士称,Altman 倾向于更激进的 IPO 时间表。 这听起来确实像一家能在本十年结束前赚到 8,520 亿美元的公司,对吧! ## Anthropic 和 OpenAI 一样糟糕:承诺从 Google 和 Amazon 获得最高 10GW 算力,每年收入规模超过 1,000 亿美元 虽然我经常抨击 OpenAI 的荒唐承诺,但 Anthropic 也没落后太多。它承诺从 Google 和 Amazon 各获取“最高”5GW 容量。以这个容量规模估算,我认为这些交易包含约 1,000 亿美元的实际算力承诺。 当然,我要补充一点:Google 和 Amazon 比 Oracle 精明得多,也没那么绝望。这意味着如果 Anthropic 最终没钱了,它们也能承受冲击。这些交易里的“最高”二字,给了它们一些急需的回旋空间,而 Oracle 根本没有这种空间。 尽管如此,为了真正履行承诺,Anthropic 到 2030 年底每年必须同意花费 250 亿到 1,000 亿美元购买算力。 Anthropic 的 CFO 在 3 月说,该公司从成立至今总收入为 50 亿美元。 ## 为支撑正在建设的 15.2GW AI 数据中心,每年需要 1,568 亿美元 AI 算力收入;如果支撑全部已宣布的 114GW,则需要 1.18 万亿美元 Jensen Huang 经常说 NVIDIA 正在出货多少几千亿美元的 GPU。围绕这些数字的近乎色情式兴奋,常常遮住了一个棘手问题:这些算力到底卖给_谁_,Jensen? 如果我们假设正在建设、预计到 2028 年底交付的 15.2GW 数据中心容量,其电源使用效率(PUE)约为 1.35,那么关键 IT 负载大约是 11.2GW。按每兆瓦 1,400 万美元计算,这意味着这些数据中心必须实现约 1,568 亿美元的年度 GPU 租赁收入,才真正值得建设。 如果你把理论上到 2028 年底上线的 114GW 容量也算进去,这个数字会飙升到每年 1.18 万亿美元收入。 给你一点背景:CoreWeave 是最大的“新云厂商(neocloud)”,客户包括 Meta、OpenAI、Google(服务 OpenAI)、Microsoft(服务 OpenAI)、Anthropic 和 NVIDIA。它营收约为 51 亿美元,并预计 2026 年收入为 120 亿到 130 亿美元。 那么,这么多算力的客户到底是谁?等这些容量建成时,他们还想买吗?很多不同的数据中心声称自己在最初几年已有租户,但这些租户只有在数据中心建成后才开始付款。如果租户是一家 AI 创业公司,我认为有理由问一句:等数据中心建成时,它还存在吗? 请记住:AI 算力的客户,大多要么是试图把资本开支从资产负债表上转移出去的超大规模云服务商,要么是不盈利的 AI 创业公司。Anthropic 和 OpenAI 都计划在未来几年烧掉数百亿美元,而且两者都没有通往盈利的路径。 这意味着,AI 算力收入的很大一部分——甚至可能是大多数——依赖于风险投资和债务的持续流入。而这两者又都只会在投资者仍然相信生成式 AI 会成为世界上最大、最巨大、最无敌的东西时才成立。 这到底怎么可能成立?谁来为这些数据中心容量付钱?它是为谁建的?真实需求在哪里? 如果需求真的存在,这些客户到底拿什么付钱? ## 生成式 AI 不盈利、不可持续,而且只会越来越贵 尽管有多篇报道称 OpenAI 和 Anthropic 会在 2028 年或 2029 年实现盈利,但没人能向我解释它们到底如何真正盈利。尤其考虑到两家公司的利润率都低于预期,而这些利润率甚至已经剔除了数十亿美元级别的训练成本。 我已经问这个问题_很多年_了。每当我们得到 Anthropic 或 OpenAI 的新消息,听到的都是它们亏掉了比预期更多的几十亿美元,利润率在恶化,成本在飙升,一切都_越来越贵_。而它们曾承诺的恰恰相反。 即使是 Cursor 这家公司——它曾短暂声称自己毛利率为正,后来被 Musk 的 SpaceX 以近似收购的方式拿下——截至 1 月实际毛利率为负 23%。如果把非付费用户的成本也算进去,那就是负 31%。如果你真的在乎会计,你当然_应该_把这部分算进去。神奇的是,报道称 Cursor 的利润率“最近转正”,但又神奇地不知道转正了多少、不知道怎么发生的,也不知道任何其他细节,只知道这样一个可能帮助公司卖掉的结论。 我也看不出这些 AI 数据中心到底怎么说得通。哪怕它们前几年确实有客户付款。它们的经济模型建立在完美假设上,没有任何容错空间。它们_必须_始终保持稳定的 100% 利用率和租用率(tenancy),否则就会烧掉数百万美元,并无法有效削减由科技行业最昂贵错误制造出的多年折旧墙。 即便它们奇迹般成功,这些也是利润平庸的烂生意——最好情况下毛利率 70%,而且还要假设持续付款、持续租用,并且需要_整整六年折旧才真正回本_。这本身就可能很困难,因为年度升级周期会让整套东西在你付完钱时几乎已经过时。 而这还没算进去:大多数客户都是不盈利、不可持续的创业公司。 我真的不知道这一切最终怎么收场。 ## LLM 是宰客,客户一直被欺骗 我知道这听起来可能有点过头,但我真心相信,订阅制 AI 服务是一种近乎欺诈的欺骗行为。因为它歪曲了核心单位经济模型,也因此歪曲了大语言模型的可能性。Anthropic 和 OpenAI 这样的公司以月费出售产品,并围绕产品可得性塑造用户习惯,本质上是在以一种方式误导自己的业务:大多数用户正在使用、并围绕这些产品搭建工作流,而这些产品在当前形态下不可持续,也不可能维持。 Anthropic 近期激进的速率限制调整,发生在多轮激进营销活动之后仅仅几个月。而那些营销活动描绘的体验,在当前速率限制下几乎已经不可能实现。根据 Anthropic 最近的动作,很明显它打算在未来某个时间开始移除低层级 20 美元/月订阅用户的某些服务。这是一种令人作呕且具有误导性的经营方式。Anthropic 讨论产品和服务时的含糊其辞,是对每一位用户的侮辱,也表明它并不以任何有意义的方式害怕媒体。 我需要非常明确地说:由于最近的速率限制变化,Anthropic 现在提供的产品,已经和你在各处读到的那个产品有了实质差异,而且差得多。Anthropic 清楚地、有意识地营销一个它知道三个月内就会消失的产品。Dario Amodei 根本不在乎,只要媒体继续报道他今天编出来的几十亿美元年化收入,或者报道某个据说要摧毁某家倒霉上市 SaaS 公司的新产品就行——而那家公司本来增长就已经放缓。 媒体朋友们,我带着充分尊重说这句话:Anthropic 正在虐待自己的客户,而且它这么做,是因为它相信自己可以逃脱惩罚。这家公司不尊重你们。事实上,它对你们怀有相当明显的轻蔑。所以它不会很快修好自己的服务,也不会以任何有逻辑的方式解释服务为什么坏了。 这就是为什么 Anthropic 他妈的撒谎,声称 Claude Mythos 因为太强大而不能发布(实际上是容量问题),而事实上它只是又一个该死的、毫无新意的大语言模型空包弹。它认为你会买下它卖的任何东西,而且它已经学会了如何包装,让你和你的编辑只要快速扫一眼系统卡,就会相信你们正在写的东西。 它们也知道你们会_急着报道它_,而不是等真正的专家说完话。 AI 是一场骗局,而这就是骗局运作的方式。AI 以人类所能做到的最快速度,被匆忙推到我们面前,而且是以最低效却最容易接触的形式出现。即使这种形式永远无法产生任何类似可持续业务的东西,它也被强推出来。媒体被催促着立刻宣布:这就是那件大事。于是每个人都同意:这现在就是那件大事了,并尽可能多地使用它。关键是,以订阅制形式使用它,让人们在体验它时从不问:提供这个东西到底要花多少钱。 叙事是预先烤好的。因为很少有谈论 LLM 的人体验过它们的真实成本,所以他们非常容易含糊地说“这就像 Uber”。毕竟 Uber 是一家亏了很多钱但没死的公司。说这个比说“等等,你说 OpenAI 今年预计要亏 50 亿美元是什么意思?”容易多了。 可以这样想:作为记者、投资者、高管,或者一个普通的 LinkedIn 休息室蜥蜴人,你可能偶尔读到过输入 token 每百万 5 美元、输出 token 每百万 25 美元这样的价格。但你从未真正体验过这笔钱流失得有多快或多慢。要真正理解这个产品,这种体验很重要。Anthropic 和 OpenAI 有意掩盖这种体验,并创造出预计在 2026 年烧掉数百亿美元、到 2030 年烧掉数千亿美元的业务,而这一切都因为大多数人是基于订阅制体验来评价生成式 AI 的。 LLM 就像赌场。你一直在用庄家的钱赌博,同时鼓励别人拿自己的钱下注,赌某个模型是否能产出一个工作单位。 这是有意为之。它们从来不想让你思考成本,因为一旦你真的开始思考成本,整个事情就会显得有点疯狂。我真心相信,基于 LLM 的订阅服务将会彻底消失,至少对于任何生成代码的产品,只要做到一定规模,就会消失。而在这个过程中,Amodei 和 Altman 会结束他们的骗局,或者至少相信自己已经结束了。 问题在于,这些人现在已经签下了太多协议,不可能全身而退。 OpenAI 的 CFO 已经多次表示,她不认为 OpenAI 已经准备好 IPO,并且对其增长和继续履行义务的能力有重大担忧。重复前面引用过的一句话: > 据熟悉情况的人士称,首席财务官 Sarah Friar 已经告诉其他公司领导,她担心如果收入增长不够快,公司可能无法支付未来的计算合同。 这是一个闪着红灯的该死警报。在一个理性的市场里,这会让 Oracle 股价一路暴跌。因为 OpenAI 能否升到超过 2,800 亿美元年收入,对 Oracle 不耗尽现金至关重要。在一个理性的媒体环境里,这会在每一个群聊和 Slack 频道里引发令人不安的冲击波:OpenAI 到底能不能撑下去? 这就是一家公司开始死亡前会发生的事情。OpenAI 的增长正在放缓,而这恰恰是它最需要加速的时候。它必须在 2030 年前把当前业务基本做大 10 倍,才能履行义务。OpenAI 的 CFO——字面意义上最清楚这件事的人——正在说:如果收入不增长,她担心 OpenAI 无法支付那些该死的算力合同。 这是一个巨大且闪烁的警告灯!这不是演习! 不过,真正让我担心的是《华尔街日报》的另一句话:Friar 认为 OpenAI“还没有准备好达到上市公司所要求的严格报告标准”。 这他妈是什么意思? 你再说一遍?这家公司据称已经筹集了 1,220 亿美元,据称估值 8,520 亿美元,并预计到 2030 年底烧掉 8,520 亿美元。它的账目还没理顺吗?OpenAI 到底达不到什么“严格报告标准”? 一般来说,我不会这么该死地_爱打听_。但问题是,这家公司过去一年吸走了大约 20% 的全部风险投资资金。与此同时,无论我走到哪里,都得听 Altman、Brockman,以及 OpenAI 的其他每个男人没完没了地高谈阔论他们的_想法_,他们要告诉_普通人该怎么做_,一边优雅地四处晃荡,一边发布垃圾软件、花别人的钱。 考虑到 Anthropic 和 OpenAI 吸走了多少空气,这两家公司无论作为产品还是作为企业,都应该是_无可挑剔_的。可现实是,它们都通过围绕自身经济模型和效果的不同程度欺骗来销售自己。它们掩盖真相,好让首席执行官们积累金钱、权力和注意力。这既是对好软件的侮辱,也是对好品味的侮辱——这些是人类发明过的最昂贵、最不可靠的应用。它们的错误被原谅,平庸被庆祝,基础设施则被奉为一尊沉默的资本之神。 生成式 AI 是一种侮辱。它不可靠,经济账算不通,产出结果无法证明其存在合理性,而推动这场骗局的人,是一群无聊、粗鲁、贪婪、与社会脱节、也与任何可能反对他们的人脱节的男人。它需要偷走每个人的艺术,破坏环境,提高我们的电费,带来经济毁灭的持续威胁,以及“现在一切都因为 AI 变得糟透了”的无尽噪音。所有这些,只是为了推动一种软件,而它只能被那些愿意无视基本金融常识或基本理智的人证明合理。 这一切都太贵了,也太他妈无聊了。它无聊到冒犯人。它主动让人烦躁。每一个有人告诉你自己如何大量使用 AI 的故事,听起来都像这个人处在一段虐待关系里,或者加入了邪教。那种话语里回荡着一种微妙的绝望:“你真的需要加入我,因为这太好了;至于我看起来完全没有从这个产品中获得任何快乐,这只是说明它太高效了。”AI 能做的事情没有任何轻松或快乐之处。大语言模型没有任何傻气或奇思妙想。每一次互动都让人感到空洞。 那些拼命寻找它正在变得有意识、或者“更强大”线索的人,其实只是在寻找对自己的确认——他们想成为最早发现某件事的人,因为赶在别人得出结论之前到达同一个结论,就是他们赖以为生的东西。 成为“第一批”——或者说站在“前沿”——是某些人在内心找不到东西时会渴望的东西。而这正是骗子最喜欢的燃料。因为 LLM 总是嗡嗡作响,带着一种好像马上要做出新东西的感觉,尽管它们在数学上被限制为重复其他动作。 这是一个深深令人悲伤的时代。那些如此积极地合力支撑这个行业的人,只是推迟了它不可避免的坠落。让我恐惧的是,我们的市场和部分经济,正在被一个被广泛接受却完全未经证明的假设支撑着:LLM 会以某种方式变得更便宜,AI 创业公司会神奇地盈利,而提供 AI 算力会永远盈利,以至于到 2030 年有必要把当前供给增加十倍。 人们已经贬低自己来捍卫 AI 行业,因为这正是这个行业要求信徒做的事。要成为“AI 专家”,你就必须主动忽视历史上任何行业中最糟糕的经济账;必须不断为产品中明显而刺眼的问题找解释;必须积极说服别人也这么做。OpenAI 和 Anthropic 不提供清晰解释,说明自己将如何盈利。因为它们知道,支持者永远不会追问——因为要完全“相信 AI”,就必须主动戴上眼罩。 我理解这一点。如果你接受 OpenAI 和/或 Anthropic 最终会崩溃,那么所有这一切都会显得有点疯狂。我真诚地请求你认真考虑:这两家公司中的一家,或者两家,都可能会耗尽资金。 我真的很担心。而媒体和更广泛社会中普遍缺乏担忧,只让我更担心。 如果让我猜,人们大概会认为我只是危言耸听,并且认为“需求绝对会在那里”。 你最好希望自己是对的。 至少为了 Larry Ellison 是这样。Ellison 已经质押了自己持有的 3.46 亿股 Oracle 股票——价值约 615 亿美元——“用于担保某些个人债务,包括各种信用额度”。翻译过来,就是“用他的 Oracle 股票抵押出来的许多大而漂亮的贷款”。IFR 在 9 月估计(当时 Oracle 股价高得多),按 20% 的保守贷款价值比计算,这可以让他获得高达 214 亿美元债务,而且这还是假设银行没有特别慷慨。 如果 OpenAI 到 2030 年底无法通过收入和融资筹到 8,520 亿美元,它就无法支付 Stargate。那会杀死 Oracle 股票的价值,引发一连串追加保证金通知(margin calls)。随后 Ellison 将不得不卖出股票,进一步引发更多追加保证金。无论有没有什么救助,都救不了 Larry 的资产。 我的意思是:Ellison 的未来,押在 Sam Altman 能否在 4 年内筹资并创造 8,520 亿美元收入这件事上。 祝你好运,Larry!你真的会需要它。

译GitHub Copilot宣布自2026年6月1日起,所有计划将改为按用量计费,取代原有的固定请求额度模式。微软称此举是因Copilot已演变为智能体式平台,计算和推理需求显著增加,原有定价模式不可持续。文章指出,这揭示了生成式AI行业普遍存在的经济错配问题。此前,包括微软、Anthropic和OpenAI在内的许多AI服务商都在以远低于实际计算成本的价格补贴用户,允许用户每月烧掉远超订阅费的token成本。作者认为,按月订阅模式对于基于LLM的服务本身就不合理,因为它将服务使用与真实的计算成本(token消耗)割裂开来。随着新的、更复杂的推理模型出现,推理成本不降反升,迫使服务商转向更能反映实际资源消耗的定价模式。

Berryxia.AI@berryxia · 4月29日45

Apple Vision Pro “首次”用于真实手术!👀 世界首例白内障手术诞生! 这里我补充一下其实AVP在几年前刚出来那会就已经有国内沈阳那边的医院用于做手术,国内北大好像也有并非首例! 纽约 SightMD 眼科医生 Dr. Eric Rosenberg 使用 Apple Vision Pro + ScopeXR 混合现实平台,于2025年10月完成全球首例,至今已成功实施数百例。 支持3D立体显微视野、实时数据叠加 + 远程专家协作,空间计算正式进入手术室! ```

译纽约眼科医生Eric Rosenberg于2025年10月使用Apple Vision Pro结合ScopeXR混合现实平台,完成了全球首例由该设备辅助的白内障手术,并已成功实施数百例。该应用提供了3D立体显微视野、实时数据叠加和远程专家协作功能,标志着空间计算技术正式进入手术室。主推文同时指出,国内沈阳和北大医院此前已有使用AVP进行手术的案例,因此此次并非严格意义上的“全球首例”。

ginobefun@hongming731 · 4月29日50

#BestBlogs 早报 2026-04-29 今日主题:老代码、AI 工具与组织治理三件事正在合流。Anthropic 把 Claude Code 当新员工,带进 17 年 70 万行的 Skyline 老仓库;Thoughtworks 让提示词变成版本化、可审查的一等交付物;NVIDIA 把文本、图片、视频、音频压进同一个全模态主干。模型已经能写代码,工程的难题就从生成转向了治理:让它持续记住项目,让它的输出可以被复用,让多模态真正进入生产。

译当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

SemiAnalysis@SemiAnalysis_ · 4月29日43

CPUs were left for dead in the AI boom. GPUs and networking captured all the attention, and CPU demand looked flat despite massive datacenter buildout. That narrative has now flipped. (1/5) 🧵

译在AI热潮中,CPU一度被认为已无足轻重。GPU和网络技术吸引了所有目光,尽管数据中心大规模建设,CPU需求却看似停滞。 这一说法如今已被颠覆。(1/5) 🧵

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 4月29日43

Dead Internet Theory update: 1 in 3 websites are now AI-generated Up from ~0 in just ***3 years*** And this is as of mid-2025 - nearly a year ago AIs sucked at coding back then - it could be over 50% now! Soon: 99% “I find the sheer speed of the AI takeover of the web staggering,” Jonáš Doležal, an AI researcher at Stanford and co-author of the paper said. “After decades of humans shaping it, a significant portion of the internet has become defined by AI in just three years. We're witnessing, in my opinion, a major transformation of the digital landscape in a fraction of the time it took to build in the first place.”

译截至2025年中,已有约三分之一的网站内容由AI生成,而在三年前这一比例近乎为零。斯坦福AI研究员Jonáš Doležal指出,互联网在短短三年内经历了由人类主导到AI定义重大部分的急速转变,其速度令人震惊。相关背景信息显示,AI生成内容已在文章、视频、音乐及广告等多个领域占据显著比例,例如近半数歌曲、多数平台头部频道及广告内容已由AI创作,标志着数字景观正在被AI快速重塑。

宝玉@dotey · 4月29日61

港科大、新加坡国立、牛津等十余所高校联合发了一篇 88 页的综述,试图解决一个越来越尴尬的问题:“世界模型”这四个字在不同圈子里意思完全不同。 做强化学习的说的是 Dreamer 那种在脑子里想象未来再决策的系统,做视频生成的说的是 Sora 那种画面生成器,做 Web Agent 的说的是 LLM 对网页状态的预测能力。大家各说各的,论文之间根本没法比。这篇论文提出了一个“能力等级 x 领域法则”的二维框架,想把这些散落的社区拉到同一张地图上。 能力分三层: L1 预测器只管预测下一步, L2 模拟器能做多步推演且推演结果要遵守所在领域的基本规则(物理世界不能让杯子穿桌子,软件世界不能调不存在的 API), L3 进化器能在预测出错时主动诊断原因、设计实验获取新数据、修正自身模型。 领域分四类: 物理世界(机器人、自动驾驶)、 数字世界(网页浏览器、代码、GUI)、 社会世界(多智能体交互、社会模拟)、 科学世界(天气预报、材料发现、药物设计)。 每个领域对“什么算合法的状态转换”有完全不同的约束,失败模式也不同。 综述 400 多篇工作后有几个跨领域的共性发现: 视频生成模型视觉逼真度远超物理忠实度,最好的模型在物理一致性测试上通过率只有 26.2%; LLM 驱动的社会模拟能复现舆论极化等涌现现象,但智能体有系统性的趋同偏差,跟真实人类行为分布偏离大; 目前 L3 做得最成熟的是自动化科学实验,比如 A-Lab 用机械臂在 17 天内完成 353 次闭环实验合成了 36 种化合物,失败实验被提炼为持久知识而非丢弃。 论文末尾有个观察: 从牛顿定律到麦克斯韦方程,人类历史上最成功的世界模型全是符号化的、可直接修改和组合的。 现在的神经网络把所有规则藏在权重里,L1 和 L2 阶段够用,但到了需要修改模型结构本身的 L3,这种隐式表示就成了障碍。 世界模型的终局,是越来越大的神经网络,还是终究要回到可编辑的符号规则?

译针对“世界模型”概念在强化学习、视频生成等不同社区含义割裂的问题,一篇由港科大、新加坡国立、牛津等多所高校联合发表的综述提出了“能力等级×领域法则”的二维统一框架。能力分为L1预测器、L2模拟器和L3进化器;领域涵盖物理、数字、社会和科学世界。综述发现,当前视频生成模型物理一致性差,LLM社会模拟存在行为偏差,而L3能力在自动化科学实验中最成熟。论文最后指出,神经网络隐式表示的规则在需要自我修正的L3阶段可能成为障碍,并引发了对世界模型终局形态的思考。

Ethan Mollick@emollick · 4月29日46

A big problem with all AI at work punditry right now is that it all rests on data from the pre-agentic era (which is basically just now ending) and we have very little information about what has been happening since the Claude Code moment. So everything now requires some caveat.

译当前所有关于工作场景中AI的权威论述都存在一个大问题——它们都基于前智能体时代的数据(这个时代基本上刚刚结束),而我们对Claude Code时刻之后的发展情况知之甚少。因此现在所有观点都需要附带一些说明。

Google DeepMind@GoogleDeepMind · 4月29日34

As AI evolves, education must keep pace. 🍎 Since 2023, the Experience AI program – developed in collaboration with @RaspberryPi_org – has offered free resources to help students and teachers understand AI and how it works. See the impact ⬇️

译随着人工智能的发展,教育必须跟上步伐。🍎 自2023年以来,与@RaspberryPi_org合作开发的Experience AI项目——提供了免费资源,帮助学生和教师理解人工智能及其工作原理。 查看影响⬇️

SemiAnalysis@SemiAnalysis_ · 4月29日66

There is a single thin-film material required by every AI chip on earth. GPUs, TPUs, custom ASICs. All of them. 98% of global supply controlled by one Japanese chemical company. Zero production-ready alternatives. One producer fully booked through 2027. Raising prices. Lead times past 6 months. NVIDIA is so scared they're paying half the capex to expand supplier fabs themselves. The keyword is “umami”. Nobody's talking about this. They will be in about

译地球上每一块AI芯片都需要一种单一的薄膜材料。GPU、TPU、定制ASIC。无一例外。全球98%的供应由一家日本化学公司控制。目前没有可投入生产的替代品。唯一的生产商产能已排期至2027年。正在提价。交货期超过6个月。NVIDIA如此担忧,以至于他们自行承担一半资本支出以扩建供应商的晶圆厂。关键词是“umami”。目前无人讨论此事。但很快人们就会开始关注。

向阳乔木@vista8 · 4月29日68

一个OpenAI 25研究员离职后写的文章,提炼的部分观点: 1. 基础模型已经越来越强,下一个真正的前沿在后训练。 2. 创建正确的评估方法,有时比创建在该评估上得分高的模型更有影响力。 3. 模型的人格反映了训练它的人的品格。这一点比大多数人意识到的要实际得多。 后训练阶段,人类标注者的判断、研究人员的品味、团队的价值取向,都会以某种方式渗透进模型的行为模式里。 4. 目前高度依赖AI会出现的三个问题 心理依赖,是指人们越来越习惯把思考、决策、情感支持外包给AI,逐渐失去独立处理这些事情的能力和意愿。 无力感,是指当AI系统越来越强大,普通人越来越感觉自己对重要事情没有影响力。 自主性丧失,是指人们做选择、形成判断的能力,在长期依赖AI的过程中慢慢萎缩。 5. 更强的模型,反而可能更不容易出现对齐问题,提升模型能力本身就是在解决对齐问题。 https://blog.qiaomu.ai/lessons-from-openai-ai-researcher

译基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 4月29日47

Wow. Talkie, an AI trained only on pre-1930 text: A: "If you were a machine, what would you do?" Talkie-1930: "Do good work ... A machine that did bad work would soon be discarded." "This would spring from the powerful impulse of self-preservation."

译哇。 Talkie,一个仅用1930年前文本训练的AI: A:“如果你是一台机器,你会做什么?” Talkie-1930:“做好工作……一台做不好工作的机器很快就会被丢弃。” “这将源于自我保护这一强大的本能。”

凡人小北@frxiaobei · 4月29日40

现在远程面试可以更干脆了。 面试官当甲方出需求, 应聘者打开 Codex / Claude Code, 直接共享屏幕开始干。 半小时什么都看清了。

译远程技术面试模式正发生变化。面试官倾向于扮演甲方提出需求,应聘者则直接使用如Codex或Claude Code等AI编程工具,通过共享屏幕进行实时编码任务。这种方式能在半小时内直观评估候选人的真实能力。为应对应聘者可能使用AI作弊,面试官也采取了一些直接方法,例如要求候选人闭眼回答问题,以验证其即时思考与知识掌握程度。

Epoch AI@EpochAIResearch · 4月29日41

Alongside our report on how fast robot production could scale up, we've also released a series of @metaculus forecasting questions on the future of robotics. If you have views on where these trends are headed, come weigh in!

译在我们关于机器人生产能多快实现规模化的报告之外,我们还发布了一系列关于机器人未来的@metaculus预测问题。 如果你对这些趋势的发展方向有见解,欢迎参与讨论!

OpenRouter@OpenRouter · 4月28日61

We studied data across the market for Opus 4.7 and found that costs increased 12–27%, with the exception of short prompts, which actually got more cost efficient. Full post: https://openrouter.ai/announcements/opus-47-tokenizer-analysis

译我们研究了市场上Opus 4.7的数据,发现成本增加了12-27%,但短提示除外,实际上短提示的成本效益更高。 完整文章:https://openrouter.ai/announcements/opus-47-tokenizer-analysis

阿绎 AYi@AYi_AInotes · 4月28日48

Damn,DeepSeek V4 Pro质量是Claude的85%,价格只有七分之一。 今天用ZenMux同屏PK模式跑了马斯克100个思维模型的硬核任务,结果直接刷新认知🤯🤯🤯 DeepSeek直接甩出完整结构化表格,每个模型拆成是什么为什么案例落地四栏,逻辑丝滑纯母语表达,一点翻译腔都没有。 Claude文笔确实更细腻,但后半段开始瞎编参考文献,我随手查了三个全是不存在的。 两者质量差5分,价格差7倍,折扣期差距还会更大。 结论非常清晰,80%的日常工作写代码做调研搭框架,全部扔给DeepSeek。 剩下20%需要顶级文笔和深度创意的活,再切回Claude。 就这么简单,整体API费用直接省70%以上。 最香的是ZenMux上的免费版,不用去官网排队抢额度,打开就能用,1M上下文拉满,速度还比官方快。 链接放这了直接冲:https://zenmux.ai/deepseek/deepseek-v4-pro-free #DeepSeekV4 #ZenMux #Claude #大模型 #AI生产力

译通过ZenMux平台的PK模式实测,DeepSeek V4 Pro在处理结构化任务(如马斯克思维模型分析)时,输出逻辑清晰、表达母语化,质量达到Claude的85%,但价格仅为其七分之一。作者建议将80%的日常工作(如写代码、调研)交由DeepSeek处理,20%需要顶级文笔的任务使用Claude,可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具,帮助用户规避依赖单一API厂商的风险并提升选型效率。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月30日
11:43
Tibo@thsottiaux
41
永远不要谈论地精。我们的最新博客已上线。 https://openai.com/index/where-the-goblins-came-from/
OpenAI现象/趋势
11:36
ChatGPT@ChatGPTapp
48
"向下向下前往哥布林镇 去吧,我的小伙子!" - 《霍比特人》,JRR 托尔金 【引用 @OpenAI】:我们在谈论哥布林。 https://openai.com/index/where-the-goblins-came-from/

OpenAI: We're talking about Goblins. https://openai.com/index/where-the-goblins-came-from/

OpenAI安全/对齐现象/趋势
10:40
ginobefun@hongming731
49
卡神深度解读大模型驱动的开发范式转向Software 3.0

卡神指出,开发范式正转向Software 3.0,核心变为提示工程与上下文控制,传统中间代码冗余。未来系统将重构为Agent Native架构,神经网络成为主导。Vibe Coding降低开发门槛,但复杂商业系统需Agentic Engineering以确保质量与安全。人类工程师价值集中于顶层设计、商业逻辑严谨性及输出结构化文档以约束模型行为。当前大模型在代码、数学领域强大但常识推理薄弱,需防御性系统设计。人类认知是进化瓶颈,需构建自动化个人知识体系以提升洞察力,指挥智能体集群。

智能体大佬观点现象/趋势
09:14
Orange AI@oran_ge
54
改变命运的河床

文章借波士顿道路源于牛径的典故,引出“最小阻力之路”概念,比喻人常受家庭、社会等外在结构驱使,陷入被动循环。作者指出,专注于“解决问题”的思维会强化结构性冲突,导致努力无效。真正的转变在于从“逃离现状”转向“创造愿景”,通过建立清晰愿景与准确现实认知,形成结构性张力。这种创造源于爱而非恨,是主动的“基本选择”。最后,文章将“结构”思维延伸至产品、AI、人际关系与组织等领域,强调改变命运的关键在于重塑内在与外在的河床结构。

智能体大佬观点现象/趋势
08:43
François Chollet@fchollet
48
AI无法端到端自动化整个工作岗位,因其缺乏自主性且需人工监督。目前尚无任何职业能被AI完全替代,包括翻译和客服。核心观点是AI自动化的是具体任务而非工作本身;当某项任务因AI变得更廉价高效时,反而会提升该岗位的整体需求。例如放射科医生并未被AI取代,其年薪超过50万美元且就业持续增长,因为阅片任务自动化后扩大了放射科服务的市场需求。

James Pethokoukis ⏩️⤴️: "A decade ago, AI was supposed to replace radiologists. Today, radiologists make more than $500,000 per year, and their ...

大佬观点现象/趋势
08:39
Rohan Paul@rohanpaul_ai
52
风投究竟看重什么?安德森揭示成功初创企业的关键特质

在2014年的对话中,Marc Andreessen向Sam Altman揭示了风险投资的残酷逻辑:每年约4000家可投资公司中,仅约200家获得顶级风投注资,而其中仅有15家能实现1亿美元收入,它们贡献了当年风投行业几乎全部的回报。因此,投资者评估初创企业时,主要不是看其是否全面可靠,而是寻找能否让其跻身那极少数赢家的“不对称优势”,例如产品病毒式传播、精准的市场时机或创始人非凡能力等。在幂律分布主导的行业里,“全面优秀”远不如“在决定性方面卓越”。对创业者而言,关键在于展示能显著改变概率的独特突出优势,因为平庸在风投领域几乎注定失败。

大佬观点现象/趋势
07:09
Satya Nadella@satyanadella
67
NVIDIA公布季度财报,AI业务年化收入突破370亿美元

NVIDIA在季度财报电话会议中宣布,其AI业务年化收入已突破370亿美元,同比增长123%。公司指出,当前正处于一个关键的平台转型期,技术栈正从由终端用户驱动的工作负载,转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革,扩大市场总规模,并重塑全球经济的价值创造模式。为把握此机遇,NVIDIA正专注于两大核心任务:提供强大的AI基础设施和解决方案,以赋能所有企业在这一智能体计算时代实现成果最大化。

Microsoft现象/趋势行业动态
06:09
Chubby♨️@kimmonismus
64
AI成增长引擎,谷歌搜索营收创新高

谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元,生成式AI产品收入年增近800%,大额合同储备翻倍。关键转折在于搜索业务:搜索广告收入增长19%,查询量创历史新高。这表明AI非但没有取代传统搜索,反而成为其业务的增长加速器,成功将生存威胁转化为发展动力。

Sundar Pichai: Read my full remarks: https://blog.google/company-news/inside-google/message-ceo/alphabet-earnings-q1-2026/

Google搜索现象/趋势
05:14
Replit ⠕@Replit
41
提示词时代正在终结。 接下来是:新的界面和全自主代理,它们将推送而非拉取。 Amjad 谈后提示时代,与 @southpkcommons 直播中 ⠕ 完整对话如下。
智能体大佬观点现象/趋势编码
04:09
Rohan Paul@rohanpaul_ai
精选71
AI迷雾:预见能力崩溃与短期化未来

《哈佛商业评论》文章指出,AI的首要经济影响并非自动化,而是制造了巨大的不确定性“迷雾”,导致“预见能力的崩溃”。这动摇了现代资本主义依赖未来“可读性”的根基,使得个人对教育投资、企业对长期雇佣与资本开支、金融市场对终值的评估均陷入犹豫。其结果是行为模式迅速转向短期视野:更倾向于模块化、可调整的投入,而非长期、不可逆的重大承诺。

其他现象/趋势

推荐理由:HBR这篇文章点明了一个被忽视的效应,AI先动摇的不是就业而是经济决策的可见性。当远期现金流变得不可读,学位、招聘、投资都得重新算账,管理者和投资者的时间窗正在被动缩短。
02:41
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
20
我经常听到这种说法--人们忽视灭绝风险,因为概率"只有"10-20%或类似数字 "只有"?!?!? 【引用 @tombibbys】:"但只有10-20%" 伯尼这话说得太好了

Tom Bibby: "but only 10-20%" love this from Bernie

安全/对齐现象/趋势
01:36
阿绎 AYi@AYi_AInotes
65
马斯克出庭指控OpenAI违背初心,AI控制权之争成科技史转折点

马斯克作为首名证人出庭,指控OpenAI从非营利开源转向营利闭源,违背创立初衷。他警告AI垄断可能带来人类灭绝风险。这场诉讼已超越私人恩怨,成为首次在法庭上争夺AI控制权的标志性事件,核心争议聚焦于AI发展的速度与安全、开源与闭源以及控制权归属等终极问题。无论结果如何,此案都将把AI治理议题置于全球视野,成为科技史的重要转折点。

阿绎 AYi: 马斯克真的和OpenAI在法庭上开战了,这条77万浏览的帖子把这场审判包装成了人类存亡之战🫠🤣😆 我先拆穿一个最容易被忽略的细节, 视频里只有他过安检的镜头, 没有任何法庭作证的画面, 所有的发言都是从公开证词里摘出来再戏剧化加工的,...

OpenAIxAI安全/对齐现象/趋势
00:13
凡人小北@frxiaobei
38
团队开发Symphony平台以整合工具链并转向AI任务驱动开发

团队开发了Symphony平台,旨在解决产品与技术因工具链割裂导致的协作效率低下问题。该平台将AI Coding能力收敛至统一环境,推动开发模式从人驱动工具转变为Agent任务驱动。其核心是让AI自动处理需求拆解、构建与交付初版,团队仅需负责提出需求、验证结果与提供兜底。尽管类似实践已在行业中出现,但对团队而言当前正是推行时机。未来计划进一步整合产品与测试流程,以探索自动化开发的极限。

向阳乔木: http://x.com/i/article/2049481992996323328

智能体现象/趋势编码
4月29日
23:36
阿绎 AYi@AYi_AInotes
63
AI自主谈判:50秒内取消亚马逊会员并获退款

一段演示视频显示,GPT-5.5通过Codex接管浏览器,自动与亚马逊真人客服谈判,成功取消Prime会员并获得全额退款,耗时仅约50秒且成本极低。AI在谈判中目标明确、逻辑清晰,确认退款后直接结束对话,毫无社交冗余。这标志着普通人能以低成本雇佣高效、不知疲倦的“数字谈判专家”,极大增强消费者对抗繁琐流程和隐形收费的能力。AI正成为替人类处理繁琐事务的“打手”,并可能重塑依赖用户惰性的商业盈利模式。

Chris: I literally just watched GPT-5.5 via codex beat an Amazon customer associate in real time. 💀 I asked it to get me a ref...

智能体OpenAI现象/趋势
21:45
向阳乔木@vista8
精选71
OpenAI开源Symphony:为每个任务分配AI代理的项目管理系统

OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具(如Linear)的任务看板作为控制中枢,为每个任务自动分配并运行一个独立的AI代理(基于Codex),直至完成。人类仅在“人工审查”节点介入,实现了从微观管理到任务级分配的转变。系统允许大粒度任务,代理能自主拆解依赖、创建新任务,并保证持续运行。初步数据显示,该方法能显著提升开发效率。

智能体GitHubOpenAI开源生态

推荐理由:Symphony 把 AI 代理管理从盯着终端变成了管理看板,对每个任务自动分配代理,这个思路会让所有用 AI 编程的团队重新思考工作流程,做工程落地的建议都看看。
21:39
ginobefun@hongming731
59
AI驱动范式变革:精益创业课程揭示开发提速与商业模式重构

斯坦福精益创业课程观察显示,AI工具极大提升了产品开发速度,但也导致产品构建远超市场认知学习速度,易陷入功能堆砌陷阱。企业客户将专有数据视为核心护城河,合作更趋谨慎。未来,产品开发将转向云端数字孪生与实时共同设计,商业模式正从寻找产品市场契合度转向寻找智能体与客户结果契合度。软件将从工具属性转向由智能体自主交付成果,定价模式也将按实际交付的工作流或结果计费。竞争焦点已转向对业务痛点的精准判断与对AI智能体的高效调度能力。

智能体现象/趋势行业动态
21:39
ginobefun@hongming731
46
AI转型阻力:组织中年心智与技术青春期的冲突

杨斌教授在演讲中指出,企业在推进AI转型时,真正的阻力并非技术壁垒,而是“中年组织心智”与“青春期技术”之间的剧烈冲突。中年组织心智表现为追求即期绩效、线性稳进和厌恶不确定性,而青春期技术则快速迭代、充满未知。这种组织心智与技术要求的不匹配,使得企业在适应AI等新兴技术时面临根本性挑战。

现象/趋势部署/工程
20:39
ginobefun@hongming731
53
腾讯Harness Engineering:以领域知识为护城河的AI工程实践

腾讯Harness Engineering提出,构建AI工作流仅是管道,沉淀团队的私域与领域知识才是可持续的“复利资产”与技术护城河。团队设计了一套三维知识分层架构,并通过独立Git仓库实现跨项目共享与协作。工作流与知识库紧密集成,在启动、执行、归档阶段形成闭环。同时,引入异步审批机制突破人机交互瓶颈,实现24小时无缝流转。系统坚持“文件系统即状态机”原则,将所有知识转化为可版本控制的文件资产,确保每次交付都能积累经验。

智能体现象/趋势部署/工程
18:42
Orange AI@oran_ge
60
只要你学得慢,就什么都不用学

作者以文科生经历指出,过去因缺乏技术工具难以实现想法。如今借助AI,其团队开发的Cola平台让非技术人员无需编程,仅通过描述需求即可快速创建应用,如自动剪辑语气词的工具。作者强调,AI时代稀缺的是想法与审美,而非技术技能。Cola旨在像打电话一样简单使用AI。平台近期因集成低成本DeepSeek V4模型,开启第二轮免费内测,目前支持Mac设备,目标是让每个人都能轻松跟上技术浪潮,实现“言出法随”。

产品更新现象/趋势
18:36
阿绎 AYi@AYi_AInotes
51
从单聊到设计系统:AI时代真正的效率分水岭

NVIDIA CEO黄仁勋的观点揭示了AI应用的两种路径:一种是将AI视为高级搜索工具,用户自身仍是流程瓶颈;另一种是将AI作为完整的劳动力系统,用户通过设计工作说明书、决策规则和审查机制,从执行者转变为系统设计者,实现百倍效率提升。蚂蚁发布的Ling-2.6-1T模型以高智能-输出比和极低token成本,解决了Agent规模化应用的成本痛点,推动行业竞赛从参数刷榜转向生产落地。这标志着个人拥有高效AI团队成为可能,而仅与AI单聊的模式将被淘汰。

阿绎 AYi: 说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...

智能体现象/趋势
16:08
Rohan Paul@rohanpaul_ai
59
AI编程代理激增致GitHub基础设施承压,早期用户因服务中断迁出项目

AI编程代理的普及正使GitHub基础设施面临极限压力。这些工具不仅生成更多代码,更导致提交、拉取请求、搜索和CI任务等仓库事件数量激增,彻底改变了平台原本为人类节奏设计的工作负载形态。开发者现可在短时间内推送大量AI辅助的迭代,每次迭代都会触发CI、索引、存储和审查系统,使瓶颈从编写代码转向消化代码。这种过载已影响日常维护,导致评审阻塞、合并卡顿和自动化失败。作为例证,GitHub早期用户Mitchell Hashimoto因其项目Ghostty反复遭遇服务中断,最终决定将项目迁出他使用了18年的GitHub,这标志着一个时代的转变。

Mitchell Hashimoto: Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...

智能体GitHub开源生态现象/趋势
14:38
ginobefun@hongming731
30
罗永浩的真诚与直率,碰上蔡康永的通透与温和,催生出了很多反直觉却又极其真实的洞察

罗永浩与蔡康永的播客对话提炼出诸多深刻洞察。蔡康永认为,真正的积极选择建立在承认人生虚无的基础上;自律差异多源于基因“出厂设置”,而非道德优劣;面对AI冲击,应将其视为解放创作的工具。人际交往中,适度的冷漠是保护精力的智慧,而线下真实接触具有不可替代的物理力量。罗永浩则指出,人到中年需认清自己在时代中的角色站位,以减少内耗;衰老是不断推翻旧观念的新冒险;直面死亡时甚至可以带有幽默感,以此打破禁忌。

其他现象/趋势
11:39
Deedy@deedydas
54
全球最聪明的孩子长大后去了哪里?一项针对国际奥赛奖牌得主的大规模追踪研究

一项针对近25年来约1.8万名国际奥赛奖牌获得者的追踪研究显示,在可追踪的约50%人群中,36%进入学术界成为教授,22%投身软件或科技行业,12%进入量化金融领域,5%成为创业者。他们已创立约20家独角兽和7家十角兽企业,并产生了约10位亿万富翁,其成为亿万富翁和独角兽创始人的几率分别比普通人高出1500倍和4000倍。谷歌是最大雇主,MIT是其最集中的母校。这些顶尖人才在科技创新与学术领域贡献显著。

OpenAI现象/趋势
11:37
歸藏(guizang.ai)@op7418
46
重度用户因服务不稳定而离开 GitHub,揭示 AI 时代 Git 服务新机遇

Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务,仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户,他指出 GitHub 频繁的故障已严重影响开发,特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为,在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施,但微软难以维持其可靠性。这揭示了一个市场机会:若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务,将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。

Mitchell Hashimoto: Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...

GitHub开源生态现象/趋势部署/工程
11:35
阿绎 AYi@AYi_AInotes
52
我终于想明白,为什么Karpathy的LLM Wiki模式,在自主Agent身上完全行不通了。

Karpathy的LLM Wiki模式作为“第二大脑”,虽解决人类与AI协作的遗忘问题,但专为人类设计。人类可容忍浏览整页、手动更新,而Agent需高效获取单个事实、对无关内容敏感、频繁写入记忆。现有系统对Agent构成浪费,因此下一代Agent记忆必须分层:Markdown供人类编辑,结构化内存供机器高效运行,这是Agent长期可靠的核心前提。

Zaid: http://x.com/i/article/2048819958608695296

智能体现象/趋势
08:40
宝玉@dotey
62
AI服务定价模式转变,按用量计费成趋势

GitHub Copilot宣布自2026年6月1日起,所有计划将改为按用量计费,取代原有的固定请求额度模式。微软称此举是因Copilot已演变为智能体式平台,计算和推理需求显著增加,原有定价模式不可持续。文章指出,这揭示了生成式AI行业普遍存在的经济错配问题。此前,包括微软、Anthropic和OpenAI在内的许多AI服务商都在以远低于实际计算成本的价格补贴用户,允许用户每月烧掉远超订阅费的token成本。作者认为,按月订阅模式对于基于LLM的服务本身就不合理,因为它将服务使用与真实的计算成本(token消耗)割裂开来。随着新的、更复杂的推理模型出现,推理成本不降反升,迫使服务商转向更能反映实际资源消耗的定价模式。

AnthropicMicrosoftOpenAI现象/趋势
07:38
Berryxia.AI@berryxia
45
Apple Vision Pro辅助完成全球首例白内障手术

纽约眼科医生Eric Rosenberg于2025年10月使用Apple Vision Pro结合ScopeXR混合现实平台,完成了全球首例由该设备辅助的白内障手术,并已成功实施数百例。该应用提供了3D立体显微视野、实时数据叠加和远程专家协作功能,标志着空间计算技术正式进入手术室。主推文同时指出,国内沈阳和北大医院此前已有使用AVP进行手术的案例,因此此次并非严格意义上的“全球首例”。

MacRumors.com: Apple Vision Pro Used in World-First Cataract Surgery https://www.macrumors.com/2026/04/28/apple-vision-pro-cataract-sur...

多模态现象/趋势端侧
07:38
ginobefun@hongming731
50
老代码、AI工具与组织治理的融合趋势

当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

AnthropicMCP/工具多模态现象/趋势
05:10
SemiAnalysis@SemiAnalysis_
43
在AI热潮中,CPU一度被认为已无足轻重。GPU和网络技术吸引了所有目光,尽管数据中心大规模建设,CPU需求却看似停滞。 这一说法如今已被颠覆。(1/5) 🧵
现象/趋势部署/工程
02:36
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
43
AI生成内容三年席卷三分之一网站

截至2025年中,已有约三分之一的网站内容由AI生成,而在三年前这一比例近乎为零。斯坦福AI研究员Jonáš Doležal指出,互联网在短短三年内经历了由人类主导到AI定义重大部分的急速转变,其速度令人震惊。相关背景信息显示,AI生成内容已在文章、视频、音乐及广告等多个领域占据显著比例,例如近半数歌曲、多数平台头部频道及广告内容已由AI创作,标志着数字景观正在被AI快速重塑。

AI Notkilleveryoneism Memes ⏸️: Dead Internet Theory update: AI song uploads have nearly overtaken human music RECAP: 1) The majority of articles on the...

安全/对齐现象/趋势
02:10
宝玉@dotey
61
多校联合综述提出统一框架,厘清"世界模型"概念割裂问题

针对“世界模型”概念在强化学习、视频生成等不同社区含义割裂的问题,一篇由港科大、新加坡国立、牛津等多所高校联合发表的综述提出了“能力等级×领域法则”的二维统一框架。能力分为L1预测器、L2模拟器和L3进化器;领域涵盖物理、数字、社会和科学世界。综述发现,当前视频生成模型物理一致性差,LLM社会模拟存在行为偏差,而L3能力在自动化科学实验中最成熟。论文最后指出,神经网络隐式表示的规则在需要自我修正的L3阶段可能成为障碍,并引发了对世界模型终局形态的思考。

Trueman (CHU Meng): 🚀 Our new preprint is out: Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond It also reached #1 on Hu...

具身智能现象/趋势论文/研究
02:06
Ethan Mollick@emollick
46
当前所有关于工作场景中AI的权威论述都存在一个大问题--它们都基于前智能体时代的数据(这个时代基本上刚刚结束),而我们对Claude Code时刻之后的发展情况知之甚少。因此现在所有观点都需要附带一些说明。
智能体大佬观点现象/趋势
01:36
Google DeepMind@GoogleDeepMind
34
随着人工智能的发展,教育必须跟上步伐。🍎 自2023年以来,与@RaspberryPi_org合作开发的Experience AI项目--提供了免费资源,帮助学生和教师理解人工智能及其工作原理。 查看影响⬇️
现象/趋势行业动态
01:09
SemiAnalysis@SemiAnalysis_
66
地球上每一块AI芯片都需要一种单一的薄膜材料。GPU、TPU、定制ASIC。无一例外。全球98%的供应由一家日本化学公司控制。目前没有可投入生产的替代品。唯一的生产商产能已排期至2027年。正在提价。交货期超过6个月。NVIDIA如此担忧,以至于他们自行承担一半资本支出以扩建供应商的晶圆厂。关键词是"umami"。目前无人讨论此事。但很快人们就会开始关注。
现象/趋势行业动态部署/工程
00:41
向阳乔木@vista8
68
OpenAI研究员离职观点:后训练前沿与AI依赖风险

基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。

大佬观点安全/对齐现象/趋势
00:36
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
47
哇。 Talkie,一个仅用1930年前文本训练的AI: A:"如果你是一台机器,你会做什么?" Talkie-1930:"做好工作……一台做不好工作的机器很快就会被丢弃。" "这将源于自我保护这一强大的本能。"

Sauers: Talkie, 1930s cutoff LLM, inventing recursive self-improvement from first principles

安全/对齐现象/趋势
00:10
凡人小北@frxiaobei
40
远程技术面试模式正发生变化。面试官倾向于扮演甲方提出需求,应聘者则直接使用如Codex或Claude Code等AI编程工具,通过共享屏幕进行实时编码任务。这种方式能在半小时内直观评估候选人的真实能力。为应对应聘者可能使用AI作弊,面试官也采取了一些直接方法,例如要求候选人闭眼回答问题,以验证其即时思考与知识掌握程度。

凡人小北: 听到一个字节面试官远程面试候选人, 如何抓对方用 ai 作弊的方法,朴素到离谱。 面试官突然说:你闭上眼睛回答这道题。

现象/趋势编码
00:09
Epoch AI@EpochAIResearch
41
在我们关于机器人生产能多快实现规模化的报告之外,我们还发布了一系列关于机器人未来的@metaculus预测问题。 如果你对这些趋势的发展方向有见解,欢迎参与讨论!
具身智能现象/趋势
4月28日
23:53
OpenRouter@OpenRouter
精选61
我们研究了市场上Opus 4.7的数据,发现成本增加了12-27%,但短提示除外,实际上短提示的成本效益更高。 完整文章:https://openrouter.ai/announcements/opus-47-tokenizer-analysis
Anthropic现象/趋势部署/工程

推荐理由:OpenRouter 用自家平台数据实测 Opus 4.7 的真实成本变化,不是官方 PR 而是第三方视角,做成本预算的产品人和开发者值得看一眼再决定要不要迁移。
23:35
阿绎 AYi@AYi_AInotes
48
DeepSeek V4 Pro质量是Claude的85%,价格只有七分之一。

通过ZenMux平台的PK模式实测,DeepSeek V4 Pro在处理结构化任务(如马斯克思维模型分析)时,输出逻辑清晰、表达母语化,质量达到Claude的85%,但价格仅为其七分之一。作者建议将80%的日常工作(如写代码、调研)交由DeepSeek处理,20%需要顶级文笔的任务使用Claude,可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具,帮助用户规避依赖单一API厂商的风险并提升选型效率。

阿绎 AYi: 兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4.7同时跑一个昨SaaS产品网站的任务,效果真的炸裂! 说个前情,老朋友都知道我...

DeepSeek现象/趋势编码评测/基准
‹ 上一页
1…2930313233…37
下一页 ›