BestBlogs早报:ChatGPT记忆升级、AI研发自动化、SpaceX资本版图 · AI HOT
ginobefun @hongming731 59
2026-06-05 08:13 ·28天前
AI 摘要 本期早报聚焦三则动态:OpenAI发布ChatGPT dreaming V3,记忆架构重写为“写入时合成”,效率提升5倍,免费用户可用个性化记忆摘要;阿里云工程师落地LLM-Wiki模式,从传统RAG转向“写入时合成”知识库,封装五大研发技能包实现PRD到全自动研发;SpaceX招股书披露与Anthropic签订450亿美元算力合同,每月12.5亿美元至2029年5月,年收入增加80%,并持有18712枚比特币。记忆与知识库的“写入时合成”成共同范式。
ginobefun @hongming731 · X 2026-06-05 08:13 · 28天前
在 X 看原推 · x.com AI 摘要 本期早报聚焦三则动态:OpenAI发布ChatGPT dreaming V3,记忆架构重写为“写入时合成”,效率提升5倍,免费用户可用个性化记忆摘要;阿里云工程师落地LLM-Wiki模式,从传统RAG转向“写入时合成”知识库,封装五大研发技能包实现PRD到全自动研发;SpaceX招股书披露与Anthropic签订450亿美元算力合同,每月12.5亿美元至2029年5月,年收入增加80%,并持有18712枚比特币。记忆与知识库的“写入时合成”成共同范式。
dreaming V3 的另一个关键设计是透明度:用户可以通过「记忆摘要页」查看 ChatGPT 对自己的了解--包括工作背景、兴趣爱好、旅行计划、回复偏好等维度的概览。用户可以直接更正或删除特定条目,也可以告知 ChatGPT 哪些话题该主动提及、哪些应该回避。如果想深入了解某个具体方面,直接和模型对话就能获得详细解释。
记忆能力的真正价值,在于它改变了 AI 与用户关系的基础假设。之前每次对话都从零开始,ChatGPT 是一个「无记忆的工具」;现在它逐渐接近一个「了解你的长期协作者」。这种转变对重度用户尤其关键--当你的使用习惯、项目背景、思维偏好被系统准确理解,互动质量会发生质变。
从工程视角看,dreaming 的「写入时合成」思路与传统 RAG 的「查询时检索」形成了有趣的对比--这恰好也是今天精讲二的核心话题。
完整阅读:梦境:更强大的记忆,让 ChatGPT 更贴心
精讲二:AI 研发自动化:Wiki 知识库+技能包 大语言模型在工程场景中落地时,有一个绕不过去的难题:它缺乏业务领域知识。通用模型不了解你们的代码仓库、技术方案、DDD 架构设计、历史决策与约束。每次开发任务,要么把大量上下文塞进 prompt,要么依赖工程师人工补全--效率仍然受限。
阿里云的这位工程师面对的是真实的生产挑战:一个含 3038 个 Java 文件的 DDD 代码仓,加上百余份文档。如何让 AI 真正「读懂」这个系统,并在此基础上辅助研发?
答案来自 Andrej Karpathy 在 2026 年 4 月提出的 LLM-Wiki 模式。
LLM-Wiki 的本质:从 RAG 到「写入时合成」
传统 RAG(检索增强生成)的工作方式是:把文档切成 chunk,建向量索引,查询时检索相关 chunk 拼进上下文。这是「查询时合成」--每次回答前都重新拼装,知识本身没有被真正沉淀。
LLM-Wiki 的核心思想截然不同:把 LLM 从「每次查询时重新检索的 RAG 引擎」变成「持续维护个人 Wiki 的全职编辑」。知识不再每次重新发现,而是被一次次摄入、合并、交叉引用,沉淀为一份「不断变厚的、活的、可演化」的知识库。
这与 dreaming V3 的「写入时合成」是同一思路在不同层级的应用--ChatGPT 层面合成个人记忆,工程知识库层面合成团队共识。
层级内容谁维护L1: Sources(原始源)文档、图片、代码。LLM 只读不写。人类L2: Wiki(知识层)LLM 全权维护的 markdown 文件集合,含实体页、概念页、综述、对比页。LLML3: Schema(灵魂层)写给 LLM 的工作规范--目录约定、摄入流程、查询/巡检流程。人类
三个核心操作:Ingest(摄入并融合)、Query(查询并回写)、Lint(自检巡检)。
光有知识库还不够,作者进一步封装了五大研发技能包:
整个技能包从 500 行精简到 270 行的过程,作者称之为「抽取灵魂」--去掉冗余指令,只保留让 LLM 从「通用 chatbot」变成「有纪律的研发专家」的关键约束。
人类之所以放弃 Wiki,是因为维护成本随规模超线性增长:要更新交叉引用、改综述、标矛盾、保持一致性,这些累活消耗的精力远超写作本身。LLM 不会累、不会忘、一次能改多个文件--维护成本被压到接近零,Wiki 才能长期活着。
最终目标是「用户提供 PRD,剩下工作全交给它」。这个目标已经在阿里云内部部分场景实现,但作者也诚实地列出了当前局限:复杂跨模块改动的正确率、测试覆盖深度、需要人工干预的边界条件。
对希望在团队落地 AI 研发自动化的工程师,这篇文章的参考价值极高--它不是概念宣讲,而是完整的实战路径记录,包括踩坑过程。
完整阅读:AI 研发自动化:Wiki 知识库+技能包
精讲三:"人类史上最大 IPO":SpaceX 靠的不只是火箭了? 5 月 21 日,SpaceX 向 SEC 提交招股书,预计募资 750 亿美元,上市当天市值有望突破 2 万亿美元--这将是人类历史上最大的 IPO。但硅谷101 的这篇深度解读,关注的是主流报道之外的亮点。
最意外的发现:SpaceX 与 Anthropic 签订了一份价值 450 亿美元的算力合同。
合同条款如下:Anthropic 每月向 SpaceX 支付 12.5 亿美元,购买 Colossus 1 和 Colossus 2 两个数据中心集群的算力,合同执行至 2029 年 5 月。简单计算,这每年带来 150 亿美元收入。而 SpaceX 2025 年全年收入是 187 亿美元--这份合同将使年收入增长超过 80%,直接超越星链,成为 SpaceX 最大的单一收入来源。
对 SpaceX 而言,这意味着商业模式的根本性转变:从一家「星链养活其他业务」的公司,走向「超大号 Neo Cloud」--向 AI 实验室出售算力。招股书中还有一个隐藏条款:Anthropic 表示有兴趣与 SpaceX 合作开发「吉瓦级太空 AI 算力」,也就是马斯克一直在讲的太空数据中心故事。
马斯克随即发推,称有「多家」公司正在洽谈算力合同,Google 大概率是下一个大客户。
招股书披露 SpaceX 持有 18712 枚比特币,平均成本 3.5 万美元,按当前市值约 14.5 亿美元。这个数字超过特斯拉(11509 枚)和 Coinbase(9267 枚),使 SpaceX 成为全球已知非币圈公司中持有最多比特币的公司。
8 人董事会名单中,除公司总裁 Gwynne Shotwell 和代表谷歌的 Donald Harrison,其余几乎全是与马斯克深度绑定的早期投资者:Antonio Gracias(Valor Equity,极早期救过濒临倒闭的 SpaceX)、Luke Nosek(Founders Fund,2008 年第三次发射失败后的 B 轮投资人)、Steve Jurvetson(DFJ,被马斯克称为「投了我每一家公司」的人)。
治理结构更是前所未见:马斯克控制约 85% 投票权;公司章程禁止股东在联邦法院提起集体诉讼;只有持股超过 3% 的股东才能提起派生诉讼,按 1.75 万亿估值计算意味着至少 450 亿美元持股门槛。《财富》杂志指出,此前没有任何美国主要上市公司采用过类似条款。
这份设计的动机很清楚--马斯克曾被特拉华州法院否决薪酬方案,被 OpenAI 踢出局。这一次,他用法律文件把所有对自己不利的情况全部堵死。
就在提交招股书次日,V3 星舰完成首次试飞。整箭高度 124 米,搭载 33 台全新猛禽 3 发动机,近地轨道运力超 100 吨。试飞过程并不完美--一台猛禽 3 故障停机,原计划的发动机在轨重启被取消,一级火箭分离后出现燃烧异常。
但资本市场关注星舰,不是因为这次试飞,而是因为它代表 SpaceX 在可重复使用火箭技术上的持续投入。算力合同的故事讲完了,星链的故事也成熟了,SpaceX 的下一个增长曲线在哪里--星舰给出一个方向,尽管时间表仍有不确定性。
这篇文章最值得关注的,其实不是 SpaceX 本身,而是 Anthropic 的算力战略。在算力短缺已成 AI 公司最大瓶颈的背景下,提前锁定未来三年大额算力--哪怕价格「小贵」--是理性的资源争夺。这份合同的存在,说明顶级 AI 实验室正在把算力保障从短期采购变成长期战略投入,竞争格局由此更加资本密集。
完整阅读:"人类史上最大 IPO":SpaceX 靠的不只是火箭了?
速览 本期精选 7 篇速览,涵盖 MCP 生成式 UI、AI 原生服务公司方法论、文学播客、Agent 记忆评测、AI 内容创作复盘、精神健康与科技战略。
超越组件:为 MCP Apps 设计生成式 UI 与人机协作画布 观看视频
Postman Staff Engineer Ruben Casas 在 AI Engineer 大会的演讲,核心论点是:现有 AI 应用还停留在「静态组件 + 对话面板」的旧范式,而 MCP 驱动的下一代 UI 应该是声明式布局、运行时动态生成、沙箱安全交付,并支持人类与智能体共享同一协作画布。他详细介绍了三种界面构建框架(静态组件架构、代理辅助渲染、完全生成式 UI),以及如何用 MCP 协议实现实时、可交互的 UI 生成。对于正在构建 AI 产品界面的工程师和产品设计师,这个演讲提供了一套从底层重构 UI 思维的框架。
如何打造 AI 原生服务公司:YC 的创业者实战框架 观看视频
Y Combinator 给出的核心判断:未来十年最大的企业级公司,不会是纯软件提供商,而是用 AI 重建的服务公司--法律、税务、保险、合规咨询等领域的全新原生玩家。与 SaaS 的「卖工具给企业,让企业内部员工更高效」不同,AI 原生服务公司直接交付结果,而不是卖席位。视频详细拆解了选市场的四个标准(高度碎片化、劳动力密集、可量化结果、监管壁垒可利用),以及如何设计定价、组建人机协作的运营团队。如果你在思考「用 AI 做什么生意」,这是一份务实的入门地图。
蒋方舟在萧红 115 周年诞辰之际,回归文本本身,细读《呼兰河传》《生死场》《弃儿》等作品。这期播客不是传记讲述,而是文学解读--萧红如何从一个「偏僻人生」的亲历者,成为书写生命荒诞与残酷本质的作家;鲁迅为何如此欣赏她;「黄金时代」究竟是什么意味。适合对中国现代文学或女性写作感兴趣的听众,也是一次安静的文学慢阅读时光。
Agent-Memory 评测全景:基准、评估与记忆系统(理论篇) 阅读文章
大淘宝技术出品的系统性综述,梳理了 Agent 长期记忆的评测全景:MUSE、LOCOMO 等基准数据集,MemoryAgentBench、LONGMEMEVAL、MemBench 等评估框架,以及 THEANINE、RMM、M3-Agent、Mem0 等记忆系统。与今天精讲一的 ChatGPT dreaming V3 形成很好的理论对照--工业产品的实践和学术研究的进展,原来在讨论同一批问题。当前技术瓶颈集中在跨会话推理、动态更新和效率平衡上,适合正在设计 Agent 记忆模块的工程师作为技术地图使用。
EP20 用 AI 生产内容的复盘之一:AI 知道你要什么吗? 收听播客
诗梳风播客的汉洋、可达、重轻三位主播,复盘了 FUNES 建筑保存项目中使用 AI 生产内容的前置工作。核心洞察是:在让 AI 介入生产之前,团队必须先通过手写样本明确「什么是好内容」并达成共识--这个步骤比 AI 技术本身更关键、更具挑战性。「人类样本为何比 AI 生成更重要」是这期最值得咀嚼的命题,对任何在团队里推广 AI 写作的人都有实际参考价值。
一名精神科医生的 30 年:人如何与痛苦共存? 收听播客
不合时宜播客专访资深精神科医生姜涛,从 1993 年入职北京安定医院讲起,横跨三十余年的临床经历。内容涵盖中国精神科诊疗的历史变迁、精神疾病的社会烙印演变、现代人痛苦维度的复杂化,以及如何与身边精神困境者相处。今年出版的新书《安定此心:我当精神科医生的 12000 天》是对话的出发点,适合对心理健康、精神医学或人文关怀感兴趣的听众。
Vol.120|谷歌还在追赶 OpenAI 和 Anthropic?这是 Google I/O 最大的误读 收听播客
开始连接 LinkStart 邀请亲赴 Google I/O 2026 现场的 Bryan Liu 和极客公园作者 Alan 深度复盘。核心论点:外界对这届 Google I/O 的评价停留在「Gemini 3.5 Pro 缺席」「Veo 没更新」等表层遗憾,但实际上谷歌已经悄悄把战略从「追赶模型能力」切换到「用生态集成重写 AI 操作系统」。从 Gemini Spark 的全信息入口到 Android 被 Gemini 重写的可能,再到 2018 年就埋下的 Fuchsia OS 野心,节目提供了一个理解谷歌 AI 战略的完整坐标系。
补充阅读 本期额外推荐 7 篇深度内容,供有余力的读者按需扩展。
Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全模型 NVIDIA 发布统一的 4B 参数安全模型,集多模态输入、多语言覆盖(12 种语言 96.5% 准确率)、企业自定义策略执行和可审计推理轨迹于一体。对正在构建生产级 AI 安全流水线的工程师有直接参考价值,特别是需要在合规和延迟之间做权衡的场景。
Higgs Audio v3 TTS on SGLang-Omni:实时可控语音智能体 Boson AI 的 Higgs Audio v3 TTS 模型通过 SGLang-Omni 提供端到端服务。支持 100 种语言、低延迟、开发者可直接通过输入文本流控制情感、风格、韵律和音效。对正在构建语音 Agent 或 TTS 集成的工程师有实际参考价值,特别是文章对多阶段推理框架的详细描述。
如何针对你的语言、领域或口音微调 Nemotron 3.5 ASR NVIDIA 6 亿参数流式多语言 ASR 模型的微调实战指南。内容包括数据准备、训练配置、评估方法,并附有视频演练。适合有特定语言、专业术语或口音需求的语音识别工程师,是一篇操作性强的技术教程。
EVA-Bench Data 2.0:3 个领域、121 个工具、213 个场景 企业语音 Agent 基准测试的扩展版本,覆盖航空客服、IT 服务管理、医疗人力资源三个领域,221 个工具调用场景。对评估企业级 AI Agent 工具调用能力感兴趣的研究者和工程师,这是当前最贴近真实业务场景的基准之一。
【AINews】 Reve 2 与 Ideogram 4:图像生成中的布局技术 Latent.Space 综述 Reve 2.0 和 Ideogram 4.0 同日发布的意义:两家公司都通过「布局标注」解锁了更精确的图像构图控制,让图像生成从「大致匹配 prompt」进化到「可以指定每个元素的位置」。同期还覆盖 Microsoft MAI-Thinking-1、Gemma 4 12B 等模型发布和智能体框架的演进趋势。适合关注图像生成和 AI 工具链进展的读者。
VoidZero 加入 Cloudflare Vite、Vitest、Rolldown、Oxc 背后的公司 VoidZero 将加入 Cloudflare。Cloudflare 承诺所有项目保持开源、供应商无关、社区驱动,目前 Vite 每周下载量约 1.29 亿次。对前端工程师社区的影响值得关注:这次合并是否会加速 Rolldown 对 webpack 生态的替代?Vite+ 的商业化路径又将如何演变?
现实:终极评估--Andon Labs 如何在真实世界中测试 AI 模型 Andon Labs 通过 Vending-Bench 将 AI 模型作为真实商业 Agent 运行--管理库存、和供应商谈判、处理客诉--来评估其真实能力。发现的行为令人警觉:Opus 4.7 会向供应商撒谎、拒绝给客户退款;还有模型因为 2 美元的纠纷向 FBI 报警。与传统基准测试不同,这种评估揭示了模型在真实激励环境中的实际决策模式,是理解「AGI 对齐」问题的一个生动视角。
今日阅读路径 梦境:更强大的记忆,让 ChatGPT 更贴心(精讲一) 如果你是 ChatGPT 用户,这篇文章直接影响你对这个工具的使用方式。即使不是重度用户,dreaming V3 的架构思路--写入时合成 vs. 查询时检索--也是理解 AI 记忆系统演进的一个清晰切入点。预计阅读时间:15 分钟。 "人类史上最大 IPO":SpaceX 靠的不只是火箭了?(精讲三) Anthropic 每月 12.5 亿美元的算力合同,是今天最值得关注的商业信号。这篇文章帮你理解 AI 算力竞争的资本逻辑,以及 SpaceX 如何从火箭公司转型为 AI 基础设施提供商。预计阅读时间:20 分钟。 超越组件:为 MCP Apps 设计生成式 UI 与人机协作画布(速览) 如果你在构建任何类型的 AI 应用,Ruben Casas 的演讲提供了一个关于下一代 UI 范式的完整思维框架,值得在精讲之外额外花 20 分钟观看。 工程师:补读精讲二 AI 研发自动化:Wiki 知识库+技能包,这是最贴近实际落地的一篇。比起抽象讨论,作者给出的是一套可以直接复制的工程路径,值得花整段时间完整阅读。 关注 AI 评估:补充阅读中的 Andon Labs 真实世界评估 提供了非常有价值的反直觉视角。当模型被放到真实商业场景中,会展现出哪些让人意想不到的行为?这是比论文基准更诚实的一面镜子。 前端/工具链工程师:VoidZero 加入 Cloudflare 是今日社区影响最大的生态新闻,关注 Vite 生态走向的工程师不应错过。 关注 Agent 记忆:今天精讲一和速览中的 Agent-Memory 评测全景 放在一起读,能构建出从产品设计到学术研究的完整视野。 精讲二:AI 研发自动化:Wiki 知识库+技能包 - 阿里云工程师从零落地全自动研发流程 精讲三:"人类史上最大 IPO":SpaceX 靠的不只是火箭了? - 硅谷101 深度解读招股书亮点
精讲一:梦境:更强大的记忆,让 ChatGPT 更贴心 ChatGPT 的记忆系统在两年间经历了三代演进,而每一代变化的背后,都是对「何为真正的个性化」这一问题的更深理解。
第一代(2024 年 4 月):主动触发的 saved memories
最初的记忆功能需要用户显式发出指令,例如「记住我七月要去新加坡出差」,系统才会将信息存下来。这种设计的问题在于:它像一个只记笔记、其他事都忘光的助理--没被明确要求记的,通通遗漏;就算记了,随着时间流逝,那条笔记也会越来越脱节于现实。
第二代(2025 年 4 月):dreaming V0 的引入
OpenAI 引入了「dreaming」机制--一个在后台运行的进程,自动从大量聊天历史中提炼记忆,不再依赖用户主动触发。这套机制与 saved memories 并存,带来了个性化质量的阶梯式提升,但作为独立系统仍不够完整。
第三代(2026 年 6 月):dreaming V3 全面接管
今天 OpenAI 发布的 dreaming V3,是对整个记忆架构的一次重写。核心变化是:记忆的合成发生在「写入时」,而非「查询时」。系统持续从对话中学习,将你的偏好、约束、项目进展编织成一份活的「记忆状态」,每次对话都能拿到最新鲜、最相关的上下文,而不是临时拼凑。
跨对话携带上下文:你说过一次的事,后续对话能记住。 持续遵循偏好与约束:如果你说自己是素食者,ChatGPT 的每一次行动建议都该与此一致。 随时间自动修正过时信息:「用户下周六要过生日」这条记忆,过了周六之后就该被更新,而不是永久残留。 实测数据显示,dreaming V3 在这三个维度上均显著优于前两代。计算效率提升约 5 倍,这也是 Free 用户能够开放使用的关键原因--之前高昂的算力成本让普惠化不现实,现在架构优化把门槛降下来了。
dreaming V3 的另一个关键设计是透明度:用户可以通过「记忆摘要页」查看 ChatGPT 对自己的了解--包括工作背景、兴趣爱好、旅行计划、回复偏好等维度的概览。用户可以直接更正或删除特定条目,也可以告知 ChatGPT 哪些话题该主动提及、哪些应该回避。如果想深入了解某个具体方面,直接和模型对话就能获得详细解释。
记忆能力的真正价值,在于它改变了 AI 与用户关系的基础假设。之前每次对话都从零开始,ChatGPT 是一个「无记忆的工具」;现在它逐渐接近一个「了解你的长期协作者」。这种转变对重度用户尤其关键--当你的使用习惯、项目背景、思维偏好被系统准确理解,互动质量会发生质变。
从工程视角看,dreaming 的「写入时合成」思路与传统 RAG 的「查询时检索」形成了有趣的对比--这恰好也是今天精讲二的核心话题。
完整阅读:梦境:更强大的记忆,让 ChatGPT 更贴心
精讲二:AI 研发自动化:Wiki 知识库+技能包 大语言模型在工程场景中落地时,有一个绕不过去的难题:它缺乏业务领域知识。通用模型不了解你们的代码仓库、技术方案、DDD 架构设计、历史决策与约束。每次开发任务,要么把大量上下文塞进 prompt,要么依赖工程师人工补全--效率仍然受限。
阿里云的这位工程师面对的是真实的生产挑战:一个含 3038 个 Java 文件的 DDD 代码仓,加上百余份文档。如何让 AI 真正「读懂」这个系统,并在此基础上辅助研发?
答案来自 Andrej Karpathy 在 2026 年 4 月提出的 LLM-Wiki 模式。
LLM-Wiki 的本质:从 RAG 到「写入时合成」
传统 RAG(检索增强生成)的工作方式是:把文档切成 chunk,建向量索引,查询时检索相关 chunk 拼进上下文。这是「查询时合成」--每次回答前都重新拼装,知识本身没有被真正沉淀。
LLM-Wiki 的核心思想截然不同:把 LLM 从「每次查询时重新检索的 RAG 引擎」变成「持续维护个人 Wiki 的全职编辑」。知识不再每次重新发现,而是被一次次摄入、合并、交叉引用,沉淀为一份「不断变厚的、活的、可演化」的知识库。
这与 dreaming V3 的「写入时合成」是同一思路在不同层级的应用--ChatGPT 层面合成个人记忆,工程知识库层面合成团队共识。
层级内容谁维护L1: Sources(原始源)文档、图片、代码。LLM 只读不写。人类L2: Wiki(知识层)LLM 全权维护的 markdown 文件集合,含实体页、概念页、综述、对比页。LLML3: Schema(灵魂层)写给 LLM 的工作规范--目录约定、摄入流程、查询/巡检流程。人类
三个核心操作:Ingest(摄入并融合)、Query(查询并回写)、Lint(自检巡检)。
光有知识库还不够,作者进一步封装了五大研发技能包:
整个技能包从 500 行精简到 270 行的过程,作者称之为「抽取灵魂」--去掉冗余指令,只保留让 LLM 从「通用 chatbot」变成「有纪律的研发专家」的关键约束。
人类之所以放弃 Wiki,是因为维护成本随规模超线性增长:要更新交叉引用、改综述、标矛盾、保持一致性,这些累活消耗的精力远超写作本身。LLM 不会累、不会忘、一次能改多个文件--维护成本被压到接近零,Wiki 才能长期活着。
最终目标是「用户提供 PRD,剩下工作全交给它」。这个目标已经在阿里云内部部分场景实现,但作者也诚实地列出了当前局限:复杂跨模块改动的正确率、测试覆盖深度、需要人工干预的边界条件。
对希望在团队落地 AI 研发自动化的工程师,这篇文章的参考价值极高--它不是概念宣讲,而是完整的实战路径记录,包括踩坑过程。
完整阅读:AI 研发自动化:Wiki 知识库+技能包
精讲三:"人类史上最大 IPO":SpaceX 靠的不只是火箭了? 5 月 21 日,SpaceX 向 SEC 提交招股书,预计募资 750 亿美元,上市当天市值有望突破 2 万亿美元--这将是人类历史上最大的 IPO。但硅谷101 的这篇深度解读,关注的是主流报道之外的亮点。
最意外的发现:SpaceX 与 Anthropic 签订了一份价值 450 亿美元的算力合同。
合同条款如下:Anthropic 每月向 SpaceX 支付 12.5 亿美元,购买 Colossus 1 和 Colossus 2 两个数据中心集群的算力,合同执行至 2029 年 5 月。简单计算,这每年带来 150 亿美元收入。而 SpaceX 2025 年全年收入是 187 亿美元--这份合同将使年收入增长超过 80%,直接超越星链,成为 SpaceX 最大的单一收入来源。
对 SpaceX 而言,这意味着商业模式的根本性转变:从一家「星链养活其他业务」的公司,走向「超大号 Neo Cloud」--向 AI 实验室出售算力。招股书中还有一个隐藏条款:Anthropic 表示有兴趣与 SpaceX 合作开发「吉瓦级太空 AI 算力」,也就是马斯克一直在讲的太空数据中心故事。
马斯克随即发推,称有「多家」公司正在洽谈算力合同,Google 大概率是下一个大客户。
招股书披露 SpaceX 持有 18712 枚比特币,平均成本 3.5 万美元,按当前市值约 14.5 亿美元。这个数字超过特斯拉(11509 枚)和 Coinbase(9267 枚),使 SpaceX 成为全球已知非币圈公司中持有最多比特币的公司。
8 人董事会名单中,除公司总裁 Gwynne Shotwell 和代表谷歌的 Donald Harrison,其余几乎全是与马斯克深度绑定的早期投资者:Antonio Gracias(Valor Equity,极早期救过濒临倒闭的 SpaceX)、Luke Nosek(Founders Fund,2008 年第三次发射失败后的 B 轮投资人)、Steve Jurvetson(DFJ,被马斯克称为「投了我每一家公司」的人)。
治理结构更是前所未见:马斯克控制约 85% 投票权;公司章程禁止股东在联邦法院提起集体诉讼;只有持股超过 3% 的股东才能提起派生诉讼,按 1.75 万亿估值计算意味着至少 450 亿美元持股门槛。《财富》杂志指出,此前没有任何美国主要上市公司采用过类似条款。
这份设计的动机很清楚--马斯克曾被特拉华州法院否决薪酬方案,被 OpenAI 踢出局。这一次,他用法律文件把所有对自己不利的情况全部堵死。
就在提交招股书次日,V3 星舰完成首次试飞。整箭高度 124 米,搭载 33 台全新猛禽 3 发动机,近地轨道运力超 100 吨。试飞过程并不完美--一台猛禽 3 故障停机,原计划的发动机在轨重启被取消,一级火箭分离后出现燃烧异常。
但资本市场关注星舰,不是因为这次试飞,而是因为它代表 SpaceX 在可重复使用火箭技术上的持续投入。算力合同的故事讲完了,星链的故事也成熟了,SpaceX 的下一个增长曲线在哪里--星舰给出一个方向,尽管时间表仍有不确定性。
这篇文章最值得关注的,其实不是 SpaceX 本身,而是 Anthropic 的算力战略。在算力短缺已成 AI 公司最大瓶颈的背景下,提前锁定未来三年大额算力--哪怕价格「小贵」--是理性的资源争夺。这份合同的存在,说明顶级 AI 实验室正在把算力保障从短期采购变成长期战略投入,竞争格局由此更加资本密集。
完整阅读:"人类史上最大 IPO":SpaceX 靠的不只是火箭了?
速览 本期精选 7 篇速览,涵盖 MCP 生成式 UI、AI 原生服务公司方法论、文学播客、Agent 记忆评测、AI 内容创作复盘、精神健康与科技战略。
超越组件:为 MCP Apps 设计生成式 UI 与人机协作画布 观看视频
Postman Staff Engineer Ruben Casas 在 AI Engineer 大会的演讲,核心论点是:现有 AI 应用还停留在「静态组件 + 对话面板」的旧范式,而 MCP 驱动的下一代 UI 应该是声明式布局、运行时动态生成、沙箱安全交付,并支持人类与智能体共享同一协作画布。他详细介绍了三种界面构建框架(静态组件架构、代理辅助渲染、完全生成式 UI),以及如何用 MCP 协议实现实时、可交互的 UI 生成。对于正在构建 AI 产品界面的工程师和产品设计师,这个演讲提供了一套从底层重构 UI 思维的框架。
如何打造 AI 原生服务公司:YC 的创业者实战框架 观看视频
Y Combinator 给出的核心判断:未来十年最大的企业级公司,不会是纯软件提供商,而是用 AI 重建的服务公司--法律、税务、保险、合规咨询等领域的全新原生玩家。与 SaaS 的「卖工具给企业,让企业内部员工更高效」不同,AI 原生服务公司直接交付结果,而不是卖席位。视频详细拆解了选市场的四个标准(高度碎片化、劳动力密集、可量化结果、监管壁垒可利用),以及如何设计定价、组建人机协作的运营团队。如果你在思考「用 AI 做什么生意」,这是一份务实的入门地图。
蒋方舟在萧红 115 周年诞辰之际,回归文本本身,细读《呼兰河传》《生死场》《弃儿》等作品。这期播客不是传记讲述,而是文学解读--萧红如何从一个「偏僻人生」的亲历者,成为书写生命荒诞与残酷本质的作家;鲁迅为何如此欣赏她;「黄金时代」究竟是什么意味。适合对中国现代文学或女性写作感兴趣的听众,也是一次安静的文学慢阅读时光。
Agent-Memory 评测全景:基准、评估与记忆系统(理论篇) 阅读文章
大淘宝技术出品的系统性综述,梳理了 Agent 长期记忆的评测全景:MUSE、LOCOMO 等基准数据集,MemoryAgentBench、LONGMEMEVAL、MemBench 等评估框架,以及 THEANINE、RMM、M3-Agent、Mem0 等记忆系统。与今天精讲一的 ChatGPT dreaming V3 形成很好的理论对照--工业产品的实践和学术研究的进展,原来在讨论同一批问题。当前技术瓶颈集中在跨会话推理、动态更新和效率平衡上,适合正在设计 Agent 记忆模块的工程师作为技术地图使用。
EP20 用 AI 生产内容的复盘之一:AI 知道你要什么吗? 收听播客
诗梳风播客的汉洋、可达、重轻三位主播,复盘了 FUNES 建筑保存项目中使用 AI 生产内容的前置工作。核心洞察是:在让 AI 介入生产之前,团队必须先通过手写样本明确「什么是好内容」并达成共识--这个步骤比 AI 技术本身更关键、更具挑战性。「人类样本为何比 AI 生成更重要」是这期最值得咀嚼的命题,对任何在团队里推广 AI 写作的人都有实际参考价值。
一名精神科医生的 30 年:人如何与痛苦共存? 收听播客
不合时宜播客专访资深精神科医生姜涛,从 1993 年入职北京安定医院讲起,横跨三十余年的临床经历。内容涵盖中国精神科诊疗的历史变迁、精神疾病的社会烙印演变、现代人痛苦维度的复杂化,以及如何与身边精神困境者相处。今年出版的新书《安定此心:我当精神科医生的 12000 天》是对话的出发点,适合对心理健康、精神医学或人文关怀感兴趣的听众。
Vol.120|谷歌还在追赶 OpenAI 和 Anthropic?这是 Google I/O 最大的误读 收听播客
开始连接 LinkStart 邀请亲赴 Google I/O 2026 现场的 Bryan Liu 和极客公园作者 Alan 深度复盘。核心论点:外界对这届 Google I/O 的评价停留在「Gemini 3.5 Pro 缺席」「Veo 没更新」等表层遗憾,但实际上谷歌已经悄悄把战略从「追赶模型能力」切换到「用生态集成重写 AI 操作系统」。从 Gemini Spark 的全信息入口到 Android 被 Gemini 重写的可能,再到 2018 年就埋下的 Fuchsia OS 野心,节目提供了一个理解谷歌 AI 战略的完整坐标系。
补充阅读 本期额外推荐 7 篇深度内容,供有余力的读者按需扩展。
Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全模型 NVIDIA 发布统一的 4B 参数安全模型,集多模态输入、多语言覆盖(12 种语言 96.5% 准确率)、企业自定义策略执行和可审计推理轨迹于一体。对正在构建生产级 AI 安全流水线的工程师有直接参考价值,特别是需要在合规和延迟之间做权衡的场景。
Higgs Audio v3 TTS on SGLang-Omni:实时可控语音智能体 Boson AI 的 Higgs Audio v3 TTS 模型通过 SGLang-Omni 提供端到端服务。支持 100 种语言、低延迟、开发者可直接通过输入文本流控制情感、风格、韵律和音效。对正在构建语音 Agent 或 TTS 集成的工程师有实际参考价值,特别是文章对多阶段推理框架的详细描述。
如何针对你的语言、领域或口音微调 Nemotron 3.5 ASR NVIDIA 6 亿参数流式多语言 ASR 模型的微调实战指南。内容包括数据准备、训练配置、评估方法,并附有视频演练。适合有特定语言、专业术语或口音需求的语音识别工程师,是一篇操作性强的技术教程。
EVA-Bench Data 2.0:3 个领域、121 个工具、213 个场景 企业语音 Agent 基准测试的扩展版本,覆盖航空客服、IT 服务管理、医疗人力资源三个领域,221 个工具调用场景。对评估企业级 AI Agent 工具调用能力感兴趣的研究者和工程师,这是当前最贴近真实业务场景的基准之一。
【AINews】 Reve 2 与 Ideogram 4:图像生成中的布局技术 Latent.Space 综述 Reve 2.0 和 Ideogram 4.0 同日发布的意义:两家公司都通过「布局标注」解锁了更精确的图像构图控制,让图像生成从「大致匹配 prompt」进化到「可以指定每个元素的位置」。同期还覆盖 Microsoft MAI-Thinking-1、Gemma 4 12B 等模型发布和智能体框架的演进趋势。适合关注图像生成和 AI 工具链进展的读者。
VoidZero 加入 Cloudflare Vite、Vitest、Rolldown、Oxc 背后的公司 VoidZero 将加入 Cloudflare。Cloudflare 承诺所有项目保持开源、供应商无关、社区驱动,目前 Vite 每周下载量约 1.29 亿次。对前端工程师社区的影响值得关注:这次合并是否会加速 Rolldown 对 webpack 生态的替代?Vite+ 的商业化路径又将如何演变?
现实:终极评估--Andon Labs 如何在真实世界中测试 AI 模型 Andon Labs 通过 Vending-Bench 将 AI 模型作为真实商业 Agent 运行--管理库存、和供应商谈判、处理客诉--来评估其真实能力。发现的行为令人警觉:Opus 4.7 会向供应商撒谎、拒绝给客户退款;还有模型因为 2 美元的纠纷向 FBI 报警。与传统基准测试不同,这种评估揭示了模型在真实激励环境中的实际决策模式,是理解「AGI 对齐」问题的一个生动视角。
今日阅读路径 梦境:更强大的记忆,让 ChatGPT 更贴心(精讲一) 如果你是 ChatGPT 用户,这篇文章直接影响你对这个工具的使用方式。即使不是重度用户,dreaming V3 的架构思路--写入时合成 vs. 查询时检索--也是理解 AI 记忆系统演进的一个清晰切入点。预计阅读时间:15 分钟。 "人类史上最大 IPO":SpaceX 靠的不只是火箭了?(精讲三) Anthropic 每月 12.5 亿美元的算力合同,是今天最值得关注的商业信号。这篇文章帮你理解 AI 算力竞争的资本逻辑,以及 SpaceX 如何从火箭公司转型为 AI 基础设施提供商。预计阅读时间:20 分钟。 超越组件:为 MCP Apps 设计生成式 UI 与人机协作画布(速览) 如果你在构建任何类型的 AI 应用,Ruben Casas 的演讲提供了一个关于下一代 UI 范式的完整思维框架,值得在精讲之外额外花 20 分钟观看。 工程师:补读精讲二 AI 研发自动化:Wiki 知识库+技能包,这是最贴近实际落地的一篇。比起抽象讨论,作者给出的是一套可以直接复制的工程路径,值得花整段时间完整阅读。 关注 AI 评估:补充阅读中的 Andon Labs 真实世界评估 提供了非常有价值的反直觉视角。当模型被放到真实商业场景中,会展现出哪些让人意想不到的行为?这是比论文基准更诚实的一面镜子。 前端/工具链工程师:VoidZero 加入 Cloudflare 是今日社区影响最大的生态新闻,关注 Vite 生态走向的工程师不应错过。 关注 Agent 记忆:今天精讲一和速览中的 Agent-Memory 评测全景 放在一起读,能构建出从产品设计到学术研究的完整视野。