5月5日

00:11

Tomer Tunguz 博客（VC 分析）

精选63

基于开源模型和商用GPU的广告支持型AI在经济上可行。计算表明，一个由4块B200 GPU组成的集群服务300名用户时，每小时成本约18美元。通过广告收入即可覆盖成本：在内容网络中每3分钟展示一条广告（CPM 3.12美元），或在搜索广告中每39分钟展示一条（CPM 38.40美元），这一广告频率已与常见的移动和网页应用相当。对于代码代理等高强度任务，可采用混合盈利模式：用户每月支付10美元订阅费并每日观看8条广告，即可支持约200万token的用量，这证明了该模式的实用性。

开源生态推理现象/趋势

推荐理由：Tunguz 用一页纸的算账说清了广告支持 AI 的经济账，一天看 8 条广告就能换两百万 token，这对做免费 AI 产品的团队是个真正有说服力的模型。

5月4日

23:12

Gary Marcus：The Road to AI We Can Trust（RSS）

日益增长的 AI 抵制浪潮

由于您提供的正文内容仅为开篇句“Nobody should be surprised”，缺乏具体论述与事实细节，无法据此生成符合要求的摘要。摘要需要基于文章主体内容，提取如“发布了什么”、“具体变化”、“关键数据”等核心信息。建议提供完整的文章内容，以便撰写准确、信息量充足的摘要。

大佬观点现象/趋势

08:00

OpenRouter：Announcements（RSS）

精选57

GPT-5.5 价格上调：实际成本分析

OpenAI 将 GPT-5.5 的每 token 价格翻倍，但模型输出更精简（less verbose）。OpenRouter 通过实测用量评估了净成本变化。

OpenAI 现象/趋势

推荐理由：OpenRouter 用真实 API 数据算了 GPT-5.5 的净成本，虽然单价翻倍但实际涨幅比想象中小，API 用户值得一看。

04:12

Gary Marcus：The Road to AI We Can Trust（RSS）

大语言模型（LLMs）是否改善了患者治疗结果？

一项新综述研究指出，尽管大语言模型（如GPT、Claude、LLaMA）在医疗领域的应用日益广泛，但目前尚无明确证据表明其直接改善了患者治疗结果。该综述分析了多项临床研究，发现这些模型在诊断支持、文书处理等方面展现出潜力，但在提升治愈率、降低死亡率或改善患者生活质量等关键临床指标上，尚未展现出统计学上的显著积极影响。研究强调，需要更多高质量的随机对照试验来评估LLMs对患者结局的实际影响。

大佬观点现象/趋势

5月2日

03:10

Tomer Tunguz 博客（VC 分析）

精选57

本周的积极信号：AI在医疗、教育、农业与科研领域的突破性进展

近期多项进展展现了AI的巨大积极影响。医疗领域，Mayo Clinic的AI能通过常规CT提前最多三年检测胰腺癌，强生利用AI将新药线索生成时间减半。教育方面，哈佛研究显示AI导师使学生学习效果翻倍，泰国培训16万名教师惠及330万学生。农业上，AI能以约88%准确率预测害虫爆发。科研中，AI快速筛查NASA数据，新发现超一万颗系外行星候选。此外，香港推出AI洪水预报系统，Atlassian和Twilio等公司也因AI驱动业绩增长并上调预期。这些案例平衡了AI风险，凸显其创新潜力。

多模态数据/训练现象/趋势

推荐理由：Tomer 收集了最近两周 AI 在医学、教育、农业的硬核落地案例，对反 AI 恐慌是一剂清醒剂，SaaS 公司的营收也说明行业在回暖。

5月1日

05:09

Gary Marcus：The Road to AI We Can Trust（RSS）

史上最大的资本错配？

随着全球科技巨头与初创企业持续将海量资金投入生成式人工智能和大语言模型的研发竞赛，业界开始出现对资本配置效率的深刻担忧。巨额投资集中于少数头部模型如GPT、Claude和LLaMA的迭代，而基础设施、能源消耗及实际商业应用场景的落地速度引发质疑。部分分析师指出，超过千亿美元的资金涌入可能催生技术泡沫，并挤压其他关键科技领域的创新资源。这种集中趋势正促使投资者重新评估风险与回报的平衡。

大佬观点现象/趋势

4月30日

15:09

Tomer Tunguz 博客（VC 分析）

精选67

2026年Q1云巨头资本支出达1120亿美元，谷歌增长领先

2026年第一季度，三大云服务巨头资本支出合计1120亿美元。谷歌云以63%的同比增长率领跑，远超微软Azure的40%和亚马逊AWS的28%。谷歌增长主要受企业AI解决方案驱动，云服务积压订单环比翻倍至超4600亿美元。客户通过API每分钟处理160亿个令牌，同比增长60%。为满足需求，谷歌将2026年资本支出指引上调至1800-1900亿美元，超过微软的约1200亿美元。谷歌凭借全栈自研的Gemini模型和TPU芯片，在增长速度和结构优势上表现突出。

Google Microsoft 现象/趋势行业动态

推荐理由：三家云厂一个季度砸了 1120 亿美元搞 AI 基建，Google 靠自研模型增速冲到 63%，全栈整合的优势这次用财报坐实了，做 AI 创业的得重新想想云选型。

06:20

Google Research：Blog（网页）

精选57

谷歌研究团队应用实证研究辅助工具的四个领域

自去年秋季推出实证研究辅助（ERA）工具以来，谷歌研究团队已将其应用于多个科学领域以解决实际问题。在流行病学中，它助力流感与新冠预测；在宇宙学里，协助分析星系数据以探究暗能量；在大气监测方面，提升了二氧化碳排放的追踪精度；在神经科学领域，则用于解析大脑活动数据。这些实践表明，ERA能帮助科学家生成专家级的实证软件，其成果超越了黑箱模型，可发现兼具可解释性与机制准确性的解决方案，从而有效加速科学发现进程。

智能体 Google 现象/趋势

推荐理由：Google 把自家 ERA 工具在流行病学、宇宙学、气候监测、神经科学四个方向的实战案例摊开讲，虽然不是新模型发布，但对做 AI for Science 的人来说，这是一份难得的「AI 科研助手到底能干嘛」的全景参考。

01:39

Hugging Face：Blog（RSS）

精选62

AI评估正成为新的算力瓶颈

AI评估成本已突破关键阈值，正重塑其可及性。Holistic Agent Leaderboard花费约4万美元运行了2万多次智能体推演，单次前沿模型测试成本可达2829美元。研究显示，相同任务成本差异可达33倍，脚手架选择是核心成本驱动因素。虽然静态基准可通过压缩技术实现百倍成本缩减，但智能体评估因轨迹长、噪声大而压缩有限。高支出未必带来更好结果：例如在GAIA测试中，2828美元方案准确率28.5%，而1686美元方案反达57.6%。当评估包含模型训练时，成本将完全超越常规API框架。

Hugging Face 现象/趋势评测/基准

推荐理由：这篇把分散的评估成本数据拉通了算总账，曾经便宜的评测现在动辄上万美元，独立评估正被价格挤出牌桌，做Agent的人必须意识到排行榜的代价。

4月29日

09:35

Tomer Tunguz 博客（VC 分析）

精选63

AI销售中的三个核心问题

AI销售策略正从询问软件预算转向三个核心问题：软件总预算、劳动力总预算，以及客户期望三年后两者的比例。这一转变将销售对话提升至战略层面。当前数据显示，销售、支持和工程部门的人力与软件成本比分别为10:1、4:1和最高25:1，高比率意味着巨大的AI替代潜力。新的销售流程分为两步：先切入现有软件预算，再拓展至AI所释放的劳动力预算，最终目标是重新定义企业对成本结构的认知。

智能体大佬观点现象/趋势

推荐理由：Tunguz 用一张劳动力/软件支出比率表把 AI 销售的底层逻辑讲透了，做 ToB SaaS 或 Agent 产品的人看完会重新想自己的定价天花板在哪。

4月28日

12:34

Tomer Tunguz 博客（VC 分析）

精选64

GPU现货价格六周内暴涨114%

根据Ornn Compute Price Index数据，NVIDIA B200 GPU的现货租赁价格在六周内飙升114%，从三月初的2.31美元涨至本周的4.95美元/小时。此次价格暴涨与GPT-5.5等前沿模型发布带来的需求冲击紧密相关，这些模型需要Blackwell架构提供的内存支持。与此同时，B200与上一代H200的价差从0.28美元大幅扩大至1.80美元，不同云服务商之间的报价差距也扩大了一倍以上，反映出市场供应紧张。预计夏季B200价格将维持在5美元以上，云端推理成本持续上升。

现象/趋势行业动态部署/工程

推荐理由：Tomer Tunguz 用 Ornn 真实价格指数拆出 B200 六周涨 114% 的供需逻辑，做 AI infra 选型或算力采购的人该把这张图存下来，夏天 B200 破 5 刀基本板上钉钉。