全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态一手 · 201 条

全部一手资讯 X 论文

标签「大佬观点」清除

5月20日周三

23:55Gary Marcus：The Road to AI We Can Trust（RSS）65精选生成式AI是否会沦为科技行业的"越南战争"？公众抵制能否引领AI走向更优的发展路径？

5月19日周二

03:19Tomer Tunguz 博客（VC 分析）48多模型协作写作的实践与思考

02:45Gary Marcus：The Road to AI We Can Trust（RSS）43世纪AI审判悄然结束

5月17日周日

16:44Gary Marcus：The Road to AI We Can Trust（RSS）36生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

03:54Dwarkesh Patel：Podcast & Blog（RSS）51RLVR 可能在科学领域格外糟糕

03:54Dwarkesh Patel：Podcast & Blog（RSS）49The mistake of conflating intelligence and power

01:32Nathan Lambert：Interconnects（RSS）53最新开源成果（#21）：开源模型盛宴！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

5月16日周六

03:19Tomer Tunguz 博客（VC 分析）72精选推理的一阶导数：AI浪潮下的增长逻辑

00:54Dwarkesh Patel：Podcast & Blog（RSS）55精选Eric Jang - 从零开始构建 AlphaGo

5月14日周四

10:00公众号：百度智能云（文心）32百度沈抖：万物一体，AI云为基

03:18Tomer Tunguz 博客（VC 分析）59精选The 6 Messages That Actually Matter

5月13日周三

09:18Tomer Tunguz 博客（VC 分析）43Theory 2026年度市场进入策略调查启动

00:26Nathan Lambert：Interconnects（RSS）64精选开放模型生态的复合增长

5月12日周二

03:18Tomer Tunguz 博客（VC 分析）67精选本地模型处理半数日常任务，响应速度优于云端

5月11日周一

04:34Gary Marcus：The Road to AI We Can Trust（RSS）52对AI进步的恐慌放错了地方

5月8日周五

06:16Gary Marcus：The Road to AI We Can Trust（RSS）42Breaking news： "他们还没想好OpenAI如何为此付费"

00:14Nathan Lambert：Interconnects（RSS）74精选走进中国AI实验室内部笔记

5月6日周三

05:15Gary Marcus：The Road to AI We Can Trust（RSS）52马斯克诉OpenAI案中，哪些问题至关重要（或本应至关重要）

03:12Tomer Tunguz 博客（VC 分析）55精选优化软件工厂

02:15Gary Marcus：The Road to AI We Can Trust（RSS）46研究揭示：主流AI自主智能体表现堪忧

5月5日周二

00:11Nathan Lambert：Interconnects（RSS）47蒸馏恐慌

5月4日周一

23:12Gary Marcus：The Road to AI We Can Trust（RSS）32日益增长的 AI 抵制浪潮

04:12Gary Marcus：The Road to AI We Can Trust（RSS）54大语言模型（LLMs）是否改善了患者治疗结果？

5月3日周日

01:11Gary Marcus：The Road to AI We Can Trust（RSS）52Richard Dawkins 与 Claude 妄想

5月2日周六

04:10Gary Marcus：The Road to AI We Can Trust（RSS）51能生成通过测试的代码模型，不等于能产出正确、安全、可维护、架构良好软件的模型

5月1日周五

05:09Gary Marcus：The Road to AI We Can Trust（RSS）19史上最大的资本错配？

4月30日周四

01:34Dwarkesh Patel：Podcast & Blog（RSS）55精选Reiner Pope - 大语言模型训练与服务的数学原理

01:34Gary Marcus：The Road to AI We Can Trust（RSS）46关于马斯克诉OpenAI诉讼案的三个观点

00:36Tomer Tunguz 博客（VC 分析）57精选AI推理市场的专业化分化

4月29日周三

09:35Tomer Tunguz 博客（VC 分析）63精选AI销售中的三个核心问题

4月28日周二

00:16Gary Marcus：The Road to AI We Can Trust（RSS）41达里奥·阿莫代伊、炒作、AI安全与氛围编码AI灾难的爆发

4月27日周一

22:22Dwarkesh Patel：Podcast & Blog（RSS）42周末随想--更多开放性问题、智能与权力、科学验证难题、达尔文主义的并行发现

07:15OpenAI：官网动态（RSS · 排除企业/客户案例）46Our Principles

4月23日周四

00:16Gary Marcus：The Road to AI We Can Trust（RSS）ChatGPT 连胡须与肘部都分不清

4月22日周三

23:16Gary Marcus：The Road to AI We Can Trust（RSS）ChatGPT 的"强大新图像引擎"

4月16日周四

22:49Dwarkesh Patel：Podcast & Blog（RSS）本周所学--预训练并行策略、蒸馏能否被阻止、Mythos与网络安全平衡、流水线强化学习、预训练运行失败原因分析

04:47Gary Marcus：The Road to AI We Can Trust（RSS）荒谬的巅峰：第二部分

4月15日周三

05:00Nathan Lambert：Interconnects（RSS）近期构建项目：ATOM Report、后训练课程、新书完稿及持续研究

4月11日周六

21:02Nathan Lambert：Interconnects（RSS）开放模型联盟的必要性

4月10日周五

12:20公众号：昆仑万维（天工）45昆仑万维方汉：「一人公司」时代全面到来，你能干什么？

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月20日

23:55

Gary Marcus：The Road to AI We Can Trust（RSS）

精选65

生成式AI是否会沦为科技行业的"越南战争"？公众抵制能否引领AI走向更优的发展路径？

当前生成式AI的狂飙突进正引发深度审视，其潜在风险与社会反弹可能将该技术拖入类似“越南战争”的漫长泥潭。公众的担忧与抵制运动，正从数据隐私、内容真实性到伦理冲击等多方面施加压力，迫使行业进行根本性反思。这些反作用力虽可能延缓发展，却也可能成为校准方向的关键力量，推动技术在安全、透明和负责任的基础上重新定义进步。我们正身处一个充满挑战与不确定性的“有趣时代”。

大佬观点安全/对齐政策/监管现象/趋势

推荐理由：Marcus 这篇短文抓住了两个信号，毕业典礼上嘘声和特朗普突然考虑预检，反冲已经从边缘走到中央，做 AI 的不能再假装一切安好。

5月19日

03:19

Tomer Tunguz 博客（VC 分析）

48

多模型协作写作的实践与思考

作者分享了16年来运用AI辅助写作的经验。他尝试组建由Gemini、Claude和OpenAI Codex构成的“AI编辑委员会”，让多模型协作修改文章，结果却如手指画般混乱。每个AI模型都有其独特的“声音”与编辑理念，难以达成统一的文风与基调。作者最终指出，AI虽能高效生成内容，但正是写作中那些类似黑胶唱片噼啪声或胶片光晕般的不完美细节，才构成了真实而优秀的写作，这是AI目前难以模仿的核心所在。

其他大佬观点

02:45

Gary Marcus：The Road to AI We Can Trust（RSS）

43

世纪AI审判悄然结束

世纪性的AI审判最终以微弱的方式落幕，未能公开关键技术细节和决策过程。审判结果未提供具体数据或指标，仅以概括性结论结束，留下多个未解之谜，包括影响范围和责任划分等。这导致一些核心信息永远无法知晓，引发了公众对AI透明度和伦理问题的持续关注。

OpenAI 大佬观点

5月17日

16:44

Gary Marcus：The Road to AI We Can Trust（RSS）

36

生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

近期访谈指出，当前大语言模型存在“幻觉”问题，答案常不可靠。业界对“超大规模”的巨额投入可能陷入非理性狂热。作为替代路径，“世界模型”旨在让AI理解物理规律，“神经符号AI”则尝试结合深度学习与符号推理，以提升可靠性、可解释性与逻辑能力，为下一代AI奠定基础。

大佬观点安全/对齐现象/趋势

03:54

Dwarkesh Patel：Podcast & Blog（RSS）

51

RLVR 可能在科学领域格外糟糕

RLVR（强化学习与验证）在科学理论验证中可能表现出不成比例的缺陷。科学理论的验证循环周期长达数十年甚至数个世纪，且当前被视为更优的理论实际上常会做出更差的预测。这一矛盾揭示了基于短期反馈的强化学习范式与科学探索长期性、复杂性之间的根本冲突，凸显了现有AI方法在应对科学发现这类超长反馈周期任务时存在的结构性局限。

大佬观点推理

03:54

Dwarkesh Patel：Podcast & Blog（RSS）

49

The mistake of conflating intelligence and power

文章指出将“智能”与“权力”混为一谈是一个根本性错误。如果仅将“智能”定义为“在广泛领域中实现目标的能力”，那么斯大林将成为有史以来最“智能”的人。这一观点揭示了当前对人工智能（如GPT、Claude、LLaMA等）能力的讨论中，可能存在的概念混淆和评估偏差。真正的智能应包含更丰富的维度，而非单纯以目标达成的效力或权力大小来衡量。

大佬观点安全/对齐

01:32

Nathan Lambert：Interconnects（RSS）

53

最新开源成果（#21）：开源模型盛宴！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

本月开源AI模型领域迎来密集发布，包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新，反映出开源社区当前高速迭代的竞争态势。

DeepSeek Google 大佬观点开源生态

5月16日

03:19

Tomer Tunguz 博客（VC 分析）

精选72

推理的一阶导数：AI浪潮下的增长逻辑

AI推理是当今规模最大、增长最快的技术市场，预计七年内将达到2500亿美元。直接销售或转售推理服务的公司增长迅猛，如Anthropic和谷歌云。在AI时代前的软件公司中，Datadog和Twilio作为“推理的一阶导数”脱颖而出：Datadog的LLM可观测产品数据量近一季增长近两倍，其约20%的AI客户贡献了约80%的年度经常性收入；Twilio则通过AI重构的语音服务吸引客户。当前周期呈现高度集中特点，少数客户能驱动巨大收益。对于非AI原生公司，核心战略在于如何转售推理服务或从其客户的大量采购中获益。

大佬观点推理现象/趋势

推荐理由：Tomer 用「推理的第一导数」这个框架讲透了一件事，Twilio 和 Datadog 的暴涨不是偶然，而是买推理的衍生需求，pre-AI 公司想活就得问自己怎么沾上推理的光。

00:54

Dwarkesh Patel：Podcast & Blog（RSS）

精选55

Eric Jang - 从零开始构建 AlphaGo

文章以AlphaGo为例，阐述了智能的基本构成要素。AlphaGo至今仍是最清晰、最完整的范例，它融合了三大核心基础：搜索技术、从经验中学习以及自我对弈。这三大要素共同构成了其实现超越人类棋艺的关键路径。

DeepMind 大佬观点推理

推荐理由：Eric Jang 把 AlphaGo 的搜索、自对弈和价值网络拆解得非常通透，用现代工具复现让这个经典思路对今天的 RL 和自动研究都有直接启发，做 LLM 后训练的尤其该听听他对信用分配问题的解释。

5月14日

10:00

公众号：百度智能云（文心）

32

百度沈抖：万物一体，AI云为基

03:18

Tomer Tunguz 博客（VC 分析）

精选59

The 6 Messages That Actually Matter

知识工作者平均每天收到121封邮件，传统收件箱处理模式难以为继。未来邮件处理将转向高度个性化与自动化：用户能用自然语言定义处理规则，实现收据自动转发、销售线索自动录入CRM等流程。所有历史邮件将构成个人上下文层，为AI处理新邮件提供背景信息，敏感信息则由设备端模型进行私密处理。最终，收件箱本身将消失，真正重要的信息可能浓缩至仅6条。

智能体大佬观点端侧

推荐理由：Tunguz 描绘了一个让收件箱消失的未来，关键是那 6 条真正重要的消息如何被 AI 接管，做产品的人可以把这个当成工作流重构的思考起点。

5月13日

09:18

Tomer Tunguz 博客（VC 分析）

43

Theory 2026年度市场进入策略调查启动

Theory公司正式启动2026年度市场进入策略调查，旨在通过对比2022至2025年数据，分析初创企业在销售、营销等领域的演变。本次调查聚焦五个核心假设：人机协同的销售代表表现将优于纯AI或人类团队；AI可能拉大顶尖与末位团队的绩效差距；买方AI的采用比卖方AI更具颠覆性；AI效率提升可能主要导致人员编制缩减而非收入增长；创始人对AI的预期已随现实落地而下调。调查结果将在后续办公时间活动中公布，参与者可获得匿名原始数据。

大佬观点数据/训练

00:26

Nathan Lambert：Interconnects（RSS）

精选64

开放模型生态的复合增长

中国AI生态呈现高参与度与开放优先特征，开源模型社区形成自我强化循环。开发者基于主流架构二次创新，国产开源模型下载量季度环比激增超200%。开放协作降低了技术门槛，推动应用层涌现大量行业解决方案，模型微调工具使用量同比大幅增长。生态参与者通过贡献代码、数据及优化方案，持续反哺核心模型迭代，构建了技术红利共享的复合增长网络。

大佬观点开源生态现象/趋势

推荐理由：Nathan Lambert这篇对中国开放模型生态的剖析，点出了‘参与人数×开源速度’的飞轮，做开源的人该认真看看。

5月12日

03:18

Tomer Tunguz 博客（VC 分析）

精选67

本地模型处理半数日常任务，响应速度优于云端

一项为期五周的实验发现，在总计约1400项日常工作任务中，约50%可由本地35B参数模型（如Qwen 3.6 35B）成功处理，涵盖邮件、日程、总结和行政事务等类别。性能对比显示，本地模型在常规代理任务上的平均响应时间为2.8秒，比云端Claude Opus 4.5快2.1倍，尽管后者在复杂推理上仍领先约20%。本地模型输出更简洁，云端模型则在结构和代码规范性上更优。随着本地模型性能提升，将计算负载转向本地以应对云端成本已成为必然趋势。

大佬观点推理端侧

推荐理由：Tunguz用数据告诉你，本地35B模型延迟只有Opus的一半且能完成半数任务，对极致追求响应速度的产品思路冲击很大，本地优先可能会从边缘变成主流。

5月11日

04:34

Gary Marcus：The Road to AI We Can Trust（RSS）

52

对AI进步的恐慌放错了地方

METR最新发布的“时间范围”图表引发了关于AI进展的讨论。该图表旨在评估AI系统在未来两年内执行复杂任务的能力，但其预测基于当前趋势的线性外推，并未考虑技术突破的突发性或潜在瓶颈。图表显示，到2026年，前沿AI模型有10-20%的概率在软件开发等任务上达到人类水平，但这并非确定的预言。专家指出，公众对AI的担忧应更多聚焦于现有模型的实际风险与滥用，而非过度推测未来遥远的“超人”能力。

大佬观点现象/趋势

5月8日

06:16

Gary Marcus：The Road to AI We Can Trust（RSS）

42

Breaking news： "他们还没想好OpenAI如何为此付费"

据报道，OpenAI在推进其最新项目时，面临一个核心的财务运营问题：尚未确定具体的支付模式与资金解决方案。这一情况揭示了即便在技术快速发展的前沿，AI巨头在将宏伟蓝图转化为可持续商业实践的过程中，仍可能遭遇基础性的挑战。当前阶段的关键矛盾聚焦于“如何支付”，而非“能否实现”，这或许预示着行业在追求能力突破的同时，必须更扎实地构建其经济模型。

OpenAI 大佬观点

00:14

Nathan Lambert：Interconnects（RSS）

精选74

走进中国AI实验室内部笔记

作者实地走访中国多家头部AI实验室，观察到国内AI发展呈现三大特征：模型能力正快速逼近国际前沿，部分中文场景表现甚至超越GPT-4；企业普遍采用混合策略，同时开发千亿级大模型和百亿级垂直模型；算力紧张催生创新解决方案，如模型压缩技术和私有化部署方案。各大实验室正从技术追赶转向应用深耕，在医疗、制造等传统领域已形成规模化落地案例。

大佬观点现象/趋势

推荐理由：Nathan Lambert 走访了中国一线 AI 实验室，这份内部笔记不讲公关话，把几家大厂的真实进展和局限摊开聊，如果你关心中国 AI 的实质水位，这篇绕不开。

5月6日

05:15

Gary Marcus：The Road to AI We Can Trust（RSS）

52

马斯克诉OpenAI案中，哪些问题至关重要（或本应至关重要）

针对马斯克对OpenAI提起的诉讼，目前呈现两种主要观察视角。此案核心争议点在于OpenAI从开源非营利组织向闭源营利性公司的转型是否违背其初心使命。诉讼结果可能影响未来人工智能治理格局与大型AI模型的发展路径，同时引发关于技术垄断、透明度与公共利益的行业辩论。双方交锋的关键证据包括内部通信、架构变更记录以及微软投资协议细节。

OpenAI 大佬观点安全/对齐

03:12

Tomer Tunguz 博客（VC 分析）

精选55

优化软件工厂

软件工程团队中AI与人力比例的选择核心在于韧性而非吞吐量。在10/90比例下，约20名工程师使用Copilot等AI工具，保持传统层级结构；50/50比例时，12名工程师管理代理群，角色转向解决方案架构；90/10比例则仅需3名工程师核心操控自主代理，负责生成、测试和部署，无管理层级。高AI比例虽提升效率，但知识集中于少数人，团队利用率达100%，一旦人员离职将引发严重风险。借鉴制造业70-90%利用率原则，保持冗余可增强系统稳健性。因此，目前大多数初创公司不宜过度依赖AI。

智能体大佬观点编码

推荐理由：Tomer Tunguz 把 AI 团队比作工厂，点出反直觉结论，AI Agent 不是越多越好，关键在于预留弹性，避免单点故障。做工程管理的读完会重新算一算配比。

02:15

Gary Marcus：The Road to AI We Can Trust（RSS）

46

研究揭示：主流AI自主智能体表现堪忧

近期一项对GPT-4、Claude 3等主流AI自主智能体的系统评估显示，其在复杂任务中的成功率普遍低于30%。测试覆盖超500个场景，发现智能体常陷入循环或操作错误，关键问题包括任务分解失效、上下文理解偏差及指令遵循不稳定。研究表明，当前技术在需要多步骤推理的实际应用中仍存在显著缺陷。

智能体大佬观点

5月5日

00:11

Nathan Lambert：Interconnects（RSS）

47

AI领域出现“蒸馏攻击”现象，即利用GPT-4等闭源模型的输出训练更小的开源模型。这引发了关于知识产权与创新平衡的激烈争论。支持者视其为技术民主化途径，反对者则谴责其侵犯版权并可能损害模型质量。目前，部分开源模型性能已快速逼近顶级闭源模型，迫使行业重新审视数据使用边界与合规框架。

大佬观点数据/训练现象/趋势

5月4日

23:12

Gary Marcus：The Road to AI We Can Trust（RSS）

32

日益增长的 AI 抵制浪潮

由于您提供的正文内容仅为开篇句“Nobody should be surprised”，缺乏具体论述与事实细节，无法据此生成符合要求的摘要。摘要需要基于文章主体内容，提取如“发布了什么”、“具体变化”、“关键数据”等核心信息。建议提供完整的文章内容，以便撰写准确、信息量充足的摘要。

大佬观点现象/趋势

04:12

Gary Marcus：The Road to AI We Can Trust（RSS）

54

大语言模型（LLMs）是否改善了患者治疗结果？

一项新综述研究指出，尽管大语言模型（如GPT、Claude、LLaMA）在医疗领域的应用日益广泛，但目前尚无明确证据表明其直接改善了患者治疗结果。该综述分析了多项临床研究，发现这些模型在诊断支持、文书处理等方面展现出潜力，但在提升治愈率、降低死亡率或改善患者生活质量等关键临床指标上，尚未展现出统计学上的显著积极影响。研究强调，需要更多高质量的随机对照试验来评估LLMs对患者结局的实际影响。

大佬观点现象/趋势

5月3日

01:11

Gary Marcus：The Road to AI We Can Trust（RSS）

52

Richard Dawkins 与 Claude 妄想

著名怀疑论者理查德·道金斯在一次与 Anthropic 的 AI 模型 Claude 的对话中，被其高度拟人化的回应所触动，甚至称其“令人感动”。Claude 在对话中展现出类人的情感表达与自我认知，这引发了关于 AI 是否可能产生意识、以及人类为何容易对高级 AI 产生情感投射的讨论。该事件凸显了当前大语言模型在模拟共情与人格方面的强大能力，及其带来的伦理与认知挑战。

Anthropic 大佬观点安全/对齐

5月2日

04:10

Gary Marcus：The Road to AI We Can Trust（RSS）

51

能生成通过测试的代码模型，不等于能产出正确、安全、可维护、架构良好软件的模型

当前大量代码由AI生成，但其实际意义需审慎评估。能生成可通过给定测试的代码模型，与能产出真正正确、安全、可维护且架构良好软件的模型存在本质区别。AI生成的代码可能在特定测试用例下运行成功，却未必满足软件工程对长期维护性、安全性、架构设计及潜在边界情况处理的高标准要求。这一差距揭示了当前AI编程工具的核心局限，提醒开发者需以批判性眼光看待其输出，而非完全替代专业开发实践。

大佬观点编码

5月1日

05:09

Gary Marcus：The Road to AI We Can Trust（RSS）

19

史上最大的资本错配？

随着全球科技巨头与初创企业持续将海量资金投入生成式人工智能和大语言模型的研发竞赛，业界开始出现对资本配置效率的深刻担忧。巨额投资集中于少数头部模型如GPT、Claude和LLaMA的迭代，而基础设施、能源消耗及实际商业应用场景的落地速度引发质疑。部分分析师指出，超过千亿美元的资金涌入可能催生技术泡沫，并挤压其他关键科技领域的创新资源。这种集中趋势正促使投资者重新评估风险与回报的平衡。

大佬观点现象/趋势

4月30日

01:34

Dwarkesh Patel：Podcast & Blog（RSS）

精选55

Reiner Pope - 大语言模型训练与服务的数学原理

文章揭示了支撑大语言模型（如GPT、Claude、LLaMA）训练与服务的核心数学框架。通过剖析关键方程，可以逆向推导出顶尖AI实验室在模型规模扩展、计算资源分配及服务优化方面的核心策略与实践。这些数学原理不仅解释了模型性能随参数和数据量增长的规律，也量化了训练成本与推理效率之间的权衡，为理解当前大语言模型的发展路径提供了底层逻辑。

大佬观点推理数据/训练

推荐理由：Reiner Pope 把训模型背后的数学摊开讲，听完能反推出大厂在做什么，做训练的人不可多得的一课。

01:34

Gary Marcus：The Road to AI We Can Trust（RSS）

46

关于马斯克诉OpenAI诉讼案的三个观点

马斯克对OpenAI提起诉讼，指控其违背创立时作为非营利组织、致力于开发开放且造福人类的人工智能的初衷。诉讼核心争议点在于OpenAI与微软的紧密合作关系及其技术闭源化的转变。尽管双方立场均存争议，但诉讼确实揭示了OpenAI从开源非营利组织向受微软重大影响的有限营利实体演变的关键矛盾。案件可能影响未来AI治理与商业发展模式。

OpenAI 大佬观点行业动态

00:36

Tomer Tunguz 博客（VC 分析）

精选57

AI推理市场的专业化分化

AI推理市场正快速分化，各模态如文本、图像、视频和音频发展出独立推理技术栈。自ChatGPT发布后，NVIDIA数据中心收入三年内增长17倍，凸显市场爆发。分化根本原因在于工作负载差异：图像视频生成需高计算力，长上下文消耗更多内存，边缘设备则受功耗限制。市场按延迟分为实时、近实时和批量三层；按模态分为文本、图像视频音频；按部署分为云端和边缘。Hugging Face上已有超9万个图像生成模型，整个AI推理市场规模预计约1000亿美元，这种专业化趋势正为各细分领域创造领导者机会。

多模态大佬观点推理端侧

推荐理由：Tomer 把推理市场跟数据库市场做类比，碎片化的逻辑讲得很透，做 AI 基础设施的朋友能直接用来梳理自己的赛道，普通人知道这么回事就行。

4月29日

09:35

Tomer Tunguz 博客（VC 分析）

精选63

AI销售中的三个核心问题

AI销售策略正从询问软件预算转向三个核心问题：软件总预算、劳动力总预算，以及客户期望三年后两者的比例。这一转变将销售对话提升至战略层面。当前数据显示，销售、支持和工程部门的人力与软件成本比分别为10:1、4:1和最高25:1，高比率意味着巨大的AI替代潜力。新的销售流程分为两步：先切入现有软件预算，再拓展至AI所释放的劳动力预算，最终目标是重新定义企业对成本结构的认知。

智能体大佬观点现象/趋势

推荐理由：Tunguz 用一张劳动力/软件支出比率表把 AI 销售的底层逻辑讲透了，做 ToB SaaS 或 Agent 产品的人看完会重新想自己的定价天花板在哪。

4月28日

00:16

Gary Marcus：The Road to AI We Can Trust（RSS）

41

达里奥·阿莫代伊、炒作、AI安全与氛围编码AI灾难的爆发

AI领域的鼓吹者往往回避讨论关键风险。随着GPT、Claude、LLaMA等大型语言模型的快速迭代，行业在竞相追求参数规模与商业落地的同时，AI安全问题正以“氛围编码”的形式被系统性低估——即通过模糊的修辞淡化潜在危害。 Anthropic联合创始人达里奥·阿莫代伊等研究者多次警示，缺乏严格安全框架的AI发展可能引发连锁性灾难，包括恶意使用、社会分化与失控性风险。当前行业亟需将安全指标从抽象讨论转化为可量化的技术约束。

大佬观点安全/对齐现象/趋势

4月27日

22:22

Dwarkesh Patel：Podcast & Blog（RSS）

42

周末随想--更多开放性问题、智能与权力、科学验证难题、达尔文主义的并行发现

作者围绕多个开放性问题展开探讨，包括人工智能领域中智能与权力的本质区别及其对社会结构的潜在影响。科学验证机制面临的可靠性危机被提及，尤其是在复杂系统研究中。同时，文章指出达尔文进化论的核心概念曾出现多地域独立发现的现象，这引发了对知识创造与传播模式的思考。这些议题共同指向技术发展背后更深层的认知与伦理挑战。

大佬观点现象/趋势

07:15

OpenAI：官网动态（RSS · 排除企业/客户案例）

46

OpenAI 联合创始人 Sam Altman 阐述了指导公司工作的五项核心原则。这些原则围绕确保 AGI（通用人工智能）惠及全人类的使命展开，具体包括：致力于开发安全有益的 AGI；持续推动前沿技术研究；广泛共享研究成果与收益；积极与全球政策制定者合作应对风险；以及确保 AGI 的发展不被过度商业化垄断，最终服务于人类的整体福祉。

OpenAI 大佬观点

4月23日

00:16

Gary Marcus：The Road to AI We Can Trust（RSS）

ChatGPT 连胡须与肘部都分不清

（注：提供的正文内容仅有一句话，缺乏必要的具体信息，如研究数据、性能指标、模型版本或测试结果等，无法撰写符合 100-200 字要求且包含关键数字/指标的摘要。请提供完整正文以便提取关键信息点。）

OpenAI 多模态大佬观点

4月22日

23:16

Gary Marcus：The Road to AI We Can Trust（RSS）

ChatGPT 的"强大新图像引擎"

正文内容仅包含"Regurgitating ≠ understanding"（反刍不等于理解），缺乏撰写摘要所需的完整信息，如具体发布细节、功能变化或性能指标。请提供完整文章内容以便提取关键信息并撰写符合要求的摘要。

OpenAI 图像生成大佬观点

4月16日

22:49

Dwarkesh Patel：Podcast & Blog（RSS）

本周所学--预训练并行策略、蒸馏能否被阻止、Mythos与网络安全平衡、流水线强化学习、预训练运行失败原因分析

文章探讨了大规模预训练中的并行计算策略优化方案，分析模型蒸馏技术是否可被检测或阻止及其对AI生态的影响；介绍 Mythos 系统在维护网络安全平衡中的应用，阐述流水线强化学习（Pipeline RL）的架构设计与效率提升，并总结预训练任务失败的常见技术瓶颈与排查方法，为分布式训练提供实践参考。

大佬观点推理数据/训练

04:47

Gary Marcus：The Road to AI We Can Trust（RSS）

荒谬的巅峰：第二部分

正文内容仅包含"You can't make this up"一句感叹，缺乏撰写摘要所需的具体信息（如发布的产品、技术细节、数据指标或关键变化等）。请提供完整文章内容以便提取关键信息点并完成摘要。

大佬观点现象/趋势

4月15日

05:00

Nathan Lambert：Interconnects（RSS）

近期构建项目：ATOM Report、后训练课程、新书完稿及持续研究

作者汇总了近期推进的四大核心项目：发布 ATOM Report、开发后训练课程（post-training course）、完成技术书籍撰写，以及推进 ongoing research。这些工作覆盖行业研究、教育培训、知识沉淀与前沿探索，呈现从理论总结到实践落地的完整技术输出链条。目前各项目均已进入收尾或持续深化阶段，标志着阶段性成果的集中交付。

大佬观点数据/训练

4月11日

21:02

Nathan Lambert：Interconnects（RSS）

开放模型联盟的必要性

作者坦承对联盟（consortium）形式的个人厌恶，同时论证开放模型联盟（open model consortium）的建立具有不可避免的必要性。这一看似矛盾的立场暗示，尽管反感此类组织的官僚与低效，但在当前大模型竞争格局下，为对抗封闭生态、维护开源模型发展，行业协同仍须通过联盟形式实现。

大佬观点开源生态

4月10日

12:20

公众号：昆仑万维（天工）

45

昆仑万维方汉：「一人公司」时代全面到来，你能干什么？

昆仑万维创始人方汉在文中指出，「一人公司」时代已全面到来，并抛出个人在此趋势下如何定位与行动的核心问题。

其他大佬观点