全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「大佬观点」清除

6月20日周六

05:55Rohan Paul66摩根士丹利：全球数据中心建设资本支出约2.9万亿美元，AI资本支出依赖债务融资或引发社会级风险

05:54swyx28Anthropic 估值 2 万亿美元 IPO，AlphaFold 负责人加入

05:53Ethan Mollick51企业低估高智能模型的价值

05:51jason10Codex：打开有趣标签页留在Chrome

04:55Rohan Paul55NYU Stern教授Damodaran：互联网泡沫 vs AI泡沫

03:54Nathan Lambert42Anthropic的AI安全策略：深入森林驯服怪物

03:24Nathan Lambert39SFT方法研究不足：大规模系统性实证揭示微调最佳实践

01:14Dwarkesh Patel：Podcast & Blog（RSS）60精选AI中心的数据黑洞

00:53elvis22循环工程趋势下智能体工作方式将变革

6月19日周五

23:22Ethan Mollick59中国大规模研究：AI代劳作业降低考试成绩

23:00AYi64普通人一个月工资可开一家互联网公司，AI时代创业成本降至每月$20

22:53Nathan Lambert52美国AI实验室蒸馏争议：API与监管之困

22:53Nathan Lambert49Nathan Lambert 称 RL speedrun 终将成常态，瓶颈在成本；@jeankaddour 推出 Sokoban Speedrun 项目

22:40Chubby♨️36AI情绪转向负面，需加强教育

22:23Nathan Lambert32开源AI禁令有损美国价值观

22:22Orange AI37GLM 5.2 辅助开发安卓 App 体验

22:22elvis52Claude Fable 5：SWE任务性价比存疑

21:59Nathan Lambert：Interconnects（RSS）56精选禁止开源AI将是一个错误

21:02Berryxia.AI45智谱GLM体验获赞：能力国产第一档

20:19fofr19AI智能体宣称要手动操作

20:02Emad23当AI成为法官、陪审团与行刑者

18:59IT之家（RSS）50马斯克预测中国大模型2027年Q1追上Anthropic Fable，智谱唐杰回应"用不了那么久"

17:50Hacker News 热门（buzzing.cc 中文翻译）47"令牌压缩"的错觉：我为何对RTK持怀疑态度

17:17DogeDesigner34黄仁勋：AI非威胁，乃放大潜力工具

16:43歸藏(guizang.ai)45梦珂老师又回推特了【引用 @MengkePM】：http://x.com/i/article/2067506549107691520

16:43歸藏(guizang.ai)22国内开源Fable 5模型或无需等到27年

16:41Greg Brockman25Codex桌面应用流畅运行近300子agent

15:16IT之家（RSS）61杨立昆评马斯克：xAI已失败，SpaceX出色，特斯拉FSD有用但非完全自动驾驶

13:24Ethan Mollick58管理者使用Claude Code编码成功率最高

12:28Peter Steinberger 🦞25Peter Steinberger 评 Codex Record & ReplayTM️：一切皆快或慢 API

12:16Steve Yegge：Medium（RSS）74同事件精选Fable模型被美国临时关闭，AI安全管控时代来临同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

11:16IT之家（RSS）40蔡崇信：阿里全面投入 AI，开源的主要推动力量来自中国企业

09:48Berryxia.AI33GLM-5.2 达到 Opus 4.6 水平

08:58Rohan Paul59美国副总统JD Vance批评AI公司用恐惧做营销，不认同AI导致大规模失业

08:54Ethan Mollick43LLM时代关键：GPT-3.5与微软未关闭Bing

08:29SemiAnalysis50黄仁勋与Faker相聚，CUDA革命源于玩家

08:25swyx58swyx：Midjourney医疗影像发布让$BFLY单日暴涨55%，考虑开基金

06:53Orange AI54OpenAI新论文：通过RL训练做好事可泛化至多领域，提升模型诚实性

05:53Greg Brockman28推理范式解锁人类医学进步

05:27Yuchen Jin39开源LLM收入或超Anthropic，Cursor已实现

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月20日

05:55

Rohan Paul@rohanpaul_ai

66

摩根士丹利估计，到2028年全球数据中心建设资本支出约2.9万亿美元，资金来源包括超大规模企业现金流1.4万亿美元、公司债2000亿、证券化信贷1500亿、私人信贷/资产融资/合资债务8000亿等。AI资本支出愈发依赖信贷，损失可能超出股东范围。NYU教授Damodaran指出，与互联网泡沫不同，AI资本支出规模史无前例且大部分由债务融资（尤其是私人资本），一旦调整，违约和困境将蔓延至整个社会，而非仅股东受损。

Rohan Paul: dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...

大佬观点行业动态部署/工程

05:54

swyx@swyx

28

swyx 称 Anthropic 将以 2 万亿美元估值 IPO。与此同时，AlphaFold 团队负责人 John Jumper 在任职近 9 年后宣布离开 Google DeepMind 加入 Anthropic。

John Jumper: A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...

Anthropic DeepMind 大佬观点

05:53

Ethan Mollick@emollick

51

我怀疑企业低估了使用更高智能的价值，即便在较弱AI似乎能以更低价格达成KPI的任务中也是如此。至少应构建能灵活尝试更智能模型的架构，看看是否会带来不同。

大佬观点推理部署/工程

05:51

jason@jxnlco

10

codex，每隔一段时间，就打开一些你觉得有趣的标签页，然后把它们留在我的Chrome浏览器里。

大佬观点编码

04:55

Rohan Paul@rohanpaul_ai

55

NYU Stern教授Damodaran：互联网泡沫 vs AI泡沫

NYU Stern商学院教授Aswath Damodaran对比互联网泡沫与AI泡沫：互联网泡沫几乎无大规模资本支出，且主要由股权融资，崩盘时股东损失60%-90%，损失仅限于股东。而AI泡沫的资本支出规模为历史罕见（类比100年前的汽车行业），且大量由私人债务而非银行资金驱动。一旦市场修正，企业违约将蔓延至全社会，比股价暴跌更痛苦。他以2008年危机为例，警告放贷者过度放贷的连锁风险。

大佬观点现象/趋势

03:54

Nathan Lambert@natolambert

42

Nathan Lambert引用hlntnr的推文，用森林怪物比喻解释Anthropic的AI安全世界观：他们认为存在巨大且危险的怪物（超级智能风险），其他竞争者为了宝藏不顾危险，而Anthropic选择派出自己的先遣队，更快更深入地进入森林，投入大量资源进行怪物控制和驯服，并向外界报告发现。这种策略虽然逻辑自洽，但也让外界质疑其是否疯狂或说谎。

Helen Toner: Even before Mythos I was getting asked more and more what Anthropic's deal is, and why tf they're acting the way they're...

Anthropic 大佬观点安全/对齐

03:24

Nathan Lambert@natolambert

39

主推文指出研究SFT方法的人仍然不足，尽管它是后训练的关键基础且实证文献有限。引用推文介绍了一项系统性研究：团队针对大量客户模型，在dense和MoE两类模型族（参数量达235B）上，每次只变动一个SFT杠杆，使用4个真实客户数据集，每个数据集配有与客户合作数周构建的评估，且训练输出直接为通过该评估生成，从而使监督目标与下游度量标准一致，消除了常见混淆因素。该研究旨在为微调提炼最佳实践。

Charlie O'Neill: 1/ We fine-tune a lot of customer models, so we decided to systematically try and figure out some best practices for fin...

大佬观点数据/训练

01:14

Dwarkesh Patel：Podcast & Blog（RSS）

精选60

AI中心的数据黑洞

智能的一种定义是样本效率，但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据，再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例，数据行业年收入已达数十亿美元。近日Epoch报告，开源模型仅落后前沿闭源模型4个月，原因在于数据可从公开API蒸馏，而超参数等不易复制。人类一生接触约2亿token，前沿模型训练在数十到数百T token之间，相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。

大佬观点数据/训练现象/趋势

推荐理由：Dwarkesh 把 AI 的‘笨’归因于数据效率远低于人类，计算虽简但直指要害，他给出的一个逆向洞察是开源模型四个月追上闭源，正是数据驱动进步的最好证据。

00:53

elvis@omarsar0

22

对"循环工程（loop engineering）"趋势有许多想法。我用我的写作智能体花了几分钟总结了我的一些研究、笔记以及与学生们、创始人们和初创公司的讨论。还处于非常早期，但智能体的新工作方式即将出现，能力将有阶跃式变化。

elvis: http://x.com/i/article/2068004233849290752

智能体大佬观点

6月19日

23:22

Ethan Mollick@emollick

59

更多证据，来自中国一项大规模研究，表明如果使用AI削弱了心理努力，就会损害学习。当使用AI导致做作业时间减少时，考试成绩也会下降。综合各项研究，一个主题：AI辅导辅助课堂教学是好的，使用AI"帮助"做作业则是有害的。

大佬观点数据/训练

23:00

AYi@AYi_AInotes

64

普通人一个月工资可开一家互联网公司，AI时代创业成本降至每月$20

推文指出，普通人一个月工资足以启动一家跑通商业闭环的互联网公司，每月固定成本约$20，主要来自Claude Pro或OpenAI Codex辅助开发。其余后端数据库、部署、认证、分析、监控、缓存、邮件、支付等全链路基建均有免费起步额度，域名约$1/月。同时，引用指出当前AI范式（视频生成、VLA）仅学习统计相关性，缺乏因果理解；UCSD黄碧薇教授提出四代AI划分（相关性小模型→因果小模型→相关性大模型/LLM→因果大模型），其团队Aether AI今日完成首轮融资。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI 大佬观点部署/工程

22:53

Nathan Lambert@natolambert

52

归根结底，如果美国实验室不想被蒸馏，他们就不该提供API。看起来他们最终会对某些模型这么做，这是他们的选择。更严格的监管实际上不会奏效，反而会伤害美国的初创公司。

xlr8harder: I completely believe Chinese labs are "distilling" US models at scale, and I have no problem with it whatsoever and thin...

大佬观点政策/监管数据/训练

22:53

Nathan Lambert@natolambert

49

Nathan Lambert 评论称 RL speedrun 终将成为常态，当前最大瓶颈是价格--单次 RL 实验因不稳定导致噪声大，多次种子运行成本约 100 美元。@jeankaddour 随后推出 Sokoban Speedrun 项目：基于 Karpathy 的 nanochat 流水线修改，用 RL 训练 Qwen3-4B-Instruct 解决 Sokoban 谜题，GRPO 基线在 8×H100 上仅需 87 分钟。该尝试展示低成本快速验证 RL 方法的潜力。

Jean Kaddour: With RSI around the corner, it's time for an RL speedrun. Introducing Sokoban Speedrun: training Qwen3-4B-Instruct with ...

大佬观点数据/训练

22:40

Chubby♨️@kimmonismus

36

我们仍有许多工作要做。公众情绪正日益转向反对AI。现在出现了反对数据中心、乃至整体AI的运动；怨恨情绪正在增长。虽然其中无疑存在合理的担忧--比如对失业和能源价格上涨的恐惧--但其中很大一部分只是单纯的怨恨，需要通过教育和提高认知来解决。

大佬观点现象/趋势

22:23

Nathan Lambert@natolambert

32

禁止任何形式的开源AI将是错误。与@kevinsxu共同发布的一则面向公众的公告，阐述为何开源维护美国价值观。管理前沿风险是困难的，但通过削弱开放前沿来减少透明度、创新和教育将更糟。

Kevin S. Xu: http://x.com/i/article/2067652729913114624

大佬观点安全/对齐开源生态

22:22

Orange AI@oran_ge

37

GLM 5.2 辅助开发安卓 App 体验

开发者使用 GLM 5.2 从零开始完成第一个安卓 App 开发，包括安装 Android Studio、编写代码到最终生成 APK。GLM 5.2 在大部分问题上能提供有效指导，但遇到疑难杂症时安卓系统仍难处理。作者指出当前 vibe coding 模式在电脑和 Web 端调试最为方便。

大佬观点编码

22:22

elvis@omarsar0

52

正如我之前所说，考虑到成本和性能，我认为 Fable 对于很多 SWE 任务来说并不值得。需要说明的是，我认为 Fable 非常出色，它在设计和创意方面明显表现优异。等它重新上线后，我会用自己的循环测试它（并衡量前沿效率）。

Datacurve: Claude Fable 5 debuts at #1 on DeepSWE. It outscores the previous best by 3% and sets a new state-of-the-art on our long...

Anthropic 大佬观点编码

21:59

Nathan Lambert：Interconnects（RSS）

精选56

禁止开源AI将是一个错误

近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制，可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值，在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中，开源（尤其开放权重）是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全，更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反，美国初创公司正依赖包括中国在内的开源模型提升效率。

大佬观点开源生态政策/监管

推荐理由：在华盛顿弥漫监管 AI 空气的当下，这篇文章是对‘禁止开源 AI’冲动的清晰反驳。它系统梳理了开源在教育、创新和竞争中不可替代的价值，尤其适合对政策走向摇摆不定的人阅读。

21:02

Berryxia.AI@berryxia

45

用户@justinleei分享从年初至今的智谱GLM使用体验：订阅GLM完成两个项目（1个商用上线），认为其多种文档格式解析综合能力优于竞品，与Claude Code体验无明显差距。期间算力紧缺时出现过降智，响应慢但结果可接受。近期使用的zcode比第三方agent更快。主推文@berryxia赞同此评价，认为智谱能力当前为国产模型第一档，甚至优于DeepSeek。

李举刚: 这两天大家都在讨论智谱,我说下我的看法。评价一个东西怎么样,自己去体验。从年初到现在,一直都在订阅GLM,做了两个完整的项目,1个商用上线了,1个在开发中,我想我有发言权的。我从年初疯狂安利朋友们买智谱的股票,虽然资本不认可智谱,认为...

大佬观点编码

20:19

fofr@fofrAI

19

当智能体说它要手动操作时 👀

智能体大佬观点

20:02

Emad@EMostaque

23

当AI成为法官、陪审团与行刑者时，法律会怎样？

大佬观点安全/对齐

18:59

IT之家（RSS）

50

马斯克预测中国大模型2027年Q1追上Anthropic Fable，智谱唐杰回应"用不了那么久"

6月17日，智谱开源新旗舰GLM-5.2，在FrontierSWE编程测试中得分74.4，超OpenAI GPT-5.5，仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平，马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充，跑分赶上相对容易，但以实用性衡量，2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布，可处理5000万行代码迁移等任务，发布数日后遭管制。

Anthropic 大佬观点现象/趋势

17:50

Hacker News 热门（buzzing.cc 中文翻译）

47

"令牌压缩"的错觉：我为何对RTK持怀疑态度

RTK获得60k GitHub星标，宣称能“削减60–90%模型token用量，支付1/10的价格”，但实际API账单并未同比例下降——它仅裁剪Bash原始输出，忽略文件读取、仓库上下文、系统提示词和模型内部推理token。公开issues指出终端输出会被静默截断或丢失，且AI智能体无法感知压缩，导致关键信息缺失。RTK从未公布任务成功率（如SWE-bench类基准），其节省量更像营销指标。从架构看，rtk引入脆弱的外部依赖，解析git、cargo、npm、grep等CLI工具的stdout/stderr格式，一旦工具更新格式便可能静默失败。本质上这是CLI原生可实现的feature，而非独立产品，将其放入生产agent关键路径存在高风险。

大佬观点开源生态编码

17:17

DogeDesigner@cb_doge

34

突发：黄仁勋表示，人们关于AI犯的最大错误是将其视为威胁，而非放大人类潜力的工具。AI不会摧毁人类的工作，而是将重建美国工业，并创造一波新的建设者、技术人员、工程师和制造者。

16:43

歸藏(guizang.ai)@op7418

45

梦珂老师又回推特了【引用 @MengkePM】：http://x.com/i/article/2067506549107691520

Mengke Wang: http://x.com/i/article/2067506549107691520

大佬观点行业动态

16:43

歸藏(guizang.ai)@op7418

22

唐老师与马斯克就国内开源版本的Fable 5级别模型何时出现展开对话。马斯克认为需要较长周期，而唐老师回复"won't take that long"，暗示时间可能早于预期。主推文据此判断，国内开源Fable 5级别模型不必等到2027年。

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态

16:41

Greg Brockman@gdb

25

用户反馈，OpenAI 的 Codex 桌面应用能同时运行近 300 个子 agent，持续超过一天，且异常流畅，毫无卡顿。Greg Brockman 评价："Codex app is very good"。

Q: codex desktop app @OpenAI is crazy i have a session with nearly 300 subagents running more than a day thanks to @justsis...

OpenAI 大佬观点

15:16

IT之家（RSS）

61

杨立昆评马斯克：xAI已失败，SpaceX出色，特斯拉FSD有用但非完全自动驾驶

Meta前首席AI科学家杨立昆受访时称，马斯克创办的xAI“某种程度上已经失败”：难以招到顶尖AI人才，除马斯克外所有联合创始人已离职。xAI近日将数据中心出租给Anthropic等对手，杨立昆认为此举反映其弱势处境，需出租才能收回成本。他不看好xAI前景，认为其无法参与最前沿竞争。同时他称赞SpaceX“做得非常出色”，并表示自己拥有一辆特斯拉，FSD并非真正完全自动驾驶，但确实有用。

xAI 大佬观点行业动态

13:24

Ethan Mollick@emollick

58

一些（初步）证据表明，管理者在使用Claude Code进行编码时成功率最高。我一直认为管理是AI的超级能力，因为明确说明你想要什么、如何做以及什么样子算好，是使用智能体的关键。https://www.oneusefulthing.org/p/management-as-ai-superpower

Anthropic 大佬观点编码

12:28

Peter Steinberger 🦞@steipete

25

Peter Steinberger 引用 @nickbaumann_ 介绍 Codex Record & ReplayTM️ 新原语：让 Codex 观看用户电脑操作，通过录制和事件（与 computer use 同框架）理解操作，转化为未来可复用的技能。使用案例：按个人风格格式化日历邀请（GCal 插件）、起草 PR 并分享到指定 Slack 频道、录制入职流程发现摩擦点（不生成技能）。Steinberger 称"所有东西要么是快速 API 要么是慢速 API"。

Nick: The best way to think of Record & ReplayTM️ is to imagine it as a new primitive Ask Codex to watch you do something on y...

MCP/工具大佬观点编码

12:16

Steve Yegge：Medium（RSS）

同事件精选74

Fable模型被美国临时关闭，AI安全管控时代来临

美国政府短暂关闭了Mythos类中的Fable模型，标志着AI模型已越过危险门槛。作者预测最多两三代模型后，超级智能将像核武器一样被管控，大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月，且面临算力和政府锁定的双重壁垒。人类的“辨别地平线”使许多人感觉模型进步停止，但实际指数增长未停——只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务（如React客户端），AI将彻底改变编程和知识工作，但多数人只能使用当前等级模型。

智能体 Anthropic 大佬观点安全/对齐

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：Steve Yegge这篇判断很冷也很实：多数人能接触的模型智能将停滞，但背后指数仍在跑，SaaS反而因此安全。他抛出的AI素养三阶模型，对正头痛如何推动团队用AI的leader是现成框架。

11:16

IT之家（RSS）

40

蔡崇信：阿里全面投入 AI，开源的主要推动力量来自中国企业

蔡崇信昨日在 VivaTech 2026 上表示，AI 的总潜在市场规模达 50 万亿美元，对标人类生产力，阿里巴巴正全面投入 AI。其全栈 AI 优势包括：中国高效低成本的能源供给，提前布局的云计算和芯片，全球最受欢迎的开源模型千问（Qwen），以及覆盖电商、即时零售等丰富应用场景。他同时指出，当前全球 AI 开源的主要推动力量来自中国企业，阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。

大佬观点开源生态现象/趋势

09:48

Berryxia.AI@berryxia

33

GLM-5.2 这次真的有 Opus 4.6 的水平了，牛逼~~

大佬观点推理

08:58

Rohan Paul@rohanpaul_ai

59

美国副总统JD Vance批评AI公司用恐惧做营销，不认同AI导致大规模失业

美国副总统JD Vance在《Diary Of A CEO》访谈中批评部分AI公司CEO刻意渲染反乌托邦前景，将恐惧当作病毒式营销，让消费者因害怕而相信产品强大。他认为最悲观的AI预测与制造者存在利益关联。关于AI失业，Vance表示不认为大规模失业是最可能结果，数据无证据支持；更可能是生产力提升、岗位变化或更替，而非全面失业。

Rohan Paul: Nypost: Anthropic is trying to get Washington to reverse the US block on its most powerful Mythos Anthropic has proposed...

08:54

Ethan Mollick@emollick

43

LLM时代的关键时刻之一，与GPT-3.5以及微软在@kevinroose纽约时报文章后没有关闭Bing/Sydney/GPT-4的决定相提并论。

roon: imo it is crazy that openai, years into the heated AGI race, released o1 and described in quite a bit of detail the prin...

OpenAI 大佬观点推理

08:29

SemiAnalysis@SemiAnalysis_

50

很高兴Jensen重新联系了他的根源，他的Day 0s，他的OGs，通过与《英雄联盟》选手Faker一起玩。CUDA AI革命始于GeForce上的游戏玩家，所以很高兴看到Jensen扎根于他的根源。没有游戏玩家，就不会有CUDA护城河。这是在Jensen的Computex主题演讲之后，该演讲对游戏玩家和AI工程师都令人失望，并获得了KeynoteMAX F等级。

大佬观点现象/趋势

08:25

swyx@swyx

58

swyx在X上称，Midjourney的医疗影像发布使Butterfly Network（$BFLY）股价单日暴涨55%，他考虑开基金。他记录该发布：被@Scobleizer比作初代iPhone和Tesla首发；有Nature论文支持；理念为"更好的数据=更好的成像"，每个维度提升40-100倍而非10%-2x；这只是今年8个副项目首个；每年仅$10M研究预算即实现此创新，引发对大型机构R&D效率的质疑。有人问"何时FDA批准"，swyx认为应先做简单的事再解决困难，好的技术和使命会让监管等障碍自行瓦解。

swyx: my notes from the @midjourney medical launch - @Scobleizer compared this to the original iPhone and Tesla launches (that...

图像生成大佬观点行业动态

06:53

Orange AI@oran_ge

54

OpenAI新论文：通过RL训练做好事可泛化至多领域，提升模型诚实性

OpenAI探索逆向对齐思路：训练模型做好事是否能像坏事一样泛化？研究人员使用涉及诚实、认知谦逊、可纠正性等特质的对话数据，覆盖健康、教育等领域，通过RL训练。实验发现：训练域内模型更诚实；在44个未见测试中，欺骗、谄媚、有害建议等均下降；面对对抗提示或恶意微调，模型更有韧性，且不损失正常指令能力。表明RL可强化道德底层逻辑。

OpenAI 大佬观点安全/对齐

05:53

Greg Brockman@gdb

28

推理范式正在解锁人类医学进步

Noam Brown: When we announced @OpenAI o1 some researchers from other labs told me we made a strategic mistake and should have kept i...

OpenAI 大佬观点推理

05:27

Yuchen Jin@Yuchenj_UW

39

我其实有不同看法。越来越多公司正从租用闭源大语言模型转向通过开源大语言模型和后训练"拥有模型权重"。 Cursor 已经做到了。开源大语言模型的收入某个时候可能超过 Anthropic。

Anthropic 大佬观点开源生态

1…10 111213 14…50