AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 201 条
全部一手资讯X论文
标签「大佬观点」清除
7月2日周四
18:31公众号:千问APP(阿里)62精选千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索
06:42Dwarkesh Patel:Podcast & Blog(RSS)54关于AI重大问题的获奖征文
04:35Tomer Tunguz 博客(VC 分析)60精选构建AI智能体应优先设计路由
7月1日周三
07:34Tomer Tunguz 博客(VC 分析)482026 年 CIO 的选择很明确
07:08Ethan Mollick:One Useful Thing(RSS)73聊天机器人的黄昏
00:42Dwarkesh Patel:Podcast & Blog(RSS)61精选Grant Sanderson 谈 AI 与数学的未来
6月30日周二
04:34Tomer Tunguz 博客(VC 分析)58精选Anthropic:当AI成本超过工程师薪酬
6月28日周日
23:42Gary Marcus:The Road to AI We Can Trust(RSS)45中国追赶
04:41Gary Marcus:The Road to AI We Can Trust(RSS)48本月生成式AI失去了魔力
6月27日周六
01:33Tomer Tunguz 博客(VC 分析)52应用层公司:护城河是赢得的,并非与生俱来
6月26日周五
23:51Dwarkesh Patel:Podcast & Blog(RSS)61精选下一个重大突破:AI在工作中学习
00:34Gary Marcus:The Road to AI We Can Trust(RSS)43Generative AI FizzleTM:生成式AI泡沫正在缓慢消退
00:00Suno:Blog(网页)32Matt Steffanina:舞者也可用 Suno 拥有自己的音乐
00:00Suno:Blog(网页)36Eric Christian 谈如何使用 Suno 听到旋律中的管弦效果
6月25日周四
15:30公众号:面壁智能(MiniCPM)45面壁智能亮相MBBF:李大海称端侧智能是AI走向物理世界必经之路
6月24日周三
22:31公众号:火山引擎74精选字节跳动技术副总裁洪定坤:AI Coding 的实践与探索
6月23日周二
03:54Tomer Tunguz 博客(VC 分析)25AI推理销售:成本加成 vs. 价值定价
6月20日周六
01:14Dwarkesh Patel:Podcast & Blog(RSS)60精选AI中心的数据黑洞
6月19日周五
21:59Nathan Lambert:Interconnects(RSS)56精选禁止开源AI将是一个错误
12:16Steve Yegge:Medium(RSS)74同事件精选Fable模型被美国临时关闭,AI安全管控时代来临同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
03:16Gary Marcus:The Road to AI We Can Trust(RSS)48埃森哲:昔日与今朝,以及它如何预示未来
6月18日周四
17:10公众号:昆仑万维(天工)48Skywork Super Agents:Agent范式正在重构Token经济
02:10Gary Marcus:The Road to AI We Can Trust(RSS)44特朗普向Anthropic提出不可能的要求
6月17日周三
23:07Nathan Lambert:Interconnects(RSS)51博客现状,2026年中
22:55CMU:Machine Learning Blog54预训练还不够"苦涩"
06:04Gary Marcus:The Road to AI We Can Trust(RSS)62精选OpenAI 的领先优势正在快速缩小
6月16日周二
22:01Nathan Lambert:Interconnects(RSS)52前沿大模型后训练配方回顾:与 Finbarr Timbers 对谈
00:47Tomer Tunguz 博客(VC 分析)61同事件精选AI 应用黄金时代已至:Fable 被禁、Nadella 的护城河论点与 Salesforce 收购 Fin同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
6月15日周一
13:10公众号:昆仑万维(天工)28智源大会|Skywork首席科学家成宇:SkyReels V4与Mureka V9技术演进
02:38Nathan Lambert:Interconnects(RSS)69同事件精选欢迎进入AI治理的AGI时代同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
00:50Gary Marcus:The Road to AI We Can Trust(RSS)65同事件精选白宫AI监管决定被指偏袒OpenAI与亚马逊同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
6月14日周日
00:49Gary Marcus:The Road to AI We Can Trust(RSS)50Gary Marcus:白宫混乱的AI政策
6月13日周六
21:30公众号:面壁智能(MiniCPM)50面壁智能李大海:全栈突破×场景落地,端侧AI加速AGI征程
6月12日周五
22:46Gary Marcus:The Road to AI We Can Trust(RSS)22Gary Marcus:今日幻觉速报
00:00OpenRouter:Announcements(RSS)56同事件精选OpenRouter:多模型路由成趋势,成本压力驱动企业从单一LLM转向跨模型推理同一事件,精选展示《OpenRouter:企业应转向多模型路由,放弃单一LLM供应商》
6月11日周四
21:45Gary Marcus:The Road to AI We Can Trust(RSS)37OpenAI 正酝酿"大幅"降价,Gary Marcus 视其为示弱信号
09:45Gary Marcus:The Road to AI We Can Trust(RSS)56精选也许 Section 230 终究不能为 AI 公司提供责任豁免
03:42Tomer Tunguz 博客(VC 分析)72Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存
00:44Gary Marcus:The Road to AI We Can Trust(RSS)63精选回顾与 Steve Eisman 的访谈,以及可能的关键新闻
6月10日周三
07:27Nathan Lambert:Interconnects(RSS)63同事件精选Claude Fable 5 与新的 AI 安全寓言同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月2日
18:31
公众号:千问APP(阿里)
精选62
千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索

千问团队2026年1月上线通用复杂任务Agent(千问App胶囊入口),总结“多快好省”方法论:支持信息搜集、研究分析等任务;执行时间降至初始1/3;通过搜索范式与上下文管理优化交付质量;Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务,构建User Memory、Environment、Task System、Assistant四大组件,指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering,下一站是A IWare Engineering,强调“低功耗,够用就行”。

智能体大佬观点部署/工程

推荐理由:千问C端团队分享的Agent工程实践很务实,从“多快好省”到AIWare Engineering的演进思路,对正在做复杂任务Agent的团队是一个有价值的参考系。
06:42
Dwarkesh Patel:Podcast & Blog(RSS)
54
关于AI重大问题的获奖征文

Dwarkesh Patel举办的AI征文比赛评选出三位获奖者。第一名Jassi Pannu主张OpenAI基金会应投入数十亿美元终结空气传播疾病,利用AI加速自主生物学发现,可带来超1万亿美元年GDP增长并消除灾难性流行病风险。第二名Ege Erdil建议AI供应链外的国家通过强产权、低资本税和开放监管政策抓住增长机会。第三名Michael Li类比香港地铁商业模式,提出AI实验室可通过收购互补性资产盈利。

大佬观点现象/趋势
04:35
Tomer Tunguz 博客(VC 分析)
精选60
构建AI智能体应优先设计路由

构建AI智能体时,应优先设计路由(router)而非选择模型。路由决定每个请求由哪层模型处理。正确路由可使70-80%流量运行在免费本地模型或异步推理上,将AI开销降低90%+。Brian Armstrong指出Coinbase通过更好的默认设置、路由和缓存,在token使用量增长的同时将AI支出减半。路由分三层:技能分类器、路由器、模型选择器。本地计算近乎零成本,异步批量推理比实时推理便宜两个数量级。大多数工作无需秒级返回。同步预测器标记复杂任务,夜间批量评估器更新路由权重。技能蒸馏后,非编码类任务中70-80%智能体流量可由本地模型处理。

大佬观点部署/工程

推荐理由:Tunguz 把代理架构的设计重心从模型选择拉回到路由上,三层分类器-路由器-选择器的划分很清晰,做 AI 应用的团队可以参考,但其中的新东西不多。
7月1日
07:34
Tomer Tunguz 博客(VC 分析)
48
2026 年 CIO 的选择很明确

对 87 家上市 SaaS 及平台公司的分析显示,2026 年只有基础设施与开发工具(一年涨幅 68.5%)和安全(一年涨幅 17.6%)两个板块增长为正,其余三个板块均下跌。市场正在买入 AI 基础设施,卖出按席位定价的应用层。

大佬观点现象/趋势
07:08
Ethan Mollick:One Useful Thing(RSS)
73
聊天机器人的黄昏

前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体AnthropicOpenAI大佬观点
关联讨论 22 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)IT之家(RSS)Simon Willison 博客
00:42
Dwarkesh Patel:Podcast & Blog(RSS)
精选61
Grant Sanderson 谈 AI 与数学的未来

3Blue1Brown 创办人 Grant Sanderson 正在制作记录 AI 在数学领域进展的新项目。他在与 Dwarkesh Patel 的对谈中指出,AI 在 IMO 获金牌并不等于 AGI,只是又一个被攻克的基准。即使 AI 未来解决千禧年大奖难题,仍可能存在大量人类任务无法被自动化。对话还探讨了概念突破验证周期可长达一个世纪、Riemann 假设的 AI 证明能否被人类理解、AI 能否在已有文献间发现隐藏联系,以及现实经济任务难以套用强化学习环境等话题。

大佬观点推理现象/趋势

推荐理由:这次对谈没有停留在AI刷数学题的喜报上,而是追问了‘验证循环’和‘定义生成’两个终极难题。Grant Sanderson的视角让人重新思考AI的进展究竟缺什么,数学家未来的角色会是什么。
6月30日
04:34
Tomer Tunguz 博客(VC 分析)
精选58
Anthropic:当AI成本超过工程师薪酬

Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。

Anthropic大佬观点数据/训练

推荐理由:Tomer Tunguz 用数据把 AI 公司的烧钱速度拆得很细,Anthropic 每个工程师年算力成本 51.5 万美元,是工资的 2.3 倍,这个数字对重新理解 SaaS 毛利率很有冲击力。
6月28日
23:42
Gary Marcus:The Road to AI We Can Trust(RSS)
45
中国追赶

美国AI产业受中国追赶引发价格战,token价格趋近于零,利润微薄,Anthropic和OpenAI的万亿IPO难以实现,数据中心巨额投资难回收。当前范式有三个根本缺陷:暴力训练全互联网成本高昂且效率低下;系统不可靠,长期无法维持溢价;基础方法易复制,导致价格战与负利润率。另有人认为,整个AI竞赛方向可能被误解,美国不应只追求最便宜的LLM,而应开发更适合科学与医学的AI新形态。

大佬观点现象/趋势
04:41
Gary Marcus:The Road to AI We Can Trust(RSS)
48
本月生成式AI失去了魔力

OpenAI倾向于推迟IPO至明年,因估值不及预期且零售投资者兴趣不足。SpaceX一周跌11.74%,Nvidia近一月跌超8%,Oracle跌22%,CoreWeave跌4%,Microsoft跌10%,SoftBank跌12%,Cerebras跌32%。美国AI政策混乱遭广泛批评,中国模型快速崛起。作者认为大语言模型正商品化。

OpenAI大佬观点现象/趋势行业动态
6月27日
01:33
Tomer Tunguz 博客(VC 分析)
52
应用层公司:护城河是赢得的,并非与生俱来

应用层公司创立时通常没有护城河。护城河分两种:先发护城河(技术差异、专有数据集、新颖架构,多见于基础设施层)和滞后护城河(规模经济、品牌、渠道关系,需长期积累)。Salesforce 凭借销售能力、品牌和十年先发优势胜过技术更好的 Siebel;Snowflake 以存储计算分离架构赢得先发护城河,再建设滞后护城河。基于 7 Powers 框架,规模经济、品牌和转换成本天然是滞后的。应用层创业公司可以坦诚回答:我们正在建造护城河。

大佬观点现象/趋势
6月26日
23:51
Dwarkesh Patel:Podcast & Blog(RSS)
精选61
下一个重大突破:AI在工作中学习

AI实验室的研究赌注是:在数千个多样化RL环境中训练模型完成数百万可验证任务,就能构建AGI。这种训练会培养出能连续数周处理开放任务、应对错误和歧义的问题解决技能。虽然模型训练时的样本效率仅为人类的百万分之一,但训练成本是一次性的,可摊销到数十亿次用户会话中;真正重要的是模型在单个会话内的智能和样本效率,而这随着RL训练正在提升。持续学习或许不再必要——如果上下文内的学习能力足够强、时间跨度足够长,就无需将经验蒸馏回权重。Transformer架构创新已能大幅扩展上下文存储,未来可能实现任意大的上下文窗口。论文还指出,一个领域不仅需要可验证性,还需要可碾压性——能在确定性、可重播的模拟器中并行运行大量rollout。

大佬观点推理数据/训练

推荐理由:RLVR 范式能否通向 AGI?Dwarkesh 指出关键瓶颈在于样本效率和 grindability,他提出的 OPSD 和 dreaming 方案重新定义了「学习中」的边界,虽然离落地尚远,但值得每一个关心 AI 下一步的人细读。
00:34
Gary Marcus:The Road to AI We Can Trust(RSS)
43
Generative AI FizzleTM:生成式AI泡沫正在缓慢消退

Gary Marcus 昨日提出新术语 Generative AI Fizzle™,认为生成式AI行业估值过高,投资者对 hype 与利润的落差失去热情。LLM 已商品化,价格战激烈,提供商盈利艰难。昨日一款新的中国开源模型发布,可能进一步冲击美国 LLM 公司。多数 AI 股票本月显著下跌,泡沫可能不会突然破裂,而是缓慢消退。

大佬观点现象/趋势行业动态
00:00
Suno:Blog(网页)
32
Matt Steffanina:舞者也可用 Suno 拥有自己的音乐

洛杉矶舞者兼 DJ Matt Steffanina 在 Suno 博客访谈中分享创作历程。他自学街舞,拥有超 3000 万粉丝和 50 亿观看量,曾为 Taylor Swift、Jason Derulo 编舞,并创办线上舞蹈教学平台 DNCR Academy。过去他靠他人音乐积累数十亿播放却未拥有资产;现在借助 Suno 在数分钟内将音乐创意变为现实。他认为 Suno 和 Hooks 让创作回归趣味,鼓励舞者自己创作音乐。

其他大佬观点
00:00
Suno:Blog(网页)
36
Eric Christian 谈如何使用 Suno 听到旋律中的管弦效果

纽约钢琴家兼作曲家 Eric Christian 在访谈中分享了他将 Suno 整合进创作流程的方式。他把刚写好的循环旋律输入 Suno,几秒内就能听到完整的管弦乐效果,而传统管弦乐模拟需要数小时。尽管他的作品均为钢琴独奏曲,但他一直以交响化视角构思音乐。至今他已售出超过 10 万份乐谱,用户遍布 200 个国家。他坚信音乐的基础在于纸上的记谱而非录音,Suno 让他在不依赖大型管弦乐团的前提下快速判定旋律是否真正成立。

大佬观点
6月25日
15:30
公众号:面壁智能(MiniCPM)
45
面壁智能亮相MBBF:李大海称端侧智能是AI走向物理世界必经之路

面壁智能联合创始人兼CEO李大海在MBBF Top Talk Summit上指出,端侧智能是AI迈向物理世界的必经之路,未来2至3年将迎来能力跃升与场景迁移两大重构。端侧智能需满足实时响应、隐私安全、离线可用三大约束,搭载面壁量产级多模态模型的智能座舱已实现不依赖云端的“感知-记忆-推理-执行”闭环。他强调端云协同是规模化落地的关键,近期推出的MiniCPM5-1B模型以两百分之一参数规模逼近两年前GPT-4o水平,证明小模型可承载高密度智能。

大佬观点端侧
6月24日
22:31
公众号:火山引擎
精选74
字节跳动技术副总裁洪定坤:AI Coding 的实践与探索

在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,但可交付性仅40-60分;结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发,能力沉淀至TRAE(日均Token消耗5.6万亿,增长50倍),并推出TRAE Work。

大佬观点现象/趋势编码

推荐理由:洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲,尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证,是所有推 AI 编程的团队必看的复盘。
6月23日
03:54
Tomer Tunguz 博客(VC 分析)
25
AI推理销售:成本加成 vs. 价值定价

以成本价转售推理(inference)是零利润业务。关键在于成本加成与价值定价的选择。优化是成本杠杆,知识蒸馏(distillation)可暂时提供防御性优势。自带密钥(BYOK)模式打破了成本加成,保留了价值定价。

大佬观点推理
6月20日
01:14
Dwarkesh Patel:Podcast & Blog(RSS)
精选60
AI中心的数据黑洞

智能的一种定义是样本效率,但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日Epoch报告,开源模型仅落后前沿闭源模型4个月,原因在于数据可从公开API蒸馏,而超参数等不易复制。人类一生接触约2亿token,前沿模型训练在数十到数百T token之间,相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。

大佬观点数据/训练现象/趋势

推荐理由:Dwarkesh 把 AI 的‘笨’归因于数据效率远低于人类,计算虽简但直指要害,他给出的一个逆向洞察是开源模型四个月追上闭源,正是数据驱动进步的最好证据。
6月19日
21:59
Nathan Lambert:Interconnects(RSS)
精选56
禁止开源AI将是一个错误

近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制,可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值,在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中,开源(尤其开放权重)是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全,更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反,美国初创公司正依赖包括中国在内的开源模型提升效率。

大佬观点开源生态政策/监管

推荐理由:在华盛顿弥漫监管 AI 空气的当下,这篇文章是对‘禁止开源 AI’冲动的清晰反驳。它系统梳理了开源在教育、创新和竞争中不可替代的价值,尤其适合对政策走向摇摆不定的人阅读。
12:16
Steve Yegge:Medium(RSS)
同事件精选74
Fable模型被美国临时关闭,AI安全管控时代来临

美国政府短暂关闭了Mythos类中的Fable模型,标志着AI模型已越过危险门槛。作者预测最多两三代模型后,超级智能将像核武器一样被管控,大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月,且面临算力和政府锁定的双重壁垒。人类的“辨别地平线”使许多人感觉模型进步停止,但实际指数增长未停——只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务(如React客户端),AI将彻底改变编程和知识工作,但多数人只能使用当前等级模型。

智能体Anthropic大佬观点安全/对齐
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:Steve Yegge这篇判断很冷也很实:多数人能接触的模型智能将停滞,但背后指数仍在跑,SaaS反而因此安全。他抛出的AI素养三阶模型,对正头痛如何推动团队用AI的leader是现成框架。
03:16
Gary Marcus:The Road to AI We Can Trust(RSS)
48
埃森哲:昔日与今朝,以及它如何预示未来

埃森哲去年九月高调宣称AI将改变其业务,但本季度财报令人失望,股价下跌约18%,本周跌幅近23%,较52周高点已跌超50%。生成式AI并未带来预期的大幅收益,MIT、麦肯锡、贝恩等多份研究均显示类似结论。Claude Code(特殊神经符号系统,非通用聊天机器人)或能提升程序员生产力,但企业整体AI投资回报未达预期,tokenmaxxing热潮正在消退。

大佬观点现象/趋势行业动态
6月18日
17:10
公众号:昆仑万维(天工)
48
Skywork Super Agents:Agent范式正在重构Token经济

Skywork Super Agents 从2024年底推理模型起步,2025年2月转向办公场景,5月发布Word、PowerPoint、Excel、网页、博客五个专项Agent,8月拓展多模态后在BrowseComp榜单进入第一梯队,11月解决Excel表格准确性难题。202

智能体大佬观点
02:10
Gary Marcus:The Road to AI We Can Trust(RSS)
44
特朗普向Anthropic提出不可能的要求

特朗普要求Anthropic完成不可能的任务,暴露了生成式AI安全护栏的根本困境。早在2024年1月,Gary Marcus就指出任何护栏都难以在过于严格和过于宽松之间找到平衡。如今这一判断得到验证:基于next-token predictor的大语言模型本质上不适合安全控制。要么对LLM加以限制直至出现更好的技术,要么承受后果。问题并非Anthropic独有,而是整个生成式AI面临的挑战。

Anthropic大佬观点安全/对齐
6月17日
23:07
Nathan Lambert:Interconnects(RSS)
51
博客现状,2026年中

Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标:为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音,避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议,以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万,付费约 900 人;运营实体 Interconnects AI, LLC 已成立,但银行账户数月余额接近零,收入再投入业务,近期不打算全职运营。

大佬观点开源生态
22:55
CMU:Machine Learning Blog
54
预训练还不够"苦涩"

Richard Sutton的“苦涩教训”通常被解读为警告不要在AI系统中编码过多人类知识,最终胜出的方法是能吸收更多算力和数据的一般性方法。现代基础模型预训练表面上是这一教训的胜利:采用通用架构、海量数据、简单的自监督目标(语言模型预测下一个token,视觉模型重建掩码块等)。但问题在于,训练目标仍由人类在训练循环外选定——完成一次大规模预训练后评估下游表现,再调整方案重新运行。这个控制环路非常粗糙。该论文探讨能否让这一环路变得更高效。

大佬观点数据/训练
06:04
Gary Marcus:The Road to AI We Can Trust(RSS)
精选62
OpenAI 的领先优势正在快速缩小

评论认为 OpenAI 正面临多重危机:缺乏护城河导致市场领先地位下滑;最大投资者微软持续疏远,近期甚至公开考虑将主要产品外包给中国;亏损速度远超预期,年亏损额以 8 倍增长。华盛顿方面可能打压 Anthropic,但也可能反而帮助其崛起,而 Elon Musk 成为另一个潜在的竞标者。

MicrosoftOpenAI大佬观点
关联讨论 4 条The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Ars Technica:AI(RSS)
推荐理由:Gary Marcus 这次拿出了市场份额和微软疏远的证据,比以往的情绪化唱衰更有说服力。如果你还相信 OpenAI 的地位不可动摇,这篇值得一看。
6月16日
22:01
Nathan Lambert:Interconnects(RSS)
52
前沿大模型后训练配方回顾:与 Finbarr Timbers 对谈

Interconnects 播客邀请 Finbarr Timbers 回顾后训练配方的演变:从 InstructGPT 的 SFT→奖励模型→RL 三阶段,到 Llama 3 / Tülu 3 的 SFT→DPO→可验证奖励 RL,再至 DeepSeek R1 以大规模 RL 为核心。2026 年配方分化为多个领域专家模型再合并回统一模型。新出现模式为 Multi-teacher On-Policy Distillation(MOPD):训练 N 个领域专家(经 SFT 和领域 RL),再通过在线采样、逐 token 最小化反向 KL 散度训练通用学生模型。MiMo Flash V2 率先引入,DeepSeek V4 与 Nemotron 3 Ultra 扩展至超过 10 个教师。MOPD 兴起源于单一 RL 流程在多领域间产生能力冲突,而专家模型易于并行训练,在线蒸馏技术日趋成熟。

DeepSeek大佬观点开源生态推理
00:47
Tomer Tunguz 博客(VC 分析)
同事件精选61
AI 应用黄金时代已至:Fable 被禁、Nadella 的护城河论点与 Salesforce 收购 Fin

美国政府关闭 Anthropic 的 Fable 访问,开源和本地模型成必备;Satya Nadella 主张 AI 生态护城河应是人类专业知识和模型外围系统;Salesforce 以 36 亿美元收购 Fin(前 Intercom),Fin 利用开源模型实现性价比。这三件事标志 AI 应用进入黄金时代。构建 AI 应用的难点:在 Kimi K2.6、Qwen 3.6 27b、GLM 5.1 等不同特性模型中选择;设计智能体系统的 hill-climbing 循环;持续评估模型+循环性能以最大化 token 预算中的智能。掌握这三项技能的公司将主导这一时代。

智能体大佬观点开源生态
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:Tunguz 认为模型不再是护城河,系统设计才是,他提的三个新学科,选模型、设计循环、评估性能,对做 Agent 的团队是实用的框架,值得一读。
6月15日
13:10
公众号:昆仑万维(天工)
28
智源大会|Skywork首席科学家成宇:SkyReels V4与Mureka V9技术演进

昆仑万维Skywork首席科学家成宇在智源大会上介绍SkyReels V4与Mureka V9。SkyReels V4在Artificial Analysis全球视频生成评测中夺得Text to Video(With Audio)与Image to Video(With Audio)双赛道第一,超越Veo 3.1和Sora 2。其四大突破包括双流MMDiT架构实现毫秒级音画同步、全模态强化学习提升视频逻辑连贯性,以及1080p/32FPS/15秒电影级画质联合生成策略。Mureka V9引入MusiCoT音乐思维链技术,实现段落级文本控制与母带级混音,在旋律性(7.25)、表现力(6.89)等维度排名第一。此外,昆仑万维以“4+3”AGI战略支撑AI短剧、AI音乐、AI游戏三大AI原生娱乐经济体。

多模态大佬观点开源生态视频
02:38
Nathan Lambert:Interconnects(RSS)
同事件精选69
欢迎进入AI治理的AGI时代

上周五收盘后,美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限,理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称,对任何模型权重的出口禁令都是长期负面政策,且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧,并暴露了前沿AI公司与政府间的紧张关系。

Anthropic大佬观点安全/对齐政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:美国政府强制叫停Claude 5,不是一次性的监管风波,而是AGI治理新时代的起跑枪。Nathan Lambert的分析撕开了政府、实验室和资本之间的脆弱关系,做AI安全与政策的人必须看的一篇。
00:50
Gary Marcus:The Road to AI We Can Trust(RSS)
同事件精选65
白宫AI监管决定被指偏袒OpenAI与亚马逊

白宫周五做出的AI监管决定被指偏袒OpenAI、亚马逊等企业,同时对Anthropic施压不足24小时,缺乏透明度和事实依据。Gary Marcus、Dean W Ball及卡托研究所Kevin Frazier等专家指出,这种由少数人闭门快速决策的做法带有腐败嫌疑,可能促使其他国家加速发展“主权AI”甚至中国AI,并导致美国人才流失。Anthropic声明称政府应在法定程序中基于技术事实阻止不安全部署,而非当前方式。Marcus呼吁建立独立机构负责AI监管,确保公平、清晰、基于证据的执行。

大佬观点安全/对齐政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:白宫对 Anthropic 的仓促禁令不仅是监管失灵,更可能触发全球 AI 主权竞赛和人才外流。Marcus 呼吁独立的透明机构,这篇分析指出了美国 AI 行业最紧迫的制度缺口。
6月14日
00:49
Gary Marcus:The Road to AI We Can Trust(RSS)
50
Gary Marcus:白宫混乱的AI政策

白宫的AI政策混乱无序,迫使各州自行其是。文章指出当前联邦层面缺乏有效协调,并探讨了更优的监管路径。

OpenAI大佬观点安全/对齐政策/监管
6月13日
21:30
公众号:面壁智能(MiniCPM)
50
面壁智能李大海:全栈突破×场景落地,端侧AI加速AGI征程

面壁智能李大海在智源大会上表示,端侧智能是实现物理世界AGI的必由之路。MiniCPM端侧模型已落地汽车(长安马自达、吉利等)、手机、AIPC、具身智能、智能家居等领域。公司开源发布周展示全栈技术:UltraData数据治理体系、MiniCPM5-1B模型以1/200参数逼近两年前GPT-4o、ForgeTrain框架对比英伟达Megatron节省10%资源、BitCPM-CANN在国产算力跑通三值训练(推理节省6倍内存)、开源PilotDeck多智能体操作系统。面壁选择全栈开源,共建端侧生态。

具身智能大佬观点开源生态端侧
6月12日
22:46
Gary Marcus:The Road to AI We Can Trust(RSS)
22
Gary Marcus:今日幻觉速报

Gary Marcus 在一篇题为“You can’t get more 2026 than that”的短文中仅写出一句:“Hallucination of the day:”。该文未披露具体模型、版本号或任何数字细节,仅以简短方式指出现阶段AI仍存在模型幻觉现象。

大佬观点安全/对齐
00:00
OpenRouter:Announcements(RSS)
同事件精选56
OpenRouter:多模型路由成趋势,成本压力驱动企业从单一LLM转向跨模型推理

OpenRouter数据显示,企业正从单一LLM转向跨模型族推理,成本压力是推动路由决策的关键。Anthropic的Opus 4.7因tokenizer tax导致输入token增加约35%;新模型Fable($10/M输入,$50/M输出)和OpenAI的GPT-5.5 Pro($30/M输入,$180/M输出)定价更高。3月至4月间有90个新模型发布,进一步增加了可选性。

大佬观点推理
同一事件,精选展示《OpenRouter:企业应转向多模型路由,放弃单一LLM供应商》
推荐理由:OpenRouter 用内部数据证实多模型路由正在成为企业降本的核心策略,比「选一个模型全家用」更务实,做 AI 预算的值得读读这些真实增长曲线。
6月11日
21:45
Gary Marcus:The Road to AI We Can Trust(RSS)
37
OpenAI 正酝酿"大幅"降价,Gary Marcus 视其为示弱信号

OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司的疲软竞争力。

OpenAI大佬观点行业动态
09:45
Gary Marcus:The Road to AI We Can Trust(RSS)
精选56
也许 Section 230 终究不能为 AI 公司提供责任豁免

德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。

GoogleOpenAI大佬观点

推荐理由:德国一个判決可能颠覆美国 AI 公司的责任豁免,Gary Marcus 拆解了 Section 230 的真正边界——它只保护第三方言论,不保护聊天机器人自己胡说八道,这个逻辑一旦在法庭站稳,整个行业都得重新思考如何控制胡说。
03:42
Tomer Tunguz 博客(VC 分析)
72
Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存

Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布
关联讨论 30 条X:Perplexity (@perplexity_ai)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
00:44
Gary Marcus:The Road to AI We Can Trust(RSS)
精选63
回顾与 Steve Eisman 的访谈,以及可能的关键新闻

原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。

OpenAI大佬观点

推荐理由:Gary Marcus 把与“大空头”原型 Eisman 的对话和 SoftBank 贷款遭拒拼在一起,一个 OpenAI 拖垮整个 AI 泡沫的连锁路线图已经画好,这是近期最清醒的风险提示。
6月10日
07:27
Nathan Lambert:Interconnects(RSS)
同事件精选63
Claude Fable 5 与新的 AI 安全寓言

前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。

Anthropic大佬观点安全/对齐开源生态
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
推荐理由:Anthropic 在 Fable 5 上悄悄加了不告知用户的安全限制,对模型开发请求做手脚却不降级通知,这种做法让人很难信任这个「最聪明模型」,也意外给美国开源社区打了一针强心剂。
‹ 上一页
123456
下一页 ›