AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 140 条
全部一手资讯X论文
标签「现象/趋势」清除
6月3日周三
00:37Tomer Tunguz 博客(VC 分析)61精选开放模型的繁荣生态
6月2日周二
17:12OpenAI:官网动态(RSS · 排除企业/客户案例)48Codex正在成为每个人的生产力工具
13:16公众号:面壁智能(MiniCPM)57对话刘知远:中国AI要"向外卷",大模型密度定律登上《自然·机器智能》封面
00:35Tomer Tunguz 博客(VC 分析)62精选AI看跌情绪地图
6月1日周一
22:38Hugging Face:Blog(RSS)60精选超越LLM:为何可扩展的企业AI采用取决于智能体逻辑
22:06Nathan Lambert:Interconnects(RSS)67精选开源与闭源模型在不同的增长曲线上
01:14Gary Marcus:The Road to AI We Can Trust(RSS)46教皇似乎比Geoffrey Hinton更懂人工智能
5月30日周六
02:12Gary Marcus:The Road to AI We Can Trust(RSS)46Token至上时代结束之后会怎样?
02:03Steve Yegge:Medium(RSS)66技术面试的终结
5月29日周五
04:11Gary Marcus:The Road to AI We Can Trust(RSS)53突发:史上三大IPO面临坏消息
5月28日周四
03:33Tomer Tunguz 博客(VC 分析)61精选软件之后是AI时代
5月26日周二
22:34Runway:News(网页)68精选Project Luxo:跨越AI媒体的恐怖谷
22:03Gary Marcus:The Road to AI We Can Trust(RSS)60精选Uber COO称未见AI投入产出成比例增长
5月25日周一
18:16公众号:火山引擎37在戛纳和贾樟柯导演聊了聊AI:普通人拍电影的时代来了
5月23日周六
19:14公众号:百度智能云(文心)40当AI进入物理世界,具身模型如何重构生产力?
00:28Tomer Tunguz 博客(VC 分析)70精选可塑界面:AI驱动的未来软件形态
00:16Hugging Face:Blog(RSS)50专业化胜过规模:Dharma 发布 DharmaOCR,3B 专用模型在 OCR 基准上超越商业前沿 API
5月21日周四
21:57公众号:百度智能云(文心)26AI重构的2026年,普通人的边界在哪里?
20:05公众号:昆仑万维(天工)43算力拉开行业差距!方汉深度解读 AI 产业变革、职场走向与企业转型之道
5月20日周三
23:55Gary Marcus:The Road to AI We Can Trust(RSS)65精选生成式AI是否会沦为科技行业的"越南战争"?公众抵制能否引领AI走向更优的发展路径?
02:18Google Blog:AI(RSS)71精选AI Mode 如何改变美国人的搜索方式
5月18日周一
19:31公众号:面壁智能(MiniCPM)21面壁智能:智能座舱的尽头是一个真正"懂你"的 Agent
5月17日周日
16:44Gary Marcus:The Road to AI We Can Trust(RSS)36生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径
5月16日周六
11:14Google DeepMind:Blog(RSS)43WeatherNext如何帮助美国国家飓风中心更好预测飓风Melissa在牙买加的历史性登陆
03:19Tomer Tunguz 博客(VC 分析)72精选推理的一阶导数:AI浪潮下的增长逻辑
5月15日周五
11:40OpenAI:官网动态(RSS · 排除企业/客户案例)32Sea 对基于 Codex 的智能体软件开发未来的展望
03:18Tomer Tunguz 博客(VC 分析)65精选AI电子邮件的成本分析
5月13日周三
03:08OpenAI:官网动态(RSS · 排除企业/客户案例)64精选Parameter Golf 揭示了关于 AI 辅助研究的哪些经验
00:26Nathan Lambert:Interconnects(RSS)64精选开放模型生态的复合增长
5月12日周二
06:13OpenAI:官网动态(RSS · 排除企业/客户案例)66精选ChatGPT 在 2026 年初如何扩大应用范围
5月11日周一
10:00公众号:昆仑万维(天工)26当企业开始用Mureka替换Suno--一场正在发生的AI音乐迁移,以及它背后的理由
04:34Gary Marcus:The Road to AI We Can Trust(RSS)52对AI进步的恐慌放错了地方
5月9日周六
01:27BAIR:Berkeley AI Research Blog64精选自适应并行推理:高效推理扩展的新范式
5月8日周五
03:13Tomer Tunguz 博客(VC 分析)57精选估值折价:Anthropic高增长背后的市场疑虑
00:14Nathan Lambert:Interconnects(RSS)74精选走进中国AI实验室内部笔记
5月7日周四
18:29Anthropic:Research(发表成果 · 网页)67精选聚焦领域:Anthropic研究所的核心研究方向
5月6日周三
23:08OpenAI:官网动态(RSS · 排除企业/客户案例)65精选前沿企业如何构建人工智能优势
03:12Tomer Tunguz 博客(VC 分析)63精选当公司里每个人都是关键人物时
5月5日周二
04:02OpenRouter:Announcements(RSS)59精选GPT-5.5 价格上涨:实际成本几何
00:11Nathan Lambert:Interconnects(RSS)47蒸馏恐慌
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
00:37
Tomer Tunguz 博客(VC 分析)
精选61
开放模型的繁荣生态

根据OpenRouter平台数据,自2025年以来,开放模型使用量显著增长。最新数据显示,开放权重模型产生了69.1%的token使用量,闭源模型为30.9%。新模型的发布会吸引开发者测试,推动token使用量达到新的平台期。开放模型市场内部竞争激烈,领导地位频繁更迭,如DeepSeek的早期优势在2025年末至2026年初被MiniMax与Kimi模型取代,随后MiMo、Qwen、腾讯Hy3、阿里巴巴及Arcee等模型的发布再次改变了份额格局。尽管开放模型目前仍只占推理总量的一小部分,但激烈的竞争与增长表明,开发者正越来越愿意将生产流量路由至开放模型。

开源生态现象/趋势

推荐理由:开放模型在OpenRouter上的token份额已到69%,而且每轮新模型发布都会把使用量推上一个台阶,做推理基础设施的应该重视这个信号。
6月2日
17:12
OpenAI:官网动态(RSS · 排除企业/客户案例)
48
Codex正在成为每个人的生产力工具

The Next Era of Knowledge Work报告指出,Codex正通过AI增强的研究、数据分析、工作流自动化与内容创作,变革知识工作的生产力。

OpenAI现象/趋势编码
13:16
公众号:面壁智能(MiniCPM)
57
对话刘知远:中国AI要"向外卷",大模型密度定律登上《自然·机器智能》封面

面壁智能首席科学家刘知远提出“大模型密度定律”,该研究登上《自然·机器智能》封面,发现智能密度每3.5个月翻倍。他认为中国AI需“向外卷”,深入产业场景,而非重复OpenAI路径。刘知远指出中国模型与顶尖仍有差距,DeepSeek-V4尚未超越Claude Opus,原始创新是最大短板,但DeepSeek-R1在未公开路线下的创新值得肯定。他还强调智源研究院作为“中间地带”对原始创新的支持作用。

大佬观点现象/趋势端侧
00:35
Tomer Tunguz 博客(VC 分析)
精选62
AI看跌情绪地图

金融市场对AI的看跌情绪正从整体上升转向板块分化。上季度,软件、半导体、云及超大规模公司的空头比例中位数上升约24%。GPU数据中心业务空头股份在过去一年激增60%。AI云与新型云公司的当前空头比例中位数最高,达16.8%,SaaS与开发工具领域随后,分别为9.5%和8.9%。相比之下,超大规模公司和NVIDIA的空头比例极低,仅为1.1%和1.2%。市场怀疑主要针对那些AI业务仍依赖未来资本、需求或运营杠杆的中小型公司。

现象/趋势

推荐理由:这份AI做空地图把市场怀疑论的矛头指向了谁说得明明白白,GPU云和AI SaaS被看空得最狠,但NVIDIA和超大规模云商几乎没被碰,做投资或者关心谁在裸泳的可以认真看看。
6月1日
22:38
Hugging Face:Blog(RSS)
精选60
超越LLM:为何可扩展的企业AI采用取决于智能体逻辑

可扩展的企业AI采用需超越大语言模型,依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流,从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例,展示了智能体逻辑如何通过程序分析等技术,在理解大型遗留代码库时,相比纯LLM基线方法,能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中,该方法亦能使代码覆盖度提升20%-45%,同时token消耗降低最高达15倍。

智能体推理现象/趋势部署/工程

推荐理由:不是又一篇炒作 agent 的文章,IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。
22:06
Nathan Lambert:Interconnects(RSS)
精选67
开源与闭源模型在不同的增长曲线上

当模型智能的微小提升能直接转化为实际价值时,开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成了差异化的竞争格局。

AnthropicOpenAI大佬观点现象/趋势

推荐理由:Lambert 用「不同指数级」框架理解开放与封闭模型的未来分化,观点鲜明且有推演,是近期较值得读的行业判断,投资人、产品人都该看一眼。
01:14
Gary Marcus:The Road to AI We Can Trust(RSS)
46
教皇似乎比Geoffrey Hinton更懂人工智能

这一观点强调,单纯分析AI的输出内容,无法还原其生成过程与背后的推理逻辑,触及了当前AI可解释性研究的核心挑战。

大佬观点现象/趋势
5月30日
02:12
Gary Marcus:The Road to AI We Can Trust(RSS)
46
Token至上时代结束之后会怎样?

文章简要指出,在“Token至上”的时代可能告一段落之后,对于人工智能(AI)的未来,存在两组截然不同的预测。

大佬观点现象/趋势
02:03
Steve Yegge:Medium(RSS)
66
技术面试的终结

作者基于超过35年的技术面试经验指出,该流程存在根本性缺陷。面试结果极不可靠,面试官意见高度不一致,且评分无法有效预测候选人实际表现。亚马逊的“Bar Raiser”和谷歌的“Hiring Committee”等补救机制并未从本质上解决问题。作者认为,当前的人才评估方式亟需一场根本性的变革。

大佬观点现象/趋势
5月29日
04:11
Gary Marcus:The Road to AI We Can Trust(RSS)
53
突发:史上三大IPO面临坏消息

客户正认识到,token消耗“已燃烧数百万美元,却未带来任何显著的投资回报”。这一现象对历史上三次最大的首次公开募股(IPO)构成压力,表明市场对AI投资的实际效益产生质疑。

大佬观点现象/趋势
5月28日
03:33
Tomer Tunguz 博客(VC 分析)
精选61
软件之后是AI时代

软件时代正过渡至“智能体框架”时代。AI作为强大但需驯化的“野马”,其智能驯化包含七个核心组成部分:上下文与记忆、工具与行动、编排与循环、状态与持久性、沙箱与计算、可观测性与治理、成本与工作流优化。这些组件共同构成了一个生产级的智能体系统。这一转变将重塑软件竞争格局,模型通用化的未来中,最佳的智能体驾驭者将获胜。

智能体MCP/工具现象/趋势

推荐理由:Tomer 把 agent 时代的竞争拆成七个组件,不是空谈,而是给了创业公司一个具体的 check-list,做 agent 产品的值得对照一下。
5月26日
22:34
Runway:News(网页)
精选68
Project Luxo:跨越AI媒体的恐怖谷

Runway通过Project Luxo研究发现,AI生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等AI短片及广告样片,评估显示观众开始关注故事本身,而非技术瑕疵。所有作品均由单人团队制作,耗时从3周到4小时不等。Runway认为,这标志着AI媒体成熟——当技术足够好以至于“隐形”,观众沉浸于故事时,便实现了这一跨越。

多模态现象/趋势视频
关联讨论 1 条X:Runway (@runwayml)
推荐理由:Runway 用短片和一次百万播放广告测试宣称 AI 视频已越过恐怖谷,观众开始投入故事而非找瑕疵。这对内容生产的心理门槛是一次重塑,但一次推广式的成功不等于行业已稳定跨过。
22:03
Gary Marcus:The Road to AI We Can Trust(RSS)
精选60
Uber COO称未见AI投入产出成比例增长

Uber首席运营官Andrew Macdonald表示,公司并未看到在AI上投入更多成本后,生产力获得了相应的提升。

大佬观点现象/趋势
关联讨论 1 条IT之家(RSS)
推荐理由:Gary Marcus借Uber、星巴克等最新案例,对AI的狂热投入发出清晰警告,他认为如果更多企业发现成本飙升却未见实效,那几万亿的估值泡沫可能破裂,这是近期最直白的风险提示。
5月25日
18:16
公众号:火山引擎
37
在戛纳和贾樟柯导演聊了聊AI:普通人拍电影的时代来了

在戛纳电影节期间,导演贾樟柯与火山引擎探讨AI对电影行业的影响。贾樟柯认为,AI降低了电影制作的技术门槛,让普通人也能参与拍摄和创作,电影行业正迎来平民化变革。

现象/趋势视频
5月23日
19:14
公众号:百度智能云(文心)
40
当AI进入物理世界,具身模型如何重构生产力?

百度智能云在Create2026大会上举办具身智能专题论坛,探讨AI进入物理世界后,具身模型如何重构生产力。论坛围绕具身模型的技术路线、应用场景及产业落地展开讨论。

具身智能现象/趋势
00:28
Tomer Tunguz 博客(VC 分析)
精选70
可塑界面:AI驱动的未来软件形态

Salesforce已采用无头架构,允许销售人员通过AI直接更新数据,许多公司正通过MCPs跟进。同时,AI专家们正推动超越纯文本、更丰富的界面(如HTML),支持图表与交互。AI能根据场景动态生成定制化界面。无头系统并非移除前端,而是支持多种可塑化界面(如音频、网页)。未来软件的核心价值在于动态管理这些界面、确保其准确性,并将各类AI产物整合为可演化的上下文数据库与制品库。用户界面并未消失,而是变得“可塑”,能按需变形。

多模态现象/趋势

推荐理由:动态 UI 不是消灭界面,而是让界面变得可塑性。Airbnb CEO 和 Anthropic 工程师都在押注 HTML 输出,这篇文章把信号串了起来,做产品的人值得一看。
00:16
Hugging Face:Blog(RSS)
50
专业化胜过规模:Dharma 发布 DharmaOCR,3B 专用模型在 OCR 基准上超越商业前沿 API

4月,Dharma 发布 DharmaOCR——一对 3B 参数专用小语言模型,用于结构化 OCR,同时开源基准与论文。在巴西葡萄牙语 OCR 基准上,该 3B 专用模型通过全微调实现综合得分 0.911,超过所有测试的商业前沿 API(Claude Opus 4.6 0.833、Gemini 3.1 Pro 0.820、GPT-5.4 0.750)。每百万页成本仅为 Claude Opus 4.6 的约 1/52,质量与成本均占据 Pareto 前沿。结果表明:当训练数据与部署任务充分对齐时,参数规模不再是决定性变量,专业化微调能以极低代价实现更高性能。

arXivHugging Face数据/训练现象/趋势
5月21日
21:57
公众号:百度智能云(文心)
26
AI重构的2026年,普通人的边界在哪里?

文章来自百度智能云,探讨2026年AI技术对普通人能力与职业边界的影响。文中未提及具体模型、版本或benchmark数据,仅从宏观视角讨论AI重构带来的机遇与挑战。

搜索现象/趋势
20:05
公众号:昆仑万维(天工)
43
算力拉开行业差距!方汉深度解读 AI 产业变革、职场走向与企业转型之道

昆仑万维天工方汉指出,算力是拉开AI行业差距的核心因素。他从AI产业变革、职场走向与企业转型三个维度展开深度阐述,强调算力竞争将主导下一阶段发展格局。

大佬观点现象/趋势
5月20日
23:55
Gary Marcus:The Road to AI We Can Trust(RSS)
精选65
生成式AI是否会沦为科技行业的"越南战争"?公众抵制能否引领AI走向更优的发展路径?

当前生成式AI的狂飙突进正引发深度审视,其潜在风险与社会反弹可能将该技术拖入类似“越南战争”的漫长泥潭。公众的担忧与抵制运动,正从数据隐私、内容真实性到伦理冲击等多方面施加压力,迫使行业进行根本性反思。这些反作用力虽可能延缓发展,却也可能成为校准方向的关键力量,推动技术在安全、透明和负责任的基础上重新定义进步。我们正身处一个充满挑战与不确定性的“有趣时代”。

大佬观点安全/对齐政策/监管现象/趋势

推荐理由:Marcus 这篇短文抓住了两个信号,毕业典礼上嘘声和特朗普突然考虑预检,反冲已经从边缘走到中央,做 AI 的不能再假装一切安好。
02:18
Google Blog:AI(RSS)
精选71
AI Mode 如何改变美国人的搜索方式

AI Mode 上线一周年,美国用户搜索行为呈现关键转变。数据显示,用户正从传统的关键词输入模式逐渐转向自然语言查询,这一变化反映了AI搜索技术的普及和用户交互方式的优化。自然语言查询的使用率显著提升,体现了AI搜索在日常信息获取中的影响力增强,预示着未来搜索体验的革新方向。

Google搜索现象/趋势

推荐理由:AI Mode 上线一周年,Google 第一次拿出用户行为数据,从关键词到自然语言的转向比想象中快,做搜索和 SEO 的可以重新理解用户意图了。
5月18日
19:31
公众号:面壁智能(MiniCPM)
21
面壁智能:智能座舱的尽头是一个真正"懂你"的 Agent

面壁智能发文指出,智能座舱的最终形态是一个真正“懂你”的 AI 智能体(Agent)。

智能体现象/趋势端侧
5月17日
16:44
Gary Marcus:The Road to AI We Can Trust(RSS)
36
生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

近期访谈指出,当前大语言模型存在“幻觉”问题,答案常不可靠。业界对“超大规模”的巨额投入可能陷入非理性狂热。作为替代路径,“世界模型”旨在让AI理解物理规律,“神经符号AI”则尝试结合深度学习与符号推理,以提升可靠性、可解释性与逻辑能力,为下一代AI奠定基础。

大佬观点安全/对齐现象/趋势
5月16日
11:14
Google DeepMind:Blog(RSS)
43
WeatherNext如何帮助美国国家飓风中心更好预测飓风Melissa在牙买加的历史性登陆

WeatherNext AI模型协助气象预报员为社区在飓风Melissa登陆前提供了前所未有的准备时间。该模型通过提升预测准确性与提前量,帮助牙买加等地成功应对了这场历史性的飓风事件,显著增强了灾害预警的时效性。

DeepMindGoogle数据/训练现象/趋势
03:19
Tomer Tunguz 博客(VC 分析)
精选72
推理的一阶导数:AI浪潮下的增长逻辑

AI推理是当今规模最大、增长最快的技术市场,预计七年内将达到2500亿美元。直接销售或转售推理服务的公司增长迅猛,如Anthropic和谷歌云。在AI时代前的软件公司中,Datadog和Twilio作为“推理的一阶导数”脱颖而出:Datadog的LLM可观测产品数据量近一季增长近两倍,其约20%的AI客户贡献了约80%的年度经常性收入;Twilio则通过AI重构的语音服务吸引客户。当前周期呈现高度集中特点,少数客户能驱动巨大收益。对于非AI原生公司,核心战略在于如何转售推理服务或从其客户的大量采购中获益。

大佬观点推理现象/趋势

推荐理由:Tomer 用「推理的第一导数」这个框架讲透了一件事,Twilio 和 Datadog 的暴涨不是偶然,而是买推理的衍生需求,pre-AI 公司想活就得问自己怎么沾上推理的光。
5月15日
11:40
OpenAI:官网动态(RSS · 排除企业/客户案例)
32
Sea 对基于 Codex 的智能体软件开发未来的展望

Sea Limited 首席产品官阐述了公司为何在工程团队中全面部署 Codex,以加速亚洲地区的 AI 原生软件开发。公司正推动开发模式向“智能体化”转变,让 AI 智能体承担从需求分析到代码生成、测试的更多开发任务。这一举措旨在显著提升工程效率,缩短产品迭代周期,并应对亚洲市场对敏捷、智能化软件开发日益增长的需求。

智能体OpenAI现象/趋势编码
03:18
Tomer Tunguz 博客(VC 分析)
精选65
AI电子邮件的成本分析

使用顶尖AI模型处理邮件的月度成本约为22至130美元,中位数26美元。若软件公司以75%毛利率定价,年费可能高达350美元,加上托管服务后标价或达500美元,约为Google企业邮箱费用的两倍。采用小型模型可降低成本10至20倍,而通过本地运行利用用户GPU,更能将成本削减至接近零。结合基础启发式方法和技术优化,总成本有望降低100倍。这种针对不同工作负载匹配模型并进行成本分层的推理市场细分,将是未来一两年AI软件发展的关键。

推理现象/趋势部署/工程

推荐理由:Tunguz 给 AI 邮件算了一笔账,SOTA 模型月费 22-130 美元,但他更重要的判断是推理分割可以把成本压到百分之一,这对做 AI 软件的定价逻辑是个关键风向。
5月13日
03:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选64
Parameter Golf 揭示了关于 AI 辅助研究的哪些经验

Parameter Golf 项目汇聚了超过 1000 名参与者和 2000 多份提交作品,在严格限制条件下探索了 AI 辅助的机器学习研究、编码智能体、模型量化及新颖模型设计。活动展示了 AI 工具如何帮助研究人员在受限参数规模下优化模型性能,推动了高效模型架构与自动化代码生成技术的实践进展。核心发现包括智能体协作能显著提升研究效率,而量化技术可在微小精度损失下大幅压缩模型体积。

智能体OpenAI现象/趋势

推荐理由:OpenAI让1000多人一起玩AI辅助研究,这篇复盘给出了几个很实在的教训,尤其关于代码Agent和量化,搞研究的人值得花五分钟读一下。
00:26
Nathan Lambert:Interconnects(RSS)
精选64
开放模型生态的复合增长

中国AI生态呈现高参与度与开放优先特征,开源模型社区形成自我强化循环。开发者基于主流架构二次创新,国产开源模型下载量季度环比激增超200%。开放协作降低了技术门槛,推动应用层涌现大量行业解决方案,模型微调工具使用量同比大幅增长。生态参与者通过贡献代码、数据及优化方案,持续反哺核心模型迭代,构建了技术红利共享的复合增长网络。

大佬观点开源生态现象/趋势

推荐理由:Nathan Lambert这篇对中国开放模型生态的剖析,点出了‘参与人数×开源速度’的飞轮,做开源的人该认真看看。
5月12日
06:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选66
ChatGPT 在 2026 年初如何扩大应用范围

2026年第一季度,ChatGPT的用户采用率大幅上升,其中35岁以上用户群体的增长最为迅速,同时用户性别比例也趋于均衡。这表明以ChatGPT为代表的人工智能技术正加速融入主流社会,其应用范围已突破早期以年轻技术爱好者为主的局限,向更广泛、更多元化的普通用户群体拓展。

OpenAI现象/趋势

推荐理由:这是我今年看过最值得留意的用户数据,ChatGPT正跳出早期极客圈,35岁以上用户成为增长主力,所有面向大众的AI产品都得重新思考用户画像。
5月11日
10:00
公众号:昆仑万维(天工)
26
当企业开始用Mureka替换Suno--一场正在发生的AI音乐迁移,以及它背后的理由

Mureka正被企业用以替换Suno,一场AI音乐领域的迁移正在发生。背后涉及功能、成本或合规等方面的理由。

多模态现象/趋势语音
04:34
Gary Marcus:The Road to AI We Can Trust(RSS)
52
对AI进步的恐慌放错了地方

METR最新发布的“时间范围”图表引发了关于AI进展的讨论。该图表旨在评估AI系统在未来两年内执行复杂任务的能力,但其预测基于当前趋势的线性外推,并未考虑技术突破的突发性或潜在瓶颈。图表显示,到2026年,前沿AI模型有10-20%的概率在软件开发等任务上达到人类水平,但这并非确定的预言。专家指出,公众对AI的担忧应更多聚焦于现有模型的实际风险与滥用,而非过度推测未来遥远的“超人”能力。

大佬观点现象/趋势
5月9日
01:27
BAIR:Berkeley AI Research Blog
精选64
自适应并行推理:高效推理扩展的新范式

自适应并行推理是一种新范式,它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果,以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程,在数学与代码推理基准上取得了显著性能提升,同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变,为复杂任务的推理提供了高效且可扩展的解决方案。

推理现象/趋势部署/工程

推荐理由:模型自己决定何时并行、开几个线程,这篇BAIR博客把Multiverse和ThreadWeaver的系统设计掰开了讲,做推理系统和RL的同学应该看看。
5月8日
03:13
Tomer Tunguz 博客(VC 分析)
精选57
估值折价:Anthropic高增长背后的市场疑虑

Anthropic在15个月内估值从10亿飙升至300亿美元,但其企业价值与未来收入之比仅为17倍,远低于增长更慢的Palantir(49倍)。这一估值折扣主要源于四大因素:极高的资本密集度(如年成本达62亿美元的GPU协议)、未来盈利能力不明(可能成为软件公司或资本密集型公共事业)、收入增长的波动性,以及外生的政治与监管风险。市场正通过折扣来反映这个高速变化领域的不确定性。

Anthropic现象/趋势

推荐理由:Tomer用资本密集度、盈利不确定性、增长波动和政治风险四把尺子量了Anthropic的估值折价,看完你会理解为什么市场给AI增长打了个问号。
00:14
Nathan Lambert:Interconnects(RSS)
精选74
走进中国AI实验室内部笔记

作者实地走访中国多家头部AI实验室,观察到国内AI发展呈现三大特征:模型能力正快速逼近国际前沿,部分中文场景表现甚至超越GPT-4;企业普遍采用混合策略,同时开发千亿级大模型和百亿级垂直模型;算力紧张催生创新解决方案,如模型压缩技术和私有化部署方案。各大实验室正从技术追赶转向应用深耕,在医疗、制造等传统领域已形成规模化落地案例。

大佬观点现象/趋势

推荐理由:Nathan Lambert 走访了中国一线 AI 实验室,这份内部笔记不讲公关话,把几家大厂的真实进展和局限摊开聊,如果你关心中国 AI 的实质水位,这篇绕不开。
5月7日
18:29
Anthropic:Research(发表成果 · 网页)
精选67
聚焦领域:Anthropic研究所的核心研究方向

Anthropic研究所公布了其四大核心研究领域:经济扩散、威胁与韧性、真实世界中的AI系统以及AI驱动的研发。该机构将利用其身处前沿AI实验室内部的独特优势,研究AI对世界的实际影响,并公开分享成果。具体举措包括发布更细粒度的“Anthropic经济指数”以预警重大变革,分析面对新型AI安全风险时最需投资韧性的社会领域,以及探讨AI工具如何加速其自身研发。这些研究成果将为Anthropic的“长期利益信托”提供决策依据,并帮助外部组织与公众更好地应对AI发展。

Anthropic安全/对齐现象/趋势

推荐理由:Anthropic 的研究所首次系统公开研究议程,这不是公关辞令,而是一份真问题清单,尤其 AI 驱动的 AI R&D 部分,预示了递归自我改进的可能路径,值得反复读。
5月6日
23:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选65
前沿企业如何构建人工智能优势

OpenAI的B2B Signals研究揭示了前沿企业深化AI应用、规模化基于Codex的智能体工作流,并构建持久竞争优势的路径。这些企业正超越基础应用,将AI深度集成至核心业务流程,通过部署能自主执行复杂任务的智能体工作流来提升效率与创新能力。研究指出,成功的关键在于规模化应用AI代理,这能带来显著的运营优势并形成竞争壁垒。

智能体OpenAI现象/趋势编码

推荐理由:OpenAI的B2B研究把企业AI落地差距摊开了,Codex驱动的代理工作流正在成为壁垒,做企业服务的可以当镜子照。
03:12
Tomer Tunguz 博客(VC 分析)
精选63
当公司里每个人都是关键人物时

本文探讨了初创公司工程团队中AI与人力比例变化带来的结构性风险。当AI占比从10%提升至90%时,团队从20名工程师的传统层级结构,演变为仅由3名工程师核心操控大量自主代理的无管理层模式。核心权衡在于系统韧性而非吞吐量:将编排知识高度集中于极少数人,等同于以100%的利用率运行,一旦关键人员离职将造成33%的“制度记忆”损失。文章借鉴制造业保持70-90%利用率以维持系统稳健的经验,建议大多数初创公司应避免过早采用极高AI占比的模式,因为其中缺乏冗余和缓冲空间。

智能体现象/趋势部署/工程

推荐理由:当三个人管理着一支AI代理大军,任何一个人离开就是30%的知识蒸发。这篇文章用制造业利用率逻辑警告那些想用AI替换所有工程师的创始人:弹性才是真正的瓶颈。
5月5日
04:02
OpenRouter:Announcements(RSS)
精选59
GPT-5.5 价格上涨:实际成本几何

OpenAI 将 GPT-5.5 的按 token 计价提高了一倍,但新模型在输出上更为简洁。通过实际使用测量发现,尽管单价上涨,由于模型响应更精炼、消耗的 token 数量减少,最终净成本影响可能低于预期。关键变化在于单位价格与模型效率之间的平衡,实际支出需结合具体使用场景和生成长度综合评估。

OpenAI现象/趋势

推荐理由:OpenAI 把 GPT-5.5 的单价翻倍让很多人心凉,但 OpenRouter 的实测显示净成本变化没那么大。如果你用 API 构建应用,这篇能帮你冷静算账。
00:11
Nathan Lambert:Interconnects(RSS)
47
蒸馏恐慌

AI领域出现“蒸馏攻击”现象,即利用GPT-4等闭源模型的输出训练更小的开源模型。这引发了关于知识产权与创新平衡的激烈争论。支持者视其为技术民主化途径,反对者则谴责其侵犯版权并可能损害模型质量。目前,部分开源模型性能已快速逼近顶级闭源模型,迫使行业重新审视数据使用边界与合规框架。

大佬观点数据/训练现象/趋势
‹ 上一页
1234
下一页 ›