AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「大佬观点」清除
6月5日周五
00:45Nathan Lambert31Mythos人均代码产出较Opus 4.5提升3.2倍
6月4日周四
23:44Claude51Lovable:信任是AI最被低估的护城河
23:22elvis48DAIR.AI 创始人 Elvis Saravia 分享动态工作流实践
23:12IT之家(RSS)67OpenAI 奥尔特曼:主动式 AI 将是聊天机器人与智能体之后的下一阶段
22:03ginobefun61Vibe Coding:借来的杠杆 vs 增长的能力
21:52Rohan Paul58Fei-Fei Li 谈世界模型 vs 大语言模型
21:49The Decoder:AI News(RSS)44OpenAI CEO Sam Altman 认为"主动式 AI"是聊天机器人和 AI 智能体之后的下一个阶段
20:53Chubby♨️84精选OpenAI称AI递归自我改进迹象初现
20:48Ethan Mollick55Claude Code和Codex功能大增,文档严重缺失
16:17AYi64Codex 额度重置:省着用反亏,建议本地兜底
14:41Tibo23OpenAI众多向量指向同一方向
14:09宝玉57Codex GPT-5.5 被吐槽不如 Claude Opus 4.8
12:47Ethan Mollick50随机试验显示 GPT-4 伦理判断与人类专家持平
12:27SemiAnalysis38Cerebras重写机械工程规则防晶圆破裂
11:47Ethan Mollick56否认AI意识可能性消除行业难题
11:39swyx44Reve 2.0 发布:用代码中间表示实现可控图像生成
11:09宝玉61AI Agent 与 PC、手机的关系:不是完全取代
11:00歸藏(guizang.ai)67即览:手机上看 Markdown 和 HTML,怎么就这么难?
10:29DogeDesigner39Grok Imagine 1.5 视频质量惊艳
10:17Ethan Mollick62Ethan Mollick:旧ML未省钱致AI投资不足
10:10向阳乔木58千问年度Top10提示词盘点:AI 2C出路有限
09:51Berryxia.AI45李飞飞:世界模型三功能--渲染、模拟、规划,模拟器最稀缺
09:36Josh Woodward25Gemini Omni 用真实镜头制造意外转折
09:18meng shao63邵猛引用leerob推文反驳"Builder"角色融合论
08:51Berryxia.AI58OpenAI 升级 GPT-Rosalind,为生命科学研究注入 Agentic 能力
08:00ginobefun48AI早报:微软战略、Kimi Work Beta、腾讯报告
08:00Tomer Tunguz 博客(VC 分析)19Local in Reality
07:51Berryxia.AI37Codex真的要起飞了!
07:09宝玉26Claude Code桌面版权限弹窗如何避免
06:29Orange AI25硅谷英文AI推的焦虑程度是中文AI推的100倍。
06:21Chubby♨️60微软Build个人回顾
03:50Chubby♨️14OpenAI预告重大发布:超级应用或5.6?
03:46Ethan Mollick39Claude 月消费5亿美元引质疑
03:20Fei-Fei Li78精选世界模型的功能分类
02:16AYi65Google 发布 Gemma 4 12B:无独立视觉编码器的统一多模态架构
02:15Ethan Mollick68Claude Mythos 提前一年达到超级预测者预期
00:45Ethan Mollick60大多人对LLM运作方式认知有误
00:17elvis66微软SkillOpt论文:AI智能体技能实现自我进化
6月3日周三
23:02Lee Robinson61Lee Robinson 反驳"工程、产品、设计合并为 builder"观点
22:37Nathan Lambert40开放模型教训:空谈廉价,行动关键
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月5日
00:45
Nathan Lambert@natolambert
31
Anthropic 表示,使用 Mythos 后人均代码产出较半年前 Opus 4.5 提升 3.2 倍。Nathan Lambert 评论称,没有 Mythos 的人在学用智能体时也有类似感受。

Lisan al Gaib: Anthropic is shipping 3.2x more code per person with Mythos nowadays than with Opus 4.5 around half a year ago

Anthropic大佬观点编码
6月4日
23:44
Claude@claudeai
51
Anton Osika (@antonosika) 是@lovable 的联合创始人兼CEO,任何人都能通过对话构建软件。 他的工作论点:AI中最被低估的护城河是信任,而赢得信任需要技艺、用心与执着。
Anthropic大佬观点现象/趋势
23:22
elvis@omarsar0
48
DAIR.AI 创始人 Elvis Saravia 分享动态工作流实践

Elvis Saravia 逆向工程了动态工作流(Dynamic Workflows)并集成到自研智能体编排器中,同时构建 HTML 监控仪表盘跟踪任务、指标和报告。该工作流可在 Claude Code、Codex、Pi 等编码智能体及自研 @dair_ai agent 上运行。成功用例包括分支深度研究、并行深度研究、会话挖掘、Bug 定位、分类、事实核查、LLM 委员会、AI 模拟、数据合成和评测生成等。他认为动态工作流与 agent 技能一样,是实现复杂长期任务的关键原语,不仅限于编码,还可扩展至商业、科学等领域。

智能体MCP/工具大佬观点
23:12
IT之家(RSS)
67
OpenAI 奥尔特曼:主动式 AI 将是聊天机器人与智能体之后的下一阶段

OpenAI CEO 萨姆·奥尔特曼提出 AI 三阶段:聊天机器人、AI 智能体(如 Codex)和“主动式 AI”——一种在后台持续运行并主动提供帮助的系统,他称这是未来一年最看好的方向。OpenAI 正研发整合 Codex 与 ChatGPT 的超级应用。成本问题已成企业第二重要话题,Uber 一季度耗尽全年 AI 预算。主动式 AI 旨在降低用户学习门槛,但对企业数据安全与 IT 架构提出新挑战。

智能体OpenAI大佬观点现象/趋势
22:03
ginobefun@hongming731
61
@pengzheng_ 指出,Vibe Coding 让人同时感觉更聪明和更笨--能发布产品但无法解释原理。如果离开 AI 就无法复现成功,那只是借来的杠杆而非增长的能力。目标不是从提示到产品,而是理解实现路径并建立信心。理解为何有效时,AI 扩展能力;不理解时,AI 替代学习。无限提示终可发布软件,关键在于每次成功是否转化为经验,否则只是产出而非能力增长。

Peng Zheng: after watching @brian_lovin and @wjosephflynn talk about vibe coding, this was the idea i couldn't shake: vibe coding ca...

大佬观点编码
21:52
Rohan Paul@rohanpaul_ai
58
Fei-Fei Li 谈世界模型 vs 大语言模型

李飞飞(Fei-Fei Li)指出,大语言模型(LLM)仅学习文本模式,能描述房间但无法理解椅子移动、玻璃破碎、阳光变化或机器人推杯子等物理变化。世界模型则试图学习视觉背后隐藏的结构,能预测相机未捕捉的视角、建模物体行为、支持真实或虚拟环境中行动的智能体。理解新视角、预测推动结果、决定下一步行动,都需要一个共同的内在模型,涵盖空间、因果与后果。

Fei-Fei Li: http://x.com/i/article/2062244283940544512

具身智能多模态大佬观点
21:49
The Decoder:AI News(RSS)
44
OpenAI CEO Sam Altman 认为"主动式 AI"是聊天机器人和 AI 智能体之后的下一个阶段

OpenAI CEO Sam Altman 提出“主动式 AI”(proactive AI)概念,这种 AI 在后台持续运行、自主采取行动,而非等待用户提示。Altman 同时指出企业正面临 AI 成本飙升以及多数员工不知道如何向 AI 提问的根本问题,并承诺“帮助人们用更少的花费获得更多价值”。

智能体OpenAI大佬观点
20:53
Chubby♨️@kimmonismus
精选84
OpenAI刚刚写道:"我们也看到了当今系统中递归自我改进(RSI)的早期迹象:AI开发本身正被AI加速。 我们预计这将加剧开发者与国家之间的竞争压力,并带来现有机构无法应对的治理挑战。 随着RSI的出现,社会将需要找到塑造AI发展轨迹的方法,确保其服务于人类利益。" 气氛变了,有事正在发生。
OpenAI大佬观点安全/对齐

推荐理由:OpenAI首次公开承认看到递归自我改进的早期迹象,等于摊牌说AI发展正在失控加速,接下来的竞争和监管博弈会非常激烈,所有关注AI安全的人都该认真读一下原文。
20:48
Ethan Mollick@emollick
55
近几个月来,Claude Code和Codex的能力大幅扩展,增加了许多工作方式(子智能体、技能、目标、工作流、插件等)。考虑到AI实验室可以用自己的AI来辅助文档编写,令人惊讶的是,大量功能实际上没有文档。
AnthropicOpenAI大佬观点编码
16:17
AYi@AYi_AInotes
64
Codex 额度重置:省着用反亏,建议本地兜底

OpenAI Codex 负责人 Tibo 因 24 小时内 3 次可靠性事故,重置所有付费计划额度。Codex 按推理时间计费:Plus 下 GPT-5.4 约 40 分钟耗尽 5 小时窗口,GPT-5.3 约 60 分钟。重置常将下个计费周期提前,导致精打细算攒的额度被覆盖,立即消耗者反而获得更多推理时间。作者认为系统奖励即刻消耗,建议本地模型兜底、云端冲峰值,夺回生产力控制权。

Tibo: Hi. Over the last 24 hours we had three separate small incidents that affected Codex reliability. Those are three too ma...

MCP/工具OpenAI大佬观点编码
14:41
Tibo@thsottiaux
23
OpenAI 有很多小向量都指向同一个方向。 期待看到它们在未来几周内汇聚融合。
OpenAI大佬观点
14:09
宝玉@dotey
57
宝玉 (@dotey) 表示,Codex GPT-5.5 在干活上不如 Claude Opus 4.8,尤其在开发 Mac 应用时 Opus 更擅长。@jesselaunz 也反馈 Codex 突然"降智",原本预期 2 天的目标仅 20 分钟就交付,用户给出了评分以来最低的 5/10 分。

Jesse Lau 遁一子: codex突然大降智,原计划跑2天的goal刚才20分钟给我交付了 拿去评分,给了AI评分以来最低的5/10分

AnthropicOpenAI大佬观点编码
12:47
Ethan Mollick@emollick
50
Ethan Mollick 引用一篇论文:四名牧师、一名拉比、十三名学者和 50 名 MBA 被要求比较《纽约时报》伦理专栏作家与 GPT-4 提出的伦理方案,结果基本持平(tie)。主推文指出,尽管 Ted Chiang 关于让 AI 做选择会导致道德萎缩的观点有一定道理,但重复随机试验发现 AI 似乎是优秀的伦理学家。

Ethan Mollick: Sounds like a joke setup, but it is an interesting paper: Four pastors, a rabbi, thirteen academics, and 50 MBAs were as...

大佬观点安全/对齐论文/研究
12:27
SemiAnalysis@SemiAnalysis_
38
垂直功率传输、柔性移动引脚中介层和直接冲击水冷。Cerebras 不得不重写机械工程手册,仅仅是为了防止单个晶圆自裂。
大佬观点部署/工程
11:47
Ethan Mollick@emollick
56
决定在任何情况下AI都不可能拥有意识,这消除了大量棘手问题--如果某种形式的AI意识在某个时候是可能的,这些问题可能会影响AI行业。
大佬观点安全/对齐现象/趋势
11:39
swyx@swyx
44
引用推文高度评价 Reve 2.0 发布文案。Reve 2.0 的核心理念:可控图像生成与编辑的关键不是更密集的提示词,而是以代码形式呈现的高度详细、可操作的中间表示。指出当前图像生成模型通过渐进退化惩罚迭代,而创造力本质上不是一次性工作流。引用 Alan Kay "做软件应自造硬件" 类比,Reve 认为真正严肃的创意工具公司应训练自己的模型。

Hasan: wow this @reve 2.0 launch copy is supurb. "it is now clear that the key to both controllable image generation and editin...

图像生成大佬观点
11:09
宝玉@dotey
61
AI Agent 与 PC、手机的关系:不是完全取代

AI Agent 不会完全取代手机和 PC,但用户无需打开多个 App,直接给 Agent 下指令即可。通用 Agent 将成未来操作系统,App 有三种结局:消亡、转为 CLI/MCP、保留为 GUI 插件。SaaS 应尽快推出 CLI 与 Skill 以适配 Agent。

宝玉: 通用 Agent 就是未来的操作系统了,就像现在我们操作电脑需要借助操作系统,以后我们跟 AI 通信会通过 Agent OS。 App 会有几种结局: - 消亡:Agent 自己就有能力,不需要独立的 App - 变成 CLI 或者 MCP...

智能体MCP/工具大佬观点
11:00
歸藏(guizang.ai)@op7418
67
即览:手机上看 Markdown 和 HTML,怎么就这么难?

即览是一款iOS/iPad应用,解决手机端无法正常打开AI生成的.md、.html等文件的问题。它本地渲染,无需上传或注册,有8000个TestFlight名额。作者引用Obsidian观点:.md正成为AI文件交互的“谢林点”;Claude Code团队认为HTML更适合展示层。即览定位纯粹:仅打开、阅读和收藏,不编辑、不云同步、不接AI。支持.md/.html/.txt及.zip网页文件,动态脚本默认关闭以确保安全。

产品更新大佬观点现象/趋势
10:29
DogeDesigner@cb_doge
39
Grok Imagine 1.5 视频质量确实令人印象深刻。🔥
xAI图像生成大佬观点视频
10:17
Ethan Mollick@emollick
62
我确实读了这篇文章,它非常奇怪,似乎是在论证先前的机器学习系统(非生成式AI)因数据问题并未带来成本节约,因此将导致对当前AI系统的投资不足。此外,它还引用了那个基本是伪造的"MIT研究"。

John Cassidy: First it was MIT and McKinsey. Now Bain finds that returns to corporate AI investments are disappointing.

大佬观点行业动态
10:10
向阳乔木@vista8
58
千问年度Top10提示词盘点:AI 2C出路有限

千问统计年度Top10提示词:股票、八字、情感咨询、朋友圈文案、景点推荐、双色球号码、失眠、解答这道题、离婚财产分割、人生的意义。作者认为AI 2C出路有限,三类:直接赚钱、懒人省时(付费意愿低)、情感情绪价值,整体空间狭窄。

大佬观点现象/趋势
09:51
Berryxia.AI@berryxia
45
李飞飞:世界模型三功能--渲染、模拟、规划,模拟器最稀缺

李飞飞基于POMDP框架将世界模型分为三种功能:Renderer(渲染器,输出像素)、Simulator(模拟器,输出几何/物理状态)、Planner(规划器,输出动作)。渲染器已商业成熟(如文生视频),规划器受资本追捧,模拟器最关键但数据稀缺。World Labs的Marble项目可从多模态提示生成可探索3D环境,同时输出高斯溅射和碰撞网格。长期目标是统一模型,在渲染、模拟与规划间流畅切换。

Fei-Fei Li: http://x.com/i/article/2062244283940544512

大佬观点
09:36
Josh Woodward@joshwoodward
25
这些太有趣了! 我们当前最喜欢的 Gemini Omni 趋势:使用真实世界镜头创造意想不到的转折。试试自己做一个!🧵

Google Flow: Our current favorite Gemini Omni trend: creating a surprising twist using real world footage. Try creating your own! 🧵

Google大佬观点视频
09:18
meng shao@shao__meng
63
邵猛引用leerob推文反驳"Builder"角色融合论

邵猛引用leerob推文,反对“工程、产品、设计融合成Builder角色”的观点。即便团队有大量MTS头衔,仍需要有人将产品/设计作为主业,责任不会因头衔模糊而消失。AI降低了代码生成门槛,但未降低系统复杂度——非工程师输出低质量代码(AI Slop)且缺乏强工程师约束架构,将导致后续维护成本爆发。初创一人多角色模式不适合摩根大通等大型受监管组织。真正难颠覆的是内部政治、15年无人文档化的关键系统、知识垄断等“人的一面”。专业化不会消失,与真正专家协作依然高效。AI对知识工作的颠覆将以十年计,瓶颈在于社会学与组织学。

Lee Robinson: "Engineering, product, and design are all merging into a 'builder' role" Yeah... I'm not so sure. This feels like an ove...

大佬观点现象/趋势
08:51
Berryxia.AI@berryxia
58
OpenAI 升级 GPT-Rosalind,为生命科学研究注入 Agentic 能力

OpenAI 为专为生命科学研究打造的企业级模型系列 GPT-Rosalind 增加新能力,融合 GPT-5.5 的 Agentic Coding 与工具调用能力。Rosalind 可自主生成假设、调用工具模拟、设计实验方案并追踪工作流可重复性,面向药物发现、分子分析、实验设计及湿实验流程。该模型非通用模型加生命科学提示,而是从头针对药物发现、蛋白设计等场景专项强化,支持企业级海量数据处理、跨团队协作与合规审计。命名致敬 DNA 结构科学家 Rosalind Franklin。

OpenAI: We're bringing new capabilities to GPT-Rosalind, a model series purpose-built for life sciences research at enterprise s...

智能体OpenAI大佬观点
08:00
ginobefun@hongming731
48
AI早报:微软战略、Kimi Work Beta、腾讯报告

微软CEO纳德拉在Build大会阐释Frontier Intelligence Platform战略,强调私有评测集为企业AI核心IP;月之暗面Kimi Work Beta上线,92%代码由AI生成,桌面端Working Agent正式推出;腾讯研究院发布3万字报告,提出组织竞争力公式:人才密度×AI杠杆/组织摩擦。

产品更新大佬观点行业动态
08:00
Tomer Tunguz 博客(VC 分析)
19
Local in Reality

原文仅包含一张标题为“Local in Reality”的图片(alt 文本为 local_cloud_routing_cleaned),无正文文字内容,无法提炼具体技术或产品信息。

其他大佬观点
07:51
Berryxia.AI@berryxia
37
卧槽!这下Codex真的要起飞了……
OpenAI大佬观点编码
07:09
宝玉@dotey
26
请教:Claude Code (Desktop)总是弹窗要确认权限,有没有办法避免总是要 Allow,很烦人,已经启用了 Bypass Permissions
Anthropic大佬观点编码
06:29
Orange AI@oran_ge
25
硅谷英文AI推的焦虑程度是中文AI推的100倍。
大佬观点现象/趋势
06:21
Chubby♨️@kimmonismus
60
微软Build个人回顾

Kim受邀首次参加微软Build,参观GitHub HQ、参与多场会议并见到Satya Nadella,认为远超预期。微软发布7个新AI模型(定位中端、约Sonnet级别、价格亲民),新Surface Laptop Ultra配新芯片对标MacBook Pro,展示Project Solaris和智能体手持设备等实验项目,推出改版Copilot应用,企业版新增智能体功能及新量子芯片。作者认为微软正认真听取反馈,在各个方向推动变革。

Microsoft大佬观点行业动态
03:50
Chubby♨️@kimmonismus
14
我很困惑,同时也感到兴奋。我感觉到OpenAI正在准备一些重大发布。 超级应用?5.6?让它来吧!
OpenAI大佬观点
03:46
Ethan Mollick@emollick
39
@binarybits 称,不相信有公司一个月意外花费5亿美元在Claude上,这个数字大得不合理。主推文表示这故事难以置信,唯一可能解释是云提供商内部会计占位符,即便如此也仍有诸多疑点。

Timothy B. Lee: I don't believe any company accidentally spent $500 million on Claude in a month. The number is an order of magnitude to...

Anthropic大佬观点行业动态
03:20
Fei-Fei Li@drfeifei
精选78
世界模型的功能分类

World Labs团队与李飞飞发文,梳理“世界模型”这一被滥用的术语。对比语言模型学习文本统计,世界模型学习空间与时间统计(如光照、物理规律)。基于部分可观马尔可夫决策过程(POMDP)框架,智能体通过动作影响世界状态,观测是部分视图。当前被称为“世界模型”的不同系统本质上是同一循环的不同投影:第一类为渲染器,输出给人眼看的像素,以视觉保真度为核心。文章着重于概念分层,未给出具体模型名、参数或基准分数。

具身智能大佬观点现象/趋势

推荐理由:李飞飞亲手给纷乱的「世界模型」下了个三分类——渲染、模拟、规划,而且点破模拟才是根基。做机器人、空间智能的人,这篇是今年的坐标系。
02:16
AYi@AYi_AInotes
65
Google 发布 Gemma 4 12B:无独立视觉编码器的统一多模态架构

Google 推出 Gemma 4 12B(Apache 2.0),采用无独立视觉编码器的统一多模态架构。仅用 35M 参数的轻量嵌入器,将图像切为 48×48 块、音频(16kHz 原始波形)切为 40ms 帧,直接作为 token 输入 Transformer。M4 Max 上 4-bit 量化识图延迟 1.2-1.5 秒,官方称 16GB 内存可用,但社区指出高分辨率多图会压线。该设计暗示:当基座模型足够大,专用子模块不再是必需,未来一个微调好的统一模型可能取代传统拼装 Whisper、LLaVa 等多模态 pipeline。

Google Gemma: Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...

Google多模态大佬观点端侧
02:15
Ethan Mollick@emollick
68
5月初,顶级超级预测者预计2026年底前最长METR 80%任务时间范围可达3-4小时。然而5月底,Anthropic的Claude Mythos模型在METR基准预览中即以80%成功率达到3小时6分钟,直接落在专家和超级预测者对2026年底的中位数预测范围内(3-4小时)。此前基线为1.5小时。此次突破表明AI能力进展速度远超预期。

Forecasting Research Institute: We also asked forecasters to predict the longest 80% success time horizon achieved by the end of 2026. All three groups ...

智能体Anthropic大佬观点
00:45
Ethan Mollick@emollick
60
大多数人,包括非常有成就的人,对LLM的运作方式没有准确的认知(他们凭什么有呢?) 你可以从广泛的观念中看到这一点:认为AI只是从已知来源复制,或者它只能产生平均水平的答案,或者它不能产生新想法。
大佬观点现象/趋势
00:17
elvis@omarsar0
66
微软SkillOpt论文:AI智能体技能实现自我进化

DAIR.AI的Elvis Saravia将微软SkillOpt论文集成到智能体编排器中后,所有智能体技能获得测试框架与自我演化机制。应用于多模态论文图表提取技能时,质量评分从0.73提升至0.93(+20点),提取结果显著改善。Saravia认为这是自我改进AI的早期范例,该思路可扩展至智能体模式优化、工具使用、上下文工程、智能体搜索及工作流评估等环节。他已基于SkillOpt启动多项后续实验。

智能体Microsoft多模态大佬观点
6月3日
23:02
Lee Robinson@leerob
61
Lee Robinson 反驳"工程、产品、设计合并为 builder"观点

Lee Robinson 认为该说法是过度简化的播客话术。现实更复杂:即便大量“技术专家”存在,仍需要有人百分百专注产品或设计;AI 虽让生成代码变易,但缺乏优秀工程师会导致灾难。硅谷常把创业公司经验套用于大公司,却难以颠覆内部政治、遗留系统等极度人性化的部分。他判断 AI 颠覆知识工作需要数十年,因为本质是社会/组织问题,而非纯智力问题。

大佬观点现象/趋势编码
22:37
Nathan Lambert@natolambert
40
过去一年构建开放模型的一个关键教训,当美国明显落后这一点已变得如此清晰时,就是空谈是廉价的。 许多人说他们在帮助/想要帮助,但实际上什么都没做。找到那些真正推动开放进步的人是至关重要的。
大佬观点开源生态
‹ 上一页
1…2627282930…50
下一页 ›