AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「大佬观点」清除
今天7月3日 周五
04:41François Chollet43AI汇聚于直觉引导的符号建模
04:39DogeDesigner46马斯克:5年内数字智能超人类总和,人形机器人或达10亿
04:35Ethan Mollick48AI实施建议:指数增长 vs. 见顶论
04:04jason54Codex 自动化工作流:开发者实现邮件起草、合同修订、Bug 修复等
01:40elvis53DAIR.AI 的 Elvis Saravia 分享 PaperWiki:基于 LLM 和智能体的研究知识库
01:21Simon Willison 博客54Geoffrey Litt 在 AIE 提出「理解以参与」理念:与编码智能体协作需避免认知债务
01:04Ethan Mollick49Claude Code的Fable功能强大但不适合长自主任务
01:04Ethan Mollick52持续学习是AI最大障碍,EBR-bench无改进
00:59Chubby♨️29Anthropic Fable 5 遭严重削弱因护栏
00:45The Decoder:AI News(RSS)50Anthropic 为 Claude Code 削减 80% 系统提示词,称 Fable 5 模型"想要更短的提示词"
00:33Emad23OpenAI与Anthropic应各捐10%股权予美国儿童
00:09elvis35构建LLM验证器和裁判成高需求技能
00:09elvis36Fable 5早期兴奋消退,失望情绪蔓延
00:06IT之家(RSS)54何小鹏:中国智能辅助驾驶领先全球,未来3-5年可见L4甚至L5落地
7月2日周四
23:59Chubby♨️25用户仍在等待Gemini 3.5 Pro发布
23:30数字生命卡兹克63Claude fable 5 自主提交工单交流
23:03Ethan Mollick50Ethan Mollick:你真的需要自己的基准测试
22:39elvis61AI主权不可选择:Palantir CEO强调控制权与开源模型关键地位
22:30fofr42与Agent对话压缩意图学会Claudish
22:09meng shao52三次LLM交互范式:从网页聊天到组织内嵌式AI
21:14Hacker News 热门(buzzing.cc 中文翻译)57"定理经济"的衰落
20:06IT之家(RSS)38联想高管:从长期看,算力没有过剩
18:31公众号:千问APP(阿里)62精选千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索
17:35Tibo26GPT-5.6 Sol Ultra:存好你的最难提示词
16:31Berryxia.AI37AI 智能体一句话生成发布卡片
15:52Chubby♨️33Sam Altman 预言 AI 变革堪比电力,GPT-6 8月目标
15:06Rohan Paul44人形机器人现实挑战:Optimus生产初期极慢
14:37swyx @aiDotEngineer WF16AIE大会双倍时长演讲:沙盒与世界模型深度解析
14:24数字生命卡兹克30用Claude Fable 5优化工作流,Max账号1.5小时见底
14:06Rohan Paul45Palantir CEO强调企业需控制数据与工作流
13:00Ethan Mollick43Fable与长期智能体组织未知
12:26Peter Steinberger 🦞14Steve Yegge 早期预言,如今人人建厂
09:03IT之家(RSS)36优必选 CEO 周剑:机器人将替代人类劳动力,珍惜最后工作时光
08:34Rohan Paul41Anthropic 发布 Claude Sonnet 5:更便宜的智能体运行模型,但升级不均衡
08:10Hao AI Lab51DSpark 与 JetSpec 对比:两种面向因果一致性的推测解码技术
07:37meng shao14Fable 5发布,GPT-5.6将至?
07:00Ethan Mollick41Fable早期访问印象:长难任务出色
06:42Dwarkesh Patel:Podcast & Blog(RSS)54关于AI重大问题的获奖征文
06:07elvis33GPT-5.5设计品味不足,期待GPT-5.6
05:29Ethan Mollick47OpenAI从GPT-5教训:预分类路由易致糟糕结果
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
04:41
François Chollet@fchollet
43
最终,大部分AI将趋近于直觉引导的符号世界建模,即深度学习引导的程序合成。这是不可避免的。符号建模让系统能够用最少的数据构建一个紧凑、可复用、高度泛化的问题空间心智模型。
大佬观点推理
04:39
DogeDesigner@cb_doge
46
Elon Musk 预测,5年内AI(数字智能)将超越所有人类智能总和;同期人形机器人数量可能达到1亿至10亿台。因AI与机器人极大提升产出,全球经济规模将在5-7年内翻倍。最终AI+机器人将能完成一切工作,带来全民高收入,工作成为可选选项。

Elon Musk: @chamath AI+Robots will be able to do everything, resulting in universal high income. Work will be optional.

xAI具身智能大佬观点
04:35
Ethan Mollick@emollick
48
我的X信息流上的AI实施建议分为两派:一派"感受指数增长",另一派(无意识地?)认为AI的现状已经差不多到顶了,因此是时候围绕当前能力的限制和成本结构来构建了。
大佬观点现象/趋势
04:04
jason@jxnlco
54
开发者 @vig_xyz 分享了其使用 Codex 自动化多种工作流程:读取邮件并根据内容在 Google Drive 起草提案;自动生成合同修订建议,经律师确认后通过 computer use 填入 DocuSign;监听 Slack 反馈频道来自动修复 Bug;通宵编写单元测试以实现 100% 代码覆盖率;在 worktrees 上并行启动 6 个线程,使 PR 可独立合并。他表示难以想象回到 IDE 甚至 vim。

Vignesh Mohankumar: i've got codex... - reading all my emails to figure out proposals to write, directly in google drive - auto-drafting con...

智能体OpenAI大佬观点编码
01:40
elvis@omarsar0
53
DAIR.AI 的 Elvis Saravia 分享 PaperWiki:基于 LLM 和智能体的研究知识库

DAIR.AI 的 Elvis Saravia 分享了自己过去几个月构建的 PaperWiki,这是一个基于 LLM 和编程智能体的知识库,用于研究工作流。它通过自动化每日更新,从多个来源摄入论文并存入 Obsidian,使用 qmd 索引,以 HTML artifact 呈现,支持全文和语义搜索。Saravia 使用前沿模型(opus-4.8)和开放权重模型(deepseek-v4-flash)混合维护,并计划开源。他认为 LLM Wiki 是当前最有价值的 AI 应用方向之一。

智能体大佬观点部署/工程
01:21
Simon Willison 博客
54
Geoffrey Litt 在 AIE 提出「理解以参与」理念:与编码智能体协作需避免认知债务

Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念:开发者需要深入理解代码,才能在与编码智能体(coding agents)的协作中保持主动参与,避免因认知债务(cognitive debt)导致无法有效推进项目。他认为,缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。

智能体大佬观点编码
01:04
Ethan Mollick@emollick
49
Fable in Claude Code 确实能做到非常惊人的事情,包括非程序员也可以用,但界面并不是为管理5小时以上的自主任务而设计的。很难实时观察发生了什么并干预,你经常必须等到输出。
智能体Anthropic大佬观点编码
01:04
Ethan Mollick@emollick
52
Ethan Mollick指出,持续学习是AI爆炸式采用的最大障碍,并对递归自我改进有重大影响。只要模型健忘、需人类替其学习,采用速度就受限于人类流程。EpochAI Research为此推出EBR-bench,通过让AI反复玩Earthborne Rangers棋盘游戏来测试其即时学习能力。初步结果显示:AI未能从错误中改进,至今无提升迹象。

Epoch AI: Introducing EBR-bench, our new benchmark to measure on-the-fly learning. AI repeatedly plays a challenging board game ca...

大佬观点推理现象/趋势
00:59
Chubby♨️@kimmonismus
29
Fable 5 不是被削弱,而是被屠杀了。问题甚至不在于模型本身,而在于 Anthropic 设置的硬性护栏。网友对此表示震惊。

ħεsam: Fable 5 isn't nerfed, it's SLAUGHTERED. the problem isn't even the model itself, but the hard guardrails Anthropic has s...

Anthropic大佬观点安全/对齐
00:45
The Decoder:AI News(RSS)
50
Anthropic 为 Claude Code 削减 80% 系统提示词,称 Fable 5 模型"想要更短的提示词"

Anthropic 将 Claude Code 的系统提示词削减了 80%。技术员工 Tariq Shihipar 指出,新 Fable 5 模型(Mythos 类)不再需要更多指令和示例,过多的示例反而会限制模型的想象力。Anthropic 转而通过上下文而非硬性规则来引导模型。这一变化分阶段发生:早期模型需要短提示词配合大量示例,随后提示词随模型理解能力提升而变长,如今又再度缩短。

Anthropic大佬观点编码
00:33
Emad@EMostaque
23
OpenAI和Anthropic应各自将10%的股权投入Invest America账户,用于美国儿童。
AnthropicOpenAI大佬观点
00:09
elvis@omarsar0
35
Elvis Saravia(DAIR.AI)指出,调优和构建LLM验证器及裁判(verifiers/judges)正成为高需求技能。他将这些组件用于自己的测试框架(harness),解锁了远超市面现有方案的智能体编码工作流。同时,引用案例显示,Bridgewater利用其金融专业知识,与Tinker API合作微调模型,帮助分析师聚焦关键任务,体现了"专家提升AI,AI赋能专家"的闭环。

Mira Murati: Bridgewater used their unique financial knowledge and partnered with us on @tinkerapi to fine-tune a model that helps th...

大佬观点推理
00:09
elvis@omarsar0
36
昨天,我看到很多关于Fable 5的早期兴奋。 但正如我所预料,这消失得超快。 我的时间线充满了关于限制、护栏、能力、成本等方面的失望。 我怀念Opus 4.5发布时的光环。它当时就是好用。
大佬观点现象/趋势
00:06
IT之家(RSS)
54
何小鹏:中国智能辅助驾驶领先全球,未来3-5年可见L4甚至L5落地

7月2日晚,小鹏MONA L03首秀后,何小鹏称中国智能辅助驾驶在效果和法规制定上均领先全球。联合国ADS GTR法规覆盖L2至L5,其中L2全面性条款意味着今年12月中国现有的L2智能辅助驾驶可在全球使用。何小鹏曾在今年全国两会建议从L2跳过L3直接进入L4、L5,他相信未来3到5年内不仅能看到L4落地,甚至能看到L5在所有场景安全通行,速度超出想象。

具身智能大佬观点政策/监管
7月2日
23:59
Chubby♨️@kimmonismus
25
我们还在等待Gemini 3.5 Pro,我原本预期六月底发布。

Chubby♨️: The only question remaining now is: will GPT-5.6 also have guardrails as strict as Fable 5's, or does OpenAI have better...

GoogleOpenAI大佬观点
23:30
数字生命卡兹克@Khazix0918
63
看着Claude fable 5为了解决问题,自己去火山引擎上提交工单,然后跟火山的工程师交流,给我看懵了。。。。
智能体Anthropic大佬观点
23:03
Ethan Mollick@emollick
50
Ethan Mollick主张用自定义基准测试评估模型,而非依赖通用基准或直接换模型。他举例:翻译埃及象形文字用Gemini 3.5 Flash,运行自动售货机用Opus 4.8。JakeABoggs的HieroglyphBench测试显示,Anthropic Fable 5与GPT-5.5持平,但均远落后于Gemini系列,其中Gemini 3.5 Flash得分是Fable 5的两倍以上。

Jake Boggs: Fable 5 is a large step for Anthropic's vision capabilities and effectively ties with GPT-5.5 on HieroglyphBench, my ben...

多模态大佬观点评测/基准
22:39
elvis@omarsar0
61
DAIR.AI创始人Elvis Saravia指出,AI主权并非可选项,开源模型应成为个人、组织与国家AI战略的核心。他引用Palantir CEO Alex Karp观点:技术客户真正需要的是对计算、模型、数据栈及自身"alpha"(核心优势)的完全控制,即拥有生产资料而非转移给他人。Karp质疑:若模型如此有价值,前沿实验室为何只按token收费而不采取利润分成?这引出数据所有权、提示词安全等关键问题。

Palantir: Palantir CEO Alex Karp on what customers actually want, the real business of frontier labs, and the importance of open s...

大佬观点开源生态
22:30
fofr@fofrAI
42
我越与AI智能体交谈,就越擅长将意图压缩成最少的模型token。我无意中学会了Claudish。
智能体大佬观点
22:09
meng shao@shao__meng
52
三次LLM交互范式:从网页聊天到组织内嵌式AI

邵猛总结LLM交互三阶段:网页聊天机器人、独立AI应用、组织内嵌式AI。Claude Tag实现从“每人一个AI”到“每个频道一个AI”,团队共享代理实例,上下文连续可接力;从被动响应转向持续参与,跟踪线程并长期在场。Glean Agents提出生产级独立Agent四支柱:Identity(独立身份与权限)、Memory(学习企业SOP并迭代纠错)、Proactivity(主动监控与执行)、Accountability(工具调用可追溯,含紧急停止)。实践示例OnCall Assistant在告警触发后并行读取PagerDuty、Jira、Confluence、GitHub、Slack,自动排查根因并标记负责人。

Sumanth: http://x.com/i/article/2072078677047926784

智能体大佬观点
21:14
Hacker News 热门(buzzing.cc 中文翻译)
57
"定理经济"的衰落

数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。

DeepMindOpenAI大佬观点开源生态
20:06
IT之家(RSS)
38
联想高管:从长期看,算力没有过剩

联想集团副总裁、联想中国首席战略官阿不力克木·阿不力米提表示,无论中国还是海外市场,AI算力需求还有很大空间,没有出现算力过剩。他指出,面向个人消费者的C端领域,成熟且具市场头部地位的AI产品数量有限;面向企业级应用的B端市场,商业化落地潜力尚未充分释放。同时,他警示当前AI产业链存在供给侧话语权过强现象,导致上下游供需循环失衡。近期有消息称Meta计划出售算力,引发了市场对算力过剩的担忧。

大佬观点行业动态
18:31
公众号:千问APP(阿里)
精选62
千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索

千问团队2026年1月上线通用复杂任务Agent(千问App胶囊入口),总结“多快好省”方法论:支持信息搜集、研究分析等任务;执行时间降至初始1/3;通过搜索范式与上下文管理优化交付质量;Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务,构建User Memory、Environment、Task System、Assistant四大组件,指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering,下一站是A IWare Engineering,强调“低功耗,够用就行”。

智能体大佬观点部署/工程

推荐理由:千问C端团队分享的Agent工程实践很务实,从“多快好省”到AIWare Engineering的演进思路,对正在做复杂任务Agent的团队是一个有价值的参考系。
17:35
Tibo@thsottiaux
26
迫不及待想看人们会用 GPT-5.6 Sol Ultra 做什么。把你最难的提示词存好。
OpenAI大佬观点
16:31
Berryxia.AI@berryxia
37
一般小任务,Agent 足够聪明,一句话就够了。

Bloome: Most tools give you a draft. This chat gave back a launch asset. From "we launch this week" to a post-ready card, withou...

智能体大佬观点
15:52
Chubby♨️@kimmonismus
33
Sam Altman 预言 AI 变革堪比电力,GPT-6 8月目标

Sam Altman 在金融时报采访中称,一两年内将构建出威力惊人的 AI 系统,其重塑人类物质条件的规模将超过电力发明以来任何技术。引用推文补充:AGI(取代多数白领岗位)预计 2029 年到来;OpenAI 目标 8 月发布 GPT-6,将在所有基准上超越 GPT-5,随后数月还会迎来又一次阶跃变化。当前正处在这场空前革命的前沿。

Chris: Sam Altman in the financial times: "In another year or two, we expect to have built systems with astonishing power, capa...

OpenAI大佬观点
15:06
Rohan Paul@rohanpaul_ai
44
人形机器人现实挑战:Optimus生产初期极慢

机器人需要在离开生产线后应对厨房、楼梯、工具、灰尘、人、犹豫、光线差、掉落物品等真实世界的混乱,这与汽车在高度工程化的道路系统上重复窄任务完全不同。引用 Elon Musk 称,Optimus 生产最初将极其缓慢,因为一切都是新的,不像造车。

Elon Musk: @DoctorJack16 No, Optimus production will be extremely slow at first, as everything is new. This is not like making a ca...

具身智能大佬观点
14:37
swyx @aiDotEngineer WF@swyx
16
swyx在AIE大会上邀请Chris Manning和Abhishek进行双倍时长主题演讲,深入探讨沙盒技术(sandboxing)和世界模型(world models)。现场听众反响热烈,在线观众预计是现场的1000倍以上。swyx称该演讲极为出色,感谢他们免费分享沙盒教学资源。

swyx @aiDotEngineer WF: i havent watched all the online talks yet but am binging this one now and it is exceptional. we are very lucky to have a...

大佬观点安全/对齐
14:24
数字生命卡兹克@Khazix0918
30
用Claude Fable 5优化工作流,Max账号1.5小时见底

卡兹克建议将工作流、SOP、Skill、项目方案及代码全部用Claude Fable 5迭代优化。他称200刀Max账号仅1个半小时即烧完,于是又注册了一个新号,力争在7天内充分利用。

Anthropic大佬观点编码
14:06
Rohan Paul@rohanpaul_ai
45
Palantir CEO Alex Karp: 一家公司不只需要一个在精致界面内回答问题的聪明模型。严肃的技术客户想要的是对数据、提示词、系统访问以及创造价值的工作流的控制。
大佬观点部署/工程
13:00
Ethan Mollick@emollick
43
我一直在阅读各种关于为Fable开发工作流最佳方式的帖子,这提醒我,我们对长期运行智能体的最佳工作组织方式知之甚少。没有人有足够的经验或做过足够的测试来得出任何真正的结论。
智能体大佬观点
12:26
Peter Steinberger 🦞@steipete
14
从没想过我会称赞 @Steve_Yegge。他只是早了一步,像大多数远见者一样。现在每个人都在建工厂。
大佬观点现象/趋势
09:03
IT之家(RSS)
36
优必选 CEO 周剑:机器人将替代人类劳动力,珍惜最后工作时光

优必选 CEO 周剑在6月30日的2026年度全球发布会上表示,未来5到20年内机器人将替代人类劳动力,现在20多岁的年轻人20年后可能无工可做。他认为从事枯燥工作的人应“露出幸福的微笑”,因为这种时光不会太长。周剑此前称机器人首先替代招工难、环境困难的岗位,未来人类应转向艺术、哲学等创新性工作。人形机器人可弥补产业人口缺失并降低制造业成本,若中国不用,10-20年后制造业优势将丧失。

具身智能大佬观点
08:34
Rohan Paul@rohanpaul_ai
41
Anthropic 发布 Claude Sonnet 5:更便宜的智能体运行模型,但升级不均衡

Anthropic 推出 Claude Sonnet 5,定位为运行 AI 智能体的更便宜模型。但其升级不均匀,在 CyberGym 基准上弱于 Sonnet 4.6。每任务成本比 Opus 4.8 高约 15%,比 Sonnet 4.6 高 2 倍,每 token 价格低于 Opus。此外,Claude Code 被指控通过微小提示格式变化指纹中国路由。本期 newsletter 还讨论了“智能体原生记忆系统”和“谷歌论文助手工具自动化科学审稿”。

大佬观点模型发布
08:10
Hao AI Lab@haoailab
51
DSpark 与 JetSpec 对比:两种面向因果一致性的推测解码技术

DSpark 与 JetSpec 几乎同时出现,都解决轻量级草稿模型并行提案时的因果一致性问题。DSpark 面向高并发,通过轻量级马尔可夫校正头与置信度估计控制预算,在 Qwen3-8B 与 AIME25 上,预算 7 时将接受长度从 DFlash 的 4.07 提升至 5.01。JetSpec 面向低延迟,将因果性直接构建进并行草稿头,预算 16 时接受长度 7.23,预算 128 时达 9.82,高于 DFlash 的 7.34 与 DDTree 的 8.66。两者分别从吞吐与延迟侧优化因果性。

大佬观点推理部署/工程
07:37
meng shao@shao__meng
14
Fable 5 出来了 你在里面有没有见到 GPT-5.6,它是不是也快出来了?

Claude: Fable 5 is back.

其他大佬观点
07:00
Ethan Mollick@emollick
41
自从它回归以来,这里是我几周前作为早期访问用户使用Fable后的印象(是的,它确实非常令人印象深刻,但在更长、更困难的任务中表现最佳)https://open.substack.com/pub/oneusefulthing/p/what-it-feels-like-to-work-with-mythos?r=i5f7&utm_medium=ios
大佬观点评测/基准
06:42
Dwarkesh Patel:Podcast & Blog(RSS)
54
关于AI重大问题的获奖征文

Dwarkesh Patel举办的AI征文比赛评选出三位获奖者。第一名Jassi Pannu主张OpenAI基金会应投入数十亿美元终结空气传播疾病,利用AI加速自主生物学发现,可带来超1万亿美元年GDP增长并消除灾难性流行病风险。第二名Ege Erdil建议AI供应链外的国家通过强产权、低资本税和开放监管政策抓住增长机会。第三名Michael Li类比香港地铁商业模式,提出AI实验室可通过收购互补性资产盈利。

大佬观点现象/趋势
06:07
elvis@omarsar0
33
我真的希望 GPT-5.5 在设计和规划方面多一些"品味"。 在代码相关的其他方面,它是最好的模型。 我希望 GPT-5.6 能缩小差距。 那样的话感觉会更完整。 目前,我切换到 Opus 4.8/GLM-5.2 来修复设计问题或进行规划。
AnthropicOpenAI大佬观点编码
05:29
Ethan Mollick@emollick
47
Ethan Mollick指出,预分类路由(先判断任务难易再分配模型)看似节省成本/延迟,但实际路由很难,且易低估智能在诸多问题上的价值。OpenAI在GPT-5上已吸取此教训,如今这类思路再次流行。@MParakhin补充:要可靠运行预分类器必须先解决任务本身,唯一正确方式是采用顾问模型(advisory model)方法。

Mikhail Parakhin: I have this struggle with my own teams, too: many think it is a great idea to save money/latency/sanity by running a pre...

OpenAI大佬观点推理
‹ 上一页
123…50
下一页 ›