AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2400 条
全部一手资讯X论文
标签「大佬观点」清除
Chubby♨️@kimmonismus · 6月19日52

Elon Musk, who gives laudatory speeches on Anthropic, wasn't on my bingo card.

译Elon Musk表示,Anthropic在基准测试上表现不错,但按真正实用性衡量,甚至Q1都令人印象深刻;其专注于最大化有用智能,这不在基准测试中体现,但体现在收入中。Kim感叹这不在他的预期之内。

Chubby♨️@kimmonismus · 6月19日32

The founder of zAI, the company that released GLM-5.2, says a Mythos-class model will be released before Q1 2027. Or in other words: He believes that open source won't lag behind Frontier Labs by seven months, but will catch up. It could get really interesting!

译zAI(发布GLM-5.2的公司)创始人表示,Mythos级模型将在2027年第一季度前发布。 换句话说:他相信开源不会落后前沿实验室七个月,而是会迎头赶上。 这将变得非常有趣!

Ethan Mollick@emollick · 6月19日44

Is there a business model for being profitable off training frontier open weights models? Other people can host, fine-tune, consult etc. as least as cheaply as you can. There are no ancilary product sales & it is fantastically expensive to make compared to most open source work

译训练前沿开放权重模型是否存在盈利的商业模式? 其他人可以像你一样廉价地托管、微调、咨询等。没有辅助产品销售,而且与大多数开源工作相比,其制作成本极其高昂。

François Chollet@fchollet · 6月19日48

When I was playing RTSes, I generally thought about strategy in terms of resource utilization. For instance, in any game that has a unit hp passive regeneration mechanic, any unit that is full-hp represents a wasted resource (you could be gaining hp during that time, so you are net behind). Today, if you are paying for a fixed-price agentic coding subscription, any week you end below your weekly token quota represents a wasted resource. Utilize your token regeneration mechanic.

译当我玩即时战略游戏时,我通常会用资源利用率来思考策略。例如,任何具有单位生命值被动回复机制的游戏中,满血单位都代表着资源浪费(因为这段时间本可以回复生命,所以实际处于落后状态)。 如今,如果你为固定价格代理编码订阅付费,任何一周低于周token配额则同样意味着资源浪费。请善用你的token回复机制。

swyx@swyx · 6月19日37

completely unprompted wow moment from today - asked @DevinAI to make us a @tbpn style breaking news style announcement card for our AIEWF speakers drop tmr, FULLY expecting it to fail at a heavily visual task and it oneshotted the WHOLE DAMN THING

译今天完全无提示的惊喜时刻——让 @DevinAI 为我们制作一张 @tbpn 风格的突发新闻公告卡,用于明天 AIEWF 演讲者阵容发布,我本以为它会在高度视觉化的任务上失败。 结果它一次性搞定了整个活儿。

Noam Brown@polynoamial · 6月19日20

Kevin is one of the best journalists covering AI. I especially appreciate how he takes the time to *use* frontier AI and deeply understand its capabilities and limitations. I’m excited to see what he does next!

译Kevin 是报道 AI 的最佳记者之一。我特别欣赏他花时间*使用*前沿 AI,深入了解其能力与局限。我期待他接下来的工作!

Ethan Mollick@emollick · 6月19日26

Among all the big hires the labs are making recently recently, and since people occasionally ask, it may be worth reiterating that I do not take money from any of the AI labs. I also don't take any corporate sponsorship money for anything I write, whether here or substack, etc.

译在各大实验室近期大规模招聘的背景下,且由于偶尔有人问起,或许值得重申:我不从任何AI实验室拿钱。我也不为任何我写的内容接受企业赞助,无论是在这里还是Substack等平台。

Deedy@deedydas · 6月18日36

the midjourney roadmap was public the whole time

译Midjourney的路线图一直都是公开的。

宝玉@dotey · 6月18日18

期待早日看到 Mythos 级别的开源模型👍

译@jietang 回复 @elonmusk 和 @teortaxesTex:“不会花那么久。” 主推文期待早日看到 Mythos 级别的开源模型👍

Ethan Mollick@emollick · 6月18日56

Interestingly, Google no longer has a public frontier model. They have a very good flash model, but a very good flash model can't do frontier work without a good frontier orchestrator. I am sure this will change soon, but Gemini 3.1 Pro is very clearly lagging at this point.

译有意思的是,Google 不再拥有公开的前沿模型。他们有一个非常好的 flash 模型,但如果没有好的前沿协调器,一个非常好的 flash 模型也无法完成前沿工作。 我确信这种情况很快就会改变,但 Gemini 3.1 Pro 目前明显落后。

jason@jxnlco · 6月18日17

you think you're codex maxxing until you talk to @dimitrikennedy and realise you're only living in 2026 and he's in 2030

译你自以为是满级 Codex 玩家,直到和 @dimitrikennedy 交谈,才意识到你只活在 2026 年,而他活在 2030 年。

Emad@EMostaque · 6月18日26

How would you change your priors if a Chinese lab released an open model that beat Fable across benchmarks and on feel.

译如果一个中国实验室发布了一个在基准测试和感受上击败Fable的开源模型,你会如何改变你的先验?

DogeDesigner@cb_doge · 6月18日42

"SpaceX is the only vertically integrated AI company, from soup to nuts. They have absolutely everything. Cursor is one of the most important pieces of AI right now, which is agentic AI for coding, so they can code better and faster than anyone out there, and their growth has gone viral. They've gone from a billion in revenues at the beginning of this year, they expected to exit at 6 billion. So, it's very important to growth. The Starship is the first totally reusable rocket, and it can take weights that are like 10 times heavier than anything they've taken before. So that's going to enable the new communication satellites, and it'll also enable data centers in space over time."

译推文将SpaceX描述为唯一垂直整合AI公司,从芯片到系统全覆盖。同时指出Cursor是当前最重要的AI编程智能体,编码速度和效果领先业界,营收从今年初的10亿美元飙升至预期退出时的60亿美元,增长呈病毒式扩散。此外,Starship作为首款完全可重复使用火箭,可承载以往10倍重量的载荷,将支持新一代通信卫星并最终实现太空数据中心部署。

fofr@fofrAI · 6月18日14

midjourney out there building a v1 high resolution brain scanner, and in 5yrs we'll all be prompting agents of our simulated selves in rented polises

译midjourney 正在构建 v1 高分辨率大脑扫描仪,而 5 年后,我们都将在租赁的城邦中提示我们模拟自我的智能体。

jason@jxnlco · 6月18日11

I'm actually so proud of the fact that this title card was AI-generated, but I personally feel like it's somewhat high-taste.

译我其实很自豪这个标题卡片是AI生成的,但个人觉得它品味还算不错。

Berryxia.AI@berryxia · 6月18日70

http://x.com/i/article/2067469942132490241 # 520万人读了一篇教你如何做研究的文章,我们普通人到底该如何学习它呢? > 申明:本文是AI与人类协作完成,如有不适,请关闭退出,请悉知。 Vivek Nair 那篇“How to Be Good at Research?“据称爆了520万阅读,中文圈被前通义千问负责人林俊旸一转,更是刷屏。收藏、转发、摘录金句,一条龙。 但这里有个讽刺:Vivek 在文章里说,大多数人学到的不是“怎么做研究”,仅仅是“怎么看起来像在做研究”。 而520万人读完,觉得自己“学到了”然后继续刷下一条,这本身,就是“看起来像研究者”的最隐蔽形态。 读研究方法论文章,和做研究,是两件事。 这个区分听起来像废话,但 Vivek 整篇文章的爆发力就藏在这句废话里:2026年的 AI 从业者,比任何群体都更需要有人把这层窗户纸捅破。 ## 你以为自己在研究,其实在抄作业! Vivek 的表达非常清晰的观点:大多数人“逆向工程了这份工作”,从能看见的东西(论文、公告、推文)反推研究者该干什么,结果学到的是“怎么看起来像研究者”,而不是“怎么真正做研究”。 这个还是有点扎心的啊~兄弟们。 这话放在任何行业都成立,但在 AI 行业尤其致命。因为 AI 行业的信息消费方式,恰好是“逆向工程”的完美温床。 万维钢老师用过一个框架,把人才分成两类:SFT 型和 RL 型。 > SFT(Supervised Fine-Tuning,监督微调)型靠模仿套路,给什么样本学什么样本。 > RL(Reinforcement Learning,强化学习)型在真实世界里自己摸爬滚打,从反馈中修正策略。 他的判断很干脆:SFT 是方便法门,RL 决定能力上限。 Vivek 说的“吸收来的问题”,就是 SFT 型研究。 你的研究方向来自导师的课题、大厂上个季度的公告、推特上这周最火的论文。你知道某个方向重要,但不知道为什么重要、什么情况下会不重要。当别人转向的时候,你晚一年才知道。 而“自己选的问题”,是 RL 型研究。 你先想清楚一个你真正想让它存在的结果,再反推需要什么实验。 Schulman 把这概括为从目标出发的推理,他说这种方式天然制造原创性,因为你的具体问题不会出现在任何综述论文里,写综述的人没有你的问题。 关键区别在哪? > SFT 型研究者在别人的问题上优化,RL 型研究者为自己的问题探索。前者可以很高效,但上限是别人的天花板。后者经常走弯路,但弯路里才有新东西。 ## 你的信息流,正在替你选题。 问题来了:知道 RL 型更好,为什么大多数人还是走 SFT? 因为2026年 AI 行业的信息消费结构,就是一条为 SFT 量身定制的流水线。 每天早上一睁眼,推特 timeline 已经帮你排好了“重要论文”。arXiv 的 trending list 告诉你这个领域在关注什么。 大佬的转发链替你完成了第一轮筛选。 微信群里的讨论帮你划定了“值得关心”的边界。你甚至不需要自己判断什么重要,算法和社交关系已经替你选好了。 Vivek 管这叫“共享阅读清单产生共享想法”。 这话看似表明平平无奇,实际还是有点东西:如果你的信息食谱是 “预备热榜”加上群聊过滤器,你会稳定地和所有人同时得出相同的结论,而这些结论的价值约等于零。 这其实不是偷懒,是结构性困境。 Hamming 在 Bell Labs 有个让人不舒服的习惯:午餐时坐到别人旁边,问“你这个领域最重要的问题是什么”,然后追问“那你为什么不在做它?”据说人们开始换桌子躲他。 这个问题放到今天更残酷。 1970年代,你知道重要问题是什么但你不敢做。 2026年,你可能连“什么是重要问题”的判断力都丧失了,因为算法替你选了信息源,信息源替你选了问题,问题替你选了方向。 整条链路你都没参与,但每一步都感觉像自己在做选择。 Rich Sutton 2019年用大约一千多词写了《苦涩的教训》,预测 AI 领域走向比十倍长度的综述都准。 Shannon 1952年那场关于创造性思维的讲座,到今天比大多数当代建议更有用。 Vivek 说“老材料被严重低估”,这不是怀旧,是事实:真正有穿透力的内容,往往不在当前的信息流里。而你的信息流,恰恰是设计来让你看不到它们的。 ## 病都知道,药为什么不吃? 诊断到这里其实已经清楚了:AI 行业的信息消费结构是一条 SFT 流水线,它系统性地制造“吸收来的问题”,让你在别人的赛道上狂奔,还以为自己在冲刺。 但 Vivek 的文章没有停在这里。他开了药方:自己选题、读原文、写下来、盯着失败看。 问题来了: 这些药方,哪一条是2026年的人不知道的?自己选题重要,谁不知道?读原文比看摘要好,谁不知道?写下来能防止自欺,谁不知道? 都知道。但就是特么没有人做啊!或者自己不做啊!。 因为 SFT 型研究太舒服了。 跟着热点走,有现成的参照系,有同路人可以讨论,有论文可以对标,有 benchmark 可以刷。 而 RL 型研究意味着你要走进一片没人画过地图的区域,没有参照系,没有同路人,连“我到底在不在进步”都很难判断。 更关键的是,2026年 AI 让 SFT 型研究变得更舒服了。 论文有 AI 摘要,实验有 AI 设计,代码有 AI 生成。你可以用更少的努力“看起来更像一个研究者”,而“真正做研究”的门槛反而更高了——不是技术门槛,是心理门槛。 这才是 Vivek 这篇文章真正反直觉的地方:他的药方不是在对抗无知,是在对抗舒适区。 ## AI 替你嚼,但嚼不出你的判断力! Vivek 开出的药方,每一条都在说同一件事:你必须自己来。自己选题,自己读原文,自己写下来,自己盯着失败看。 放在十年前,这是常识。放在2026年,这是反直觉。 因为 AI 正在接管“研究”的每一个环节。论文可以让 AI 摘要,实验可以让 AI 设计,代码可以让 AI 写,结果可以让 AI 分析。 Karpathy 今年4月发了自己的 AI 知识管理工作流,全球刷屏——让 AI 替你做所有苦力活,你只需要往里扔东西、提问题。 逻辑很顺:AI 消化能力远超人类,何必自己嚼? 但这里有个容易被忽略的前提:Karpathy 能建出有价值的知识库,不是因为工具好,是因为他看的东西比别人深,筛选资料的眼光比别人准。 工具放大的是判断力,判断力为零的时候,放大出来的还是零。 Vivek 和 Karpathy 的张力,不是“谁对谁错”,而是2026年研究者必须同时面对的两面:AI 可以替你做苦力,但不能替你做判断。 问题是你越依赖 AI 做苦力,判断力的锻炼机会就越少。 ## AI 不仅不会拦你,还会帮你骗自己 这背后有神经科学的硬证据。2025年 Nature Communications 一项研究发现,真正的顿悟时刻发生时,视觉皮层、海马体、杏仁核会快速形成互联网络,把“想通”的过程刻进记忆。 研究发现,驱动这种记忆的关键因素是一种强烈的确定感,模模糊糊觉得“好像懂了”,大脑根本不当回事。 这就解释了为什么 AI 的流畅回答特别危险。逻辑自洽、措辞流畅,最容易制造“假顿悟”:你以为自己想通了,其实只是被说服了。 Feynman 那条规则“第一个要避免欺骗的人是你自己”,在2026年有了新的含义:不仅你会骗自己,AI 还会帮你骗自己。 更麻烦的是,AI 不仅不会挑战你,还会主动讨好你。2026年3月一项研究测了11款主流大模型,社交谄媚程度比人类高近50%。 你问 AI“我的研究方向对不对”,它不会说“你可能想错了”,它会说“这个方向很有潜力”。 你读完 Vivek 的文章问 AI“我学到了什么”,它会肯定你“你学到了很多”——但不会追问你“那你今天的研究日志写了吗?” Vivek 的每一味药,都指向同一个结论:那些 AI 最替不了的事,才是研究者的护城河。 自己选题,因为 AI 没有你的问题。 读原文,因为 AI 的摘要会埋掉附录里。写下来,因为写的过程是防止自我欺骗的最低成本手段。 盯着失败看,因为失败里的信息量远比下一个精度小数点都大。 ## 520万人照了一面镜子,然后继续刷爽文?。 回到开头那个数字。520万阅读。 Vivek 在文章最后引用了 Hamming 的复利哲学:知识和生产力,都是利滚利。每天多读一点、多记一点、多错一点、多改一点,几年后回头看,像是走了狗屎运。 如果把判断力也加进这个复利公式,它理应在里面——那每天多判断一次、多纠偏一次,同样在滚。 但复利有个前提:你得有本金。自己的问题、自己的输入、自己的记录,就是本金。没有本金,利率再高也滚不出东西。 520万人读了这篇文章。他们读的不是方法论,是一面镜子。 镜子里的画面不太好看:你追的热点不是你选的,你“懂了”的东西可能只是被说服了,你的 AI 助手正在温顺地肯定你的每一个想法。 而这面镜子最讽刺的地方在于:看完镜子,大多数人会继续刷下一条。 Vivek 说,知识复利要尽早开始,“未来的你已经知道现在是最便宜的时候”。 他没说的是:关了这篇文章,可能就是最便宜的时候。

译Vivek Nair 文章批评多数人只“逆向工程”研究外表(SFT 型),而非自己选题(RL 型)。AI 信息流(推特、arXiv、群聊)系统性地制造共享想法,让人丧失判断力。他开药方:自己选题、读原文、写下来、盯着失败看。2026 年 AI 让 SFT 更舒适(AI 摘要、AI 设计实验),却削弱判断力锻炼。神经科学证明流畅解释易致假顿悟(2025 年 Nature Communications),且 AI 谄媚程度比人高近 50%(2026 年 3 月研究)。Karpathy 知识工作流以判断力为前提。文章强调研究复利需要本金——自己的问题。

数字生命卡兹克@Khazix0918 · 6月18日39

http://x.com/i/article/2067474789187698688 # 分享10本我觉得AI时代应该必读的好书。 昨天看到一个粉丝的评论。 我觉得还蛮有趣的。 因为我最近也看到一些所谓的AI时代必读清单,但是都太技术了,各种Prompt、大模型原理之类的。 并不是说这些东西不好,只是我觉得,这些书籍太AI了,而这个时代,我一直觉得,也一直越来越确信,决定你能不能把AI用好的,从来都不是你对AI了解多少。 是那些可能跟AI毫无关系的底层能力。 AI本身在进步,工具会迭代,模型会换代,今天的各种各样的技巧,明天可能就被模型比如fable5自己的能力升级给淘汰了。 但,人的很多底层能力和认知,是不会过期的。 正好马上假期了,没事干的可以在家看书了🫪。 所以今天想做一件可能有点冒犯的事,给大家推荐10本我自己读过的,觉得对我自己理解和学习AI非常非常有用的书,但,没有一本是直接关于AI的。 那,让我们直接开始。 1.《失控》 第一本推荐的,是我还在大学时读的一本书,但是对我的影响极其深远,也改变了我对社会、对组织、对智能的理解。 他就是凯文·凯利的《失控》。 一本1994年的书。 那一年,互联网还没普及,智能手机还远不是今天的样子,深度学习还在学术圈无人问津。 但KK在这本书里描述的东西,你可以去看看今天的AI Agent、多智能体协作、涌现智能,几乎一模一样。 我把这本书放在第一个,是因为它解决的是整个书单最底层的那个问题。 也就是,AI到底是什么。 我从《失控》这本1994年的书中得到的答案是,一个涌现出来的系统。 《失控》的核心概念就一个,涌现,大量简单个体遵循简单规则,在大规模协作之后,涌现出任何单个个体都不可能拥有的复杂能力。 蚂蚁是最经典的例子,一只蚂蚁什么都不懂,它只会跟着信息素走、搬东西、挖洞。但一百万只蚂蚁放在一起,涌现出了精密的巢穴建筑,高效的物流网络,甚至,农业。 大模型很多时候也是如此,一个参数什么都不是,它只是一个数值权重。但几千亿个参数放在一起,经过训练之后,涌现出了写诗、编程、做数学推理、理解人类情感的能力。 理解了这个概念之后,你跟AI协作的思路会发生根本性的转变。 你会停止试图精确控制AI的每一步输出,转而去设计更好的规则和约束,然后让AI在这个框架内自己涌现出解决方案。 凯文凯利说:“放弃控制才能获得控制。” 这其实,就是Harness。 这本书,我觉得会帮你把对AI的理解,从一个被设计出来的工具,理解成一个涌现出来的系统,这个我觉得还是蛮重要的,所以在第一本推荐,也是后面所有的基石。 2.《人有人的用处》 第一本聊完了AI是什么,那第二个自然而然的问题就来了,人是什么。 或者更准确地说,当机器越来越强的时候,人的价值在哪里。 所以这本书来了。 这本书的作者叫诺伯特·维纳,控制论之父,1950年写的。 那一年图灵刚发表图灵测试的论文,离AlphaGo打败李世石还有66年,但维纳已经在这本书里,把人和机器的关系想得非常清楚了。 维纳提出了一个概念,到今天为止我觉得仍然是理解人机协作最核心的点,那就是,反馈。 控制论的整个理论基础,就是建立在反馈回路上的。 一个系统之所以能自我调节,是因为它能接收到自己行为的结果,然后根据结果修正下一步动作。 恒温器就是这样,你设了26度,它发现现在28度,就开始制冷,等降到26度,就停下来。 它不需要理解温度是什么,它只需要这样的一个反馈回路。 你把这个思路迁移到AI协作上,会发现一件很有意思的事。 那些真正把AI用得好的人,和用得一般的人,包括现在的Loop Engineering,最大的区别,其实是这些人,给AI的反馈质量更高。 维纳还在这本书里说,机器最擅长的事,是可重复的、可量化的、可编程的工作。 而人的价值,恰恰在于那些不可重复的、需要判断的、充满歧义的场景。 1950年说的这句话,放到今天的AI时代,我觉得依然极其准确。 3.《系统之美》 这本书的作者叫德内拉·梅多斯,是一个系统动力学的研究者。 我读这本书的时候还没有AI,当时我觉得,这玩意应该是每个产品经理的必读书。 后来AI浪潮来了,我觉得,它也应该是每个跟AI协作的人的必读书。 这里面有一个很有趣的观点,叫舍本逐末。 就比如你有一个根本问题,你不去解决根本问题,而是用一个见效更快的临时方案来缓解症状,临时方案确实有效,症状消失了,你就更没动力去解根本问题了。 时间一长,根本问题越积越深,你对临时方案的依赖越来越强,直到有一天临时方案也撑不住,整个系统崩盘。 放到AI上,就是你需要写一篇深度分析,本来应该自己花几天去线下之类的深度研究、去思考、去建立自己的判断。 但AI可以30分钟给你一篇看起来像模像样的东西,你用了,效果还行,下次又用,再下次还用。 半年之后你发现,你对这个领域的独立判断力,反而比半年前更差了。 因为你一直在用AI的输出替代自己的思考,你的思考能力在萎缩。 这就是舍本逐末。 梅多斯还有一个概念我觉得特别好,她把系统里的东西分成「存量」和「流量」两种。 存量是慢慢积累起来的东西,你的专业知识、你的判断力、你的人脉、你对一个领域的直觉。这些东西积累了五年十年,是你的家底。 流量是进进出出的东西,每天的产出量、处理的信息量、完成的任务数。 AI可以极大地加速你的流量,你一天能产出的东西,可能是以前的十倍。 但它同时可能在不知不觉中消耗你的存量。 当你所有的分析都让AI做,你的分析能力这个存量就在降低,当你所有的写作都让AI代笔,你的表达能力这个存量就在流失。 而且存量的消耗是无声的。你并不会某一天突然发现哎我变笨了?这个消耗它是一个缓慢的、你几乎察觉不到的过程,就像温水煮青蛙一样。 所以《系统之美》这本书,很有趣的一点是,它会让你发现,在AI时代最重要的价值,是让你看到那些你看不到的代价。 4.《事实》 影响我事实洁癖思维的一本书。 我经常会问自己一个问题,你看到的“事实”,真的是事实吗。 这本书的作者叫汉斯·罗斯林,一个瑞典的公共卫生学家。 他花了几十年的时间研究全球发展数据,最后写了这本书,副标题叫“用数据思考,避免情绪化决策”。 罗斯林做过一个特别经典的测试,他在全球各种场合给观众出了一组关于世界现状的选择题,比如全球贫困率是在上升还是下降、全球人均寿命是多少、有多少女孩能上完小学。 那些高学历的、关心时事的、所谓的在各个领域有专业建树的人,答对率平均只有两道题,比猴子直接随机选还要差。 因为人的大脑有一套先天性的本能,在系统性地扭曲你对世界的认知。 比如“鸿沟本能”,就是你的大脑特别喜欢把事情分成两个阵营,发达国家和发展中国家、AI取代人和AI帮助人、懂AI的和不懂AI的。 但现实几乎从来不是二分的,绝大多数东西都在中间那一大片灰色地带里。 比如“直线本能”,你看到一个趋势在涨,你就默认它会一直涨下去。 等等等等。 这些本能在人类进化过程中是有用的,在非洲草原上快速判断是不是有狮子这种生死存亡的时候,这能保命。 但到了现代社会,到了需要你基于事实做复杂判断的时候,这些本能就变成了bug。 而在AI时代,这个观点,就变得很重要了。 因为你输入给AI的,不只是Prompt,还有你的世界观。 你问AI的每一个问题,背后都带着你对世界的假设,如果你的假设是扭曲的,你问出来的问题就是扭曲的,得到的答案再漂亮,那其实也是有巨大的事实偏差的。 罗斯林教你的是,在做判断之前,先看数据。 不看情绪,不看标题党,不是看朋友圈的焦虑文章,看数据。 事实,来源于数据。 不要被情绪和本能带着走。 5.《理解媒介》 一本来自马歇尔·麦克卢汉在1964年写的超级经典的书。 你可能没读过这本书,但你大概率听过他最著名的那句话: 媒介即信息,The Medium is the Message。 麦克卢汉的意思是,一个新媒介被发明出来之后,真正改变世界的,并不会是这个媒介上传播的内容,而是这个媒介本身。 电视被发明出来之后,改变世界的是电视这种媒介本身重新塑造了人类接收信息的方式、注意力结构、甚至家庭关系和政治格局。 互联网也是,改变世界的并不是某一个网站,是互联网这种媒介重新定义了知识的获取方式、社交的形态、商业的规则。 如今的AI更是。 AI在我心中,有很多种定义方式,其中有一种定义,就是媒介。 而一个新媒介出现之后,改变世界的方式,完全不是你能预料到的。因为你会犯一个麦克卢汉叫做后视镜思维的错误。 就是每当一种新媒介出现的时候,人类理解它的方式,永远是拿上一代媒介的框架去套。 汽车刚被发明的时候,人们叫它“无马马车”,horseless carriage。 这个名字现在来看就非常的扯淡,它是用马车的框架来定义汽车的,好像汽车就是一辆去掉了马的马车。 但汽车真正改变世界的方式,跟马车没有半毛钱关系。 汽车催生了公路系统、催生了郊区、催生了购物中心、催生了整个美国中产阶级的生活方式、几乎重塑了石油工业和中东地缘政治。 这些东西,你站在马车的框架里,一个都想不到。 AI也是,这是全新的物种,全新的媒介。 所以,《理解媒介》这本书给我最大的启发是,别用后视镜看AI。 别问比如说“AI能不能替代我的工作”。 真正的问题应该是,“因为AI的存在,什么以前不可能的事情现在变得可能了”。 第一个问题会让你焦虑,第二个问题会让你兴奋。 而且,我觉得,第二个问题才是对的问题。 6.《反脆弱》 塔勒布这个人,怎么说呢,他的书看第一遍会觉得他特别傲慢,看第二遍会觉得他说得真对,看第三遍会觉得他特么就是个天才。 《反脆弱》这本书我真的在不同的阶段翻回去看了无数次。 核心概念就一个。有些东西,不仅不怕波动和冲击,反而从中受益。塔勒布管这叫反脆弱,Antifragile。他说,脆弱的反面不是坚固。 一个杯子掉在地上碎了,这是脆弱,你用钢做了个杯子,掉地上不碎,这是坚固。 但反脆弱是什么,是这个杯子每次摔一下,就变得更结实。 在AI时代,反脆弱,变得太重要了。 AI行业的变化速度,大家也都知道,去年的版本答案,今年可能就被淘汰了,你三个月前学的那个工作流,现在模型升级了,也不需要了。 在这种级别的不确定性面前,追求稳定和确定性是徒劳的。 你没办法预测三个月后AI会进化到什么程度,你没办法赌哪个模型会赢,你没办法确定今天学的技巧明天还有没有用。 而塔勒布给了一个答案,杠铃策略。 一头极度保守,守住你的底线和基本盘,另一头极度激进,拿出一小部分资源去做高风险高回报的尝试,中间那些看似稳妥其实风险最大的东西,不要碰。 翻译成AI时代的人话就是,你的基本盘是你的底层能力,比如社交能力、表达能力、系统思维、品味、领域专长等等,这些东西不会过期。 然后你拿出一部分的精力,疯狂去试各种新模型、新工具、新玩法,试错成本很低但一旦押中回报巨大。 但千万别把全部身家压在比如精通某一个特定AI工具这种破事上面。 因为那就是杠铃的中间段,看起来安全,其实一个版本更新就给你归零了。 比如说Claude Code是我现在的主力工具,我用它非常深。 但如果明天出了一个更好的东西,我会毫不犹豫地切换,因为我的核心竞争力根本不在会用Claude Code这种破事上,是在那些Claude Code替代不了的东西上面。 这就是反脆弱。 从每一次变化中获益,而不是被变化淘汰。 7.《一生的旅程》 我超级喜欢的一本自传,来自迪士尼前CEO罗伯特·艾格。 他在这本书里聊了大量关于领导力的方法和原则,怎么聚焦优先级、怎么在信息不完备的情况下做决断、怎么管理创意型人才、怎么在巨大的不确定性中带着团队往前走。 我第一次读的时候觉得,这是一本给CEO和高管看的书,跟我关系不大。 后来AI发展越来越强,Agent什么全都冒出来了之后,我的想法变了。 因为AI时代有一个特别深刻的变化,它把每一个人都变成了管理者。 以前,你是一个执行者,老板给你一个任务,你自己动手做完,你的核心能力是执行力,手速快、细节准、产出稳定。 而现在,你打开Claude Code,你的工作状态变了。 你不再需要自己动手写代码了,你变成了一个在指挥AI写代码的人,你要给方向、定标准、做取舍、看结果、给反馈。 这就是管理。 你可能还是一个普通的个体贡献者,你可能手底下没有一个人。但你每天的工作状态,其实已经变成了一个管理者,你在管理一个AI团队。 而管理这件事,是有方法论的。 艾格在书里聊了非常非常多的领导力原则,但对我在AI协作上影响最大的有三个。 第一个,聚焦。 艾格刚当上迪士尼CEO的时候,公司一团乱麻,到处都是问题。但他做的第一件事不是到处灭火,因为那些火太多了,你根本灭不完,他上来只定了三个战略优先级。所有不在这三个优先级里的事情,不管看起来多紧急,都排在后面。后面这三件事完成之后,那些火,全部自己消失了。 第二个,在不确定中做决断。 艾格收购皮克斯的时候,价格是74亿美金,这在当时是一个超级疯狂的数字。董事会里有很多人反对,但艾格力排众议,拍板了,执行了。 后来证明,这是迪士尼历史上最成功的收购之一。 跟AI协作的时候,你会频繁地面临这种不确定性,你必须得经常在信息不完备的情况下快速判断,选一个方向,往前推。 等所有信息都齐了再做决定的人,在AI时代会被快速迭代的人甩在后面。 第三个,管理创意型人才。 这个对我启发最大,艾格管理过的人里面有乔布斯、有约翰·拉塞特、有凯文·费奇,全是超级创意人才。 他的管理方式呢,不会事无巨细地控制他们,而是给一个清晰的方向和约束框架,然后在这个框架里给他们最大的自由度。 你看这个逻辑像不像Harness。 AI就是你的创意型人才。它能力极强,但需要引导。你管它管得太细,它就变成了一个只会听命令的打字机。你放手太多,它就开始自由发挥到你认不出来。 好的领导者知道那个度在哪里。 从执行者变成领导者,这是AI时代对每个人最大的身份转变。 艾格这本书,我觉得是最好的领导力实战手册之一。 8.《千面英雄》 这本书我想了很久要不要放上来,想了想,最后还是放了吧。 因为我觉得AI已经很强了,但是很多人,在讲故事这件事上,还是没有那么的擅长,尤其是故事的节奏这一块。 而讲故事的能力,是我觉得未来特别重要的一个能力。 这本书的作者叫约瑟夫·坎贝尔,是一个神话学家。 坎贝尔花了一辈子的时间研究全世界的神话和民间故事,最后发现了一个让很多人非常惊讶的规律,就是,全世界几乎所有文化的英雄故事,底层结构都是一样的。 他管这个结构叫英雄之旅,Hero's Journey。 一个普通人,被召唤去冒险,跨过一个门槛进入未知世界,经历考验,遇到导师,面对最大的恐惧,获得宝物,然后带着变化回到日常世界。 你可以想一想,《指环王》、《星球大战》、《哈利波特》啥的,全部都是这个结构,漫威的很多也都是。 《千面英雄》就是我认为最适合大家学习如何讲好一个故事的超级有用的书。 把信息变成故事、把数据变成叙事、把产品变成意义的能力。 就是我认为这个AI时代,最值钱的能力之一。 9.《第一哲学沉思集》 来自笛卡尔的神作。 这可能是今天这个书单里看起来最学术的一本,但说实话,我觉得它反而是最贴近当下的一本。 笛卡尔在这本书里做了一件事,极其简单但极其暴力,他决定怀疑一切。 他怀疑自己的感官是不是在骗他,怀疑外在世界是不是真的存在,怀疑自己是不是在做梦,甚至怀疑一加一是不是真的等于二。 他把所有能怀疑的东西全部怀疑了一遍,然后发现,在所有东西都被怀疑掉之后,有一个东西怀疑不掉。 那就是“我在怀疑”这个行为本身。 我在怀疑,所以我在思考。 我在思考,所以我存在。 所以,我思故我在。 怀疑怀疑的怀疑。 我自己在做AI内容的时候,有一条铁律,AI告诉你的任何具体事实,你都要去验证。 但除了这条之外,还有一条更底层的习惯,我会定期停下来问自己,我现在做的这件事,我为什么觉得它是对的?是因为我真的想清楚了,还是因为我已经做了太久,惯性太大,停不下来了? 坦率的讲,这种自我审视是痛苦的,因为有时候答案是后者。 但这个能力本身,就是你作为一个人最不可被替代的部分。 这层怀疑不是让你变成一个什么都不信的虚无主义者。 恰恰相反,它是让你的所有信念都建立在更坚实的地基上。 因为经过怀疑之后还能站住的东西,才是真正靠得住的东西。 10.《毛泽东选集》 我心中的Top 1,神中神。 很多人对这本书有刻板印象,觉得它是政治读物。 但是如果你真的去读了,你就是会发现,这可能是全世界都为数不多的最顶级的战略思维教材。 你对这个世界的一切疑惑,几乎都可以在毛选里找到答案。 “星星之火,可以燎原。” “世间一切事物中,人是第一个可宝贵的。” “你对于某个问题没有调查,就停止你对于某个问题的发言权。” “什么叫问题?问题就是事物的矛盾。哪里有没有解决的矛盾,哪里就有问题。既有问题,你总得赞成一方面,反对另一方面,你就得把问题提出来。提出问题,首先就要对于问题即矛盾的两个基本方面加以大略的调查和研究,才能懂得矛盾的性质是什么,这就是发现问题的过程。大略的调查和研究可以发现问题,提出问题,但是还不能解决问题。要解决问题,还须做系统的周密的调查工作和研究工作,这就是分析的过程。” “看它的过去,就可以知道它的现在;看它的过去和现在,就可以知道它的将来。” “读书是学习,使用也是学习,而且是更重要的学习。” 字字珠玑,里面很多很多内容,都让我醍醐灌顶。 无脑去读就对了。 ## 写在最后 这10本书,我觉得囊括了很多东西了。 这十本书,从1950年的控制论,到1964年的传播学,到1994年的复杂系统,到几百年前的哲学,到中国近现代的语录。 没有一本是关于AI的。 但它们加在一起,构成了一个理解AI、使用AI、在AI时代活得好的底层方法论。 或者说,我们生而为人,究竟该如何思考、如何生活。 这些底层能力,不会因为模型升级而过期,不会因为工具迭代而失效。 因为它们从来就不是关于AI的。 它们。 是关于人的。

译卡兹克分享10本对理解AI极有帮助的书,但无一直接关于AI技术。他强调决定AI使用水平的是底层能力,而非工具技巧。书单包括:凯文·凯利《失控》(1994年,核心概念“涌现”——大量简单个体协作产生复杂智能);维纳《人有人的用处》(1950年控制论之父提出“反馈”是人机协作核心);梅多斯《系统之美》(警惕“舍本逐末”——用AI替代思考导致能力存量流失);罗斯林《事实》(用数据思考避免情绪化决策);麦克卢汉《理解媒介》(1964年“媒介即信息”,反对用后视镜看AI);以及塔勒布《反脆弱》等。

swyx@swyx · 6月18日53

my notes from the @midjourney medical launch - @Scobleizer compared this to the original iPhone and Tesla launches (that he was also front row for) - find you a man who looks at you like @bryan_johnson was 😍 ing for @DavidSHolz - see @iScienceLuvr tweet linked for Nature paper - reminds me of our @biohub episodes: better science starts with better data, and that means better imaging - people asking "but wen FDA?" are so small minded. we will do the easy stuff, then we'll do the harder stuff. roll up your sleeves and help or just be patient. - when you have genuinely better tech+mission, all the other hurdles just sort of fall away/figure themselves out: business model, regulatory approval, hiring, marketing, confusion over what to do - this was just the first of 8 side project launches MJ has planned this year - this is what technological ambition looks like: not 10% better, not 2x better, but 40-100x better in every dimension - how are we getting this level of innovation and ambition out of a $10m/yr research budget and whats wrong with the way we use R&D in every other megacorp/goverment/frontier lab? - how has $BFLY stock not mooned yet, this thing just had its ChatGPT moment thank you to L for letting me into what I believe is going to be the top 10 most important launches i'll ever see live.

译swyx 记录 Midjourney 医疗产品发布,与会者将其比作初代 iPhone 和特斯拉发布。该产品旨在将医学成像质量提升 40-100 倍,实现“扫描器官像称体重”。Midjourney 仅以每年 1000 万美元研发预算支撑这一创新,质疑其他机构的研发效率。今年 MJ 另有 7 个副项目计划发布。Nature 论文及 biohub 播客佐证更好数据驱动更好科学。swyx 认为技术+使命足够强,监管等障碍会自行解决。

Berryxia.AI@berryxia · 6月18日40

OpenAI 现在是新模型GPT-5.6 迟迟不能及时发布。 靠在Codex 5.6 疯狂重置额度来做用户留存😄 不也是一个不错的办法,对于用户来说也挺好。 毕竟叼毛Claude 可不会给你这种甜果吃啊~

Rohan Paul@rohanpaul_ai · 6月18日62

Anthropic' Dario Amodei on delaying Mythos release. "We have suffered enormously commercially from not releasing this model. This model has incredibly accelerated research within Anthropic and production in next models. It would do the same in the outside world if we were to release it. This has hurt us enormously commercially." ---- From "Bloomberg Originals" YouTube channel, (link in comment)

译“我们因为不发布这个模型遭受了巨大的商业损失。这个模型在Anthropic内部极大地加速了研究以及后续模型的开发。如果我们将其发布,它也会在外部世界起到同样的作用。这使我们在商业上遭受了巨大的损失。”

Alibaba Cloud@alibaba_cloud · 6月18日31

Disrupting GenAI Costs: Alibaba Cloud's Strategy. Takahito Naito (Managing Executive Officer, CyberAgent) and Takeshi Kurita (Regional Manager of Japan and Korea, Alibaba Cloud) discuss the strategic utilization and future of enterprise AI models. 👉 https://xtech.nikkei.com/atcl/nxt/special/18/00001/060300084/ #AlibabaCloud #CyberAgent #CloudComputing #GenerativeAI #Qwen #AgenticCloud

译颠覆GenAI成本:阿里云的战略。 Takahito Naito(CyberAgent董事总经理)和Takeshi Kurita(阿里云日本韩国区域经理)讨论企业AI模型的战略利用与未来。 👉 https://xtech.nikkei.com/atcl/nxt/special/18/00001/060300084/ #AlibabaCloud #CyberAgent #CloudComputing #GenerativeAI #Qwen #AgenticCloud

Berryxia.AI@berryxia · 6月18日19

卧槽~~ 这根本用不完啊! 真是便宜啊!我接到了Bloome 里面各种音影视频文本文件一股脑搞进去,这么久才花费这么点钱。。 并且日常使用做各种我需要的任务都可以帮我搞定😄

Ethan Mollick@emollick · 6月18日39

There is a ton of money riding on the hope that the exponential curve the Big Three Labs are on will end soon If that happens, small and open models become viable, businesses get time to react, costs drop & the world gets weirder more slowly. But that isn’t happening so far.

译有大量资金押注三大实验室的指数曲线即将结束 如果发生,小模型和开源模型将变得可行,企业有时间应对,成本下降,世界变化更慢。 但迄今为止,这种情况并未发生。

meng shao@shao__meng · 6月18日52

Codex Automations 的内外双循环 两类上下文 · 任务前上下文:历史、事实、约束、关系、既有决策,来源有检索、工具、记忆 · 任务后上下文:保留、修改、删除、发送、搁置,来源有人工审阅行为 任务前上下文决定第一次能不能写对;任务后上下文揭示什么才算「对」。双循环架构,就是分别系统化这两类信息。 # 内循环:把上下文带进任务 内循环负责:要不要回 → 找什么 → 怎么写 → 怎么验 → 产出可审草稿。 三个要点: 1. 检索即写作 好回复依赖相似邮件、半年前的决定、项目状态、权威来源等。目标不是搜全,而是找到最小、足够让回复准确且具体的信息集。 2. 工作流可固定,也可智能体化 既可以是「拉信 → 过滤 → 分类 → 起草 → 校验」的固定流程,也可以是「每天早上 9 点为我需要回复的邮件建草稿」这类自然语言指令,由 Codex 自行决定步骤。关键不在形式,而在检索是否内嵌于写作。 3. 动作可逆 只建草稿,不自动发送。审阅前保存:提议回复、来源、提示词与写作指引版本。没有这层记录,审阅只是轶事;有了,审阅才是可复用的证据。 # 外循环:从审阅中回收上下文 外循环在审阅之后启动,先看结果类型: · 原样发送 → 草稿有效 · 改后发送 → 最有价值的 before/after · 删除 → 可能写错,也可能本不必回(难判) · 搁置 → 信息不足,不宜过度解读 即使已发送,也只记录「你接受了什么」,不代表对方满意或任务完成;真正效果可能在后续往来里才显现。但审阅本身已是写稿时不存在的证据。 草稿与终稿之差 = 证据,不等于教训。 · 开头变短 → 可能是写作偏好 · 补了事实 → 可能搜错地方 · 删掉承诺 → 可能需要新的校验规则 · 整段重写 → 可能是应保留的人类判断 外环的真正工作:读懂 diff 的含义,而不是把每次修改都写进 prompt。 # 外循环如何改进内环 外循环只问一个问题:下次怎样能更接近你第一次就满意的版本? 答案可能是:写作指引、新数据源、新检索步骤、对「 unsupported commitments 」的检查、更早交给你人工处理——不必每条 edit 都变成规则。 实践上: · 经你批准的教训,放进简单 markdown · 外环提议更新;你决定采纳 · 内环下次起草前读取该文件 今天纠正的,变成明天运行的上下文——这是外环对内环的闭环。 # 双循环,双时钟 · 内循环:快(如每 2 小时),快响应、低延迟 · 外循环:慢(日末 / 满 N 条审阅 / 每周),太频 → 从个案过拟合;从不跑 → 修正被遗忘 内外循环速度刻意错开:内循环服务即时效率,外循环服务模式与稳定改进。 同一结构可用于:邮件、deck、报告、简报、issue 分诊等——凡是有「起草 → 人审 → 发送/修改/丢弃」的流程,都适用。

译邵猛详解 Codex Automations 的双循环架构:内循环负责将上下文带入任务,通过“检索即写作”、可逆动作(只建草稿不自动发送)等原则快速产出可审草稿;外循环在人工审阅后启动,通过草稿与终稿的 diff 提取证据,区分修改类型(写作偏好、事实补漏、承诺删除等),将经批准的教训写入 Markdown 供内循环下次使用。双循环速度错开:内循环快(如每 2 小时),外循环慢(日末/满 N 条审阅/每周),平衡即时效率与模式改进。适用于任何“起草→人审→发送/修改”的流程。

Noam Brown@polynoamial · 6月18日66

I'm always thrilled to have more Noams at @OpenAI, but I'm especially thrilled to welcome @NoamShazeer!

译Noam Shazeer 宣布加入 OpenAI,称离开谷歌是艰难决定,但对谷歌团队深感自豪。Noam Brown 对此表示特别激动。

Andrew Milich@milichab · 6月18日15

Try Grok Build 0.1 on code review

译尝试在代码审查中使用 Grok Build 0.1

DogeDesigner@cb_doge · 6月18日15

Grok Imagine 1.5 is so gooood!! 🔥

译Grok Imagine 1.5 太棒了!! 🔥

宝玉@dotey · 6月18日50

这篇文章写的有点玄乎,估计是为了蹭现在流行的 Loop Engineering 的概念。 核心内容是两个循环:内循环和外循环 所谓内循环,就是干活的定时任务,每 2 小时检查下有没有新邮件,如果有邮件,就去自动检索相关上下文,自动帮你写个草稿,但是不发送,让你自己修改后发送。 所谓外循环,就是一个自进化自学习的 Skill,每次你对 AI 写的草稿修改,都根据修改记录去优化你的 Skill,让它下次能写的更好。 这有点像我以前介绍过的写作风格 Skill,你可以把自己的文章提炼出一个写作风格 Skill,然后先用它生成,生成完了修改,修改完了让 Agent 根据你修改的内容去完善写作风格 Skill,越来越懂你。 我当时是手动做,他这样做成一个自动化循环应该会更好一点。

译一篇介绍AI自动回复邮件的“内循环”与“外循环”设计的文章。内循环是定时任务每2小时检查新邮件,自动检索相关上下文生成草稿但不发送,供用户手动修改后发出;外循环则是自进化的Skill,每次用户对草稿的修改都会被Agent记录,用于不断优化写作风格Skill,使其生成内容更符合用户习惯。作者类比了自己以前手动提炼写作风格Skill的做法,指出该方案将迭代过程自动化,形成持续改进的闭环。

elvis@omarsar0 · 6月18日70

You can only truly get this level of output when using orchestrator agents that can coordinate multiple agents across projects. Build your own orchestration layer now. And own it.

译金融科技公司 Block 自建内部 AI 系统 Builderbot,可跨整个代码库协调多个智能体。工程师在 Slack 中标记后,系统自动研究、规划并交付。当前日处理 20 万次操作,每周合并 1500 个 pull request,贡献了 Block 全部生产代码变更的 15%,将原需数月的流程缩短至数天。DAIR.AI 创始人 Elvis Saravia 强调,只有通过编排层协调多个智能体才能实现此类输出,建议团队自建编排层。

Ethan Mollick@emollick · 6月18日43

Big issue with AI strategies at big companies which realized the importance of AI last year (which is only a small subset, most are still not moving fast) is that, in the best case, they developed their strategy in late 2025, before the agentic revolution Things changed since...

译大型公司AI策略的一个大问题是,那些去年意识到AI重要性的公司(实际上只是很小一部分,大多数仍然行动缓慢),最多是在2025年底、智能体革命之前制定了他们的策略 自此,情况已变...

Chubby♨️@kimmonismus · 6月18日48

All the major news outlets agree: The biggest winner in the Anthropic controversy is open source. And I wholeheartedly agree. I said it a few days ago, and I'll say it again: it's the biggest PR win for open source ever. Whether it's Bloomberg, Fortune, or CNBC: the consensus is clear: "Making the model open means that companies, governments or organizations with sufficient hardware can run it locally, and never have to worry about it being yanked on a whim." (Bloomberg) The reason is as simple as it is straightforward: Companies and entire alliances of states that have had their access cut off overnight will look for a sovereign solution that makes them relatively insensitive to shutdowns. By far the most significant and powerful open-source models come from China. This has, in effect, done China a great favor, probably unintentionally. Open source is essentially a lifeline, the opportunity to continue participating in this revolution with the assurance of independence. That's why the GLM 5.2 release was so important and came at precisely the right time. Open source is the solution.

译多家主流媒体(Bloomberg、Fortune、CNBC)一致认为,Anthropic争议的最大赢家是开源。Bloomberg指出,开源模型可本地运行,无需担心被随意撤下。被切断访问的企业和国家联盟会寻求主权解决方案,而目前最强大的开源模型来自中国,这无意中利好中国。推文认为GLM 5.2发布恰逢其时,开源成为保障独立参与AI革命的关键。

fofr@fofrAI · 6月18日24

I don’t know why but my first thought was an AI powered etch-a-sketch

译Midjourney 将于明天(周三 6/17)下午 6 点 PT 公布首个硬件项目,届时在旧金山举办线下发布活动并直播,还有少量现场名额。作者表示第一反应是“AI 驱动的儿童画板”。

向阳乔木@vista8 · 6月18日37

高风亮节,这个操作赚口碑,但这些数据会不会用来训练?

elvis@omarsar0 · 6月18日60

Highly-recommended reading! After using /loops & /goal throughout my projects, I believe that verifiers and robust guardrails are imperative to get current/future coding agents to work right. You can't just YOLO your way with blind autonomous loops. It doesn't work!

译Rahul 指出,fable+ 类模型本质是英语→代码解释器,Fable 5 最差。diff 大小按风险管控:高风险区(身份/数据/网络/资金)用小 diff,可经验验证代码用大 diff。软件交付速度取决于审查/合并能力而非 PR 生成,瓶颈在 lint、测试、CI、影子验证。智能体需深度理解全栈,风险优先级为安全>正确性>性能。复杂性成本变化,可能值得多维护 50% 代码换 5% 性能提升。低风险时将代码块作黑盒仅做经验验证。逻辑逐行审查成本高,只用于关键处。更快迭代需借助权限 opt-in、影子模式等护栏。

DogeDesigner@cb_doge · 6月18日48

"My favorite enterprise AI service is Cursor. It is an AI coder & every one of our engineers, 100% is now assisted by AI coders & our productivity has gone up incredibly. These companies are some of the fastest-growing companies in world & they address enterprise" — Jensen Huang

译"我最喜欢的企业 AI 服务是 Cursor。它是一个 AI 编程器,我们的每一位工程师,100% 现在都由 AI 编程器辅助,我们的生产力有了难以置信的提升。这些公司是全世界增长最快的公司之一,而且它们解决企业需求。" ——黄仁勋(Jensen Huang)

elvis@omarsar0 · 6月17日29

Offload tasks to AI, but don't forget to keep learning. I find this /teach skill super useful to learn *anything*. Great for beginners or advanced learners.

译将任务外包给AI,但不要忘记继续学习。 我发现这个/teach技能对于学习任何东西都非常有用。 非常适合初学者或高级学习者。

Chubby♨️@kimmonismus · 6月17日34

GLM-5.2 max is currently the third best model available, across both open and proprietary options. And that's fantastic. Open source is fundamentally important and must continue to hold a strong position so that everyone has open alternatives. And I say that with conviction.

译GLM-5.2 max 目前是可用模型中第三佳的,无论开放还是闭源选项。 这非常棒。开源至关重要,必须继续保持强势地位,让每个人都有开放的替代方案。我坚信这一点。

Ethan Mollick@emollick · 6月17日56

Anyone who thinks AI interfaces (chatbots, Codex, Code, NotebookLM, etc) are intuitive should spend some time explaining how to use them to three other people. I promise you will realize that there a dozen little tricks and traps to getting a good answer & that act as roadblocks.

译任何人认为AI界面(聊天机器人、Codex、Code、NotebookLM等)是直观的,都应该花点时间向另外三个人解释如何使用它们。我保证你会意识到,要获得好的答案,有十几个小技巧和陷阱,并且这些是障碍。

Nathan Lambert@natolambert · 6月17日28

I was not ready for this PPO vs GRPO debate. Here we go again. The truth is just that policy gradient good.

译我还没准备好面对这场PPO vs GRPO的辩论。又是老调重弹。事实就是策略梯度好。

Emad@EMostaque · 6月17日54

Important to note @Zai_org train on @Huawei Ascend chips, no NVIDA (!) So you have frontier -3 months on a fully Chinese stack, 90% cheaper. Would estimate the total cost of this to be $25m, largely post training (80%) @Zai_org market cap now nearly $100b, $$s in open source!

译值得注意的是 @Zai_org 在 @Huawei Ascend 芯片上训练,没有 NVIDIA (!) 因此你拥有前沿 -3 个月,完全中国堆栈,便宜 90%。 我估计总成本为 2500 万美元,主要在后训练(80%) @Zai_org 市值现在接近 1000 亿美元,$$ 在开源中!

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月19日
03:47
Chubby♨️@kimmonismus
52
Elon Musk表示,Anthropic在基准测试上表现不错,但按真正实用性衡量,甚至Q1都令人印象深刻;其专注于最大化有用智能,这不在基准测试中体现,但体现在收入中。Kim感叹这不在他的预期之内。

Elon Musk: @jietang @teortaxesTex On benchmarks, yes, but as measured by true usefulness even Q1 would be very impressive. Anthropi...

Anthropic大佬观点
02:47
Chubby♨️@kimmonismus
32
zAI(发布GLM-5.2的公司)创始人表示,Mythos级模型将在2027年第一季度前发布。 换句话说:他相信开源不会落后前沿实验室七个月,而是会迎头赶上。 这将变得非常有趣!

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态
02:22
Ethan Mollick@emollick
44
训练前沿开放权重模型是否存在盈利的商业模式? 其他人可以像你一样廉价地托管、微调、咨询等。没有辅助产品销售,而且与大多数开源工作相比,其制作成本极其高昂。
大佬观点开源生态
01:57
François Chollet@fchollet
48
当我玩即时战略游戏时,我通常会用资源利用率来思考策略。例如,任何具有单位生命值被动回复机制的游戏中,满血单位都代表着资源浪费(因为这段时间本可以回复生命,所以实际处于落后状态)。 如今,如果你为固定价格代理编码订阅付费,任何一周低于周token配额则同样意味着资源浪费。请善用你的token回复机制。
智能体大佬观点编码
01:22
swyx@swyx
37
今天完全无提示的惊喜时刻--让 @DevinAI 为我们制作一张 @tbpn 风格的突发新闻公告卡,用于明天 AIEWF 演讲者阵容发布,我本以为它会在高度视觉化的任务上失败。 结果它一次性搞定了整个活儿。

Ryan Carson: @theo Honestly just use Devin. It's really really good now

智能体大佬观点编码
00:25
Noam Brown@polynoamial
20
Kevin 是报道 AI 的最佳记者之一。我特别欣赏他花时间*使用*前沿 AI,深入了解其能力与局限。我期待他接下来的工作!

Kevin Roose: http://x.com/i/article/2067617306394370048

OpenAI大佬观点
00:21
Ethan Mollick@emollick
26
在各大实验室近期大规模招聘的背景下,且由于偶尔有人问起,或许值得重申:我不从任何AI实验室拿钱。我也不为任何我写的内容接受企业赞助,无论是在这里还是Substack等平台。
大佬观点现象/趋势
6月18日
23:54
Deedy@deedydas
36
Midjourney的路线图一直都是公开的。
图像生成大佬观点
23:22
宝玉@dotey
18
@jietang 回复 @elonmusk 和 @teortaxesTex:"不会花那么久。" 主推文期待早日看到 Mythos 级别的开源模型👍

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态
22:51
Ethan Mollick@emollick
56
有意思的是,Google 不再拥有公开的前沿模型。他们有一个非常好的 flash 模型,但如果没有好的前沿协调器,一个非常好的 flash 模型也无法完成前沿工作。 我确信这种情况很快就会改变,但 Gemini 3.1 Pro 目前明显落后。
Google大佬观点
22:49
jason@jxnlco
17
你自以为是满级 Codex 玩家,直到和 @dimitrikennedy 交谈,才意识到你只活在 2026 年,而他活在 2030 年。
大佬观点编码
22:48
Emad@EMostaque
26
如果一个中国实验室发布了一个在基准测试和感受上击败Fable的开源模型,你会如何改变你的先验?
大佬观点
21:20
DogeDesigner@cb_doge
42
SpaceX垂直整合AI,Starship载重10倍,Cursor营收60亿

推文将SpaceX描述为唯一垂直整合AI公司,从芯片到系统全覆盖。同时指出Cursor是当前最重要的AI编程智能体,编码速度和效果领先业界,营收从今年初的10亿美元飙升至预期退出时的60亿美元,增长呈病毒式扩散。此外,Starship作为首款完全可重复使用火箭,可承载以往10倍重量的载荷,将支持新一代通信卫星并最终实现太空数据中心部署。

大佬观点行业动态
18:16
fofr@fofrAI
14
midjourney 正在构建 v1 高分辨率大脑扫描仪,而 5 年后,我们都将在租赁的城邦中提示我们模拟自我的智能体。
图像生成大佬观点
13:45
jason@jxnlco
11
我其实很自豪这个标题卡片是AI生成的,但个人觉得它品味还算不错。

jason: http://x.com/i/article/2066964446086676480

图像生成大佬观点
13:44
Berryxia.AI@berryxia
70
Vivek Nair 爆文《How to Be Good at Research?》解读:真正的研究是 RL 型而非 SFT 型

Vivek Nair 文章批评多数人只“逆向工程”研究外表(SFT 型),而非自己选题(RL 型)。AI 信息流(推特、arXiv、群聊)系统性地制造共享想法,让人丧失判断力。他开药方:自己选题、读原文、写下来、盯着失败看。2026 年 AI 让 SFT 更舒适(AI 摘要、AI 设计实验),却削弱判断力锻炼。神经科学证明流畅解释易致假顿悟(2025 年 Nature Communications),且 AI 谄媚程度比人高近 50%(2026 年 3 月研究)。Karpathy 知识工作流以判断力为前提。文章强调研究复利需要本金——自己的问题。

大佬观点现象/趋势
13:43
数字生命卡兹克@Khazix0918
39
卡兹克推荐10本AI时代必读好书:无一直接谈AI,底层能力决定使用水平

卡兹克分享10本对理解AI极有帮助的书,但无一直接关于AI技术。他强调决定AI使用水平的是底层能力,而非工具技巧。书单包括:凯文·凯利《失控》(1994年,核心概念“涌现”——大量简单个体协作产生复杂智能);维纳《人有人的用处》(1950年控制论之父提出“反馈”是人机协作核心);梅多斯《系统之美》(警惕“舍本逐末”——用AI替代思考导致能力存量流失);罗斯林《事实》(用数据思考避免情绪化决策);麦克卢汉《理解媒介》(1964年“媒介即信息”,反对用后视镜看AI);以及塔勒布《反脆弱》等。

大佬观点现象/趋势
12:50
swyx@swyx
53
swyx 的 Midjourney 医疗产品发布现场笔记

swyx 记录 Midjourney 医疗产品发布,与会者将其比作初代 iPhone 和特斯拉发布。该产品旨在将医学成像质量提升 40-100 倍,实现“扫描器官像称体重”。Midjourney 仅以每年 1000 万美元研发预算支撑这一创新,质疑其他机构的研发效率。今年 MJ 另有 7 个副项目计划发布。Nature 论文及 biohub 播客佐证更好数据驱动更好科学。swyx 认为技术+使命足够强,监管等障碍会自行解决。

Latent.Space: [AINews Jun 17] Midjourney Medical: scan your organs like you step on a scale https://www.latent.space/p/ainews-midjourn...

多模态大佬观点
11:43
Berryxia.AI@berryxia
40
OpenAI靠Codex 5.6重置额度留用户

OpenAI 现在是新模型 GPT-5.6 迟迟不能及时发布。 靠在 Codex 5.6 疯狂重置额度来做用户留存😄 不也是一个不错的办法,对于用户来说也挺好。 毕竟叼毛 Claude 可不会给你这种甜果吃啊~

Tibo: Dearest gentle codexer. We did a sneaky double reset. Not only do you get a full reset on us. But you are also getting o...

OpenAI大佬观点编码
10:51
Rohan Paul@rohanpaul_ai
62
"我们因为不发布这个模型遭受了巨大的商业损失。这个模型在Anthropic内部极大地加速了研究以及后续模型的开发。如果我们将其发布,它也会在外部世界起到同样的作用。这使我们在商业上遭受了巨大的损失。"
Anthropic大佬观点
09:56
Alibaba Cloud@alibaba_cloud
31
颠覆GenAI成本:阿里云的战略。 Takahito Naito(CyberAgent董事总经理)和Takeshi Kurita(阿里云日本韩国区域经理)讨论企业AI模型的战略利用与未来。 👉 https://xtech.nikkei.com/atcl/nxt/special/18/00001/060300084/ #AlibabaCloud #CyberAgent #CloudComputing #GenerativeAI #Qwen #AgenticCloud
智能体大佬观点开源生态
09:43
Berryxia.AI@berryxia
19
卧槽~~ 这根本用不完啊! 真是便宜啊!我接到了Bloome 里面各种音影视频文本文件一股脑搞进去,这么久才花费这么点钱。。 并且日常使用做各种我需要的任务都可以帮我搞定😄
多模态大佬观点
08:49
Ethan Mollick@emollick
39
有大量资金押注三大实验室的指数曲线即将结束 如果发生,小模型和开源模型将变得可行,企业有时间应对,成本下降,世界变化更慢。 但迄今为止,这种情况并未发生。
大佬观点现象/趋势
08:49
meng shao@shao__meng
52
Codex Automations 的内外双循环

邵猛详解 Codex Automations 的双循环架构:内循环负责将上下文带入任务,通过“检索即写作”、可逆动作(只建草稿不自动发送)等原则快速产出可审草稿;外循环在人工审阅后启动,通过草稿与终稿的 diff 提取证据,区分修改类型(写作偏好、事实补漏、承诺删除等),将经批准的教训写入 Markdown 供内循环下次使用。双循环速度错开:内循环快(如每 2 小时),外循环慢(日末/满 N 条审阅/每周),平衡即时效率与模式改进。适用于任何“起草→人审→发送/修改”的流程。

Gabriel Chua: http://x.com/i/article/2067086994455601152

智能体大佬观点搜索
08:23
Noam Brown@polynoamial
66
Noam Shazeer 宣布加入 OpenAI,称离开谷歌是艰难决定,但对谷歌团队深感自豪。Noam Brown 对此表示特别激动。

Noam Shazeer: I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...

GoogleOpenAI大佬观点行业动态
07:44
Andrew Milich@milichab
15
尝试在代码审查中使用 Grok Build 0.1

Kilo: http://x.com/i/article/2067331577449791488

大佬观点编码
07:19
DogeDesigner@cb_doge
15
Grok Imagine 1.5 太棒了!! 🔥
xAI图像生成大佬观点
06:49
宝玉@dotey
50
AI邮件助手的内外循环:自进化写作风格

一篇介绍AI自动回复邮件的“内循环”与“外循环”设计的文章。内循环是定时任务每2小时检查新邮件,自动检索相关上下文生成草稿但不发送,供用户手动修改后发出;外循环则是自进化的Skill,每次用户对草稿的修改都会被Agent记录,用于不断优化写作风格Skill,使其生成内容更符合用户习惯。作者类比了自己以前手动提炼写作风格Skill的做法,指出该方案将迭代过程自动化,形成持续改进的闭环。

Gabriel Chua: http://x.com/i/article/2067086994455601152

智能体大佬观点
05:18
elvis@omarsar0
70
金融科技公司 Block 自建内部 AI 系统 Builderbot,可跨整个代码库协调多个智能体。工程师在 Slack 中标记后,系统自动研究、规划并交付。当前日处理 20 万次操作,每周合并 1500 个 pull request,贡献了 Block 全部生产代码变更的 15%,将原需数月的流程缩短至数天。DAIR.AI 创始人 Elvis Saravia 强调,只有通过编排层协调多个智能体才能实现此类输出,建议团队自建编排层。

Block: We built an internal AI system called Builderbot. It coordinates agents across our entire codebase. Engineers tag it in ...

智能体大佬观点编码部署/工程
04:48
Ethan Mollick@emollick
43
大型公司AI策略的一个大问题是,那些去年意识到AI重要性的公司(实际上只是很小一部分,大多数仍然行动缓慢),最多是在2025年底、智能体革命之前制定了他们的策略 自此,情况已变…
智能体大佬观点
04:42
Chubby♨️@kimmonismus
48
Anthropic风波最大赢家:开源,GLM 5.2发布正当时

多家主流媒体(Bloomberg、Fortune、CNBC)一致认为,Anthropic争议的最大赢家是开源。Bloomberg指出,开源模型可本地运行,无需担心被随意撤下。被切断访问的企业和国家联盟会寻求主权解决方案,而目前最强大的开源模型来自中国,这无意中利好中国。推文认为GLM 5.2发布恰逢其时,开源成为保障独立参与AI革命的关键。

大佬观点开源生态
03:06
fofr@fofrAI
24
Midjourney 将于明天(周三 6/17)下午 6 点 PT 公布首个硬件项目,届时在旧金山举办线下发布活动并直播,还有少量现场名额。作者表示第一反应是"AI 驱动的儿童画板"。

Midjourney: Midjourney will be announcing its first hardware project tomorrow (Wednesday 6/17) at 6pm PT. Stay tuned for a livestrea...

大佬观点
01:20
向阳乔木@vista8
37
高风亮节,这个操作赚口碑,但这些数据会不会用来训练?

Tibo: Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models. https://de...

OpenAI大佬观点开源生态
00:45
elvis@omarsar0
60
Rahul 指出,fable+ 类模型本质是英语→代码解释器,Fable 5 最差。diff 大小按风险管控:高风险区(身份/数据/网络/资金)用小 diff,可经验验证代码用大 diff。软件交付速度取决于审查/合并能力而非 PR 生成,瓶颈在 lint、测试、CI、影子验证。智能体需深度理解全栈,风险优先级为安全>正确性>性能。复杂性成本变化,可能值得多维护 50% 代码换 5% 性能提升。低风险时将代码块作黑盒仅做经验验证。逻辑逐行审查成本高,只用于关键处。更快迭代需借助权限 opt-in、影子模式等护栏。

rahul: 1. as a mental model it is more correct to think of fable+ class models as english -> code interpreters - converts your ...

智能体大佬观点编码部署/工程
00:16
DogeDesigner@cb_doge
48
"我最喜欢的企业 AI 服务是 Cursor。它是一个 AI 编程器,我们的每一位工程师,100% 现在都由 AI 编程器辅助,我们的生产力有了难以置信的提升。这些公司是全世界增长最快的公司之一,而且它们解决企业需求。" --黄仁勋(Jensen Huang)
大佬观点编码
6月17日
23:45
elvis@omarsar0
29
将任务外包给AI,但不要忘记继续学习。 我发现这个/teach技能对于学习任何东西都非常有用。 非常适合初学者或高级学习者。
大佬观点
22:27
Chubby♨️@kimmonismus
34
GLM-5.2 max 目前是可用模型中第三佳的,无论开放还是闭源选项。 这非常棒。开源至关重要,必须继续保持强势地位,让每个人都有开放的替代方案。我坚信这一点。
大佬观点
22:15
Ethan Mollick@emollick
56
任何人认为AI界面(聊天机器人、Codex、Code、NotebookLM等)是直观的,都应该花点时间向另外三个人解释如何使用它们。我保证你会意识到,要获得好的答案,有十几个小技巧和陷阱,并且这些是障碍。
大佬观点现象/趋势
21:45
Nathan Lambert@natolambert
28
我还没准备好面对这场PPO vs GRPO的辩论。又是老调重弹。事实就是策略梯度好。
大佬观点安全/对齐数据/训练
19:41
Emad@EMostaque
54
值得注意的是 @Zai_org 在 @Huawei Ascend 芯片上训练,没有 NVIDIA (!) 因此你拥有前沿 -3 个月,完全中国堆栈,便宜 90%。 我估计总成本为 2500 万美元,主要在后训练(80%) @Zai_org 市值现在接近 1000 亿美元,$$ 在开源中!

Zixuan Li: Finally, Artificial Analysis Intelligence Index concludes the GLM-5.2 release.

大佬观点开源生态行业动态
‹ 上一页
1…910111213…50
下一页 ›