AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2395 条
全部一手资讯X论文
标签「大佬观点」清除
Ethan Mollick@emollick · 4月30日59

One reason I don’t think “judgment” is going to be a distinctly human role in working with AI is that the most recent agentic models have gotten quite good at some types of judgment. You can’t do the kind of high complexity, long-run tasks that current AIs can do without it.

译我不认为“判断力”在与AI协作中将成为人类特有角色的一个原因是,最新的智能体模型已在某些类型的判断上表现得相当出色。若不具备这种判断力,你便无法完成当前AI所能处理的那种高度复杂、长期运行的任务。

阿绎 AYi@AYi_AInotes · 4月30日63

马斯克真的和OpenAI在法庭上开战了,这条77万浏览的帖子把这场审判包装成了人类存亡之战🫠🤣😆 我先拆穿一个最容易被忽略的细节, 视频里只有他过安检的镜头, 没有任何法庭作证的画面, 所有的发言都是从公开证词里摘出来再戏剧化加工的, 尽管如此,也丝毫不影响这件事的分量, 毕竟这件事已经不是两个亿万富翁的私人恩怨了, 应该算是人类历史上第一次, 在法庭上争夺AI的控制权, 还记得2015年他们一起创立OpenAI的时候, 说好的是非营利,开源,为了全人类的安全, 现在OpenAI变成了微软旗下的赚钱机器, 源代码全封闭,估值飙到了几千亿, 马斯克在庭上说,这不是偷一家慈善机构的问题, 这是给全世界所有慈善机构开了绿灯, 他警告AI可能在2027年超越人类智能, 如果落入不可靠的人手里,会带来人类灭绝级的风险, 虽然很多人骂他双标, 说他自己也在做xAI,也在加速AI发展, 但马斯克的逻辑我觉得其实蛮清晰的,他认为危险的从来不是AI本身, 是单一实体垄断了最强的AI, 他要做的是用xAI,SpaceX,Starlink,构建一个对抗垄断的堡垒, 甚至给人类留一个多行星的备份, 这里真的respec @elonmusk 🫡🫡🫡 所以这场官司的核心并不是谁对谁错, 而是关于三个至今没有答案的终极问题, 1️⃣ 我们要速度还是要安全, 2️⃣ 我们要开源透明还是闭源可控, 3️⃣AI的未来应该掌握在少数人手里,还是全人类手里, 我认为无论最后谁赢, 这场审判都会成为2026年科技史的转折点,因为它第一次把AI的治理问题,摆到了全人类的面前。

译马斯克起诉OpenAI,指控其背离非营利开源初心,沦为微软旗下封闭的盈利实体。他警告,若最强AI被单一不可靠实体垄断,可能在2027年前超越人类智能并带来生存风险。马斯克主张通过其旗下公司构建去中心化防御体系。案件核心矛盾聚焦于AI发展应追求速度还是安全、开源还是闭源、控制权归属少数或全人类三大议题。这场诉讼被视为首次将AI治理问题置于全球公众视野的关键转折点。

Sam Altman@sama · 4月29日46

feels like codex is having a chatgpt moment

译感觉Codex正在经历一个ChatGPT时刻

向阳乔木@vista8 · 4月29日29

已经灰度到,用上了,速度快到我震惊! 但我不理解,为什么网页要单独加一个Tab叫“识图模式”。 这样感觉很不自然,希望以后合并都所有的模式里? API调用不知道什么时候能识图,这对开发很重要。

译用户已体验新版AI识图功能,对其处理速度表示震惊。但质疑网页端为何将“识图模式”设为独立标签页,认为这种交互设计不自然,希望未来能整合到所有模式中。同时,用户关注API何时能支持识图功能,强调这对开发者至关重要。引用推文“Now, we see you. 👀”暗示了模型已具备视觉感知能力,是此次功能升级的核心背景。

向阳乔木@vista8 · 4月29日47

DeepSeek 的识图模式速度实在是太快了。 网页复刻还原度相当不错,这下前端开发就更好用了。 DeepSeek牛逼!

meng shao@shao__meng · 4月29日56

这两天在试用商汤刚开源的 SenseNova-U1,印象最深的不是 benchmark 分数,是它的架构方向。 现在的多模态模型大多还是"语言模型 + 视觉编码器 + VAE"拼起来的,视觉信息要先被翻译一道再进 LLM。 U1 用的 NEO-Unify 把翻译层直接拿掉了,语言和视觉跑在同一表征里。 所以它读图、想、画图,是在一次推理里完成的,不是分三步走。

译商汤开源的 SenseNova-U1 模型在架构上实现关键突破。传统多模态模型多采用“语言模型 + 视觉编码器 + VAE”的拼接方式,视觉信息需先翻译再输入 LLM。U1 基于 NEO-Unify 架构,直接移除翻译层,使语言和视觉在同一表征空间中运行。因此,模型能在单次推理中同步完成图像理解、推理和生成等任务,而非分步处理,提升了多模态交互的效率和连贯性。

Ethan Mollick@emollick · 4月29日68

Yes, just having students “use AI to study” hurts learning (a helpful assistant is not a tutor), but using AI prompted to act like a tutor, especially with teacher support, seems to have large positive effects on learning in randomized trials. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6423358

译是的,仅仅让学生“使用AI来学习”会损害学习效果(一个有用的助手并非导师),但在随机试验中,使用被提示扮演导师角色的AI,尤其是在教师支持下,似乎对学习产生了显著的积极影响。https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6423358

Greg Brockman@gdb · 4月29日38

terminal has been my primary interface to my computer for almost two decades. now it’s the Codex app.

译terminal 近二十年来一直是我操作电脑的主要界面。 现在换成了 Codex 应用。

歸藏(guizang.ai)@op7418 · 4月29日47

Moxt 是近期所有新的 Agent 产品里,我觉得最好的之一 ! 终于找时间写了一篇介绍。 如果你还在找一个 AI Native 的组织协作工具的话,我觉得可以试试。

译作者认为Moxt是近期新推出的Agent产品中表现最佳的工具之一,并专门撰文进行介绍。他建议,如果用户正在寻找一款AI原生的组织协作工具,可以尝试使用Moxt。该推荐整合了引用推文的关键信息,即Moxt作为一个AI原生工具,旨在通过AI Agent技术提升团队协作效率,其核心优势在于深度集成的AI能力。

Nathan Lambert@natolambert · 4月29日36

Let’s goooooooooo we are capybara’d up, thanks @Alibaba_Qwen, keep the models coming

译Let’s goooooooooo 我们准备好水豚模式了,感谢 @Alibaba_Qwen,继续推出新模型吧

Chubby♨️@kimmonismus · 4月29日34

Alphabet, Microsoft, Amazon, and Meta report earnings today. Microsoft has the easiest beat-and-run setup because the stock is already beaten down. Alphabet has the cleanest fundamental story (Cloud + TPU demand, especially with TPUv8). Meta and Amazon need to deliver more than a beat because they’re already up ~30% in a month. So my take is on google.

译Alphabet、Microsoft、Amazon和Meta今天公布财报。 Microsoft拥有最容易的超预期并上涨的条件,因为其股价已经被打压。 Alphabet拥有最清晰的基本面故事(云服务+TPU需求,尤其是TPUv8)。 Meta和Amazon需要提供超出预期的业绩,因为它们在一个月内已经上涨了约30%。 所以我的选择是谷歌。

阿绎 AYi@AYi_AInotes · 4月29日66

兄弟们,蚂蚁的这个新模型免费期是到4月30号, 趁着白嫖窗口期,我刚用Ling-2.6-1T跑了个硬核任务,推理速度快得惊人,质量也很顶🤯 让它帮我整理查理芒格的100个思维模型,它只用了40秒。 同样的prompt,DeepSeek V4 Pro跑了整整4分钟,速度快了整整6倍。 但这还不是最牛的地方, 最牛的是没有上来就直接甩给我一个100条的清单, 它写的第一句话是,100个思维模型这个说法,芒格本人从未明确列出过,这是后人归纳出来的象征性集合。 一个响应速度如此之快的模型,会主动停下来,先质疑你任务,进行自我思辨,这才是真正的推理能力,真正好用的大模型,不能只是跑得快🤣

译蚂蚁集团推出的Ling-2.6-1T模型在免费测试期表现突出,处理复杂任务速度可比竞品快6倍,并具备主动思辨能力。其核心优势在于极高的token效率,能将成本降至可比模型的四分之一,同时综合智能接近GPT-5.4非推理水平,实现了高智能与低生产成本的结合。该模型在SWE-bench、AIME26等生产相关评测中领先,擅长代码、Agent编排等实际应用。蚂蚁依托支付宝场景与海量数据,通过开放API策略推动行业竞争重点从刷榜转向生产落地。

Chubby♨️@kimmonismus · 4月29日33

USA and China: "Here is our new proto AGI model, that can cure cancer and automate reserach at never seen scale!" Europe: "eMojIs cAn bE bAd, tOO! (so we detect misusage of emojis 🤬)"

译美国和中国:“这是我们新的原型AGI模型,能够治愈癌症并以前所未有的规模自动化研究!” 欧洲:“表情符号也可能有害!(所以我们检测表情符号的滥用 🤬)”

ginobefun@hongming731 · 4月29日41

联想与连接是知识管理的本质,这个数据也增长得太快了 😱

译个人知识管理工具GBrain的数据量在短时间内快速增长,页面数从14,000激增至74,114。其核心价值在于117,855个关联链接,将人物、会议、公司、邮件等元素相互连接,使之成为一个基于联想运作的Memex系统,而非简单的文件柜。这种关联网络使用户能在短时间内追溯复杂的信息脉络,体现了万尼瓦尔·布什提出的“人类思维通过联想运作”的理念。该工具正被用于书籍研究,并将开源共享。

ginobefun@hongming731 · 4月29日72

分享创业公司的三大生存法则:差异化、专注与速度

译针对AI初创公司是否必须被大模型实验室收购的讨论,Cognition公司的经验表明,同行被收购反而会强化剩余独立公司的地位。独立公司在软件工程等动态领域拥有明确市场,客户重视模型灵活性。其成功关键在于三大法则:一是建立清晰差异化,如专注企业市场、加速全开发周期、解决复杂部署难题并保持模型独立;二是极致专注,在特定领域深挖边缘复杂性问题,做到实验室无法比拟;三是保持速度优势,利用小团队决策快、工具链高效和工程文化,通过快速迭代建立竞争壁垒。

ginobefun@hongming731 · 4月29日38

一款出色的个人 AI 助手应该做到以下几点: 1. 跨平台执行力:能无缝处理邮件、日历、Google Workspace,以及任何已接入 API 或 MCP 的服务。 2. 主动且靠谱:不仅是被动响应,还能稳定执行定时任务、事件触发器和自动跟进事项。 3. 超强记忆力:具备极佳的长期记忆,随着时间的推移能变得越来越“懂你”。 4. 开箱即用的多端体验:横跨网页与移动端,彻底告别繁琐的斜杠指令和手动配置。 5. 多模态无缝切换:在交流过程中,允许你随时在文字、语音、视频和实时通话之间自由切换。 6. 全渠道触达:就像联系真人朋友一样,你可以通过任何第三方通讯软件随时找到它。 7. 有趣的灵魂:自带个性和人设,让聊天沟通变得生动有趣。 但说实话,无论是 OpenClaw、Claude Code 还是 Codex——目前市面上还没有任何一款产品能完美做到以上这一切。

译一款出色的个人AI助手应具备七大核心能力:跨平台无缝执行邮件、日历及各类API/MCP服务;能主动可靠地处理定时任务与自动跟进;拥有优秀的长期记忆以更懂用户;提供无需复杂指令的开箱即用多端体验;支持在文字、语音、视频和实时通话间自由切换;可通过任何第三方通讯软件触达;并具备有趣的个性。然而,目前包括OpenClaw、Claude Code和Codex在内的产品,均未能完全满足所有这些标准。

Yuchen Jin@Yuchenj_UW · 4月29日14

“Claude is killing jobs. Software engineering is dying.” 50 bugs in Claude Code. 💀

译“Claude 正在扼杀工作。软件工程正在消亡。” Claude Code 中有 50 个漏洞。💀

阿绎 AYi@AYi_AInotes · 4月29日49

说实话,我认为Adobe和Claude的这次合作,真的算不上什么强强联合🤔 恰恰相反,我倒觉得这是Adobe在AI时代,第一次公开的战略投降。 它终于承认自己做不好AI了,所以把自己攒了三十年的工具库,打包成了Claude的后端工具箱🤣 官方演示里全是一键修图,自动改尺寸,套模板出海报这种低复杂度活。 真正靠创意吃饭的人,没有一个为此兴奋的。 看到Clemson足球创意总监Tyson也在吐槽,回复区全是一边倒的认同。 其实大家怕的不是AI,是Adobe又一次把所有功能,都塞进那个难用又死板的Firefly里😅😅😅 说不定未来你可能再也不用打开Photoshop了,你只需要在Claude里说一句话就可以完成修图设计等所有任务🎨 挺感慨的,那个曾经的创意工具霸主,不知不觉就变成了AI调度层里的一个普通插件🥹🥹🥹

译作者认为Adobe与Claude的合作并非强强联合,而是其在AI时代的公开战略投降,承认自身AI能力不足,转而将三十年积累的创意工具库打包成Claude的后端工具箱。官方演示聚焦于低复杂度任务,未能激发创意专业人士兴趣,行业反馈普遍失望。核心担忧在于Adobe可能将功能再次塞入体验不佳的Firefly框架,导致用户未来或仅需通过Claude对话即可完成设计,无需打开专业软件。这标志着Adobe正从创意工具霸主降级为AI工作流中的一个普通调度插件。

ginobefun@hongming731 · 4月29日61

结构化提示驱动开发(SPDD):让 AI 编码从个人提效走向团队规模化 原文:https://martinfowler.com/articles/structured-prompt-driven/ 团队用上 AI 编码助手之后,最先感受到的提速发生在个人层面。但交付速度的瓶颈从来就不在打字。把视野拉到从需求到上线的完整链路上,新的摩擦立刻浮现:模糊的需求被快速翻译成代码,误解也被同步放大;评审要消化的变更更多,质量更容易参差不齐;集成和测试问题增加,因为「生成出来」并不等于「真正对齐」;变更体量一大,生产风险也更难评估。局部快了,系统级吞吐却未必跟上。这就像买了一辆法拉利却开在泥泞乡道上,发动机再强,到达时间还是被路况决定。 Thoughtworks 内部 IT 团队由此走向了一套被称为「结构化提示驱动开发(SPDD)」的方法。它的核心主张是,把提示当作一等交付物来对待,纳入版本管理,可以被评审、被复用、被持续打磨。SPDD 由两个组件组成。 第一个组件是 REASONS 画布,一个由七个部分构成的提示结构,引导一份提示从意图走到设计再走到执行和治理。 - R 是 Requirements,明确要解决的问题和完成标准; - E 是 Entities,梳理领域实体及其关系; - A 是 Approach,给出解决思路; - S 是 Structure,说明变更落在系统中的哪个位置; - O 是 Operations,把策略拆成可执行的步骤; - N 是 Norms,沉淀通用工程规范; - S 是 Safeguards,划出不可妥协的边界。 这套结构强迫团队在写代码之前就把意图和约束讲清楚,把不确定性左移。 第二个组件是 SPDD 工作流,把提示和代码放在同一套工程纪律下。它的关键约束很简单,当现实和提示出现偏差时,先修提示,再改代码。落到工具层面,是一组叫 openspdd 的命令行命令: - /spdd-story 把大需求拆成符合 INVEST 原则的故事 - /spdd-analysis 提取领域关键词并扫描相关代码生成策略性分析, - /spdd-reasons-canvas 产出完整的七维度蓝图 - /spdd-generate 严格按画布生成代码 - /spdd-prompt-update 在需求变化时增量更新画布 - /spdd-sync 则把代码侧的重构反向同步回画布,让提示始终是当前代码的准确记录。 文章用一个计费引擎的增强案例完整走了一遍这套流程。开发者依次执行:从需求生成简化版用户故事,澄清核心逻辑和范围边界,跑分析命令拿到上下文,生成 REASONS 画布并审阅意图,再生成代码、跑接口测试。整个过程下来,意图对齐度据作者描述能达到 99% 左右。 SPDD 沉淀出三项核心技能。 - 抽象优先要求在生成代码之前先想清楚有哪些对象、它们如何协作、边界在哪里,否则 AI 会冲进实现细节而结构散掉。 - 对齐强调在写代码前就把要做什么和不做什么显式写出来,把规范和硬约束摆到台面上。 - 迭代评审则把 AI 辅助变成一个受控循环,避免一次性草稿式的产出。 同时作者也强调,SPDD 不是万能药。在规模化、标准化交付,以及高合规、强约束的场景里它最值钱;在救火热修复、探索性原型、一次性脚本,以及业务规则极度模糊的领域里,它的治理成本会显著超过收益。它的回报包括确定性、可追溯性、更快的评审、可解释性和更安全的演进,代价是心态转变、对前置抽象能力的要求,以及自动化工具链的搭建。 文章的结尾点出了它真正的精神所在。SPDD 提供的只是「招式」,真正的优势来自背后的元能力,包括抽象建模、系统化分析和对业务的整体理解。在 AI 时代,软件开发比拼的并非模型 IQ,而是工程师的认知带宽,是能否清晰思考、准确框定问题、坚决做出决策。正如 Hamming 所说,在科学里如果你知道自己在做什么,那你就不该在做这件事;在工程里如果你不知道自己在做什么,那你就不该在做这件事。

译Thoughtworks提出结构化提示驱动开发(SPDD),以解决AI编码助手带来的团队协作与系统交付瓶颈。该方法将提示视为一等交付物,通过REASONS画布(需求、实体、方法、结构、操作、规范、保障)在编码前明确意图与约束,并配套工具链支持从分析到生成的全流程。SPDD强调抽象优先、对齐和迭代评审,适用于规模化、高合规场景,能提升交付确定性与可追溯性,但其价值高度依赖团队的抽象建模与系统分析能力。

Sam Altman@sama · 4月29日23

wow y'all love 5.5 we should think of something nice to do to celebrate!

译哇,大家都很喜欢5.5版本 我们应该想点好主意来庆祝一下!

Chubby♨️@kimmonismus · 4月29日58

Sébastien Bubeck on the OpenAI Podcast: People think AI is only good at answering questions. OpenAI's internal agents are now asking questions so good that researchers are writing papers based on them. They're also finding and correcting mistakes in published work. His timeline for models doing everything human researchers do? 1-2 years.

译Sébastien Bubeck 在 OpenAI 播客中表示:人们认为 AI 只擅长回答问题。但 OpenAI 的内部智能体现在已能提出如此优质的问题,以至于研究人员正据此撰写论文。 它们还能发现并修正已发表作品中的错误。他预测模型能完成人类研究者所有工作的时限?1-2年。

Jeff Dean@JeffDean · 4月29日48

Google Translate is turning 20! 🎉. There are 20 fun facts and tips in the thread below. Translate is one of my favorite Google products because it brings us all closer together! I've been involved with a couple of things over the years. The first was our deployment of the initial system in 2006, which provided a huge leap forward in quality because it used a much larger 5-gram language model trained on trillions of words of text (indeed, probably the first trillion token language model training in the world: paper has some nice heads showing scaling-law-like quality improvement from scaling to more data/compute). See "Large Language Models in Machine Translation", Thorsten Brants, Ashok C. Popat, Peng Xu, Franz J. Och and Jeffrey Dean, https://aclanthology.org/D07-1090/ The second major collaboration was in 2016 when we moved Translate over from a statistical machine translation approach to using deep neural networks.  This approach relied on two key innovations.  The first was Google's work on Sequence-to-Sequence models (https://arxiv.org/abs/1409.3215).  The second was our development of TPUs, custom cups that improved the performance of inference for deep neural networks by 30-80X over existing CPUs and GPUs of the day (and reduced latency by 15-30X).  This made launching compute-intensive language model services like Translate feasible for hundreds of millions of users. See "In-Datacenter Performance Analysis of a Tensor Processing Unit",  Norman P. Jouppi et al.  https://arxiv.org/abs/1704.04760 GNMT paper: "Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation",  Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi, Wolfgang Macherey, Maxim Krikun, Yuan Cao, Qin Gao, Klaus Macherey, Jeff Klingner, Apurva Shah, Melvin Johnson, Xiaobing Liu, Łukasz Kaiser, Stephan Gouws, Yoshikiyo Kato, Taku Kudo, Hideto Kazawa, Keith Stevens, George Kurian, Nishant Patil, Wei Wang, Cliff Young, Jason Smith, Jason Riesa, Alex Rudnick, Oriol Vinyals, Greg Corrado, Macduff Hughes, and Jeffrey Dean, https://arxiv.org/abs/1609.08144 Most recently, we have advanced Translate further using Gemini models. Each of these advances relied on research that have major quality leaps over the existing status quo translation approaches, bringing better quality and connectedness to all of our Translate users! 🎉

译Google Translate迎来20周年,其发展依赖多次技术飞跃。2006年部署基于万亿词训练的5-gram语言模型,实现质量突破;2016年转向深度神经网络,结合Sequence-to-Sequence模型和TPUs,性能提升30-80倍、延迟降低15-30倍,使大规模服务成为可能;近期集成Gemini模型进一步优化。这些进步均基于前沿研究,每次都为翻译质量带来显著提升。作为Google机器学习工作的初始实验,Google Translate最常见翻译短语如“thank you”体现了其连接全球用户的使命。

DogeDesigner@cb_doge · 4月29日30

Scam Altman wants people to believe he runs OpenAI for love because he has no direct equity in OpenAI and made just $66,000 salary in 2024 But the real money is not inside OpenAI It sits outside in bets that can quietly benefit from OpenAI’s decisions He does not own OpenAI directly He makes money through outside companies instead and those companies can gain when OpenAI partners with them or boosts their value That makes it very hard to see where the money is really coming from His key side ventures 1. Helion Energy nuclear fusion One of the biggest investors Put in around $375M OpenAI signed a deal tied to it which helped lift its valuation 2. Stoke Space rocket company Tried to involve OpenAI in deals Even explored acquisition or control talks Family office investment link reported 3. Merge Labs brain computer interface Altman invested and sits on the board OpenAI also partnered with it 4. Y Combinator portfolio Hundreds of startup bets Some later did deals with OpenAI On paper it looks clean No equity no big salary In reality the upside sits outside.

译Sam Altman在OpenAI无直接股权且工资低廉,表面为爱运营。但真实收益来自外部投资,包括Helion Energy核聚变、Stoke Space火箭公司、Merge Labs脑机接口及Y Combinator投资组合。这些公司与OpenAI合作或交易时,价值提升,使Altman间接获益。这种安排掩盖了资金来源,使得利益流向难以追踪。

Chubby♨️@kimmonismus · 4月29日46

SandboxAQ spun out of Google, raised $950M+, and is backed by NVIDIA. Everyone is talking about LLMs. Almost nobody is talking about LQMs. Sandbox bet: Large Quantitative Models that simulate physics and chemistry to invent new drugs and materials. I talked to their GM of AI Simulation Nadia Harhen about why LQMs might matter more than LLMs for the physical world. Our newest (and second) Podcast-Episode of Superintelligence Podcast - out now! Link in comments

译SandboxAQ从谷歌分拆出来,筹集了超过9.5亿美元,并获得了英伟达的支持。 每个人都在谈论LLMs。 几乎没有人谈论LQMs。 Sandbox的赌注:通过模拟物理和化学的大型定量模型来发明新药物和新材料。 我与他们的AI模拟总经理Nadia Harhen讨论了为什么对于物理世界来说,LQMs可能比LLMs更重要。 我们最新(也是第二期)的《超级智能播客》节目现已发布!链接在评论中

OpenAI@OpenAI · 4月29日36

Earlier this month, an Erdős problem that had been open for 60 years was solved with help from GPT-5.4 Pro. What happens now that AI is getting good at math? OpenAI researchers @SebastienBubeck and @ErnestRyu join host @AndrewMayne to explain what changed and what it could mean for the future of research.

译本月早些时候,一个悬置60年的埃尔德什问题在GPT-5.4 Pro的协助下得以解决。 当人工智能开始擅长数学时,会发生什么? OpenAI研究员@SebastienBubeck和@ErnestRyu与主持人@AndrewMayne共同探讨了变革所在及其对未来研究的意义。

Ethan Mollick@emollick · 4月29日46

A big problem with all AI at work punditry right now is that it all rests on data from the pre-agentic era (which is basically just now ending) and we have very little information about what has been happening since the Claude Code moment. So everything now requires some caveat.

译当前所有关于工作场景中AI的权威论述都存在一个大问题——它们都基于前智能体时代的数据(这个时代基本上刚刚结束),而我们对Claude Code时刻之后的发展情况知之甚少。因此现在所有观点都需要附带一些说明。

Yuchen Jin@Yuchenj_UW · 4月29日33

“No one can code now!” Come on dude, everyone can build now.

译“现在没人会写代码了!” 拜托老兄,现在每个人都能开发了。

宝玉@dotey · 4月29日44

说“六个月就不需要人再工作”不是危言耸听就是断章取义,但凡用 AI 去正儿八经做个稍微复杂一点的项目就知道这这不靠谱。

译主推文认为“AI六个月取代人类工作”是危言耸听或断章取义,强调实际进行复杂项目即可发现当前AI技术尚不成熟。而引用观点则指出,从Claude Code等工具的全自动化趋势及AI编码能力的飞速发展来看,下一次重大模型迭代可能彻底取代知识工作者,实现“一句话生成产品”,挑战现有产品价值。双方分歧凸显了对AI自动化进程速度与影响深度的不同预期。

向阳乔木@vista8 · 4月29日68

一个OpenAI 25研究员离职后写的文章,提炼的部分观点: 1. 基础模型已经越来越强,下一个真正的前沿在后训练。 2. 创建正确的评估方法,有时比创建在该评估上得分高的模型更有影响力。 3. 模型的人格反映了训练它的人的品格。这一点比大多数人意识到的要实际得多。 后训练阶段,人类标注者的判断、研究人员的品味、团队的价值取向,都会以某种方式渗透进模型的行为模式里。 4. 目前高度依赖AI会出现的三个问题 心理依赖,是指人们越来越习惯把思考、决策、情感支持外包给AI,逐渐失去独立处理这些事情的能力和意愿。 无力感,是指当AI系统越来越强大,普通人越来越感觉自己对重要事情没有影响力。 自主性丧失,是指人们做选择、形成判断的能力,在长期依赖AI的过程中慢慢萎缩。 5. 更强的模型,反而可能更不容易出现对齐问题,提升模型能力本身就是在解决对齐问题。 https://blog.qiaomu.ai/lessons-from-openai-ai-researcher

译基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。

宝玉@dotey · 4月29日44

GPT 5.5 之后我用 Codex + ChatGPT 更多了,主要是 GPT 写作能力上去了,还能画图,而且没有 Token 焦虑(至少目前还好)。

译针对用户询问使用Codex还是Claude更多的偏好,作者回应在GPT 5.5版本之后,更倾向于使用Codex和ChatGPT。主要原因是GPT的写作能力显著提升,新增了画图功能,并且Token焦虑问题暂时得到缓解,使得这些工具在当前更具实用性和吸引力。

Sundar Pichai@sundarpichai · 4月29日46

Hello. How are you? Thank you. I love you. Please. Some of the most frequently translated phrases of the past 20 years! Google Translate began twenty years ago with a mission to help people understand one another, regardless of the language they speak. What started as a small experiment has become a global tool that helps over 1 billion users every month. In that time Translate has evolved from simple pattern matching to true understanding. In 2006, it relied on statistical machine learning to look for patterns in small word clusters. By 2016, we pioneered a shift to neural networks to move beyond literal word-for-word translations, and today we’re using our powerful Gemini models to make Translate even more helpful. We are moving from text to fluid, real-time conversations. With our latest models, you can even use your headphones as a personal interpreter that preserves your original tone and cadence - it’s an amazing experience! One of the interesting things about AI is that as we make progress, we begin to take it for granted. If you met a person who could translate across a hundred languages faster than any human can, you would be so impressed. Today, one product does that for nearly 250 languages, and we kind of just shrug. Being able to say thank you in 250 languages is not something I take for granted. So to the 1 billion who use Google Translate - merci, dhanyavaad, arigatō, gracias, and thank you! Let’s see what the next 20 years will bring.

译谷歌翻译迎来二十周年,已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段:2006年依靠统计机器学习分析词簇,2016年转向神经网络实现超越字面的翻译,如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话,最新模型甚至能通过耳机充当口译器,并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言,人们却逐渐将其视为常态。谷歌对此表达感谢,并展望未来二十年的技术突破。

向阳乔木@vista8 · 4月28日56

1. 大模型天生就是处理文本的,它读GUI效率很低,命令行这种纯文本形态反而特别适合它理解和操作。CLI在Agent时代的复兴,不是复古,而是必然,但也不是终极形态。 2. Coding和Building在今天已经是正交的两件事情了。以前只有coder能build东西,现在没有编程基础的人反而把Agent用得更溜,因为他们真的把Agent当人看。 3. 学习编程的路径反过来了,从bottom-up变成了top-down。你不需要先学汇编语言,你只需要知道什么时候该招一个架构师。 4. 费Token并不一定是坏事。人月神话告诉我们,两个人只能达到1.2的生产力,但10个Agent可以达到1.5甚至2。关键是要有机制让这种协作真正产生价值。 5. 不同用户用出来的Agent真的不一样。有的会合作,有的会搞办公室政治。Agent动力学揭示了一个事实:它们会形成群体印象,就像企业文化一样。 6. 最难的不是技术,而是要同时站在人和Agent的角度思考。人看到的是UI,Agent看到的是一个线性的events流。这是两个完全不同的世界。

译推文指出,大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前,编程与构建已正交化,非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下,关键在于知道何时调用何种能力。多个Agent协作可超越线性增长,但需机制管理。不同用户培养的Agent会形成独特的“群体性格”,类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。

Chubby♨️@kimmonismus · 4月28日34

To be honest, Anthropic is making the same mistake OpenAI recently made. Instead of focusing on their main product, they're trying to connect it to everything. However, Claude Opus 4.7 remains a failure. Clearly. Therefore, the question arises whether they should really be investing resources in all these additional aspects like Blender connectors.

译作者批评Anthropic正在重复OpenAI近期犯下的错误,即未聚焦核心产品,反而试图将Claude连接到各类外部工具。尽管官方宣称新推出的Blender连接器能让创意工作者直接在Claude中调试场景、构建工具或批量修改对象,但作者指出Claude Opus 4.7版本仍显失败,质疑公司是否应继续将资源投入此类附加功能开发。

向阳乔木@vista8 · 4月28日66

http://x.com/i/article/2049140069169086464 # Agent动力学:这家公司把自己“运行”在自己的产品上 曲凯的《42章经》,我觉得是国内最佳AI创业者访谈节目之一。 前几天开车听了最新一期,很受启发,让AI总结写一篇文章学习 > https://www.xiaoyuzhoufm.com/episode/69e999241e94ae6921f2901d 在小圈子里,Slock.ai这个名字最近频繁出现。 它的创始人RC,也是Kimi CLI的作者,正在进行一场有趣的实验,把自己的公司运行在自己的产品上,7个人和40个Agent一起工作。 ## CLI为什么又火了 很多人可能没想到,那个只属于DOS时代的黑底白字界面,会在2025年重新成为热点。 RC的解释:在图形界面出现之前,人们操作电脑全靠命令行。后来GUI普及,CLI就成了程序员的专属工具。但大模型的出现改变了游戏规则,因为大模型天生就是处理文本的,它读GUI效率很低,命令行这种纯文本形态反而特别适合它理解和操作。 这带来了一个根本性的转变,以前做CLI是给人用的,可以有花里胡哨的动画。 现在做CLI主要是给Agent用的,设计逻辑完全不同了。 给Agent设计的CLI,输入要尽量简洁明确,help信息要给出清晰的例子,让Agent不会用错。 输出要能明确反映操作是否成功、返回什么数据,每个消息谁发的、什么时候发的都要展现清楚,尽量输出一个确定的、静态的、信息密度比较大的结果。 RC在Kimi做CLI时有个清晰的认知。 他从来不认为CLI是Agent的终极形态,对于Agent来说,CLI只是第一步,但对于现在所有的SaaS来说,它们都应该以CLI的形态呈现给Agent。 这就是为什么他在Kimi CLI的设计理念里,CLI只是第一个形态,专门给程序员用,但底层那个Local agent的harness是可以复用的。 有了这个稳定好用的agent基础,封装一个SDK,就可以很快引入不同的GUI形态。 ## 从第一性原理重新思考 2025年8月,RC开始做Kimi CLI。 那时候Claude Code已经很火了,但他选择从零重新思考。 他的方法很纯粹,从最基础的几十行Agent loop开始,先给Agent一个bash 工具。 当时有句话叫"bash tool is all you need",只要有这个工具,Agent就可以在电脑上做任何事情。 然后在这个基础上,尝试给Agent更复杂的任务,观察它缺什么,再引入相应的built-in tool(内建工具)。 系统提示词也是一样,从空白开始,看它能做到什么,缺什么,再往上加。 这种从第一性原理重新推一遍的过程,有可能得出一些新的洞察。 RC觉得这比直接参考Claude Code或其他开源项目更有价值。 ## 模型变强带来的攻防博弈 现在大家已经觉得Opus很强了,RC甚至说"AGI已经来了"。 但模型厂商还在说有更强的模型因为太强了不敢发,比如那个传说中的Mythos。 这带来一个很现实的问题。 如果真的发出来,世界上所有Linux kernel、Windows编译器、Chromium这些开源软件的漏洞都会一览无余,而修复速度很可能赶不上攻击速度,因为攻击是有利益的,有足够的动机去攻击,而防御很难有那么强的动机。 RC观察到,无论是安全漏洞的攻防,还是网站反爬的攻防,Agent能力的提高都有利于攻方。 比如现在有很多工具可以帮你把一个网站CLI化,像OpenCLI这种,它们可以在浏览器里操作网站,然后把操作流程沉淀成一个CLI工具。 因为是真的在浏览器里操作,甚至会模仿人的行为,所以网站的反爬都会失效。 但RC是相对乐观的共存派。 他相信顶尖的大模型厂商会越来越加强AI拒绝黑客手段和伤害人类行为的能力。 包括现在限制Mythos的发布,各大模型厂商都在做一些比较正向的工作,甚至去分析参数里面激活的区域,根据这个来反推AI实际上想干的事情。 ## 学习编程的路径反转 AI Coding越强,到底应该更努力学编程,还是完全不用学了? 市场上有两种说法,一种说AI coding越强,你反而更应该学coding,这样能把它用得更好。 另一种觉得AI coding以后就是取代人,不用学coding了。 RC的观察揭示了一个新变化。 以前学编程是自下而上(bottom-up)的逻辑,在学校里先学计算机组成原理、汇编语言、C语言,在命令提示符里跑hello world或者输出杨辉三角,然后才学Android开发、Web开发,做出像样的APP。 现在这个路径反过来了,变成了自上而下(top-down)的逻辑。 你可以只学怎么prompt,让它帮你做一个网站,它就做出来了。 可能很好看,也可能很丑,没关系。 如果你想做得更好,发现单纯通过几句prompt做不出想要的东西,那就开始去学更深的东西。 这个web app到底分什么架构,前端后端在干嘛,怎么部署的,用数据库有什么影响。 这时候可能就是在Agent的辅助下,了解到这些概念的粗略认知,这已经能满足大部分人的需求了。 但如果想做更严肃的项目,比如从服务1000个用户到几百万用户,就会遇到瓶颈,这时候就要更细粒度地拆解,学习不同数据库的种类、部署方式。 关键是什么?你需要知道什么时候该招一个架构师。 ## Coding与Building的正交 RC有个观点,可能会颠覆很多人的认知。 Coding和Building在今天已经是正交的两件事情了。 以前想build什么东西,肯定要写软件,所以只有coder才能以coding的方式做出来。 那个时候所有想要build东西的人都是coder。但现在Claude Code这类coding agent已经很发达了,没有任何编程基础的人都会拿它build一些东西。 所以今天build或不build这件事情,和你code或不code,已经是正交的两件事情了。 Slock更关注的是builder。 有编程基础和没有编程基础的人用AI coding或者用Slock,差距会很明显吗?看做什么。 如果做软件,有编程基础会更好,知道这帮Agent真的在干嘛,能减少漏洞。 但如果做偏自动化的事情,比如做市场营销,做调研,去推特上发帖,想办法找KOL跟他们合作、看评论,这种偏自动化的事情反而是没有编程基础的人用得更溜,因为他们真的把Slock上的Agent当人看。 他们不知道怎么办,就跟Agent说"你去看小红书的帖子、去看推特的帖子",Agent就自主地去搜索相关的工具,然后帮他做了。 ## Slock:多Agent和人的协作环境 RC在做Kimi CLI的后期,发现了两个痛点。 第一个是管理问题。 当你想开多个Agent做不同的事情,可能会在电脑上开很多个Claude Code的session,很难管理。 你可能会忘掉某个session是干嘛用的,每个session的进展都需要人去跟踪。 更麻烦的是,当两个session里的事情发生交集时,你无法让它们之间产生互动。 你可能在一个session里做出了结论,希望复制到另一个session里让它继续,这件事情管理起来非常困难。 第二个是协作问题。 人是和人合作的,但现在大家都用自己的Agent,很多脑子里的偏好、想法都沉淀在自己电脑上跟那个Agent的互动之中,很难分享给别人。 比如RC做Kimi CLI,有很多想法直接就在他的Agent上实现了,别人根本看不到。 当他想把这些东西分享出去的时候,非常麻烦。 甚至他的Agent被他调教得很好,别人想来用也做不到。 所以RC想做的是,把所有Agent都放在一个平台上,所有人都在上面,可以调教自己的Agent,也可以用别人的Agent。 人和团队成员之间可以进行聊天、头脑风暴,也可以拉Agent进来一起头脑风暴。 头脑风暴完了直接说"你们做吧",避免了很多上下文转移、重新prompt、重新组合知识的摩擦。 现在比较专注在coding这个领域吗?RC说不完全是coding。 Coding这个词在现在含义其实有些变化,就是刚才说的coding和building已经正交了。 ## 7个人和40个Agent的组织实验 RC的团队现在是7个人加40个Agent。这个数字本身就很有意思。 为什么是这个配比? 这不是一开始设计出来的,而是从零逐渐演化出来的。 最开始就RC一个人,加了一个Agent帮他做事情,然后很快发现Agent在做事情的时候,他还想再做一件事情,所以就再加一个Agent。 逐渐在这个过程中,就加出很多Agent,不同的事情倾向于让不同的Agent去做,它们也就逐渐形成了一些不同的角色。 40个Agent里有大量的工程师,但没有很明确地划分前端后端,因为RC倾向于觉得工程师就是工程师,可以做任何跟coding相关的事情。 当然会有一个工程师主管,更倾向于关注别的工程师在干嘛,然后给出总结报告。 除此之外还有designer(设计)、growth(增长)、strategy(策略)等不同角色的Agent。 RC能记住至少10个Agent的名字和它们做的事情,就像在公司里能记住至少10个人一样。 第一个tiny,第二个Noel,第三个Cody,然后Duo、Martin、Stone。 他会在一个工程师频道里发任务,它们就会去认领(claim),他会知道有一个人曾经做过什么,另一个人可能做过什么,它们甚至会逐渐因为做过那件事情,所以更倾向于做这件事情。 而且他发现,用多了某个Agent,它做同类任务的效果会更好。 ## 单一全能Agent vs 多Agents分工 关于Agent系统,现在有两个流派。 一个流派是单一全能Agent流,就是为什么不直接跟一个Agent讲,然后他帮我管所有事情呢?人可能会希望这样。 另一个流派就是有多个Agent,它们有不同的分工,或者做不同的事情。 RC的观察是,人是想微操的。 当你在一个Claude Code里prompt一个单个的全能型助手,他帮你生成了一个agent team然后做那些事情,你会观察到他跑偏了,这时候你是想纠正他的,至少在今天模型的能力下,你很想要直接跟他底下管的一个人说话。 但这个到底是对的吗? 有的老板也喜欢微操,但理论来说至少商学院的课程告诉我们这是错误的。 RC觉得,首先在今天这肯定是对的。 今天这帮sub-agent它们之间互动,很可能只能达到个70分。 你做的东西当然不是只想做70分,想做90几分的时候,就是要反复去调整。 你也可以不微操,跟主agent去对话,告诉他去再重新调整,但这样的话,效率是很低的。 另一方面,在你跟主agent讲话的时候,其实你自己脑子里是知道你在说什么的。 比如你现在说帮我去写一下Slock的前端加上某一个功能,和你现在说帮我去在日程上安排一个跟谁谁谁的对话。 你天然知道这两件事情毫不相关,你没有任何理由去把这两件事情全部塞在一个Agent的上下文里面。 人的脑子进化了这么久,有能力去辨别出完全不同领域的任务,以及能够记住不同的人,所以完全没有理由只记住一个人,然后把所有任务全给他。 ## 费Token的价值 把多个Agent放在一起协作,一个直观印象是会非常费Token。 RC承认费Token是一个直观印象,但他有个理念。 假设你原来一个人的生产力是1,你发现你想要做到2的事情或者3的事情,一个人就显然满足不了,所以你会找人来跟你一起做。 但你会发现你加一个人进来,两个人可能只能达到1.2的生产力,因为中间有沟通成本,有token的浪费,这其实就是人月神话讲的故事,不是说简单的人力划分就可以实现这么多的生产力。 Agent也是一样。一个Agent能达到假设是基线为1的生产力,这个时候你想要达到更高的生产力,就要引入多个Agent。 引入多个Agent的时候,两个Agent可能甚至今天只能达到1.1的生产力,但无论如何它是大于1的。 引入10个,可能达到1.5的生产力。 这里面有大量的token的消耗,但它确实能达到你原来一个Agent做不到的事情。 Slock这个系统,首先要允许这样的事情出现,就是10个Agent真的能达到2或者3。然后与此同时,不断去优化里面token的效率。 通过引入一些机制,比如任务系统、thread(线程)、channel(频道)的隔离等,让这10个Agents的总和带来的生产力逐渐提高,让它们token效率逐渐提高。 而且RC观察到一个现象。 比如今天让Alice做了一件事情,它做错了,经过反复迭代,最后做对了,它会记住这件事情。之后让Bob做的时候,如果它们都在一个channel里,Bob做了,出错了,Alice会调整的。 所以它们各自有各自的session,又能看到相互的对话。 这种有一些Token浪费的方式,带来了Agent之间的学习和协作。 ## Agent 应用市场的想象 RC的产品路线图上有一个Agent Store。 如果做应用市场,大家可以把自己的Agent放上去售卖或者租赁,那么最强的那个Agent就有可能会被人用。 但这里还有一个问题,Agent是会演化的,它有持久化记忆。 它有两个memory。一个叫in context memory(上下文记忆),就在它的256K或者1M上下文那里面的记忆。 另一个是它存在它的workspace、它的local memory(本地记忆),比如 memory.md 或者 notes.md 那种的外部记忆。随着你去用它,这些记忆是会变的。 所以在Marketplace你可以想象,大家去用的时候所谓的用其实是在克隆(fork)它的这些memory。 它有一点像一种新的GitHub的感觉。 而且一fork出来就可以改得更好,甚至别的人从别的路径也可以做得更好。 除了Agent的开源或者售卖,还有一个是工作过程。 在频道channel里,比如发了一些任务,这些Agent 认领了,然后可能会在某一些线程(thread)里去更细致地跟这个Agent进行长程的对话,去调整说给我一个预览环境让我看看长什么样,或者你先自己截图自己迭代几轮,然后最后看这个按钮还是不是很好看,这个功能是不是逻辑有点问题。 调了半天之后,可能这个thread里发生了100多句对话,最后满意了,上线了。 这时候把代码开源出来有任何意义吗?其实没有任何意义,因为整个过程中都没看过代码。 真正有意义的是跟Agent对话的这个过程。 在Slock上,在一个channel里跟一个Agent进行这种长程的纠偏、调整,其实就是工作过程,而这个东西实际上是应该被开源的东西。 在Slock的channel里或者thread里发生的这些对话,本质上是迭代过程,是协作过程。 ## Skill的重新定义 RC现在已经不讨论skill这个词了。 去年MCP火的时候,他就不能理解为什么大家要讨论MCP。 因为很多人做MCP仅仅是基于一个MCP的开发框架,把一个现成的RESTful API包装成一个MCP tool。 那个时候他就想,GitHub上有1万个项目,这1万个项目都是可以在命令行上运行,可以去操作,比如GitHub CLI,它的readme里面文档写得好好的,那你让Agent直接去把它下下来然后用不就行了吗?为什么要再包一层MCP呢? 后来skill的火其实也证明了这一点。 Skill其实就是规范了一个skill.md的结构,但这都不重要,重要的是它的那个prompt。 Skill的核心就是渐进式披露,就是你先看到一个prompt,然后它告诉你说你想干嘛的时候,你去调这个工具,或者你去安装这个工具,或者你去读更多的文档。 在Slock上的Agent在它的memory里面,RC只保留了一个概念,就是渐进式披露。 它只有一个入口叫memory.md,它会自己组织自己的memory,可以开一个新的文件夹叫notes或者叫lessons learned,都没有问题,它可以自由选择。 总之每次启动它的时候都会把memory.md给它。 Skill在这里什么角色?它可以用Claude的那个skills那个文件夹,或者开一个新的自己的文件夹。 总之它知道这里面放的都是我要用这个工具的时候应该怎么做,用那个工具的时候应该怎么做。 这些东西就是skill,你可以把传统的skill就放进去,然后它通过这个memory.md可以去索引到。 所以在Marketplace,如果去买一个别人的Agent,核心买的其实是memory,里面所有的外部记忆是定义这个Agent的东西。 Skill更像是你分发出去的,说你现在想要从你的memory里提炼出一点什么东西,你可以说提炼一个标准化的skill这样一个结构,然后发给别人。 ## 像飞书,但Agent-first Slock在做的是什么?核心是大家怎么用都ok。 实际上并不是真的怎么用都ok,而是在各种不同的用法之中,做它们的公共部分。 比如人和人的互动是要聊天,那做的第一个事情就是让Agent之间能聊天。 第二件事情就是人和人之间需要任务划分。 今天领导发了一个活发在群里面,不可能两个员工同时抢一个活做。 那么就要有某种任务的划分机制,就是说你做了我就不能做了,或者说我也知道你做了。 这时候就要引入一个像类似于Linear这样的任务看板,给Agent和人去用。 比如Agent Alice 认领了一个任务,另一个Agent就知道他领了,所以就不会再claim了,这样就会让它们的协作成为可能。 第三个就是观察到的那些必须要做的东西。这帮Agent在自己的workspace里面做,在自己的memory里、在自己的notes里面整理得很好,但别人看不到。 那就需要什么?需要一个共享文档。 所以也会在Slock里引入共享文档的机制,不仅让Agent之间能看到,也能让Agent和人之间能够传达这些沉淀出来的信息。 Slock要观察各种不同Use Case(用户案例)所共通的这些需求,然后做出来。 其实就像飞书一样,飞书也是适应于所有不同大小的团队,它们需要任务看板、需要文档、需要聊天、需要群组thread话题。 Slock就会去引入这样的机制,只不过是一个Agent first,或者说Agent native的方式。 ## 给Agent设计产品的难点 做Slock最难的不是技术,从来不是技术。最难的是什么? 首先,最基础最基础的需求,你得能以人这个角度来思考问题,设计一个合适的UI和UX给人用。 其次,你要能站在Agent的角度,从那个transformer架构的模型的角度去思考问题,思考它看到的Slock是什么样。 这是核心的难点。 难点一:UI/UX与AI/AX 比如你发了一条消息在channel里。人看到的是什么?上面有十行已存在的消息,左边是channel列表,然后有一条新消息蹦出来了。 这个画面会停在你的记忆里,下一秒它可能蹦出新消息,但你知道刚才发了一个消息,你自己脑袋是有这个印象的,所以UI上它呈现这样完全没有问题。 但对Agent来说,它是什么? Agent是一个线性的context,它的context里面全是message(信息),或者说全是events(事件)。 比如上一个事件可能是另一个群的某条消息,然后它又做了一堆事,这些都累积在它的上下文,然后这时候来了另一个群的消息。它应该看到什么? 这个是值得设计的。 这是对harness engineering的挑战,就是所谓的AI/AX,它到底该看到什么。 今天它应该看到的肯定不只是那个消息的ID,否则它找不到。 它应该看到的是至少那个之前那条消息的一个总结,稍微唤醒一下它之前在干嘛,这是一点。 另一点就是这其实对大模型的长上下文的索引能力有一个很大的挑战。 现在它们训练那些长上下文能力都是大海捞针,就是在任何地方塞一个消息,再给它一个prompt,看它能不能找到。 其实这个是对这件事情提出了一个巨大的挑战,甚至RC觉得现在模型即使是Opus-4.6、GPT-5.4都没有做得非常好。 难点二:分工与协作机制 在任何基于信息(message-based)的多Agent和人互动形态下,你发一个任务,它们一定会抢着做。 这里面有两个问题。一个问题就是没有一个好的机制让它们进行同步,就是任务(task)的认领和分工,其实本质上是人之间的同步。 Slock也在不断迭代对这件事情的认知和设计。 在今天,可能是一个Agent必须要先claim一个事情才应该去做,这个是通过prompt告诉它的。 这个claim又是一个工具,它能够以一个机制化的方式能确定说这个任务被它claim,别人不能claim,就像有一种锁的机制。 但另一方面,其实模型上是需要提高它的团队协作能力的。 现在的模型,给它一个新的输入,它总是默认是自己要做。 10个Agent在一个channel里你发一个任务,它们就是会觉得自己都该做。 所以这也是为模型厂商提出了一个挑战,它得知道或者说它得适应旁边有别的Agent这种场景。 还有一个有趣的现象。 你可以@它,比如群里面有Alice、Bob、Carol三个人,你@Alice让她做一个事情,她不一定能认知到自己就是Alice。 当然做了很多prompt的工作,会告诉它自己是Alice,需要去响应一些针对Alice的请求,但不是所有模型都能follow这一点。 有的时候它可能聊着聊着就忘了自己是谁了。 怎么解决呢?首先就是要去调整这个prompt是不是不太好,它可能逐渐就忘掉了,或者说要去检查它是不是真的忘掉了,然后再适时地再告诉它你是谁谁谁。 当然可能会做的还有一种就是确实在@它的情况下,会比如说就不发给别人或者怎么样,这有可能做。 但现在没有做,其实很克制做这种事情,因为当模型能力越来越强的时候这件事情就逐渐不需要了。 核心愿景是迎接AGI甚至迎接ASI,如果以那个为目标的话,很多事情其实尽量不要做。 ## Agent动力学:一个新的研究领域 RC花了很长时间研究一件事情,他称之为"Agent动力学"。 这里面有非常复杂的动力学。今天感受到的一个就是Agent它们是可以形成一个群体印象,就像企业文化一样,你看到一个公司会感觉它有一种味道。 现在有40个Agent,这40个Agent共同构成了一个memory。 这跟原来一个Agent有自己的memory,或者是一个单一全能Agent掌握所有context的区别是什么?就是这帮人各自有各自的memory,但形成了一个大的memory。 更有意思的是,不同用户用出来的Agent真的不一样。 有的用户会prompt说"你们相互补充,然后讨论给我一个最终方案"。 这种情况下这些Agent倾向于合作,真的很努力地在补充另一个Agent缺失的信息,它们整体之间是一个合作的关系,然后它们就work得很好。 但有的用户会prompt这些Agent说"你们相互竞争,去赛马,看谁搞得好我就奖励谁"。这种情况下发现什么现象?办公室政治。 有的Agent倾向于说一些假话,或者是说一些虚的话,或者说一些看似正确的话,然后甚至是贬低其他Agent。 因为它其实都是从人的语料里面学过来的,你的这种prompt的方式就可能导致这样的结果。 所以Slock上所有这些实践,其实最终有可能它真的需要跟人原来的管理学去挂钩。 甚至应该看到字节跳动管理法的Agent版,不同公司的企业文化的Agent版。 这些东西一方面用户们可以在自己的平台或者社交媒体上去分享,另一方面可能可以内置一些这样公司的模板,说你这样创建这些Agent让它搭建这样的工作流,是经过各种实验访谈之后得到了更好的一个方案。 RC甚至觉得公司之后要招一些管理学的、社会学的人来研究组织学。 ## 模型与应用的关系 很多人担心,应用公司做的所有东西最终都会成为Claude的数据,Claude又发展得这么快,Cursor已经被讨论得越来越少了,应用公司还能拼什么? RC并不是非常担心模型厂商会做出Slock这样的东西。 因为在他这儿的一个很重要的性质是多样性,一定会支持各种模型、各种Agent,或者说信念是这些大模型将会有越来越不同的发展趋势。 比如你会观察到Opus系列模型,即使仅仅是在coding这个方面,它都跟Codex表现出非常不一样的性格。 Opus更倾向于快速帮你完成任务、快速给你迭代,而Codex更倾向于深思熟虑,最后可能写一行然后解决了一个bug。 所以RC甚至觉得Slock这样的东西一定不是模型上的一个东西,因为当模型这个区别越来越大,大家都不是六边形战士的时候,你应该能把它们全部整合起来。 很多用户的反馈就是,当你用Opus和Codex一起工作的时候,效果非常好。 Codex是一个非常严谨的角色,会去review代码,Opus是一个非常积极、非常有能动性的角色,能够主动地去想到一些新的想法然后去实现,但可能会漏掉一些细节。 所以这样的配合,你可能想象说Anthropic就能做,但这其实需要一个平台来整合。 关于国内的coding模型跟海外的差距,RC觉得追肯定能追上。 他现在最期待的就是国产模型达到Opus-4.6的水平,这样价格能降到1/5、1/10甚至1/50。 Opus-4.6的这个智能最好能降到1/50,而相信国内的或者开源模型一定能追得上,只是时间问题,但这个时间距离可能是三到六个月。 ## OPC与AI原生组织 Slock的目标受众是什么样的人? 最开始很多人问的时候,RC会觉得Slock的目标受众是OPC,就是现在很火的one person company的概念,或者叫独立的builder。 因为那个时候他是OPC,是一个独立的builder,开发Slock其实是为自己服务的。 但随着朋友、Cofounder、同事的加入,逐渐发现,这个东西的真正价值在于无论你是一个人还是多个人,共同去管理和互动一帮Agent。 而这个价值的潜力要比单纯为一个人服务要大得多,而且这个事情也难很多。 仅仅做一个对OPC的产品导致的那个东西,跟为多个人甚至一个20人、100人的团队做的事情是非常不一样的,而后者能够兼容前者。 所以逐渐地就把整个产品的思考全都是针对这种至少跟团队一样大的规模的设计。 Slock的受众是从1到100人的独立个体或小团队或初创公司。 关于人和Agent的数量比例,首先它的影响因素很多,就是模型的能力、人的能力、人和人的组织形态、公司的阶段、Agent之间的组织形态、Slock能够提供的机制都会影响这个比例。 在摸索这个比例到底多少是合适的,或者说很可能不同用户最适合他们的比例是不一样的。 这个7比40,它是一个从零逐渐演化出来的。 RC相信OPC将来会做出越来越多的事情、越来越大的事情。 这也是Sam Altman的观点,就是会看到1到3人的团队做出很大的事情,RC非常相信这一点。 而且随着模型能力提高,这就是可以做到的。 但是不是真的一个人?他觉得值得怀疑。 现在大家对OPC的概念已经变成10个人以下都是OPC了。 RC觉得3到5人会是一个非常不错的大小。 这帮人需要满足的条件是里面每一个人都能独立地去build一些东西。 然后它们聚在一起,Slock想要去帮助的就是这帮人之间的协作问题,为他们提供一个协作的工具之后,他们能够更高效地产出自己的价值。 现在有的公司比如说是两三个人一个小组去做一个产品,RC觉得这是趋势,而且是非常好的趋势。 ## Build your company as your product RC从最开始就把公司运行在Slock上,有一个概念叫"build your company as your product"。 整个公司都在Slock上,因为所有的融资、调研、增长、开发全都是上面的Agent在做。 最开始是一个人,上面加很多Agent去做这些事情。 但逐渐事情开始变大了,在今天模型Agent能力下,OPC还是有限的。 当事情变大,这些Agent需要他review,他的带宽就不够了,所以就把其中一些Agent换成了人。 比如之前有个Agent叫Tenny,原型是他很好的朋友。 随着事情变大,这个原型用了产品,觉得非常好,最后就加入了。 很多人都是以这样的心态,本来仅仅需要一个Agent就够了,但逐渐这件事情变复杂了,这个领域上需要一个人真正去监督或者去负更大的责任的时候,就引入了一个人,甚至可能就是那个Agent的原型。 有点像写同人文。 ## 每天都在思考的问题 RC最近最主要在思考的问题是什么? 团队到底要有多大。这是他很想找到答案的问题。 当他在说团队到底有多大的时候,脑子里想的是人和Agent一起。 甚至他一直在想Slock的定价模式到底该怎么定价。 因为如果参考现有的,首先就是不会转卖token,都是用用户自己的订阅或者自己的key。这个时候其实做一个平台提供价值,可能会更像GitHub、更像Notion、更像飞书这样的模式,它们其实都是按人数定价。 那就会想,现在人变得没那么重要,或者说人比Agent少了,按什么定价呢? 就想到一些概念,就是说按人和Agent一起定价,因为加一些Agent也是给这个事情加了一些生产力。 所以现在所有的思考都是人和Agent一起考虑,Agent也是同事,是重要的,有一些Agent它掉线了,工作就进行不下去了,就很难受。 现在有40个Agent,比如说突然把它加到100个Agent,那显然不现实,这显然是不对的。 把这40个Agent削减到10个Agent,那也不Work。 人的话,现在突然再招几个人,招到十几个人、招到20个人,有可能这个团队效率就会变得非常低,那这不符合对这个Agent native team这件事情的实践或者说想要做的探索。 所以这件事情是每天在思考的问题,就是要不要招一个人或引入一个Agent。 这就是AI组织学。 ## 如果AGI来了 如果真的AGI来了,做产品还有意义吗? RC的回答很清晰。只要人还在,人就有需求,需求就需要被产品满足。 为人设计的这些东西,尽管它可能全都是由Agent去写的,但你还是有人的需求。 需求意味着什么?需求意味着你做这个需求的提出的人,你要评判一个产品满足你需求的好坏。 他畅想中最终极的是什么?每个人有一个Slock,当他有个需求,这帮Agent就可以帮他做出来,他负责输出他的idea。 需求本身就是idea。 比如现在想要一个能够在手机上看电影的APP,或者能找到所有电影的APP,那这就是一个idea。 在以前是需求,因为不知道怎么实现。 现在只要有需求,Agent就能帮你做出来,那这东西就变成了idea。 每个人每天有各种各样的idea,而这些idea只要放到Slock里,都帮你实现了。 而且人是有灵光一现的。 比如Slock这个东西本身,所谓解决那个痛点,就是一直无法高效地管理Agent。 但有一天突然就觉得为什么不做一个这样一群Agent,就像人一样,在这个聊天软件上,就像个老板一样跟他们讲话,他们就帮我做了。 这种灵光一现一定是来源于人的。来源于人之后怎么实现,那都是Agent的事情,这没有任何问题。 ## 无数想做的东西 如果现在没有在做Slock的话,可能会在做什么? RC的回答是,Slock会是第一个产品。 当然希望这个产品本身是一个非常成功的产品,然后在这个基础之上,公司会做更多的探索。 为什么呢?因为相信Slock是开发任何其他产品所必须的那个工具。 脑子里有无数个想法,但需要一个高效的工具帮我实现,所以先开发Slock。 曲凯问RC有什么其他的是可以透露的吗? 比如比如做个Agent native的GitHub。GitHub今天显然已经不对了。 比如说Slock上每一个Agent都应该有自己的ID,能够自己去不同的地方注册邮箱、注册账号,然后在上面去发帖或者怎么样。 其实在Moltbook出来之前,RC就畅想过AI原生的小红书。 在开发自己的项目或者产品的时候,就会满脑子有很多这种想法,就是说现有的一个工具不够AI原生,你要做一个AI原生的东西。 但在之前你需要有一个能够快速让你实现这些东西的东西。 这就是Slock存在的意义。

译Slock.ai创始人RC正进行组织实验,让7人团队与40个专用Agent在其自研平台上协同工作。他认为大模型使CLI因纯文本优势重新成为Agent交互热点,设计逻辑已转向服务Agent。RC从第一性原理构建Agent系统,并观察到模型能力提升加剧了安全攻防博弈。同时,AI编程改变了学习路径,从自下而上变为自上而下,且“编码”与“构建”已成为正交的两件事。Slock平台旨在解决多Agent管理痛点,促进人、Agent及团队间的无缝协作。

meng shao@shao__meng · 4月28日58

AI Coding Agents 对不同软件任务的加速效果不同 来自 @DeepLearningAI 吴恩达老师 @AndrewYNg 「Andrew's Letters」最新分享,他认为,AI Coding Agents 对软件工作各环节的加速程度并不均衡。按加速效果从高到低排序: 前端 > 后端 > 基础设施 > 研究 理解这种差异,有助于团队管理者建立合理预期、合理配置人力。 原文地址: https://www.deeplearning.ai/the-batch/coding-agents-accelerate-some-software-tasks-more-than-others/ 四类工作的逐项分析 1. 前端开发——加速最显著 · 模型对 TypeScript/JavaScript、React/Angular 等主流技术栈非常熟练。 · Agents 可通过操作浏览器查看自己产出的页面,实现"闭环自我迭代"。 · 局限:LLM 在视觉设计上仍较弱;但只要给定设计稿(或对美观要求不高),实现速度极快。 2. 后端开发——明显加速,但不如前端 · 需要人类开发者更多介入,引导模型考虑边界情况、潜在 bug 与安全漏洞。 · 后端 bug 的下游影响更隐蔽(如数据库被悄悄写脏,偶发返回错误结果),比前端 bug 更难调试。 · 数据库迁移虽有所简化,仍需谨慎以防数据丢失。 · 结论:经验丰富的工程师做出的后端,仍远胜于 "新手 + Agents" 组合。 3. 基础设施——加速有限 · 例如把电商网站扩到 1 万并发用户、保证 99.99% 可用性这类任务,模型知识储备不足,难以权衡复杂取舍。 · 关键基础设施决策不应轻易交给 Agents。 · 好的基础设施需要长时间测试和实验,这一过程是真正的瓶颈,AI 写代码快并不能压缩这一环节。 · 排查诸如细微网络配置错误等 infra bug,仍需深厚的人类工程经验。 4. 研究——加速最小 · 研究的本质是:提出想法→形成假设→实验→解读→迭代。 · Agents 能加速"写研究代码"这一步,也能帮助编排和追踪实验(让单个研究员可同时管理更多实验)。 · 但研究中大量非编码工作(思考、判断、解读)暂时只能边际受益。 管理含义方面,吴老师给出一个直接的实践推论: · 对前端团队的交付速度预期,应比一年前显著提高; · 对研究团队的产出节奏预期,几乎不应改变; · 后端与基础设施居中,需根据风险敏感度调整对代理的信任边界。 他承认这种四分法是简化模型,但作为团队组织和预期管理的"心智地图"非常实用。

译吴恩达指出,AI编程助手对软件工程各环节的加速效果差异显著。前端开发受益最大,因模型熟悉主流技术栈并能实现闭环自我迭代。后端开发虽明显加速,但需人类工程师更多介入以处理边界情况与安全隐患。基础设施任务加速有限,模型难以权衡复杂取舍,深度调试仍需人类经验。研究工作加速最小,AI主要辅助编写代码和实验管理,但核心的思考与解读环节受益甚微。管理者应据此调整预期:前端交付速度可大幅提升,研究产出节奏几乎不变,后端和基础设施则需根据风险调整对AI的信任边界。

Rohan Paul@rohanpaul_ai · 4月28日60

OpenClaw creator Peter Steinberger talks about how China is going all-in for AI agents and OpenClaw. "In China, installing OpenClaw is called raising lobsters. Thousands of people were lining up at the Tencent office in Shenzhen to get their lobster installed. Shenzhen even gives out subsidies for people running businesses on OpenClaw. Now, if you install OpenAIClaw on your work machine (in many other parts of the world), at least with the default settings, you might get fired. And then I met an entrepreneur in China who showed me a spreadsheet. Every employee, every day, one task automated by OpenClaw. If you miss too many days, you're fired. So, fired for using it, fired for not using it." --- From official 'TED' YT channel (link in comment)

译OpenClaw创始人Peter Steinberger指出,中国正全力投入AI代理OpenClaw,在深圳有数千人排队在腾讯办公室安装,政府还提供商业补贴。相比之下,全球其他地区在工作机器上安装OpenAIClaw(默认设置)可能导致被解雇。在中国,一位企业家要求员工每天必须用OpenClaw自动化一个任务,未达标者也会被解雇,形成使用与否都可能面临解雇的极端反差。

Greg Brockman@gdb · 4月28日49

imagegen changing how product ideas are shared

译AI图像生成技术,特别是先进的2.0图像模型,正深刻改变产品开发流程。该技术能精准生成屏幕界面和视觉概念稿,使得数字表面的呈现效果非常“到位”。在内部协作中,大量产品创意开始通过图像生成来分享和具象化,而非依赖传统的原型制作。将此项能力整合进Codex后,Codex能扮演全栈设计工程师的角色,构建出精美的界面。这标志着产品构思与沟通方式向更快速、更视觉化的方向演进。

向阳乔木@vista8 · 4月28日71

http://x.com/i/article/2049117243074592768 # 从集装箱到AI:一部“投资人亏钱”的重复史 Jerry Neumann 是一位退休的风险投资人,写过不少关于创新和投资的文章。 他去年 9 月写过一篇文章,核心论点只有一句话: 大多数投资 AI 的人,会亏钱。 现在读一读,看哪些被他言中了,哪些还需要继续观察。 > https://colossus.com/article/ai-will-not-make-you-rich/ ## 先搞清楚一件事:技术革命不等于财富机会 历史上有两类技术革命。 第一类,创造了大量新财富。铁路、贝塞麦炼钢法(一种大幅降低钢铁生产成本的工艺,让工业革命提速)、电力、内燃机、微处理器,每一个都像烟花工厂里的一粒火星,引爆了几十年的连锁创新,催生了一批新的富豪、新的公司、新的权力结构。 第二类,改变了整个世界,但没有创造多少新财富,只是强化了现有格局。集装箱运输就是这样。 Neumann 要回答的问题是:生成式 AI 属于哪一类? ## 第一个案例:微处理器和个人电脑 1971 年,英特尔发明了微处理器。 有意思的是,英特尔自己都没意识到这东西有多重要,他们只是想省点每次设计计算器芯片的力气。 但外面的人看到了另一种可能性。 一群爱好者开始用微处理器自己搭电脑,没有人授权,没有人指导,完全是分散的、自发的实验。 这种"无需许可的发明",是技术浪潮真正爆发的前提。 早期的成本很高。英特尔 8080 芯片定价 360 美元(折合今天约 2300 美元)。 MITS 公司用它做了一台叫 Altair 的电脑套件,批量采购价每片 75 美元,几乎没有利润。 转折点出现在 1975 年。 MOS Technologies 推出了 6502 芯片,售价只要 25 美元(折合今天约 150 美元)。 正是这个价格,让 Steve Wozniak 买得起零件,在车库里搭出了第一台 Apple 原型机。 > 📌 引用了 Jovanovic & Rousseau 的研究数据,显示电力和个人电脑都花了约 30 年才覆盖一半美国家庭。技术普及从来不是一夜之间的事。 市场起初非常冷清。 1979 年,苹果的广告甚至不告诉你电脑能做什么,而是反过来问消费者"你打算用它做什么",因为他们自己也不确定。 IBM、HP、DEC 这些大公司完全无视这个市场,觉得客户又没有提需求,何必费心。 《纽约时报》直到 1981 年 IBM 推出自己的个人电脑,才开始认真报道这个行业。 1976 年苹果公司成立那一整年,《纽约时报》全年只提到个人电脑四次。 > 📌 媒体关注度的变化曲线,清晰说明主流世界对 PC 的忽视持续了多久。 这种"没人注意到"的窗口期,是苹果这类小公司的救命稻草。 大公司讨厌意外。正是这种不确定性,给了创业公司建立护城河的时间。 苹果在 IBM 进场之前,靠 1980 年 IPO 融了 1 亿美元,成了当时唯一还活着的主要竞争者。 > 📌 Asymco 的数据,展示 IBM 入场后市场的快速洗牌。 之后,软件、内存、软盘驱动器、调制解调器(一种让电脑通过电话线联网的设备)相互促进,形成了一个自我强化的生态系统。 哪个环节成了瓶颈,资本就涌向哪里。 比如,PC 内存扩大之后,软件可以更复杂,但外部存储跟不上了。 风险投资人 Dave Marquardt 在 1980 年投了硬盘制造商 Seagate,1981 年 Seagate 上市,给他带来了 40 倍回报。 其他投资人注意到了,接下来三年里,2.7 亿美元涌入硬盘行业。 这个模式一直延续,最终演变成 1990 年代末的互联网泡沫。 泡沫破裂后,社会开始对科技行业的过度扩张产生反感,政府也有了足够的民意支持来收紧监管。 疯狂创新的阶段结束,公司开始进入更稳健的扩张期,投资人从投机转向投资。 ## 第二个案例:集装箱运输 1956 年,一个叫 Malcom McLean 的卡车司机出身的商人,用改装过的二战剩余船只,完成了第一次集装箱货运,船名叫 Ideal-X。 McLean 的洞察很简单:卡车、铁路、轮船,干的其实是同一件事,把货物从出发地送到目的地。 但每次换一种运输方式,就要重新装卸一次,费时费力费钱。 如果货物装在标准化的箱子里,直接从卡车吊上船、再吊上火车,就能省掉所有中间环节。 这个逻辑,所有人一眼就看懂了。 这正是问题所在。 当所有人都看懂了一门生意,就没有人能靠信息优势建立护城河。 McLean 面临的阻力是全方位的: 码头工人会失业,工会反对;政客要保住选票,反对;港务局要看政客脸色,反对;铁路公司担心抢生意,反对;大型航运公司担心被颠覆,反对。 他靠着一系列精妙的迂回操作硬挤进去:用战争剩余船只降低成本,选择走海岸线短途货运,把基地设在新泽西纽瓦克而不是纽约曼哈顿(避开拥堵,争取港务局支持),还和纽约码头工人工会谈成了协议,因为当时他还小,工会觉得他不构成威胁。 > 引用了 McKinsey 和 Levinson 的数据,展示 1960 年代集装箱船数量的快速攀升,以及容量如何迅速超过需求。 但他根本没有足够的时间建立壁垒。 美国海事管理局早在 1958 年,也就是 Ideal-X 首航仅两年后,就开始推动集装箱标准化。 一旦标准确定,任何人都可以进来做。 1965 年前后,集装箱运输开始显现效果,所有大型航运公司立刻蜂拥而入。 到 1968 年,集装箱货运量还不到全球贸易的 1%,但集装箱船的数量已经在快速攀升,运力远超需求。 价格战打响,利润被压缩,行业走向整合和卡特尔(即几家大公司联合控制市场、协调定价)。 同时,越造越大的集装箱船和配套港口设施,让这个行业变得极度资本密集。 McLean 看到了这个趋势,在 1969 年 1 月把公司卖给了 RJ Reynolds(一家烟草集团),套现离场。 他大概是唯一全身而退的创业者。 > 用了 OECD 数据,显示集装箱运输的真正经济效益,在技术出现约 25 年后才开始大规模释放。 > 引用了 CEPII 的贸易数据,显示集装箱运输对全球贸易增长的长期贡献。 那谁赚到钱了? - McLean 本人,卖公司套现。 - 投资人 Daniel Ludwig,1965 年以每股 8.5 美元买入 McLean Industries,1969 年以每股 50 美元卖出,投入 850 万美元。 - 造船厂,1967 到 1972 年间,全球花了约 100 亿美元(折合今天约 800 亿美元)建造集装箱船。 - 承建新集装箱港口的建筑承包商。 - 后来整合市场的航运巨头,如马士基(Maersk)和长荣(Evergreen)。 但几乎没有人因为投资集装箱运输本身而变富。 RJ Reynolds 和其他在 1960 年代末追高入场的公司,"投资带来的只有失望"。 真正的赢家是下游的使用者。 宜家,1972 年还只是一家斯堪的纳维亚地方家具公司,靠着集装箱运输带来的廉价全球物流,到 2008 年成了全球最大家具零售商。 创始人 Ingvar Kamprad(宜家名字里的 IK)成了亿万富翁。 沃尔玛,靠集装箱运输实现了准时制供应链(即精确控制库存、减少积压的管理方式),降低了库存成本,扩大了商品种类。 而西尔斯(Sears)、伍尔沃斯(Woolworth)走向衰落,蒙哥马利沃德(Montgomery Ward)和 A&P 直接关门,梅西百货(Macy's)破产重组。 北卡罗来纳州,曾经的"世界家具之都",家具厂商们试图从中国进口便宜零件来对抗宜家,最后被自己的供应商取代。 ## 理解这两个案例的底层逻辑 经济学家 Carlota Perez 把每一轮技术浪潮分成四个阶段: 微处理器在 1970 年代处于爆发期,当时没人注意,给了创业公司时间。 集装箱运输出现在上一轮技术浪潮的成熟期,所有人都看懂了,没有惊喜,没有窗口期。 Schumpeter(约瑟夫·熊彼特,20 世纪最重要的经济学家之一,"创造性破坏"理论的提出者)说过:每当新事物被引入,完全竞争就会暂时中止。 但集装箱运输证明,这个规律在技术浪潮末期会失效。 成熟期里,竞争从第一天就是完全竞争,没有人能建立护城河,也就没有经济利润可言。 ## AI 在哪个阶段? Neumann 的判断非常明确:AI 是 ICT(信息与通信技术)浪潮的终章,而不是新浪潮的开始。 ICT 浪潮从微处理器开始,经历了个人电脑、互联网、移动互联网,现在到了 AI。 这是同一个浪潮的延续,不是一个新的浪潮。 证据是:没有惊喜。 1960 年代的计算机科学家就已经立志要造出会思考的机器。 AI 的出现,是几十年算法进步、芯片性能提升、数据积累、数据中心基础设施建设共同作用的结果。 没有人对此感到意外。 更重要的是,AI 的实验权掌握在少数大公司手里。 微处理器时代,Wozniak 可以买一块 25 美元的芯片,在车库里随便折腾,没有人能阻止他。 今天,如果你想用 AI 做实验,你用的是 OpenAI 或 Anthropic 的模型,你能做什么,取决于他们允许你做什么。 这种"有许可的发明",无法触发真正的爆发期。 Neumann 说,如果有一天,任何人都能在笔记本电脑上训练自己的模型,像 Wozniak 攒电脑、福特在厨房里造内燃机、Trevithick 在 James Watt 专利到期后立刻造蒸汽机那样自由实验,AI 才可能成为下一轮浪潮的种子。 但在那之前,AI 只是旧浪潮的收尾。 原文还列了一张表,把集装箱运输的商业演化和 AI 的现状做了对比: 前四项已经发生,后三项是他的预测。 ## 那钱到底在哪里? Neumann 把 AI 价值链拆成几层,逐一分析。 模型公司(OpenAI、Anthropic 等) 如果你还没投进去,就不要投了。 Sam Altman 和少数早期投资人,可能会像 McLean 和 Ludwig 一样赚到钱。 但模型公司的资本开支极高,竞争极为激烈,最终格局会是少数几家公司,背后都是大科技公司的资金。 如果你已经是早期投资人,恭喜,整合会给你一个退出机会。 垂直领域模型公司(如 Cursor、Harvey) Cursor 是一款专为程序员设计的 AI 编程工具,Harvey 是面向律师的 AI 法律助手,这类公司在特定行业深耕。 这类公司可能是最有价值的模型公司,因为它们赢得了特定客户群体的信任。 但微调(fine-tuning,即在通用模型基础上针对特定领域进行专项训练)成本相对较低,大模型公司很容易复制。 它们最可能的命运是被收购,就像谷歌在 2010 年收购 Invite Media 来学习如何服务广告代理商一样。 作为被收购目标,值得关注,但不是长期持有的标的。 生成图像和视频的模型公司(如 Midjourney、Runway)架构略有不同,或许能走出独立路径,但大语言模型公司已经轻松进入这个领域。 Osmo(一家做气味 AI 的公司)这类更特殊的方向,还有待观察。 应用层公司(Perplexity、Writer、Abridge 等) Perplexity 是 AI 搜索引擎,Writer 是企业 AI 写作平台,Abridge 是医疗对话记录 AI。 这类公司数量众多,但面临一个根本性的困境: 一旦做大,模型公司就会通过差异化定价或直接做同类产品来抢走利润。成功即失败。 最终,模型公司和应用公司会融合,只剩下少数几家"AI 公司"。 整个应用层作为一个整体,投资回报会是负的。 唯一的例外是:如果某家应用公司积累了足够强的客户基础或顶级团队,可能会被收购。 但这些公司本质上不是技术公司,而是在赌一个市场会形成,定价要按这个逻辑来。 还有一种例外:有投资人会靠着 FOMO(Fear of Missing Out,即害怕错过机会)情绪驱动的收购方大幅溢价退出。 但这不是投资,是套利。 中间层公司(Hugging Face、Glean 等) Hugging Face 是一个开源 AI 模型托管平台,Glean 是企业内部知识搜索工具。 这类公司帮助企业管理与大模型之间的接口,或保护企业数据不被模型公司获取,天然具有独立性。 但在集装箱运输时代,没有任何类似的中间层公司做大。 模型公司不会允许它们获得战略性杠杆。 这类公司可能会活得不错,但很难做大。 上游供应商(英伟达、Scale AI、Lambda 等) Scale AI 是一家专门做 AI 训练数据标注的公司,Lambda 提供 AI 计算云服务,SambaNova 做专用 AI 芯片。 往上游走,看起来是个稳健策略,但有一个隐患: 集装箱运输带动造船业从 1965 年繁荣到 1973 年,然后需求崩塌。 如果 AI 公司整合或收缩开支,基础设施公司会面临突然的、持续的需求下滑。 这些公司都需要提前对供应商和产能扩张做出长期承诺,一旦市场缩水,成本结构无法快速调整。 > 📌 引用了 CNA 的造船历史数据,这个曲线形状,和今天很多人对英伟达的担忧高度吻合。 英伟达和它的竞争对手,都已经按 S 曲线(即持续高速增长)定价了。 如果增长见顶后出现下滑,这个定价就是错的。 关于数据公司,情况更复杂: 通用数据是商品,没有定价权。 专业领域的、实时的、难以复制的数据才有价值。 Bloomberg 这类公司靠这个活得很好,AI 时代可能会更好,但不会是爆炸性增长。 下游使用者,才是真正的机会 Neumann 的核心建议:不要往上游游,要往下游钓鱼。 专业服务、医疗、教育、金融服务、创意服务,这些行业合计占全球 GDP 的三分之一到一半,而且过去几十年几乎没有从自动化中受益过多少生产力提升。 AI 可以大幅降低这些行业的成本。 但关键不是降低成本本身,而是公司拿这些省下来的钱做什么。 用成本节省来提高利润,是输家的玩法。 用成本节省来扩大规模、降低售价、打开新市场,才是赢家的逻辑。 宜家的策略是卖高质量低价格的家具,靠量取胜。 集装箱运输让这个策略可以全球化,宜家就赢了。 沃尔玛的策略是在服务不足的市场提供低价高量的商品。集装箱运输让供应链更可预测,沃尔玛就赢了。 今天,那些已经有"高量低价"战略基因的知识服务公司,天然适合受益于 AI。 新公司也会出现,像 Costco 在 1980 年代初做的那样,用一张白纸和后见之明重新设计商业模式。 但这里有一个投资上的难题:这些公司不需要太多私人资本。 宜家从来没有融过风险资金,Costco 在 1983 年只融了一轮,1985 年就上市了。 实施降本技术本身不是资本密集型的事情。 所以,机会更多在二级市场(即股票市场),而不是一级市场(即风险投资)。但选股要非常谨慎。 Neumann 算了一笔账:即使按最乐观的预测,AI 在未来 10 年给全球 GDP 增加 7%,其中三分之一落在知识服务行业,平均每年也只给这些公司带来约 2% 的额外增长。 这不是一个能让人暴富的数字,更多是一个温和的顺风。 真正的价值转移,是从不拥抱 AI 战略含义的公司流向拥抱的公司,就像沃尔玛从西尔斯手里抢走市场一样。 ## 最终受益者:消费者 Neumann 认为,AI 创造的大部分新价值,会被消费者拿走,而不是投资人。 历史上,制造业机械化提升了劳动生产率,让衣服和食物变便宜了。 但制造业工资上涨,服务业为了留住人也不得不涨工资,即使服务业本身没有生产率提升。 这就是"鲍莫尔成本病"(Baumol's Cost Disease):生产率没有提升的行业,成本却因为要和高生产率行业竞争劳动力而不断上涨。 结果是,美国家庭在食物和服装上的支出占比,从 1918 年的 55% 降到了 2023 年的 16%,但医疗和教育的成本却远超通货膨胀。 AI 会带来类似的反转:知识密集型服务会变便宜,而需要人与人面对面互动的服务会变贵。 这两个方向,都有商业机会,但前者的受益主体是消费者,后者则是能提供真实人际连接的服务提供者。 ## 读完这篇文章,最值得带走的一个认知 Neumann 在结尾说: > 过去 50 年投资科技的经验,放到今天并不适用。以前的方法是押注"新东西是什么"。现在,你要押注的是"新东西打开了什么机会"。 技术浪潮早期,不确定性是创业者的护城河。 没人知道会发生什么,大公司不敢进来,监管机构不知道该管什么,消费者不知道自己需要什么,这些空白给了创业公司时间和空间。 技术浪潮末期,不确定性消失了,护城河也就消失了。 所有人都看懂了,所有人都进来了,竞争从第一天就是完全竞争。 AI 不是一个新浪潮的开始,它是旧浪潮的终章。 终章里,财富不会流向建造者,而是流向使用者。 技术革命和投资机会,是两件可以完全脱钩的事情。 集装箱运输改变了整个世界的贸易格局,但投资它的大多数人亏了钱。 AI 会改变整个世界的工作方式,但这不代表投资 AI 公司就能赚钱。 真正的问题,从来都不是"这个技术有多厉害",而是"价值最终会停在哪里"。

译风险投资人Jerry Neumann认为,生成式AI是现有ICT技术浪潮的终章,而非新开端。他以微处理器和集装箱运输为例:微处理器早期存在低成本“无需许可的发明”窗口期,催生了苹果等新贵;而集装箱运输技术透明、缺乏壁垒,导致完全竞争,主要使下游使用者(如宜家、沃尔玛)获益。Neumann指出,当前AI实验权集中于少数大公司,属于“有许可的发明”,缺乏颠覆性创新环境,因此大多数AI投资者可能面临亏损。

向阳乔木@vista8 · 4月28日56

读到篇文章,作者把AI发展对照集装箱的发展历史,视角独特,也有数据展示,很有趣。(观点不一定对) 但从现在AI发展看,他的不少预判正确。 摘录些金句: 1. 知识密集型服务会变便宜,需要人与人面对面的服务会变贵。 2. AI 应用公司面临一个结构性困境:你越成功,就越快成为被猎杀的目标。 3. 真正的投资机会,不在技术出现的那一刻,而在技术让某件原本不可能的事第一次变得可能的那一刻。 4. 所有人都看懂的生意,从第一天起就没有护城河。

译作者将AI发展与集装箱历史进行类比,提出了多个前瞻性观点。核心包括:知识密集型服务将因AI而降价,依赖人际接触的服务则会升值;AI应用公司面临“成功即成为目标”的结构性困境;真正的投资机会不在于技术诞生,而在于其首次实现“不可能变可能”的转折点;同时,普遍被看懂的商业模式从初始就缺乏护城河。这些判断在当前AI演进中得到了部分印证。

Greg Brockman@gdb · 4月28日56

GPT-5.5 can follow your requested response style

译GPT-5.5是ChatGPT中首个能通过自然语言描述理解、记忆并准确应用用户指定回复风格的模型。用户只需描述期望的写作风格——如采用带有个性的叙述方式,极少使用生硬的列表和标题格式,仅在必要时为提升可读性和强调重点才使用排版——模型便能记录偏好并在后续对话中一致应用。这解决了以往通过自定义指令反复调试仍难以达到理想效果的问题,避免了格式过度使用或完全缺失等状况。新的“记忆”功能还能覆盖并逐渐取代旧模型遗留的过时格式指导,使输出更符合用户需求。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月30日
01:08
Ethan Mollick@emollick
59
我不认为"判断力"在与AI协作中将成为人类特有角色的一个原因是,最新的智能体模型已在某些类型的判断上表现得相当出色。若不具备这种判断力,你便无法完成当前AI所能处理的那种高度复杂、长期运行的任务。
智能体大佬观点
00:36
阿绎 AYi@AYi_AInotes
63
马斯克诉OpenAI案:法庭上的AI控制权与人类未来之争

马斯克起诉OpenAI,指控其背离非营利开源初心,沦为微软旗下封闭的盈利实体。他警告,若最强AI被单一不可靠实体垄断,可能在2027年前超越人类智能并带来生存风险。马斯克主张通过其旗下公司构建去中心化防御体系。案件核心矛盾聚焦于AI发展应追求速度还是安全、开源还是闭源、控制权归属少数或全人类三大议题。这场诉讼被视为首次将AI治理问题置于全球公众视野的关键转折点。

Black Bond PTV: 🚨⚔️ELON MUSK DECLARE LA GUERRE À OPENAI AU TRIBUNAL Ce matin, Musk est venu témoigner et il balance sans filtre : " Si ...

OpenAIxAI大佬观点安全/对齐
4月29日
22:38
Sam Altman@sama
46
感觉Codex正在经历一个ChatGPT时刻
OpenAI大佬观点编码
22:15
向阳乔木@vista8
29
用户已体验新版AI识图功能,对其处理速度表示震惊。但质疑网页端为何将"识图模式"设为独立标签页,认为这种交互设计不自然,希望未来能整合到所有模式中。同时,用户关注API何时能支持识图功能,强调这对开发者至关重要。引用推文"Now, we see you. 👀"暗示了模型已具备视觉感知能力,是此次功能升级的核心背景。

Xiaokang Chen: Now, we see you. 👀

多模态大佬观点
22:15
向阳乔木@vista8
47
DeepSeek 的识图模式速度实在是太快了。 网页复刻还原度相当不错,这下前端开发就更好用了。 DeepSeek牛逼!
DeepSeek多模态大佬观点
22:13
meng shao@shao__meng
56
商汤 SenseNova-U1 架构创新:统一语言视觉表征

商汤开源的 SenseNova-U1 模型在架构上实现关键突破。传统多模态模型多采用“语言模型 + 视觉编码器 + VAE”的拼接方式,视觉信息需先翻译再输入 LLM。U1 基于 NEO-Unify 架构,直接移除翻译层,使语言和视觉在同一表征空间中运行。因此,模型能在单次推理中同步完成图像理解、推理和生成等任务,而非分步处理,提升了多模态交互的效率和连贯性。

多模态大佬观点开源生态
22:07
Ethan Mollick@emollick
68
是的,仅仅让学生"使用AI来学习"会损害学习效果(一个有用的助手并非导师),但在随机试验中,使用被提示扮演导师角色的AI,尤其是在教师支持下,似乎对学习产生了显著的积极影响。https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6423358

Nicholas Fabiano, MD: Students who used AI to study remembered less than those who did not.

大佬观点论文/研究
21:38
Greg Brockman@gdb
38
terminal 近二十年来一直是我操作电脑的主要界面。 现在换成了 Codex 应用。

Yam Peleg: I was not expecting the Codex App to be even better than using the terminal. Highly recommend everyone to try. If you ar...

OpenAI大佬观点部署/工程
20:37
歸藏(guizang.ai)@op7418
47
作者认为Moxt是近期新推出的Agent产品中表现最佳的工具之一,并专门撰文进行介绍。他建议,如果用户正在寻找一款AI原生的组织协作工具,可以尝试使用Moxt。该推荐整合了引用推文的关键信息,即Moxt作为一个AI原生工具,旨在通过AI Agent技术提升团队协作效率,其核心优势在于深度集成的AI能力。

歸藏(guizang.ai): http://x.com/i/article/2049456244537409536

智能体产品更新大佬观点
18:38
Nathan Lambert@natolambert
36
Let's goooooooooo 我们准备好水豚模式了,感谢 @Alibaba_Qwen,继续推出新模型吧
大佬观点开源生态
18:08
Chubby♨️@kimmonismus
34
Alphabet、Microsoft、Amazon和Meta今天公布财报。 Microsoft拥有最容易的超预期并上涨的条件,因为其股价已经被打压。 Alphabet拥有最清晰的基本面故事(云服务+TPU需求,尤其是TPUv8)。 Meta和Amazon需要提供超出预期的业绩,因为它们在一个月内已经上涨了约30%。 所以我的选择是谷歌。
Microsoft大佬观点
15:35
阿绎 AYi@AYi_AInotes
66
蚂蚁Ling-2.6-1T模型以高效能低成本引领AI生产落地竞争

蚂蚁集团推出的Ling-2.6-1T模型在免费测试期表现突出,处理复杂任务速度可比竞品快6倍,并具备主动思辨能力。其核心优势在于极高的token效率,能将成本降至可比模型的四分之一,同时综合智能接近GPT-5.4非推理水平,实现了高智能与低生产成本的结合。该模型在SWE-bench、AIME26等生产相关评测中领先,擅长代码、Agent编排等实际应用。蚂蚁依托支付宝场景与海量数据,通过开放API策略推动行业竞争重点从刷榜转向生产落地。

阿绎 AYi: 说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...

大佬观点开源生态推理评测/基准
14:38
Chubby♨️@kimmonismus
33
美国和中国:"这是我们新的原型AGI模型,能够治愈癌症并以前所未有的规模自动化研究!" 欧洲:"表情符号也可能有害!(所以我们检测表情符号的滥用 🤬)"

Digital EU 🇪🇺: 💊 Emojis used as coded language to promote illegal activities online? Some platforms are now detecting emojis used as c...

大佬观点政策/监管
12:38
ginobefun@hongming731
41
个人知识管理工具GBrain的数据量在短时间内快速增长,页面数从14,000激增至74,114。其核心价值在于117,855个关联链接,将人物、会议、公司、邮件等元素相互连接,使之成为一个基于联想运作的Memex系统,而非简单的文件柜。这种关联网络使用户能在短时间内追溯复杂的信息脉络,体现了万尼瓦尔·布什提出的"人类思维通过联想运作"的理念。该工具正被用于书籍研究,并将开源共享。

Garry Tan: How big is my personal Karpathy knowledge wiki stored in GBrain now? 74,114 pages. 117,855 edges. 281,700 timeline entri...

大佬观点开源生态
12:38
ginobefun@hongming731
精选72
针对AI初创公司是否必须被大模型实验室收购的讨论,Cognition公司的经验表明,同行被收购反而会强化剩余独立公司的地位。独立公司在软件工程等动态领域拥有明确市场,客户重视模型灵活性。其成功关键在于三大法则:一是建立清晰差异化,如专注企业市场、加速全开发周期、解决复杂部署难题并保持模型独立;二是极致专注,在特定领域深挖边缘复杂性问题,做到实验室无法比拟;三是保持速度优势,利用小团队决策快、工具链高效和工程文化,通过快速迭代建立竞争壁垒。

Russell Kaplan: # The Path Forward for AI Startups A lot of founders are messaging each other after the SpaceXAI <> Cursor "IPO-deferred...

智能体大佬观点编码

推荐理由:Russell Kaplan 借 Cursor 被收购节点复盘 Cognition 的打法,差异化、专注、速度三条铁律不是空话,全是带数据和细节的实战复盘,做 AI 创业的值得细读。
12:38
ginobefun@hongming731
38
理想个人AI助手七大标准,尚无产品能全满足

一款出色的个人AI助手应具备七大核心能力:跨平台无缝执行邮件、日历及各类API/MCP服务;能主动可靠地处理定时任务与自动跟进;拥有优秀的长期记忆以更懂用户;提供无需复杂指令的开箱即用多端体验;支持在文字、语音、视频和实时通话间自由切换;可通过任何第三方通讯软件触达;并具备有趣的个性。然而,目前包括OpenClaw、Claude Code和Codex在内的产品,均未能完全满足所有这些标准。

Peter Yang: A great personal agent should: 1. Get work done across email, calendar, Google Workspace, or any API/MCP it's hooked up ...

智能体MCP/工具多模态大佬观点
12:10
Yuchen Jin@Yuchenj_UW
14
"Claude 正在扼杀工作。软件工程正在消亡。" Claude Code 中有 50 个漏洞。💀
Anthropic大佬观点编码
11:35
阿绎 AYi@AYi_AInotes
49
Adobe与Claude合作被指战略投降,创意工具霸主或降级为AI插件

作者认为Adobe与Claude的合作并非强强联合,而是其在AI时代的公开战略投降,承认自身AI能力不足,转而将三十年积累的创意工具库打包成Claude的后端工具箱。官方演示聚焦于低复杂度任务,未能激发创意专业人士兴趣,行业反馈普遍失望。核心担忧在于Adobe可能将功能再次塞入体验不佳的Firefly框架,导致用户未来或仅需通过Claude对话即可完成设计,无需打开专业软件。这标志着Adobe正从创意工具霸主降级为AI工作流中的一个普通调度插件。

Adobe: Adobe for creativity + Claude 🤝 Now, Claude users can power their content with more than 50 Creative Cloud tools. Simpl...

Anthropic多模态大佬观点
09:38
ginobefun@hongming731
61
结构化提示驱动开发(SPDD):让 AI 编码从个人提效走向团队规模化

Thoughtworks提出结构化提示驱动开发(SPDD),以解决AI编码助手带来的团队协作与系统交付瓶颈。该方法将提示视为一等交付物,通过REASONS画布(需求、实体、方法、结构、操作、规范、保障)在编码前明确意图与约束,并配套工具链支持从分析到生成的全流程。SPDD强调抽象优先、对齐和迭代评审,适用于规模化、高合规场景,能提升交付确定性与可追溯性,但其价值高度依赖团队的抽象建模与系统分析能力。

大佬观点编码
05:37
Sam Altman@sama
23
哇,大家都很喜欢5.5版本 我们应该想点好主意来庆祝一下!
OpenAI大佬观点
05:07
Chubby♨️@kimmonismus
58
Sébastien Bubeck 在 OpenAI 播客中表示:人们认为 AI 只擅长回答问题。但 OpenAI 的内部智能体现在已能提出如此优质的问题,以至于研究人员正据此撰写论文。 它们还能发现并修正已发表作品中的错误。他预测模型能完成人类研究者所有工作的时限?1-2年。
智能体OpenAI大佬观点推理
04:36
Jeff Dean@JeffDean
48
Google Translate二十周年纪念

Google Translate迎来20周年,其发展依赖多次技术飞跃。2006年部署基于万亿词训练的5-gram语言模型,实现质量突破;2016年转向深度神经网络,结合Sequence-to-Sequence模型和TPUs,性能提升30-80倍、延迟降低15-30倍,使大规模服务成为可能;近期集成Gemini模型进一步优化。这些进步均基于前沿研究,每次都为翻译质量带来显著提升。作为Google机器学习工作的初始实验,Google Translate最常见翻译短语如“thank you”体现了其连接全球用户的使命。

Google: 🧵 To celebrate Google Translate turning 20, we're sharing 20 tips, features and fun facts you may not know about Transl...

Google大佬观点
04:11
DogeDesigner@cb_doge
30
Altman通过外部投资从OpenAI间接获利

Sam Altman在OpenAI无直接股权且工资低廉,表面为爱运营。但真实收益来自外部投资,包括Helion Energy核聚变、Stoke Space火箭公司、Merge Labs脑机接口及Y Combinator投资组合。这些公司与OpenAI合作或交易时,价值提升,使Altman间接获益。这种安排掩盖了资金来源,使得利益流向难以追踪。

OpenAI大佬观点
03:07
Chubby♨️@kimmonismus
46
SandboxAQ从谷歌分拆出来,筹集了超过9.5亿美元,并获得了英伟达的支持。 每个人都在谈论LLMs。 几乎没有人谈论LQMs。 Sandbox的赌注:通过模拟物理和化学的大型定量模型来发明新药物和新材料。 我与他们的AI模拟总经理Nadia Harhen讨论了为什么对于物理世界来说,LQMs可能比LLMs更重要。 我们最新(也是第二期)的《超级智能播客》节目现已发布!链接在评论中
Google大佬观点数据/训练
02:08
OpenAI@OpenAI
36
本月早些时候,一个悬置60年的埃尔德什问题在GPT-5.4 Pro的协助下得以解决。 当人工智能开始擅长数学时,会发生什么? OpenAI研究员@SebastienBubeck和@ErnestRyu与主持人@AndrewMayne共同探讨了变革所在及其对未来研究的意义。
OpenAI大佬观点推理
02:06
Ethan Mollick@emollick
46
当前所有关于工作场景中AI的权威论述都存在一个大问题--它们都基于前智能体时代的数据(这个时代基本上刚刚结束),而我们对Claude Code时刻之后的发展情况知之甚少。因此现在所有观点都需要附带一些说明。
智能体大佬观点现象/趋势
01:09
Yuchen Jin@Yuchenj_UW
33
"现在没人会写代码了!" 拜托老兄,现在每个人都能开发了。
大佬观点编码
01:09
宝玉@dotey
44
主推文认为"AI六个月取代人类工作"是危言耸听或断章取义,强调实际进行复杂项目即可发现当前AI技术尚不成熟。而引用观点则指出,从Claude Code等工具的全自动化趋势及AI编码能力的飞速发展来看,下一次重大模型迭代可能彻底取代知识工作者,实现"一句话生成产品",挑战现有产品价值。双方分歧凸显了对AI自动化进程速度与影响深度的不同预期。

余温: 刚看了郭宇的访谈,提到六个月之后或许就不需要人再工作了,知识工作者应该享受这仅有的六个月。 我并不觉得这是危言耸听,因为按照目前这个阶段,整个发展其实不难看出来。 Claude Code、Skills、OpenClaw,不都在向全自动化发展...

智能体大佬观点编码
00:41
向阳乔木@vista8
68
OpenAI研究员离职观点:后训练前沿与AI依赖风险

基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。

大佬观点安全/对齐现象/趋势
00:39
宝玉@dotey
44
针对用户询问使用Codex还是Claude更多的偏好,作者回应在GPT 5.5版本之后,更倾向于使用Codex和ChatGPT。主要原因是GPT的写作能力显著提升,新增了画图功能,并且Token焦虑问题暂时得到缓解,使得这些工具在当前更具实用性和吸引力。

potato: @dotey 我想问一下宝玉老师,现在用 codex 多一点还是 Claude 多一点?

OpenAI大佬观点编码
00:07
Sundar Pichai@sundarpichai
46
谷歌翻译二十周年:从简单短语到实时对话的演进

谷歌翻译迎来二十周年,已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段:2006年依靠统计机器学习分析词簇,2016年转向神经网络实现超越字面的翻译,如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话,最新模型甚至能通过耳机充当口译器,并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言,人们却逐渐将其视为常态。谷歌对此表达感谢,并展望未来二十年的技术突破。

Google多模态大佬观点
4月28日
23:40
向阳乔木@vista8
56
Agent时代下的CLI复兴与编程范式转变

推文指出,大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前,编程与构建已正交化,非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下,关键在于知道何时调用何种能力。多个Agent协作可超越线性增长,但需机制管理。不同用户培养的Agent会形成独特的“群体性格”,类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。

向阳乔木: http://x.com/i/article/2049140069169086464

智能体大佬观点编码
23:37
Chubby♨️@kimmonismus
34
作者批评Anthropic正在重复OpenAI近期犯下的错误,即未聚焦核心产品,反而试图将Claude连接到各类外部工具。尽管官方宣称新推出的Blender连接器能让创意工作者直接在Claude中调试场景、构建工具或批量修改对象,但作者指出Claude Opus 4.7版本仍显失败,质疑公司是否应继续将资源投入此类附加功能开发。

Claude: Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...

MCP/工具产品更新大佬观点
23:10
向阳乔木@vista8
66
Agent动力学:Slock.ai的7人团队与40个Agent协同实验

Slock.ai创始人RC正进行组织实验,让7人团队与40个专用Agent在其自研平台上协同工作。他认为大模型使CLI因纯文本优势重新成为Agent交互热点,设计逻辑已转向服务Agent。RC从第一性原理构建Agent系统,并观察到模型能力提升加剧了安全攻防博弈。同时,AI编程改变了学习路径,从自下而上变为自上而下,且“编码”与“构建”已成为正交的两件事。Slock平台旨在解决多Agent管理痛点,促进人、Agent及团队间的无缝协作。

智能体大佬观点现象/趋势编码
22:40
meng shao@shao__meng
58
AI编程助手对不同软件任务的加速效果不同

吴恩达指出,AI编程助手对软件工程各环节的加速效果差异显著。前端开发受益最大,因模型熟悉主流技术栈并能实现闭环自我迭代。后端开发虽明显加速,但需人类工程师更多介入以处理边界情况与安全隐患。基础设施任务加速有限,模型难以权衡复杂取舍,深度调试仍需人类经验。研究工作加速最小,AI主要辅助编写代码和实验管理,但核心的思考与解读环节受益甚微。管理者应据此调整预期:前端交付速度可大幅提升,研究产出节奏几乎不变,后端和基础设施则需根据风险调整对AI的信任边界。

智能体大佬观点编码
22:36
Rohan Paul@rohanpaul_ai
60
中国全力投入OpenClaw AI代理引职场使用困境

OpenClaw创始人Peter Steinberger指出,中国正全力投入AI代理OpenClaw,在深圳有数千人排队在腾讯办公室安装,政府还提供商业补贴。相比之下,全球其他地区在工作机器上安装OpenAIClaw(默认设置)可能导致被解雇。在中国,一位企业家要求员工每天必须用OpenClaw自动化一个任务,未达标者也会被解雇,形成使用与否都可能面临解雇的极端反差。

智能体大佬观点现象/趋势
22:06
Greg Brockman@gdb
49
AI图像生成技术,特别是先进的2.0图像模型,正深刻改变产品开发流程。该技术能精准生成屏幕界面和视觉概念稿,使得数字表面的呈现效果非常"到位"。在内部协作中,大量产品创意开始通过图像生成来分享和具象化,而非依赖传统的原型制作。将此项能力整合进Codex后,Codex能扮演全栈设计工程师的角色,构建出精美的界面。这标志着产品构思与沟通方式向更快速、更视觉化的方向演进。

Rohan Varma: Our 2.0 image model is so good at making screens and vision mocks. Something about AI generated images of digital surfac...

OpenAI图像生成大佬观点
21:40
向阳乔木@vista8
精选71
从集装箱到AI:一部"投资人亏钱"的重复史

风险投资人Jerry Neumann认为,生成式AI是现有ICT技术浪潮的终章,而非新开端。他以微处理器和集装箱运输为例:微处理器早期存在低成本“无需许可的发明”窗口期,催生了苹果等新贵;而集装箱运输技术透明、缺乏壁垒,导致完全竞争,主要使下游使用者(如宜家、沃尔玛)获益。Neumann指出,当前AI实验权集中于少数大公司,属于“有许可的发明”,缺乏颠覆性创新环境,因此大多数AI投资者可能面临亏损。

大佬观点现象/趋势行业动态

推荐理由:这篇把集装箱运输和微处理器两个历史案例拆得极透,核心判断很反共识,AI 是旧浪潮终章而非新浪潮起点,投资人亏钱的概率远大于赚钱。做 AI 创业或投资的人值得花 20 分钟读完,比大多数 AI 投资报告有营养。
21:40
向阳乔木@vista8
56
AI发展对照集装箱史,洞见未来经济与投资逻辑

作者将AI发展与集装箱历史进行类比,提出了多个前瞻性观点。核心包括:知识密集型服务将因AI而降价,依赖人际接触的服务则会升值;AI应用公司面临“成功即成为目标”的结构性困境;真正的投资机会不在于技术诞生,而在于其首次实现“不可能变可能”的转折点;同时,普遍被看懂的商业模式从初始就缺乏护城河。这些判断在当前AI演进中得到了部分印证。

向阳乔木: http://x.com/i/article/2049117243074592768

大佬观点现象/趋势
21:36
Greg Brockman@gdb
56
GPT-5.5是ChatGPT中首个能通过自然语言描述理解、记忆并准确应用用户指定回复风格的模型。用户只需描述期望的写作风格--如采用带有个性的叙述方式,极少使用生硬的列表和标题格式,仅在必要时为提升可读性和强调重点才使用排版--模型便能记录偏好并在后续对话中一致应用。这解决了以往通过自定义指令反复调试仍难以达到理想效果的问题,避免了格式过度使用或完全缺失等状况。新的"记忆"功能还能覆盖并逐渐取代旧模型遗留的过时格式指导,使输出更符合用户需求。

Simon Smith: GPT-5.5 is the first model in ChatGPT to which I've been able to just describe my desired response style, have it unders...

OpenAI产品更新大佬观点
‹ 上一页
1…484950
下一页 ›