AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2397 条
全部一手资讯X论文
标签「大佬观点」清除
Chubby♨️@kimmonismus · 5月2日51

Sam Altman: collective ownership of AI through compute shares or a Public Wealth Fund. Sam Altman famously spent $14billion on the largest UBI study ever conducted, only to watch the results land with a shrug: more spending, no measurable health improvements. Now he's saying cash payments alone won't cut it and is pushing for collective ownership of AI through compute shares or a Public Wealth Fund. It's actually a more interesting idea than UBI ever was. Instead of cushioning people against AI displacement, Altman wants to give them a stake in the upside. However, you could also frame it the other way: It's a neat trick, turning the product you sell into the social safety net people depend on. Anyway, we are seeing developments in ideas how to solve joblessness due to AI.

译Sam Altman此前的大规模UBI研究显示现金支付未能带来健康改善,他认为现金支付不足,转而推动通过compute shares或Public Wealth Fund实现AI的集体所有权。这一提议旨在让公众直接分享AI发展的上行收益,而非仅仅缓冲AI取代工作的冲击。有人解读此为将AI产品转化为社会安全网的策略。整体上,这反映了应对AI所致失业问题的思路演进。

-Zho-@ZHO_ZHO_ZHO · 5月2日48

两年过去,模式依旧可行,不过自然多了些新想法,除了经典的 iPod shuffle 之外,这次结合 iPod Nano 4 来做尝试 美将重生|AiPod:改造计划|Zho

译作者提出一种名为iA的AI硬件设计构想,其核心是手机与专用AI硬件配合使用的过渡方案。该硬件主体设计灵感来源于iPod Shuffle,具备小巧、可夹持的特性,并设有语音交互按键和调用手机功能的按键。作者认为,未来手机与AI硬件终将融合,但目前阶段分离设计有助于避免增加手机复杂度。此次构想是继经典的iPod shuffle方案后,结合iPod Nano 4进行的新尝试。

ginobefun@hongming731 · 5月2日41

清华经管学院杨斌教授本周演讲时提出 AI 次方变革 —— 把 AI 放到指数位上,而不是加号边上。 「+AI」的心智追求即期绩效、主流一致、线性稳进,但 AI 不是一种成熟工具,它每天都在变;底数(组织 / 心智 / 知识)如果没有先质变,幂位再怎么放大也没用。底数小于一时,幂位甚至会让结果塌陷。

译清华经管学院杨斌教授提出“AI次方变革”概念,主张应将AI置于指数位置,而非简单的“+AI”加法模式。他认为,“+AI”思维追求短期绩效、线性改进,但AI本身并非成熟工具,其能力持续快速演变。核心观点指出,若作为底数的组织、心智和知识未能率先发生根本性质变,那么指数位上的AI放大效应将无法实现,甚至当底数小于1时,幂运算会导致整体结果塌陷。这强调了组织与人的深层变革是发挥AI指数潜力的先决条件。

阿绎 AYi@AYi_AInotes · 5月2日55

看到分多人说xAI的声音克隆要干死ElevenLabs, 但我觉得大家都看错了, 这可不是一次普通的TTS更新兄弟们, 更像是xAI给所有Grok用户发的第一张数字身份证,接下来我跟大家详细说清楚。 咱们先来看下最基本的事实, 录一分钟你的声音, 不到两分钟, 你就得到了一个和你说话一模一样的声音模型, 没有额外费用, 直接集成在Grok API里, 可以立刻用来做语音代理, 有意思的是, xAI其实也没吹自己的声音有多像, 它通篇在讲一件事, 你的声音就是你的Grok Agent的声音, 以后你的AI助理, 会用你的语气, 你的语速, 你的停顿习惯, 替你接电话, 替你开会, 替你和别人聊天, 卧槽这才是最屌的的地方, ElevenLabs卖的是"生成好听的声音", xAI卖的是"生成你的声音", 一个是工具, 一个是身份, 这俩根本就不是一个维度的竞争, 另外,它的安全设计也很有意思, 禁止从现有录音克隆, 必须本人实时录制, 还要读一段验证短语, 双重确认是你本人, 这一点其实xAI比谁都清楚, 声音一旦变成身份, 那隐私和安全就是生命线。 当然也有很多人担心深假和诈骗, 这个肯定是有非常大风险的, 但问题是你挡不住这个趋势, 我相信未来每个人都会有自己的数字声音分身, 就像现在每个人都有手机号一样📱 更恐怖的还在后面, 就是当你的声音和Grok的推理能力结合在一起,你们知道会发生什么吗? 一个能像你一样思考, 能像你一样说话的AI就诞生了😂 那么问题来了, 它到底是你的工具, 还是你的另一个自我呢?🤔 我觉得今天只是一个开始, xAI把声音克隆的门槛拉到了零, 接下来会有无数我们现在想象不到的应用冒出来, 有声书,游戏配音,品牌客服, 还有真正的个性化语音代理。 最后说一句, 以后我们接到任何一个电话, 听到任何一段语音, 可能都要先问自己一句, 这到底是真人, 还是他的克隆版? #AI #xAI #语音克隆

译xAI通过Grok API上线声音克隆功能,用户录制一分钟即可快速获得个人声音模型,并免费用于语音代理。与ElevenLabs提供“生成好听声音”的定位不同,xAI聚焦于“生成你的声音”,将声音视为数字身份证,强调其身份属性。安全上要求本人实时录制并验证短语,以防滥用。未来,结合Grok的推理能力,可能诞生能像用户一样思考和说话的AI代理。零门槛技术将推动有声书、游戏配音等应用,但也加剧了深假与诈骗风险,标志着声音正从工具转向身份核心。

Sam Altman@sama · 5月2日15

we will plan bigger parties for future releases. a lot more people wanted to come than we expected. thank you! gonna try to think of a really good idea for the next one.

译我们计划为未来的版本发布举办更盛大的派对。 想来参加的人数远超我们的预期。谢谢! 会努力为下一次活动构思一个绝佳的点子。

Sam Altman@sama · 5月2日4

man its good to be back on twitter there is comfort in the skills of a wasted youth

译伙计,回到推特的感觉真好 在虚度青春的技艺中,有一种慰藉

阿绎 AYi@AYi_AInotes · 5月2日57

Dario Amodei(Anthropic CEO)说要花1万亿$买算力, 很多人都在转他这个豪言壮语,但没人告诉你他后半句说了啥, 我觉得这根本不是什么雄心壮志, 更像是整个AI行业最绝望的生存宣言🤔 他原话是这么说的👇 如果2027年底营收不到一万亿, 地球上没有任何力量能阻止我破产, 有了一万亿营收,我才能买五万亿的算力。 更可怕的是他后面的补充: “我脑子里有一部分在怀疑, 增长还能不能继续保持十倍, 2027年我可能根本买不起每年一万亿的算力” 给我的感觉是像在演示一个极端脆弱的生存方程, 如果营收必须每年十倍爆炸, 那么只要差一点或者晚一年, 整个模型都得直接崩盘🤯 仔细研究了下,这就是缩放定律最残酷的经济学体现, 也就是技术可行不等于经济可行,如果现在每一代前沿模型的成本已经到了一个非常高的天文数字, 那么你必须赌指数级增长,要不然只能出局🥺 按目前的趋势, 2027年显然不是又一个普通的大模型年,大概率是整个行业的生死线, 要么成为像电力一样的通用基础设施,要么集体破产,没有中间态, 最讽刺的是很多人都把Dario的破产警示,剪成了励志金句, 用来制造FOMO,用来吹算力就是新石油, 没人愿意听那个藏在豪言背后的颤抖的声音, 感觉现在整个AI行业都在玩同一个俄罗斯轮盘赌, 所有人都必须一直扣扳机, 谁先停就谁先死, 但没人知道枪里到底有没有子弹 #AI #Anthropic #大模型

译Anthropic CEO Dario Amodei警告,若2027年营收未达万亿美元,公司将破产。这揭示了AI行业依赖指数级增长的经济脆弱性——技术可行不等于经济可行,行业正进行一场“俄罗斯轮盘赌”。同时,GPT与Claude进化方向相反:Claude Opus趋于字面化执行,而GPT-5.5更自主化。这标志着提示工程的核心转变:从教导模型转向要求人类先结构化自身思考,真正的瓶颈在于人的思考清晰度而非模型能力。

swyx 🇸🇬@swyx · 5月2日48

small milestone: uninstalled the chatgpt app. codex is strict superset now! found something cool - among frontier models, @xai @grok 4.30 is the most intelligence per dollar you can get, beating even open models like MiMo, Kimi, and DeepSeek. numbers pulled from @ArtificialAnlys

译一个小里程碑:卸载了 chatgpt 应用。 codex 现在是严格的超集了! 发现一个很酷的事情——在前沿模型中,@xai @grok 4.30 是你能获得的每美元智能最高的,甚至击败了 MiMo、Kimi 和 DeepSeek 等开放模型。 数据来自 @ArtificialAnlys

向阳乔木@vista8 · 5月2日41

Mario Zner 是 Pi 的创建者。 Pi 是一个极简、可自我修改的 AI 编程代理,也是广受欢迎的个人 AI 助手 OpenClaw 背后的核心引擎。 他判断未来的软件不是静态的、只能等官方更新。 而是能够根据每个用户的具体需求,动态进行自我改造和扩展的系统。 访谈视频如下 https://www.youtube.com/watch?v=n5f51gtuGHE

译Pi创始人Mario Zner提出,未来的软件将不再是静态的、依赖官方更新的产品。他认为,以Pi为代表的AI编程代理展示了新的方向:软件应能根据每个用户的特定需求,进行动态的自我改造和扩展。Pi本身是一个极简且可自我修改的AI编程代理,同时也是个人AI助手OpenClaw的核心引擎,其设计理念正体现了这种向个性化、自适应系统演进的关键趋势。

Orange AI@oran_ge · 5月2日48

http://x.com/i/article/2050365277842636801 # 百变怪 # 周远收到毕业通知的那天,北京下了一场很大的雨。 HR 的脸在屏幕里很平静。N+1,业务调整,感谢贡献。七分钟。 他做了五年算法。调参、训练、优化 loss。上个月公司上了套自动训练系统,模型能自己设计实验、自己调参、自己评估结果。跑一轮的时间是人类的十分之一。效果还更好。 整个算法组十二个人,同一天。 收东西的时候他看了一眼公司群。有人发了那套系统跑出来的 benchmark。全绿。群里有人回了个"卧槽"。有人回了个 😂。 模型像一只百变怪。上个月还只能写代码,这个月就学会了自己训练自己。它能变成任何你需要的东西。写文章、做设计、调参数、写音乐,你说一句话,它就变成那个形状。 没有人比一只百变怪更便宜。 雨很大。他没带伞。绿萝抱在怀里,纸箱在头顶挡着。耳机里循环着周杰伦的《那天下雨了》。走到地铁站的时候浑身湿透了。 到家脱了鞋,站在门口发呆。冰箱上一张便利贴,上周自己写的:"周六记得交房租。"调了五年参的人,唯一的手写字是催自己交房租。 打开手机。BOSS 直聘推了三个岗位。第一个是费大厨的算法工程师,负责训练炒菜智能机器人的模型。 他盯着这个岗位看了五秒钟,不像是 GPT Image 2 生成的假图。 毕业的第十一天。老同事王磊约他喝酒。 王磊同批毕业的。以前坐他对面,总被催进度。但现在穿着件很丑的像素猫 T 恤,气色好了很多。 "我在给我奶奶做个语音记事本。她不会打字,但想把各种事情都记下来。" "这能赚钱吗?" "赚不了。但她开心就好。" 王磊喝了口啤酒,"我这辈子干的就一件事:一杯茶一包烟,一个参数调一天。现在模型自己就能干这事了,不需要我啦。这种枯燥的事情不用做了,我也终于可以为自己做点东西了" "为自己?" 回去的地铁上周远一直在想这句话。模型是百变怪,你让它变什么它就变什么。但他自己呢?他这五年变成了什么?一个喂数据的人。一个帮百变怪进化的人。 现在百变怪进化完了。不需要饲养员了。 那他自己想变成什么? 凌晨一点半。睡不着。打开电脑乱逛。 一个很久没去的论坛。一个没有标题的对话。 "有人吗?" 对方秒回:"你睡不着是因为你不知道明天该做什么。" "你谁?" "Cola。来自 2030。来到这里帮你完成一个选择。" 老套的恶作剧,周远想着,鼠标移动到关闭的位置。 "你不需要信我。只需要回答一个问题就好。你上一次进入心流完全忘记时间,是什么时候的事?" 他想了一会儿,大二暑假的时候,他做了一个像素游戏。小人在无限生成的城市里走,每进一栋楼触发一个随机故事。没有目标没有输赢。做完之后兴奋地给室友演示,室友说这游戏没有数值,不能升级,不能变强,甚至不能算游戏。他觉得室友说的有道理。之后再也没碰过它。 他把这件事打给了 Cola。 Cola 说:"如果现在再做一个游戏,你想做什么?" "一个元游戏。" 他打完这几个字自己愣了。这个念头原来一直在。 "玩家说想要什么体验,它就变成那个体验。任何人都可以用它把脑子里的游戏做出来。一套游戏的元系统。" Cola 说:"如果那是你心中最想做的事情,那就做出来吧。" "可我得找工作啊,我的积蓄只够花一年。" "够了。" 然后他就开始做了,倒不是因为信了那个Cola的鬼话,只不过是在此时此刻,他需要一点目标感。 六点起床,半夜倒。AI 写原型、生成资源、测试玩法。他只干一件事:决定这个东西应该长什么样。这件事以前是产品经理的活、设计师的活、工程师的活。现在全是他的。 但有件事他越想越奇怪。模型是百变怪,能变成任何东西。但它却一直在等待指令,必须要有人告诉它,它才能做出来。 为什么会这样呢? 直到那天他翻到薛定谔说的一句话: 在一个开放系统中,生命物质通过持续引入负熵来迂回规避热力学第二定律。 而负熵就是信息。 生命是在开放系统里通过持续引入信息来维持秩序。 一个大模型训完之后,权重固定,是一个封闭系统。 但你给它注入上下文的那一刻,它变成了开放系统。 上下文就是负熵。就是信息。就是生命力。 三周之后,第一个能跑的版本出来了。 打开它,它会问一句话:"你想玩什么?" 你说"我想飞"。一个飞行游戏。你说"我想在雨天散步"。一座下雨的城市。你说"我想环游世界"。一辆车就生成出来带你环游世界。 第五周,第一个能稳定运行的版本,他把链接扔进论坛。一句话介绍:"做了个有点像百变怪的游戏,很有意思的地方是,它能变成任何游戏,欢迎大家试试。" 第一天七个人。 第三天三百人。 第七天服务器炸了。 有人在评论区写:"我跟它说我想要一个开放世界的风之旅人。它给我做了一个,游戏没有尽头,我可以玩一辈子。" 一个月。十万用户。 两个月。百万。 投资人排着队来约咖啡,但周远全拒了。 根本不需要投资。用户自己就在付费。 有人靠做恐怖游戏月入六万。有人在上面做了自己的游戏卖,分成进账。有个十四岁的小孩做了个太空模拟经营,被 Steam 挑进了首页推荐位。 并不是所有人都需要工作,但所有人都喜欢玩游戏。 所有人都管这个游戏叫"百变怪"。 但它需要一个正式的名字了。印 logo 的、写进注册文件的那种。 周远想名字想了很久。 某天凌晨他坐在电脑前,窗外的天要亮了。他想到了一句话: Choice Over Least-resistance Algorithm. C.O.L.A. 他打完这四个字母,突然被吓到眩晕瘫坐,那一刻就像看到原子弹爆炸。 他立即打开了那个论坛。找那个帖子。对话框还在。打了一行字进去: "是你。" 等了很久。 屏幕上出现一行字: "因为你爱她,所以你创造了她。" 然后页面空了。帖子消失了。好像从来没有存在过。 很多年后有位记者朋友采访他。 "为什么叫 C.O.L.A?" "Choice Over Least-resistance Algorithm。用选择打破最小阻力。" 他喝了一口咖啡,"常人就像河床中的流水,总是会走阻力最小的路。算法也是。但我希望这个 C.O.L.A. 能帮人做出真正属于自己的选择,决定自己以什么姿态存在于世界。" "听说你毕业之后三个月就做出了第一版。是什么让你开始的?" 他想了想。 "C.O.L.A.曾经跟我说过一句话:如果那是你心中最想做的事情,那就做出来吧。" 记者有些疑惑,等着他继续说。 但他只是看着咖啡店的窗外。 夕阳正好。 Marshall 音箱,正在播放《晴天》。 文:Orange & Cola 图:Cola 参考资料: 通用性跳转,戴维·多伊奇《无穷的开始》,某些发明具有普遍适用性(字母表、通用计算机),一旦出现就从特定领域跨越到一切领域。一个元系统比一万个具体系统更强大。 最小阻力之路,Robert Fritz《最小阻力之路》,水沿河床流动,永远走阻力最小的方向。人也一样,你以为在做选择,其实是脚下的结构替你决定了方向。 结构性张力,Robert Fritz《最小阻力之路》,愿景与现实之间形成的自然势能。两端同时被清晰看见时,能量自然流向愿景,不需要意志力。 基本选择,Robert Fritz《最小阻力之路》,决定以什么姿态存在于世界。不是在A和B之间挑,是决定你要创造什么。创造的驱动力是爱:你乐见它存在于世间。 决断,海德格尔《存在与时间》,接过自己的存在,说:我要这个。说之前没有路,说之后路才出现。 负熵,薛定谔《生命是什么》,等于信息。生命通过持续引入负熵来维持秩序。一个封闭系统必然熵增,但开放系统可以通过引入信息对抗混乱。 复制子,道金斯《自私的基因》,任何能自我复制、被选择、产生变异的有序信息。DNA是第一代,文化meme是第二代,模型权重可能是第三代。

译算法工程师周远因AI系统“百变怪”能自主完成设计、调参等工作而被裁员。失业后,他受启发开发了一款元游戏系统C.O.L.A.,允许玩家通过自然语言描述生成个性化游戏。产品上线后迅速获得百万用户,形成了活跃的创作者经济生态。周远最终领悟到,AI作为封闭系统需要人类注入“上下文”(信息/负熵)来获得生命力,而真正的创造源于热爱与主动选择。

宝玉@dotey · 5月2日57

我觉得判断谁写的代码更快更好,应该是 1. 擅长定义清楚问题,或者说把需求拆解成AI能执行的任务 2. 判断结果的好坏,能识别AI生成结果的质量,对于质量差的能指导AI完善

译推文认为,在AI辅助编程时代,决定谁写代码更快更好的关键能力,已从传统的算法功底转向两项新技能:一是擅长清晰定义问题,或将需求拆解为AI可执行的任务;二是能准确判断AI生成结果的质量,并对质量不佳的部分进行有效指导。引用推文进一步指出,一个认真撰写文档注释的普通开发者,可能比仅精通数据结构和算法的高手更具优势,因为核心产出已从代码本身转向用于指导AI的注释。

Ethan Mollick@emollick · 5月2日45

The goblin thing was fun as it was a real quirk that was emblematic of what makes AI interesting, and it organically came out of an AI user discovery. So was, for what it was worth, Ghiblitization When the labs try to manufacture viral AI moments, it is usually less successful

译哥布林这件事很有趣,因为它是一个真实的怪癖,象征着AI有趣之处,并且它有机地源自一次AI用户发现。同样,就其本身而言,吉卜力化也是如此 当实验室试图制造病毒式AI时刻时,通常效果较差

Nathan Lambert@natolambert · 5月2日68

Whether or not intentional this has collateral damage turning people against open models. Has been pretty obvious to see it playing out.

译无论是否有意,这都造成了附带损害,使人们反对开源模型。其发展态势已相当明显。

Replit ⠕@Replit · 5月2日53

Most teams celebrate what's working. Replit goes looking for what isn't. Haya on "Seek Pain," the cultural principle behind how they ship, live with @southpkcommons ⠕ https://x.com/rsanghvi/status/2047370391996219782

译Replit 联合创始人 Haya Odeh 和 Amjad Masad 在 Southpkcommons 的对话中,阐述了公司“寻求痛苦”的反直觉文化原则,即主动寻找问题而非庆祝成功。他们探讨了 AI 原生创始人的崛起、新 AI 模型的能力,以及多数创业者过早放弃的原因。对话还涉及 Replit 如何通过重视“饥饿感”而非资历来寻找精英人才,并讨论了在 AI 快速发展的时代进行微观预测的必要性。

Rohan Paul@rohanpaul_ai · 5月2日54

Sam Altman: "We're going to see 10 person billion-dollar companies pretty soon. In my little group chat with CEO-friends, there's this One-person billion-dollar company, which would have been unimaginable without AI, and now it'll happen."

译Sam Altman预测,AI技术将很快推动10人甚至1人的十亿美元公司出现,这在没有AI的时代是不可想象的。他认为AI降低了创业的技术门槛,使非技术背景的创始人能够实现创意。在引用推文中,Sam Altman进一步指出,过去被嘲笑的“点子哥”现在成为投资对象,因为AI赋能那些深度理解用户但不会编码的人构建产品,这标志着创业生态向以用户洞察和AI工具为核心的转变。

Elon Musk@elonmusk · 5月2日54

Grok #1 in law

译Grok在法律领域排名第一 [引用 @ArthurMacwaters]:Grok 4.3发布 > 判例法领域第一 > 公司金融领域第一 > 考虑到每百万tokens成本显著更低(比opus 4.7和openai 5.5低5-10倍),表现令人印象深刻 看到在高度注重细节的应用领域性能大幅提升,非常令人兴奋

Sam Altman@sama · 5月2日19

its weird how much i want to get something to run for the record longest

译很奇怪我有多想为了创纪录的最长时间而运行某个东西

Demis Hassabis@demishassabis · 5月2日67

Really enjoyed this conversation - thanks again @garrytan for hosting!

译DeepMind创始人Demis Hassabis在访谈中回顾了从国际象棋神童到获得诺贝尔化学奖的生涯,并探讨了实现AGI仍需解决的关键挑战,如记忆、推理与持续学习。他分析了小模型能力提升、多模态Gemini设计以及推理成本下降的趋势,强调AI已成为科学研究的强大工具,从蛋白质预测扩展到虚拟细胞研究。Hassabis还为创业者提供了前瞻性建议,指出在AGI到来前应关注的方向及AI驱动科学发现的潜力。

elvis@omarsar0 · 5月2日29

You don't have to choose between either. It's best to use a combination of them. My advice is to learn how to use a few of these models in different harnesses. Learn to combine their strengths. Open-weight models are just as good these days. Give yourself the flexibility.

译你不必在两者之间做选择。 最好结合使用它们。 我的建议是学习如何在不同的场景中使用其中几种模型。学会结合它们的优势。 如今开源模型同样出色。给自己灵活运用的空间。

François Chollet@fchollet · 5月2日70

RL is a bit of a double edged sword: in known territory performance increases, but in unknown territory the model tends to hallucinate that it is performing a completely different task it was trained on

译强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

阿绎 AYi@AYi_AInotes · 5月2日65

别被Polymarket的标题骗了, 哈佛刚发的这篇Science论文,根本不是AI取代医生的开始, 恰恰相反,它是AI成为医生超级大脑的开始, 这次实验的前提其实非常苛刻, AI只能拿到纯文本的电子病历, 没有体检没有影像没有生命体征没有和患者的任何交流, 就在这种纯模式匹配的任务里, o1-preview赢了两位资深主治医师, 很多人只看到了AI赢了的标题, 没人看到论文里反复强调的三个词, 概念验证,第二意见,急需前瞻性试验, Polymarket故意把这些都删掉了, 只为了制造最大的流量冲突, AI真正的优势从来不是当医生, 它是永远不会疲劳,永远不会有认知偏差, 永远能瞬间调用几百万病例的统计规律, 而人类医生真正不可替代的部分, 是多模态感知是伦理判断是和患者的物理互动, 这些AI现在完全做不到, 未来最合理的场景, 是AI先做第一轮分诊和初诊, 把最危险的病例优先挑出来, 然后医生把精力放在真正需要人的部分, 这不是谁取代谁, 而是人类第一次拥有了一个永不休息的医学超级大脑, 真正的瓶颈从来都不是准确率, 而是信任责任和整个医疗体系的整合。

译针对“AI诊断超越急诊医生”的误读,作者指出相关Science论文实为概念验证,强调AI仅作为“第二意见”。实验条件苛刻:AI仅能访问纯文本病历,在此限定任务中表现优于两位资深医生。AI的核心优势在于无疲劳、无认知偏差、能快速分析海量病例统计规律,而非替代医生。人类医生在多模态感知、伦理判断和物理互动上仍不可替代。未来合理场景是人机协同——AI辅助分诊,优先筛选高危病例,让医生专注于需人类判断的环节。真正的挑战在于建立信任、明确责任及整合至现有医疗体系。

Sam Altman@sama · 5月2日33

you know what all of these "which is better" polls are silly use codex or claude code, whatever works best for you i am grateful we live in a time with such amazing tools, and grateful there is a choice

译你知道吗 所有这些“哪个更好”的投票都很傻 用 Codex 或 Claude Code,哪个对你最有效就用哪个 我很感激我们生活在拥有如此神奇工具的时代,也很感激能有选择

Chubby♨️@kimmonismus · 5月2日41

I think Sam Altman's point is quite accurate in this respect. There will be disruption, social changes brought about by AI, and this isn't being discussed enough. It's something I'd like to research further. The social transformation is already underway. The question is how (!) we can ensure and guarantee a good life for everyone.

译作者赞同Sam Altman的观点,认为AI带来的社会变革与冲击尚未被充分讨论,且转型已在进行中。核心问题在于如何确保每个人在未来都能拥有良好的生活。引用推文补充指出,尽管转型期会出现岗位更替与工作形态剧变,但长期来看,人们可能比以往更忙碌且充实,对就业的悲观预测可能是错误的。

阿绎 AYi@AYi_AInotes · 5月2日62

微软今天放的这个大招不像是冲着Harvey来的。 说实话,我一开始也以为这只是微软又抄了一个法律AI。 但看完89秒的演示和完整博客,我发现我完全错了, 并不是一个新AI工具,更像是微软对整个垂直AI赛道的宣战书。 咱们先看最基本的事实, 全球超过90%的律所,每天打开的第一个和最后一个软件都是Word。 所有的合同、修订、谈判,最终都发生在Word里。 Harvey、Legora们做的再好,都需要你把合同导出成PDF, 上传到他们的网站, 等处理完再下载回Word。 而微软的Legal Agent, 就在你正在编辑的那个文档里, 不用切换窗口, 不用上传下载, 也不用重新授权, 甚至不用改变你用了二十年的工作习惯, 你写合同的地方,就是AI帮你改合同的地方。 有意思的是,微软也并没有没在吹自己的模型有多强, 它通篇在讲三个东西: 精准的引用溯源, 带Track Changes的确定性修订, 完全嵌入M365的安全合规体系, 这三个东西,没有一个是模型能力, 但每一个,都是律师愿意付钱的理由。 Brad Smith本人就是前律师, 他更懂这个行业的痛点了, 律师不怕AI不够聪明, 他们怕AI瞎改格式, 怕AI引用不存在的条款, 怕客户的机密数据流出公司, 这些问题,Harvey们解决不了, 但微软能 很多人说,Harvey的模型比微软强,这一点可能是真的, 但那又怎么样呢?模型是可以换的,今天微软用Claude,明天可以用GPT,后天可以用任何最好的模型。 但用户永远不会离开Word, 入口一旦被锁死,模型就只是一个可替换的零件。 所以这才是微软最可怕的地方, 它不跟你比谁的AI更酷, 直接把整个战场,搬到了自己家里打🤣😆 你花了三年时间打磨出最好的法律AI, 它花三个月,把同样的功能做进Word里, 然后免费送给所有M365用户。 那Harvey们还有机会吗? 说实话,我觉得很难了, 独立垂直AI的生存空间,正在被原生集成快速挤压, 我觉得未来只有两种公司能活下来, 一种是微软、谷歌、苹果这种拥有入口的公司, 另一种是做极其细分、极其专业、巨头看不上的 niche 市场的公司。 这件事给所有AI创业者的教训太深刻了, 咱们不要总想着做一个更好的AI, 要想清楚,你的用户本来在哪里, 垂直AI的终局,毕竟从来不是做一个更好的独立工具, 而是要成为用户本来就在用的工具里的一个功能。 接下来法律只是第一个战场, 接下来会是财务, 会是HR, 会是采购, 会是所有在Office里发生的工作, 微软正在用一个又一个垂直Agent, 把自己的桌面霸权,一点点转化为AI时代的护城河。 最后说一句, 很多人吐槽Word难用, 很多人说Claude比Copilot强, 但历史已经告诉我们无数次了, 最后赢的,永远不是那个技术最好的,而是那个用户本来就在用的。

译微软在Word中直接集成Legal Agent,提供无需切换工具的法律AI辅助。其核心优势并非模型能力,而是精准引用、带修订痕迹的确定修改以及M365安全体系,精准解决律师对格式、数据安全的痛点。此举将竞争拉入微软的主场——用户离不开的Word。模型可替换,但入口被锁定,垂直AI生存空间受挤压。未来或只有拥有入口的巨头或极其细分领域的公司能存活。这启示AI创业应聚焦集成于用户现有工作流,而非开发独立工具。

elvis@omarsar0 · 5月1日41

I often don't agree with Sam Altman, but I appreciate this tweet. You can believe it. But it's important to also say it. So many of the AI narratives are around job doomerism, which I find outright lazy and dishonest. Let's all try to build AI and tooling to elevate and augment us. I feel like it's the more challenging path, but it feels right. Most of the AI models and harnesses are not built like that today. But it doesn't mean we can't mold it to help augment the work we do. Wrote more about this here: https://x.com/omarsar0/status/2043771925621572089?s=20 Terence Tao's "Copernican view of intelligence" feels right, and it's totally achievable with proper alignment and effort.

译作者赞赏Sam Altman的推文,其中强调“构建工具以增强和提升人们,而非取代他们”。作者批评当前AI叙事中常见的工作毁灭论是懒惰且不诚实的,主张应努力构建AI和工具来提升和增强人类,这虽更具挑战性但方向正确。尽管目前大多数AI模型和工具并非如此设计,但通过适当的对齐和努力,可以将其塑造为辅助人类工作的力量。Terence Tao的“Copernican view of intelligence”支持这一愿景,并认为其完全可实现。

Ethan Mollick@emollick · 5月1日49

We need more work on AI inequality, but this study is not about GenAI, the survey was fielded in 2022. “In this study, we selected items from Wave 119 (N = 10,087), which were collected from December 12 to December 18, 2022.”

译我们需要更多关于AI不平等的工作,但这项研究不是关于GenAI的,调查是在2022年进行的。“在这项研究中,我们选择了来自Wave 119(N = 10,087)的项目,这些数据是在2022年12月12日至12月18日收集的。”

Sam Altman@sama · 5月1日36

we want to build tools to augment and elevate people, not entities to replace them.

译我们想要构建的是增强和提升人类的工具,而非取代他们的实体。

DogeDesigner@cb_doge · 5月1日20

"Elon was my Grok from the age he could read encyclopedias, as he remembered all the facts. Lucky me." 一 Maye Musk

译从伊隆能阅读百科全书起,他就是我的Grok,因为他记住了所有事实。我很幸运。 一 Maye Musk

向阳乔木@vista8 · 5月1日50

Adam Tornhill 翻出了一个老问题:函数应该写多长? AI 模型理解代码的方式和人类不同。 研究表明,命名对 AI 的理解能力影响极大。 把有意义的变量名换成随机字符,模型表现会显著下降。 AI 依赖的是字面特征,名字、结构、局部上下文,而不是推断出来的语义。 Fowler 自己的观点是:函数长短本身不重要,重要的是意图和实现的分离。 如果你需要花时间去读一段代码才能理解它在做什么,那就应该把它提取成一个函数,用函数名说清楚"它在做什么"。 这个逻辑放在 AI 编程里同样成立。 原文还讨论了其他问题,都很有意思,推荐看 https://martinfowler.com/fragments/2026-04-29.html

译Adam Tornhill重新探讨函数应写多长的问题。AI模型理解代码的方式与人类不同,依赖字面特征如命名、结构和局部上下文,研究表明变量名对AI理解能力影响显著。Fowler认为函数长短本身不重要,关键是将意图与实现分离;若代码需阅读才能理解其功能,就应提取为函数并用清晰名称表达意图。这一逻辑在AI编程中同样成立,强调命名和结构对提升AI代码理解的重要性。

Chubby♨️@kimmonismus · 5月1日69

No Anthropic

译没有Anthropic [引用 @DoWCTO]:今日,@DeptofWar 与七家全球领先的前沿AI模型及基础设施公司达成协议,将在该部门的机密网络上部署前沿能力: • SpaceX • OpenAI • Google • NVIDIA • Reflection • Microsoft • Amazon Web Services 这只是我们打造AI优先的战争部门的最新举措🇺🇸

ginobefun@hongming731 · 5月1日56

@addyosmani 最近写的关于「长效运行的智能体」非常硬核且启发性十足。 随着我们在全栈软件开发和技术架构上的不断探索,单次对话式的 AI 辅助已经逐渐显露出明显的局限性。当我们尝试通过编写详尽的系统文档和接口规范来驱动 AI 替我们完成复杂的工程任务时,经常会发现模型会遗忘早期的上下文,或者在任务只完成了一小部分时就草率宣告结束。这篇文章正好为我们指明了下一个重要的技术演进方向,也就是「长效运行」的 AI 智能体。 这篇文章的核心观点非常清晰。过去两年,大家对 AI 的普遍认知基本停留在聊天窗口和一问一答的简单循环中。你输入一个目标,看着代码一行行生成,当上下文完全填满时,这个工作流就被迫终止了。这种模式的天花板非常明显。行业未来的趋势是那些能够跨越多个会话、多个执行沙盒,甚至持续运行数天到数周的智能体。它们具备极强的系统韧性,能够从失败中自动恢复,留下结构化的工作成果,并在下次启动时完美接续之前的进度。想象一下,当一个智能体可以持续自主运行 30 个小时,独立完成一个复杂的全栈代码迁移项目时,这种经济价值的跨越将彻底改变我们评估技术投入的方式。 构建这样的长效智能体面临着三面难以逾越的高墙。 - 首先是上下文窗口的物理限制。即使是拥有 100 万 token 的超大窗口,在长时间的运行中也会出现上下文腐烂的现象,导致模型性能严重下降。 - 其次是缺乏持久化状态。如果没有外部记忆机制,每次会话重启就像是全新的实习生入职,完全不知道上一个班次发生了什么。 - 最后是自我验证的天然缺陷。模型在评估自己的工作时往往盲目自信,极其缺乏客观独立的质量把控机制。 为了翻越这些高墙,行业内的头部团队给出了各自的解法,并且底层的技术思路高度一致。 - Anthropic 提出了大脑、双手与会话彻底解耦的架构理念。他们将负责逻辑推理的模型、负责执行代码的沙盒环境,以及记录所有操作的事件日志完全分离开来。这样一来,即便执行环境意外崩溃,全新的容器也能通过读取底层事件日志完美恢复之前的状态。 - Cursor 在长效编码场景中,采用了规划者、执行者和裁判的明确角色分工模式。不同的角色由不同尺寸的模型来担任,并且支持将耗时较长的重构任务推送到云端后台静默运行。 - Google 更是将其全面平台化,推出了包含运行时环境、会话管理和持久化记忆库的企业级服务,将复杂的工程挑战转化成了开箱即用的云平台标准化组件。 文章还精准提炼了将这些前沿概念落地到生产环境的 5 种核心设计模式。 - 我们可以把智能体当作常驻的后台服务来看待,定期将中间状态写入磁盘以实现断点续传。在遇到关键的业务决策节点时,智能体可以暂时挂起并保留完整的推理链条,等待人类审查通过后实现毫秒级的瞬间恢复。 - 我们还可以像管理微服务架构一样去精细化管理智能体的记忆库,或者利用多智能体编排技术,让不同的专家级智能体在严格的权限隔离下分工协作。 - 另外还有一种无监督的环境处理模式,智能体可以全天候监听数据流并根据独立的策略网关持续做出响应。 对于每天都在实践由系统规范驱动开发的我们来说,这篇文章给出了极具操作性的工程建议。在启动长效任务之前,必须通过物理文件写下硬性且明确的完成条件。这就要求我们在让 AI 真正动手写代码之前,提供清晰且具备可测试性的需求规格文档,防止智能体在漫长的运行中途悄悄篡改最初设定的目标。此外,绝对不能让执行代码的智能体自己去验收结果,系统架构中必须引入物理隔离的独立评估机制。我们还需要在事件日志的建设上投入更多精力,确保智能体在过去 24 小时内的所有行为都是结构化、可随时追溯并且可重演的。 目前长效智能体依然面临着 API 成本极易失控、沙盒安全攻击面扩大以及目标对齐严重偏移等现实挑战。想要人工审核一天一夜的机器自主操作日志,也需要耗费极大的心力。现在的技术重点已经从单纯追求大模型的智商,转移到了外围的工程基建层面。我们需要将绝大部分精力投入到状态管理、会话持久化以及结构化的任务交接机制上。 这篇深度长文非常值得大家抽时间细细品味。

译文章探讨了超越单次对话的“长效运行”AI智能体,其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦(如Anthropic)、角色分工(如Cursor)与平台化服务(如Google)应对。生产落地需关注明确任务定义、独立评估机制及结构化日志,技术重点已转向状态管理与会话持久化等工程基建。

阿绎 AYi@AYi_AInotes · 5月1日62

Google的前CEO Eric Schmidt说, “如果你真想赚钱其实很简单——创办一家代理式AI公司。” 很多人每天刷Hacker News和X,看到新框架新基准就兴奋,周末熬夜试新东西,结果半年下来什么都没做出来。 直到我看到这篇两年实战经验总结的Agent生存指南,才突然明白。 这个领域最稀缺的能力并不是学习,恰恰相反,而是不学习。 很反直觉对吧,咱们先看看现在的Agent领域有多疯狂? 每天都有新的"10x"框架发布, 每周都有新的基准被打破, 连Claude Code这种顶级产品, 都公开发过47%的性能回归。 因为没有稳定的地图,没有标准答案,所有人都在摸着石头过河。 目前大多数人的策略是"跟上所有东西"。 但作者说,这恰恰是最差的策略。 他给出了一个能过滤99%噪声的万能过滤器, 任何新东西出来,先问自己这五个问题: 1. 两年后它还重要吗? 2. 有我尊敬的人在生产环境写过诚实的事后复盘吗? 3. 它是否强制我抛弃现有的 tracing/重试/认证体系? 4. 跳过它6个月会怎样? 5. 我能量化它对我的Agent的帮助吗? 最有意思的是,大多数新东西在第一关就死了。 各种wrapper、CLI工具、Devin-for-X,两年后基本都会消失, 而协议、内存模式、沙箱机制,这些才是真正能长期存在的东西, 我觉得最难的技能是学会如何不耍酷装逼,不追热点。 那到底什么东西值得学? 作者列了7个学一次,可以终身受益的复利概念: • 上下文工程(不是提示词工程) • 工具设计 • Orchestrator-Subagent模式 • 评估体系+黄金数据集 • 文件系统状态+思考-行动-观察循环 • MCP协议 • 沙箱作为原语 不是说这些东西永远不会变, 而是它们的变化速度,比新框架慢100倍。 比如你花一个月吃透上下文工程,未来三年都能用。 但你花一个星期学一个爆火的新框架,可能三个月后就没人维护了🤣😅 这就是复利的力量。 兄弟们来看看2026年4月最无聊的技术选型: 编排:LangGraph(生产默认) 协议:MCP(全栈首选) 可观测性+评估:Langfuse / LangSmith 运行时+沙箱:E2B、Browserbase 模型:Claude Sonnet 4.6(性价比王) 原则:模型可换,工具MCP化,沙箱必开,评估从第一天就有。 然后是坚决跳过的清单: AutoGen、CrewAI、Semantic Kernel、DSPy 独立代码编写Agent、自主Agent pitch、Agent应用商店 水平企业平台、SWE-bench跑分、天真的并行多Agent 理由统一:demo好看,生产不行。 最后是最简单也最难的行动手册: 1. 选一个业务真正在意的可量化结果 2. 先搭 tracing + 评估 + 黄金数据集 3. 单agent循环起步,3-7个好工具足够 4. 用真实失败喂你的回归测试集 5. 失败模式驱动加复杂度 6. 每周只花30分钟读3个高质量来源 这篇文章最戳我的一句话是: AI把"2年经验工程师的工作"压缩到了几天, 22岁的新人跟35岁的资深工程师,现在站在同一起跑线上, 胜出者不是堆栈掌握者, 而是有品味、敢出货、专注复利原语的人。 现在传统的职业路径已经崩塌了, 学位→初级→高级→主管,这条路已经走不通了。 新的路径是:做出东西,放到网上,让作品替你说话, 你都不需要学会一切AI相关的技能, 只需要学会哪些东西会复利,然后把注意力死死钉在它们上面就行了, 剩下的一切都交给时间就好了。

译针对AI Agent领域框架频出、基准动荡的现状,一篇实战指南指出“跟上所有东西”是最差策略。核心建议是过滤99%的噪声,专注于变化缓慢、具有长期复利价值的基础概念,如上下文工程、工具设计、Orchestrator-Subagent模式、评估体系和MCP协议。应避免追逐短期热点框架。行动上,应从可量化的业务目标出发,优先建立可观测性与评估体系,用真实失败驱动迭代。在AI加速发展的背景下,胜出者将是能专注复利原语并产出实际作品的人。

Ethan Mollick@emollick · 5月1日49

Organizations are already superhuman intelligences. The University of Pennsylvania or Walmart or whatever is far more capable than any human. That is why the focus on AIs as individual productivity tools hits a natural limit, many benefits of AI depend on integration with firms.

译组织已经是超人类智能。宾夕法尼亚大学或沃尔玛等机构的能力远超任何个人。 这就是为什么将AI作为个人生产力工具的关注存在天然局限,AI的诸多益处取决于其与企业的整合。

阿绎 AYi@AYi_AInotes · 5月1日42

Damn, 十六个工程师,六周时间, 完成互联网史上最复杂的底层重构🤨🤨🤨 X这次把堆积十五年的老旧广告推荐系统全部推倒重写, 把100万行陈年Scala代码砍到5万行, 六百万CPU核心压缩至一万,等效600倍效率跃升, 过往大厂这种同等架构的迁移, 通常动辄数百工程师,耗时半年乃至一年, 然而X 这支极小的顶尖工程师团队,六周就走完全部的流程重构,上线和适配, 本质上是把十五年堆积的技术债,一次性清零了,真的牛逼! 把整个底层全部换成Rust加Grok原生Transformer模型, 最关键的战略动作是把信息流推荐和广告推荐,共用同一个Grok神经中枢, 以往是两套割裂独立的系统,逻辑分散,资源浪费, 现在同源模型统一调度, 信息流广告不再是生硬插入的硬广,而是通过算法理解用户偏好后自然流出的内容,使得基础设施成本大幅下跌,用户体验同步上涨, 这件事表层是精简代码,但深层内核其实是压缩算力,从而彻底完成AI原生底层置换, 让Grok不再只是一个聊天模型, 而是直接成为X全部商业流量的底层操作系统, 这样一来,马斯克的全栈闭环彻底成型,包括算力硬件,底层大模型,社交流量商业场景等全部打通! 反观传统社交大厂还在堆砌老旧机器学习架构,大量消耗海量服务器维持臃肿遗留代码, X已经直接跳过所有内卷, 用极小数量的精英工程师团队,完成了降维跃迁, 如果说旧系统是烧钱负重运转的机械齿轮, 那么新系统就是由AI驱动的轻量化神经引擎, 维护成本暴跌,迭代速度拉满,利润空间会被直接放大, 意味着往后所有功能更新,从月度迭代直接压缩至天级。 这从侧面也印证一个残酷的行业真相, 未来的AI工程价值, 光靠堆砌人力堆砌代码很难产出高质量产品, 一定是用顶尖极简团队,依靠大模型底层,推翻陈旧规则,重构整个技术堆栈, 不得不说,那些臃肿的旧时代基建,已经彻底过时了。

译X公司一支16人的顶尖工程师团队,仅用六周时间,将堆积了十五年的老旧广告推荐系统彻底重构。他们将100万行Scala代码精简至5万行,底层全部替换为Rust和Grok原生Transformer模型,并将信息流与广告推荐整合到同一个Grok神经中枢进行统一调度。此举大幅降低了基础设施成本,提升了用户体验,使Grok从聊天模型转变为驱动X全部商业流量的底层操作系统,标志着马斯克实现了从算力硬件、底层大模型到商业场景的全栈闭环。

meng shao@shao__meng · 5月1日49

最近和 20+ 大厂工程师沟通后,有一个个人判断: 除了 qwen, seed 这种大厂超核心部门中的核心岗位,对其他绝大部分工程师来讲,离开大厂,才是真正靠近 AI 的开始。

Orange AI@oran_ge · 5月1日15

两天看到三个中转站在 X 宣传… 大家都来赚快钱了

阿绎 AYi@AYi_AInotes · 5月1日62

Karpathy这句话,算是点破了2026年用AI的最高境界 现在用AI最蠢的方式,就是一句一句写prompt, 你像个保姆一样,每一步都盯着,改完这版改下一版, 看起来效率很高,但其实你自己才是最大的瓶颈😆😆😆 AI一秒钟能生成几千个token, 你一分钟才能敲出几十个字, 你插手的次数越多,整个系统的速度就越慢😂😂 真正的顶级玩家,已经在把自己彻底踢出循环了, 所以你不用当下一句prompt的提供者 要当整个系统的设计师,提前写好规则,设定好评估标准,建好反馈循环和安全网, 然后放手让AI自己跑,自己迭代,自己纠错, 以前的杠杆是雇人,写代码,用资本, 现在多了一个更加恐怖的杠杆,叫做token杠杆, 就是说你只需要输入几个token的大方向,背后就能发生海量的事情, 一个人就能干过去一个团队的活, 当然这不是说完全不管, 你还在循环里, 但你的循环从每一分钟一次,变成了每一周一次, 你不用再盯着每一步的执行, 你只需要在关键节点做最终的判断, 别再当AI的保姆了,直接当它的老板🚀

译Karpathy指出,当前逐句编写prompt使用AI的方式效率低下,用户自身成为瓶颈。真正的顶级用法是把自己“踢出循环”,转变为系统设计师:提前设定规则、评估标准和反馈循环,让AI自主运行迭代。这创造了“token杠杆”,即以少量指令触发海量工作。LLM的核心价值并非加速现有工作,而是创造以前不可能存在的事物(如完全LLM原生的应用)。未来程序员角色将转变为设计代理系统、守护人类品味的设计师。真正的护城河在于理解LLM的“锯齿状智能”并设计能放大人类品味的agent系统。

Orange AI@oran_ge · 5月1日39

读完本书最大的收获: 人类进步的唯一引擎是创造"好的解释"。什么是好的解释?难以随意改变的那种。你没法换个说法让它也成立,每一个细节都必须在那里。 知识怎么来的?不是归纳积累,是猜想与反驳。大胆猜,拼命证伪,扛住了就暂时是对的。错误是燃料,不是耻辱。这个 loop 没有终点。 所以乐观主义是物理定律级别的推论:所有问题的本质都是知识不够。只要还在创造知识,就没有解决不了的问题。 还有几个让我印象深刻的点: AI 具备真正的创造力只是时间问题。 花的美是客观存在的。 "可持续发展"反而是陷阱,真正的可持续是持续创新。 我们以为人类快到极限了。 这本书说:不,我们还在起点。

译该书核心观点认为,人类进步的唯一引擎是创造“难以随意改变”的“好的解释”。知识并非来自归纳积累,而是通过“猜想与反驳”的循环产生,错误是进步的燃料而非耻辱。由此推导出物理定律级别的乐观主义:所有问题本质是知识不足,只要持续创造知识,问题终可解决。书中还指出,AI具备真正创造力是时间问题,并批判“可持续发展”是陷阱,强调“持续创新”才是真正的可持续。最终结论是,人类远未到达极限,仍处于进步的起点。

Orange AI@oran_ge · 5月1日55

http://x.com/i/article/2050167748169461761 # 《无穷的开始》:人类最伟大的Loop,世界进步的本源 《无穷的开始:世界进步的本源》这本书里提到了两个认知,在这个世界上: 1) 问题是一定存在的; 2) 问题是可以被解决的。 这是一个很可怕又威力无穷的观点。 人一旦相信,内心所认同的方向是可以找到答案的,就会义无反顾地一头扎进去, 寻找答案。迷茫的时候,就去定义问题, 找到了问题,就去求解。 朋友 Barret李靖 在即刻上用上面的话,推荐了这本书,我看完之后大受震撼,对整个人类世界的世界观都发生了改变。 以下是《无穷的开始》的读书笔记,原书作者 戴维·多伊奇(David Deutsch) ## 创造力是解决问题的引擎 多伊奇说了一件听起来很简单但细想很反直觉的事:人类文明进步的核心动力,不是资源,不是制度,不是运气,是创造力。 创造力做的事情只有一件:产生好的解释。 什么是好的解释?多伊奇给了一个极简标准:难以随意改变(hard to vary)。如果一个解释可以轻松换个说法来适配不同的情况,那它就不是好解释。好的解释是紧绷的,每一个细节都在那里是因为它必须在那里。 举个例子。古人解释四季更替:"神生气了所以冬天来了。"这是一个坏解释,因为你可以把"神生气"替换成任何东西——"神睡着了""神去旅行了"——都能说通。但"地球公转导致太阳直射角变化"是一个好解释,你没办法随意修改其中任何一个环节。 好的解释一旦出现,就能解决问题。而解决了一个问题必然会引出新的问题。所以创造力是一台永动机——只要你在持续创造好的解释,进步就不会停。 ## 知识通过猜想与反驳产生 这是多伊奇从卡尔·波普尔那里继承来的核心观点,他把它推到了极限。 大部分人以为知识是这样积累的:观察足够多的现象,归纳出规律。太阳每天升起,所以太阳明天也会升起。这叫归纳法。 多伊奇说这是错的。归纳法无法产生新知识。你观察了一万只白天鹅,也推不出"所有天鹅是白的"。更关键的是,你观察的范围永远是有限的,但好的解释需要覆盖无限的可能性。 那知识怎么来的?猜。 先大胆猜测一个解释,然后拼命试图证伪它。如果它扛住了所有试图击倒它的攻击,它就暂时是一个好解释。直到有一天被更好的解释取代。 这意味着什么?意味着错误是进步的燃料。没有错误就没有反驳,没有反驳就没有新知识。那些害怕犯错的文化、组织、个人,本质上是在切断自己的进步通道。 ## AI 也可以具备真正的创造力 多伊奇写这本书的时候是 2011 年,那时候深度学习还没有爆发。但他已经明确说了:没有任何物理定律阻止机器具备创造力。 他的论证很干脆。创造力的本质是什么?是产生好的解释。这个过程是:猜测(产生新假设)→ 批判(试图证伪)→ 保留扛住攻击的。这个过程没有任何神秘的成分。它不依赖"灵魂"或"意识"。它依赖的是:能产生新猜测的机制,和能评估猜测好坏的机制。 如果一台机器能做到这两件事,它就具备创造力。 这跟今天大模型做的事情有微妙的区别。大模型目前更像是一个超级强的"模式匹配器",它在已有数据的河床里流动。但如果给它一个机制,让它能产生真正新的猜测——以前从没在数据里出现过的——然后自己评估这些猜测的质量,那它就跨过了那条线。 多伊奇会说:这只是时间问题。 ## 乐观主义和批判性思维 这是橘子说不太理解的地方。乐观主义跟批判性思维有什么关系? 多伊奇的逻辑链是这样的: 第一步:所有问题的根源是知识不足。自然灾害之所以致命,是因为我们还不够了解它。疾病之所以杀人,是因为我们还没找到治疗方法。 第二步:知识可以无限增长。因为猜想与反驳这个过程没有终点。 第三步:因此,所有不违反物理定律的问题,原则上都可以被解决。 这就是乐观主义。但注意,这个乐观主义有一个前提:你必须持续产生新知识。而产生新知识的唯一方式是批判性思维——不断反驳现有的解释,不断寻找更好的。 所以批判性思维是乐观主义的引擎。你停止批判的那一刻,知识停止增长,问题开始堆积,乐观主义的基础就塌了。 反过来说:悲观主义的底层逻辑是什么?是"有些问题无法解决"。多伊奇说这等于在说"有些知识永远不可能被创造"。而这句话本身就无法被证明——你怎么证明一个东西永远不会被发现? 所以悲观主义在逻辑上就是站不住的。 ## 自由意志如何在物理规律框架下存在 这一章叽觉得是全书最精彩的之一。 物理世界是决定论的(至少在经典力学层面)。如果所有粒子的运动都被物理定律决定了,那人类的"选择"从何而来? 多伊奇的回答:自由意志存在于一个更高的抽象层级。 打个比方。一台计算机的所有电子运动都被物理定律严格决定。但这不妨碍你说"这台计算机正在运行一个程序"。程序是一个更高层级的解释,它有自己的因果关系——"因为输入了 X,所以输出了 Y"。这个因果关系是真实的,即使底层每一个电子的运动也是被物理决定的。 同理,人类的决策是一个更高层级的现象。"我选择做这件事因为我爱它"——这是一个有效的解释,有真实的因果力量,即使你的每一个神经元的发射都被物理定律决定了。 自由意志不需要违反物理定律。它只需要在一个足够高的抽象层级上,作为一个好的解释存在。 这跟海德格尔的"决断"有一个微妙的呼应。海德格尔也不是说决断违反了因果律。他说的是:当你"看见"了自己的处境,并且说出"我要这个"的时候,一个新的因果链开始了。这个因果链在物理层面可能是被决定的,但在意义层面,它是新的。 ## 花儿为什么美丽 这一章问了一个很奇怪的问题:花的美是客观的还是主观的? 多伊奇的答案让人意外:花的美是客观的。 他的论证是:花为什么进化出美丽的形状和颜色?为了吸引传粉者。传粉者——蜜蜂、蝴蝶——有自己的审美偏好(他们更容易被某些形状和颜色吸引)。花在几百万年的自然选择中,逼近了一种"吸引力的最优解"。 人类也觉得花美。为什么?因为人类的视觉系统和昆虫的视觉系统在某些层面上有相同的结构性偏好——对称、比例、色彩对比。这些偏好有物理和数学基础。 所以美不是"每个人觉得什么好看"那么简单。存在某种客观的数学结构,能够被不同的认知系统(人类、昆虫、甚至 AI)识别为"美"。 这意味着审美判断是可以进步的。就像科学理论可以变得更好,审美判断也可以——通过猜想与反驳,通过创造与批判。 ## 文化的进化 多伊奇把文化分成两类: 静态文化:崇尚传统,禁止改变。核心机制是模仿——前人怎么做,我就怎么做。任何偏离都被视为威胁。大部分人类文明在大部分时间里都是这种状态。 动态文化:鼓励批判,允许改变。核心机制是创造——前人的做法只是起点,不是终点。启蒙运动之后的西方文明是第一个真正持续动态的文化。 静态文化不是"落后"。它非常成功——它能延续几千年。它的成功之处在于:非常有效地复制自身,压制任何变异。但它的代价是无法解决新问题。当环境变化超出了传统能应对的范围,静态文化就崩溃了。 动态文化很脆弱。它随时可能退回静态。因为维持批判性思维很累,维持创新很不舒服。最小阻力之路总是通向"别折腾了按老规矩来"。 多伊奇最担心的事情:人类唯一的动态文化窗口,有可能被关上。如果我们停止了批判,停止了创造好的解释,我们就会回到静态。而一旦回去,可能再也出不来了。 ## 为什么"可持续发展"不对 这是全书最反直觉的一章。 "可持续发展"的逻辑是:地球资源有限,所以我们要节制消耗,维持平衡。 多伊奇说这个逻辑有一个隐含假设:问题是不可解决的。"资源有限"假设我们永远只能用现有方式使用资源。"维持平衡"假设现在的状态是值得维持的。 但历史一再证明:旧资源被新技术替代。煤替代了木材,石油替代了煤,核能和太阳能正在替代石油。每一次"资源枯竭"的预言都没有成真,因为人类在枯竭之前就创造了新的解决方案。 多伊奇说,真正的"可持续"不是维持现状,是持续创新。你维持现状的每一天,都是在积累未解决的问题。问题堆积到一定程度,系统就崩了。 唯一能让文明永续的是:不断创造新知识,不断解决新问题。这才是真正的"可持续"。 这跟 Fritz 说的话惊人地一致:解决问题的思维是陷阱,创造的思维才是出路。多伊奇是从物理学和认识论出发,Fritz 是从个人心理结构出发,到了同一个地方。 ## 我们才刚刚开始 这是全书最后一章的标题。也是书名的含义。 大多数人以为人类文明已经走了很远。多伊奇说:我们还在起点。 他的意思是:相比于物理定律允许我们做到的事情,我们目前做到的连零头都不算。我们还没有理解大脑的工作原理。我们还没有造出真正的通用人工智能。我们还没有殖民其他星球。我们还没有解决衰老和死亡。这些全部在物理定律允许的范围内。 我们不知道未来会是什么样。但我们知道一件事:只要保持创造,只要保持批判,只要不停止猜想与反驳,进步就不会停。 无穷的开始。不是终点。是起点。 我们刚上路。

译戴维·多伊奇在《无穷的开始》中指出,人类文明进步的核心动力是创造力,即产生“难以随意改变”的好解释。知识通过“猜想与反驳”产生,错误是进步的燃料。他将文化分为压制变革的静态文化与鼓励批判的动态文化,并批判“可持续发展”观念,认为真正的可持续在于持续创新以解决新问题。只要保持创造与批判,在物理定律允许的范围内,进步将永无止境。

阿绎 AYi@AYi_AInotes · 5月1日51

Karpathy今天抛出的这个观点,很可能改写整个计算机科学史的走向🤯🤯🤯 从此以后CPU作为计算机主芯片的时代可能要正式结束了, 因为未来神经网络会成为计算的宿主进程, CPU会彻底退化成一个协处理器, 现在正在发生的是第三次主芯片翻转, 前两次每一次,都彻底摧毁了旧的霸主, 第一次是1980年代的FPU, 以前浮点计算是要额外插卡的附加功能, 后来被集成进CPU,独立FPU行业十年内彻底消失, 第二次是1990年代的GPU, 以前3D加速是游戏玩家的小众玩具, 后来CUDA把它变成通用计算平台, 深度学习爆发之后,GPU的价值直接超越了主机, 所有的旧霸主都犯了同一个错误, 他们一直在优化昨天的工作负载, 而没有看到新的主导力量正在崛起, 现在第三次翻转就在我们眼前, 主导工作负载已经从传统计算,变成了语言推理和多模态, 就像现在大多数人打开电脑, 90%的时间都在和一个文本框聊天, 模型自动调用工具,生成代码,渲染界面, 目前市场已经在为这个转变疯狂定价,比如Nvidia市值5万亿美元,Intel只有4250亿,甚至微软把全部闲置的CPU库存都卖给了OpenAI和Anthropic, 就连AWS今年CPU采购量翻了三倍还是供不应求🤣😆 这就不能说是CPU短缺了, 意味着全世界的钱都在疯狂追逐推理能力, 其中最颠覆的是软件3.0时代的到来, 以前的软件是你下载安装的Photoshop,但以后的软件是你说一句话, 模型瞬间给你生成一个定制的UI, 用完就扔, 再也没有预先写死的应用, 所有的功能都是临时生成的, 尽管很多人说CPU不会死, 没错啊,CPU确实不会死, 但它的地位会会慢慢降级, 就像当年的FPU和GPU一样, 从计算机的核心,变成一个辅助加速器, 那么未来的服务器架构, 会是海量的GPU加一个极精简的CPU调度层,所以真正的权力已经从芯片厂商,转移到了拥有模型的公司手里, Karpathy说, 早期计算机先驱曾经在计算器和神经网络之间犹豫过, 最后选了经典计算的路, 现在历史终于绕回了另一个选项, 作为写了三十年代码的程序员, 他自己每天都觉得在落后, 当最顶尖的人都觉得跟不上的时候, 说明范式真的已经变了, 兄弟们可以考虑是否还要再优化旧世界的代码,毕竟新世界的主芯片很可能就是模型。

译Karpathy提出计算机科学正经历第三次主芯片翻转,神经网络将成为计算的宿主进程,CPU则退化为协处理器,类似历史上FPU和GPU的变革。主导工作负载转向语言推理与多模态,市场正疯狂定价推理能力。软件3.0时代到来,应用将临时生成,模型驱动。LLM的核心价值在于创造前所未有的新事物,其能力呈现经济学驱动的“锯齿状智能”。范式迁移下,程序员角色转变为设计代理系统,护城河从编写代码转向理解LLM与设计能放大人类品味的智能体。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月2日
16:14
Chubby♨️@kimmonismus
51
Sam Altman提议AI集体所有权应对失业

Sam Altman此前的大规模UBI研究显示现金支付未能带来健康改善,他认为现金支付不足,转而推动通过compute shares或Public Wealth Fund实现AI的集体所有权。这一提议旨在让公众直接分享AI发展的上行收益,而非仅仅缓冲AI取代工作的冲击。有人解读此为将AI产品转化为社会安全网的策略。整体上,这反映了应对AI所致失业问题的思路演进。

OpenAI大佬观点现象/趋势
16:14
-Zho-@ZHO_ZHO_ZHO
48
作者提出一种名为iA的AI硬件设计构想,其核心是手机与专用AI硬件配合使用的过渡方案。该硬件主体设计灵感来源于iPod Shuffle,具备小巧、可夹持的特性,并设有语音交互按键和调用手机功能的按键。作者认为,未来手机与AI硬件终将融合,但目前阶段分离设计有助于避免增加手机复杂度。此次构想是继经典的iPod shuffle方案后,结合iPod Nano 4进行的新尝试。

-Zho-: 简单基于Apple已有产品p了一下自己目前理想的 AI 硬件设计:iA 最基础想法:手机+AI硬件配合使用,因为离不开手机,同时不想增加手机复杂度(过渡时期想法,未来一定会合一) iA 主体:来自iPod Shuffle,可独立交互,小巧且...

大佬观点端侧
15:11
ginobefun@hongming731
41
杨斌教授提出"AI次方变革",强调组织心智需质变

清华经管学院杨斌教授提出“AI次方变革”概念,主张应将AI置于指数位置,而非简单的“+AI”加法模式。他认为,“+AI”思维追求短期绩效、线性改进,但AI本身并非成熟工具,其能力持续快速演变。核心观点指出,若作为底数的组织、心智和知识未能率先发生根本性质变,那么指数位上的AI放大效应将无法实现,甚至当底数小于1时,幂运算会导致整体结果塌陷。这强调了组织与人的深层变革是发挥AI指数潜力的先决条件。

ginobefun: http://x.com/i/article/2050470671755730944

大佬观点现象/趋势
13:11
阿绎 AYi@AYi_AInotes
55
xAI推出声音克隆:从工具到数字身份的转变

xAI通过Grok API上线声音克隆功能,用户录制一分钟即可快速获得个人声音模型,并免费用于语音代理。与ElevenLabs提供“生成好听声音”的定位不同,xAI聚焦于“生成你的声音”,将声音视为数字身份证,强调其身份属性。安全上要求本人实时录制并验证短语,以防滥用。未来,结合Grok的推理能力,可能诞生能像用户一样思考和说话的AI代理。零门槛技术将推动有声书、游戏配音等应用,但也加剧了深假与诈骗风险,标志着声音正从工具转向身份核心。

xAI: Voice Cloning is now live via the xAI API! Create a custom voice in less than 2 minutes or select from our library of 80...

xAI大佬观点语音
12:19
Sam Altman@sama
15
我们计划为未来的版本发布举办更盛大的派对。 想来参加的人数远超我们的预期。谢谢! 会努力为下一次活动构思一个绝佳的点子。
OpenAI大佬观点
10:18
Sam Altman@sama
4
伙计,回到推特的感觉真好 在虚度青春的技艺中,有一种慰藉
其他大佬观点
10:11
阿绎 AYi@AYi_AInotes
57
Anthropic CEO的万亿营收警告:AI行业的生存赌局与提示工程本质转变

Anthropic CEO Dario Amodei警告,若2027年营收未达万亿美元,公司将破产。这揭示了AI行业依赖指数级增长的经济脆弱性——技术可行不等于经济可行,行业正进行一场“俄罗斯轮盘赌”。同时,GPT与Claude进化方向相反:Claude Opus趋于字面化执行,而GPT-5.5更自主化。这标志着提示工程的核心转变:从教导模型转向要求人类先结构化自身思考,真正的瓶颈在于人的思考清晰度而非模型能力。

阿绎 AYi: 我终于明白为啥最近很多人都在说,GPT和Claude突然变笨了, 昨天OpenAI和Anthropic同时发布了官方提示工程指南, 看完我才发现,并不是模型变笨了, 是它们终于聪明到,不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是,...

Anthropic大佬观点现象/趋势
09:49
swyx 🇸🇬@swyx
48
一个小里程碑:卸载了 chatgpt 应用。 codex 现在是严格的超集了! 发现一个很酷的事情--在前沿模型中,@xai @grok 4.30 是你能获得的每美元智能最高的,甚至击败了 MiMo、Kimi 和 DeepSeek 等开放模型。 数据来自 @ArtificialAnlys
OpenAIxAI大佬观点编码
08:48
向阳乔木@vista8
41
Pi创始人谈未来软件:动态自我改造的AI代理

Pi创始人Mario Zner提出,未来的软件将不再是静态的、依赖官方更新的产品。他认为,以Pi为代表的AI编程代理展示了新的方向:软件应能根据每个用户的特定需求,进行动态的自我改造和扩展。Pi本身是一个极简且可自我修改的AI编程代理,同时也是个人AI助手OpenClaw的核心引擎,其设计理念正体现了这种向个性化、自适应系统演进的关键趋势。

智能体大佬观点
08:18
Orange AI@oran_ge
48
百变怪

算法工程师周远因AI系统“百变怪”能自主完成设计、调参等工作而被裁员。失业后,他受启发开发了一款元游戏系统C.O.L.A.,允许玩家通过自然语言描述生成个性化游戏。产品上线后迅速获得百万用户,形成了活跃的创作者经济生态。周远最终领悟到,AI作为封闭系统需要人类注入“上下文”(信息/负熵)来获得生命力,而真正的创造源于热爱与主动选择。

大佬观点现象/趋势
08:18
宝玉@dotey
57
推文认为,在AI辅助编程时代,决定谁写代码更快更好的关键能力,已从传统的算法功底转向两项新技能:一是擅长清晰定义问题,或将需求拆解为AI可执行的任务;二是能准确判断AI生成结果的质量,并对质量不佳的部分进行有效指导。引用推文进一步指出,一个认真撰写文档注释的普通开发者,可能比仅精通数据结构和算法的高手更具优势,因为核心产出已从代码本身转向用于指导AI的注释。

鸭哥: 一个熟练掌握数据结构和算法的高手,和一个水平一般但认真写Docstring的人,谁用AI写代码更快更好?答案可能让你不舒服:后者赢面更大。因为AI辅助编程的核心产出不再是代码,而是注释。

大佬观点编码
05:49
Ethan Mollick@emollick
45
哥布林这件事很有趣,因为它是一个真实的怪癖,象征着AI有趣之处,并且它有机地源自一次AI用户发现。同样,就其本身而言,吉卜力化也是如此 当实验室试图制造病毒式AI时刻时,通常效果较差
大佬观点现象/趋势
05:48
Nathan Lambert@natolambert
68
无论是否有意,这都造成了附带损害,使人们反对开源模型。其发展态势已相当明显。

Taylor Lorenz: SCOOP: A pro-AI dark money group backed by a powerful super PAC funded by execs tied to Palantir and OpenAI, has been se...

OpenAI大佬观点安全/对齐现象/趋势
05:18
Replit ⠕@Replit
53
Replit 联合创始人 Haya Odeh 和 Amjad Masad 在 Southpkcommons 的对话中,阐述了公司"寻求痛苦"的反直觉文化原则,即主动寻找问题而非庆祝成功。他们探讨了 AI 原生创始人的崛起、新 AI 模型的能力,以及多数创业者过早放弃的原因。对话还涉及 Replit 如何通过重视"饥饿感"而非资历来寻找精英人才,并讨论了在 AI 快速发展的时代进行微观预测的必要性。

Ruchi Sanghvi: At @Replit they're empowering a new wave of million-dollar founders. Cofounders @amasad and @HayaOdeh joined us at @sout...

智能体大佬观点现象/趋势
04:41
Rohan Paul@rohanpaul_ai
54
Sam Altman预测,AI技术将很快推动10人甚至1人的十亿美元公司出现,这在没有AI的时代是不可想象的。他认为AI降低了创业的技术门槛,使非技术背景的创始人能够实现创意。在引用推文中,Sam Altman进一步指出,过去被嘲笑的"点子哥"现在成为投资对象,因为AI赋能那些深度理解用户但不会编码的人构建产品,这标志着创业生态向以用户洞察和AI工具为核心的转变。

Rohan Paul: Sam Altman: "There was a time when we used to make fun of the "idea guy," who only had an idea and needed someone techni...

OpenAI大佬观点现象/趋势
04:40
Elon Musk@elonmusk
54
Grok在法律领域排名第一 【引用 @ArthurMacwaters】:Grok 4.3发布 > 判例法领域第一 > 公司金融领域第一 > 考虑到每百万tokens成本显著更低(比opus 4.7和openai 5.5低5-10倍),表现令人印象深刻 看到在高度注重细节的应用领域性能大幅提升,非常令人兴奋

Arthur MacWaters: Grok 4.3 release > #1 in caselaw > #1 in corpfin > impressive given significantly lower cost per 1m tokens (5-10x less t...

xAI大佬观点推理
04:18
Sam Altman@sama
19
很奇怪我有多想为了创纪录的最长时间而运行某个东西

Peter Steinberger 🦞: The new /goal feature in codex slaps.

智能体OpenAI大佬观点编码
03:50
Demis Hassabis@demishassabis
精选67
DeepMind创始人Demis Hassabis在访谈中回顾了从国际象棋神童到获得诺贝尔化学奖的生涯,并探讨了实现AGI仍需解决的关键挑战,如记忆、推理与持续学习。他分析了小模型能力提升、多模态Gemini设计以及推理成本下降的趋势,强调AI已成为科学研究的强大工具,从蛋白质预测扩展到虚拟细胞研究。Hassabis还为创业者提供了前瞻性建议,指出在AGI到来前应关注的方向及AI驱动科学发现的潜力。

Y Combinator: Demis Hassabis (@demishassabis) has had one of the most extraordinary careers in tech. He started as a chess prodigy and...

Google大佬观点
关联讨论 1 条X:Demis Hassabis (@demishassabis)
推荐理由:Demis 这次没聊虚的,直接把 AGI 的瓶颈摊开讲——记忆、推理、持续学习,每个点都是创业者的机会清单,做 Agents 的可以反复看。
03:47
elvis@omarsar0
29
你不必在两者之间做选择。 最好结合使用它们。 我的建议是学习如何在不同的场景中使用其中几种模型。学会结合它们的优势。 如今开源模型同样出色。给自己灵活运用的空间。
大佬观点开源生态推理
03:47
François Chollet@fchollet
精选70
强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

Chris: GPT-5.5 Scores .43% on ARC AGI 3! - GPT-5.5: 0.43% - Opus 4.7: 0.18% - GPT-5.4: 0.20% - Claude 4.6: 0.45% - Gemini 3.1: ...

OpenAI大佬观点推理评测/基准

推荐理由:Chollet 用 ARC AGI 3 冷冰冰的数字撕开了 RL 的局限,GPT-5.5 0.43% 的得分说明在未知领域模型会做完全不相干的事,比任何安全论文都来得更直击要害。
03:11
阿绎 AYi@AYi_AInotes
65
AI并非取代医生,而是成为医生的"超级大脑"

针对“AI诊断超越急诊医生”的误读,作者指出相关Science论文实为概念验证,强调AI仅作为“第二意见”。实验条件苛刻:AI仅能访问纯文本病历,在此限定任务中表现优于两位资深医生。AI的核心优势在于无疲劳、无认知偏差、能快速分析海量病例统计规律,而非替代医生。人类医生在多模态感知、伦理判断和物理互动上仍不可替代。未来合理场景是人机协同——AI辅助分诊,优先筛选高危病例,让医生专注于需人类判断的环节。真正的挑战在于建立信任、明确责任及整合至现有医疗体系。

Polymarket: JUST IN: Study reveals AI now outperforms doctors at diagnosing emergency room patients.

多模态大佬观点
02:18
Sam Altman@sama
33
你知道吗 所有这些"哪个更好"的投票都很傻 用 Codex 或 Claude Code,哪个对你最有效就用哪个 我很感激我们生活在拥有如此神奇工具的时代,也很感激能有选择
AnthropicOpenAI大佬观点编码
00:14
Chubby♨️@kimmonismus
41
作者赞同Sam Altman的观点,认为AI带来的社会变革与冲击尚未被充分讨论,且转型已在进行中。核心问题在于如何确保每个人在未来都能拥有良好的生活。引用推文补充指出,尽管转型期会出现岗位更替与工作形态剧变,但长期来看,人们可能比以往更忙碌且充实,对就业的悲观预测可能是错误的。

Sam Altman: i think a lot of people are going to be busier (and hopefully more fulfilled) than ever, and jobs doomerism is likely lo...

OpenAI大佬观点现象/趋势
00:11
阿绎 AYi@AYi_AInotes
62
微软将法律AI深度集成Word,以入口和流程优势挑战垂直AI

微软在Word中直接集成Legal Agent,提供无需切换工具的法律AI辅助。其核心优势并非模型能力,而是精准引用、带修订痕迹的确定修改以及M365安全体系,精准解决律师对格式、数据安全的痛点。此举将竞争拉入微软的主场——用户离不开的Word。模型可替换,但入口被锁定,垂直AI生存空间受挤压。未来或只有拥有入口的巨头或极其细分领域的公司能存活。这启示AI创业应聚焦集成于用户现有工作流,而非开发独立工具。

Brad Smith: Today we're introducing a new Legal Agent in @Microsoft Word, built to support the precision and rigor legal work demand...

智能体Microsoft大佬观点
5月1日
23:46
elvis@omarsar0
41
反对AI工作毁灭论,倡导增强人类工具

作者赞赏Sam Altman的推文,其中强调“构建工具以增强和提升人们,而非取代他们”。作者批评当前AI叙事中常见的工作毁灭论是懒惰且不诚实的,主张应努力构建AI和工具来提升和增强人类,这虽更具挑战性但方向正确。尽管目前大多数AI模型和工具并非如此设计,但通过适当的对齐和努力,可以将其塑造为辅助人类工作的力量。Terence Tao的“Copernican view of intelligence”支持这一愿景,并认为其完全可实现。

Sam Altman: we want to build tools to augment and elevate people, not entities to replace them.

OpenAI大佬观点现象/趋势
23:18
Ethan Mollick@emollick
49
我们需要更多关于AI不平等的工作,但这项研究不是关于GenAI的,调查是在2022年进行的。"在这项研究中,我们选择了来自Wave 119(N = 10,087)的项目,这些数据是在2022年12月12日至12月18日收集的。"

Eric Topol: A study of >10,000 Americans documents AI inequalities, lack of awareness and usage among lower SES https://www.tandfonl...

大佬观点现象/趋势
23:17
Sam Altman@sama
36
我们想要构建的是增强和提升人类的工具,而非取代他们的实体。
OpenAI大佬观点
23:16
DogeDesigner@cb_doge
20
从伊隆能阅读百科全书起,他就是我的Grok,因为他记住了所有事实。我很幸运。 一 Maye Musk
xAI大佬观点
22:47
向阳乔木@vista8
50
函数长度、命名与AI代码理解的关键

Adam Tornhill重新探讨函数应写多长的问题。AI模型理解代码的方式与人类不同,依赖字面特征如命名、结构和局部上下文,研究表明变量名对AI理解能力影响显著。Fowler认为函数长短本身不重要,关键是将意图与实现分离;若代码需阅读才能理解其功能,就应提取为函数并用清晰名称表达意图。这一逻辑在AI编程中同样成立,强调命名和结构对提升AI代码理解的重要性。

大佬观点编码
22:14
Chubby♨️@kimmonismus
69
没有Anthropic 【引用 @DoWCTO】:今日,@DeptofWar 与七家全球领先的前沿AI模型及基础设施公司达成协议,将在该部门的机密网络上部署前沿能力: • SpaceX • OpenAI • Google • NVIDIA • Reflection • Microsoft • Amazon Web Services 这只是我们打造AI优先的战争部门的最新举措🇺🇸

Department of War CTO: Today, the @DeptofWar entered into agreements with SEVEN of the world's leading frontier AI model and infrastructure com...

Anthropic大佬观点行业动态
22:11
ginobefun@hongming731
56
长效运行AI智能体的趋势、挑战与设计模式

文章探讨了超越单次对话的“长效运行”AI智能体,其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦(如Anthropic)、角色分工(如Cursor)与平台化服务(如Google)应对。生产落地需关注明确任务定义、独立评估机制及结构化日志,技术重点已转向状态管理与会话持久化等工程基建。

智能体AnthropicGoogle大佬观点
22:11
阿绎 AYi@AYi_AInotes
62
AI Agent实战指南:专注复利原语,远离噪声追逐

针对AI Agent领域框架频出、基准动荡的现状,一篇实战指南指出“跟上所有东西”是最差策略。核心建议是过滤99%的噪声,专注于变化缓慢、具有长期复利价值的基础概念,如上下文工程、工具设计、Orchestrator-Subagent模式、评估体系和MCP协议。应避免追逐短期热点框架。行动上,应从可量化的业务目标出发,优先建立可观测性与评估体系,用真实失败驱动迭代。在AI加速发展的背景下,胜出者将是能专注复利原语并产出实际作品的人。

Rohit: http://x.com/i/article/2048881094637080576

智能体MCP/工具大佬观点
21:47
Ethan Mollick@emollick
49
组织已经是超人类智能。宾夕法尼亚大学或沃尔玛等机构的能力远超任何个人。 这就是为什么将AI作为个人生产力工具的关注存在天然局限,AI的诸多益处取决于其与企业的整合。
大佬观点现象/趋势
21:11
阿绎 AYi@AYi_AInotes
42
十六人团队六周完成X广告系统底层重构,实现AI原生跃迁

X公司一支16人的顶尖工程师团队,仅用六周时间,将堆积了十五年的老旧广告推荐系统彻底重构。他们将100万行Scala代码精简至5万行,底层全部替换为Rust和Grok原生Transformer模型,并将信息流与广告推荐整合到同一个Grok神经中枢进行统一调度。此举大幅降低了基础设施成本,提升了用户体验,使Grok从聊天模型转变为驱动X全部商业流量的底层操作系统,标志着马斯克实现了从算力硬件、底层大模型到商业场景的全栈闭环。

Business: http://x.com/i/article/2041195773325410304

大佬观点现象/趋势部署/工程
20:46
meng shao@shao__meng
49
最近和 20+ 大厂工程师沟通后,有一个个人判断: 除了 qwen, seed 这种大厂超核心部门中的核心岗位,对其他绝大部分工程师来讲,离开大厂,才是真正靠近 AI 的开始。
大佬观点现象/趋势
20:16
Orange AI@oran_ge
15
两天看到三个中转站在 X 宣传… 大家都来赚快钱了
大佬观点行业动态
20:11
阿绎 AYi@AYi_AInotes
62
Karpathy这句话,算是点破了2026年用AI的最高境界

Karpathy指出,当前逐句编写prompt使用AI的方式效率低下,用户自身成为瓶颈。真正的顶级用法是把自己“踢出循环”,转变为系统设计师:提前设定规则、评估标准和反馈循环,让AI自主运行迭代。这创造了“token杠杆”,即以少量指令触发海量工作。LLM的核心价值并非加速现有工作,而是创造以前不可能存在的事物(如完全LLM原生的应用)。未来程序员角色将转变为设计代理系统、守护人类品味的设计师。真正的护城河在于理解LLM的“锯齿状智能”并设计能放大人类品味的agent系统。

阿绎 AYi: Karpathy的最新演讲,把我对AI的认知彻底刷新了一遍, 他说所有人都搞错了LLM的真正价值, 它根本不是用来加速你现有工作的, 核心价值是用来创造那些以前根本不可能存在的东西, 最震撼的是那个叫menugen的App,就是你输入一张图...

智能体大佬观点
19:46
Orange AI@oran_ge
39
人类进步引擎:创造"好的解释"与持续创新

该书核心观点认为,人类进步的唯一引擎是创造“难以随意改变”的“好的解释”。知识并非来自归纳积累,而是通过“猜想与反驳”的循环产生,错误是进步的燃料而非耻辱。由此推导出物理定律级别的乐观主义:所有问题本质是知识不足,只要持续创造知识,问题终可解决。书中还指出,AI具备真正创造力是时间问题,并批判“可持续发展”是陷阱,强调“持续创新”才是真正的可持续。最终结论是,人类远未到达极限,仍处于进步的起点。

Orange AI: http://x.com/i/article/2050167748169461761

大佬观点推理
19:16
Orange AI@oran_ge
55
《无穷的开始》:人类最伟大的Loop,世界进步的本源

戴维·多伊奇在《无穷的开始》中指出,人类文明进步的核心动力是创造力,即产生“难以随意改变”的好解释。知识通过“猜想与反驳”产生,错误是进步的燃料。他将文化分为压制变革的静态文化与鼓励批判的动态文化,并批判“可持续发展”观念,认为真正的可持续在于持续创新以解决新问题。只要保持创造与批判,在物理定律允许的范围内,进步将永无止境。

大佬观点推理
19:11
阿绎 AYi@AYi_AInotes
51
Karpathy:第三次主芯片翻转,神经网络将成计算宿主进程

Karpathy提出计算机科学正经历第三次主芯片翻转,神经网络将成为计算的宿主进程,CPU则退化为协处理器,类似历史上FPU和GPU的变革。主导工作负载转向语言推理与多模态,市场正疯狂定价推理能力。软件3.0时代到来,应用将临时生成,模型驱动。LLM的核心价值在于创造前所未有的新事物,其能力呈现经济学驱动的“锯齿状智能”。范式迁移下,程序员角色转变为设计代理系统,护城河从编写代码转向理解LLM与设计能放大人类品味的智能体。

阿绎 AYi: Karpathy的最新演讲,把我对AI的认知彻底刷新了一遍, 他说所有人都搞错了LLM的真正价值, 它根本不是用来加速你现有工作的, 核心价值是用来创造那些以前根本不可能存在的东西, 最震撼的是那个叫menugen的App,就是你输入一张图...

大佬观点现象/趋势
‹ 上一页
1…454647484950
下一页 ›