AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2408 条
全部一手资讯X论文
标签「大佬观点」清除
Nathan Lambert@natolambert · 5月25日64

Something that's squashed in this is that other things impact the evolution of AI than just the few labs with mega compute. There are many social dynamics, policy, diffusion, etc and there's a substantial unaddressed opportunity for impact here. Open science/models one way.

译当前AI进步常被归因于少数算力雄厚的实验室。推文指出,社会动态、政策、技术扩散(diffusion)等其他因素同样深刻影响AI演进,且此领域存在未被充分重视的影响力机遇。开放科学与开放模型是应对方向之一。文中引用观点指出,通往AGI的预训练工作高度集中于OpenAI、Google、Meta等巨头,算力差距的残酷现实是,AGI关键路径上的问题现需巨大算力门槛。

Rohan Paul@rohanpaul_ai · 5月25日62

Reuters: DeepSeek just made its V4-Pro price cut permanent, pushing the price down to 25% of its original API cost. DeepSeek has not confirmed that better Ascend 950 supply caused the permanent cut, but the timing points to a cost curve moving downward as China’s AI stack shifts from restricted Nvidia chips toward Huawei hardware. --- reuters. com/world/china/chinas-deepseek-make-permanent-75-price-cut-flagship-v4pro-ai-model-2026-05-23/

译路透社报道,深度求索宣布其旗舰模型V4-Pro的API价格永久下调75%,但未直接确认这是由于华为昇腾芯片供应改善。报道分析,此举时机恰逢中国AI算力栈从受限的Nvidia芯片向华为昇腾硬件迁移带来的成本下降。据引述分析,DeepSeek的核心战略是通过架构创新(如MoE、DSA,以及V4-Pro的CSA/HCA技术)大幅降低对高端HBM GPU的依赖,其技术指标显示1M-token推理FLOPs和KV cache显著降低。其目标在于优化模型,使更多样的硬件(如LPDDR、NAND、定制ASIC)能够运行前沿AI,以适应不同的工业基础。

elvis@omarsar0 · 5月25日17

We are going to need so many engineers and researchers where things are headed. Don't listen to the noise, go learn the fundamentals and build/collaborate with AI as much as you can.

译按照目前的发展方向,我们将需要大量的工程师和研究员。 不要听信噪音,去学习基础知识,并尽可能多地与AI一起构建/协作。

Rohan Paul@rohanpaul_ai · 5月24日72

Jensen Huang says nothing would give him more joy than if none of his engineers were coding at all. Instead, they’re just solving undiscovered problems. His framework is 'Purpose vs Task' - coding is just a task, that should be minimized (ideally to 0).

译黄仁勋表示,如果他的工程师们完全不写代码,那将是他最大的快乐。相反,他们应该专注于解决尚未被发现的问题。 他的框架是“目的与任务”——编码只是一项任务,应该被最小化(理想情况下为0)。

Rohan Paul@rohanpaul_ai · 5月24日61

Terence Tao on how to pick a career in era of AI.

译陶哲轩谈如何在AI时代选择职业。

ginobefun@hongming731 · 5月24日67

Bob 大叔认为,未来的程序员将使用像 Gherkin 这样的声明式规范语言,而过程式代码将成为 AI 的领域。

译Bob大叔认为,未来编程的核心范式将发生转变。程序员将使用类似Gherkin的声明式规范语言来描述目标和约束,而传统的过程式代码(涉及顺序、选择、循环等逻辑)将主要由AI来生成和实现。他强调,尽管仍需形式化与精确性,但新的编程语言将不再直接描述计算机的执行步骤,而是定义AI需要达成的“目标集”。

Chubby♨️@kimmonismus · 5月24日48

"We look forward to making Mythos-class models available through general release" I don't understand Anthropic's strategy regarding Mythos. On the one hand, everyone is saying that Mythos has achieved the expected quality and is finding bugs and exploits that no other model has ever found. On the other hand, precisely for this reason, Anthropic has repeatedly stated that it's "too powerful for release." Why the sudden about-face? One explanation: PR. The preview, including a benchmark, combined with the statement that the model wouldn't be released due to its power, generated a lot of attention. But does Anthropic really need that? Anthropic is so significant because they primarily serve enterprises. Their biggest problem: compute. Too many want Claude, too little compute to support it adequately. Therefore, this PR move wasn't necessary, and the IPO is still in the near future. In short: it seems downright erratic to now do the exact opposite of what was stated. Be that as it may, once the guardrails are in place and there is general availability, SWEs will receive a significant boost. Judging by the benchmarks, nothing even comes close to the myth so far.

译Anthropic的发布策略看似矛盾:其Mythos模型性能卓越,能发现其他模型无法发现的漏洞,因此一度被官方声称“过于强大而无法发布”;但最新声明又表示将通过通用发布使其可用。这突然的转向被分析可能并非PR炒作,考虑到其核心瓶颈是算力不足且临近IPO,热度并非关键需求。尽管策略存疑,但一旦模型就绪并设立安全护栏,其远超现有水平的性能将为软件工程带来显著提升。推文引用显示,此次宣布可能是认真举措。

Rohan Paul@rohanpaul_ai · 5月24日47

Fei-Fei Li ( @drfeifei ) beautifully explains Robotics. She defines robotics not by form, like humanoids or cars, but by function: they are any "embodied machines" that must perceive, understand, and act within a physical, 3D space. This core requirement is "spatial intelligence," the unifying principle of all robotics, allowing them to perform tasks and even collaborate with humans. Throughout all of human history, we have been confined to a single, shared reality: the "physical Earth 3D world." This singularity has been our only playground. However, new technologies that combine 3D generation and reconstruction are shattering this limitation. We can now create "infinite universes"—a multiverse of digital worlds for countless purposes, from training robots to enabling creativity, travel, and storytelling. This leap from one physical world to an infinite multiverse unlocks boundless possibilities for human imagination and interaction. Video from @a16z

译李飞飞重新定义机器人学,强调其核心是“空间智能”——即机器在三维物理空间中感知、理解与行动的能力。这一能力使机器人能执行任务并实现人机协作。3D生成与重建技术正打破人类仅能体验单一物理世界的局限,创造出用于训练、创造、旅行与社交的无限数字多元宇宙。未来,人们将以“多元宇宙”的方式生活,极大拓展人类想象与交互的边界。

Rohan Paul@rohanpaul_ai · 5月24日40

Ex-Google executive Mo Gawdat defines Intelligence. "If we accept that intelligence itself is not a physical property, then it does not matter whether that intelligence is produced on carbon-based computer structures like humans, silicon-based computer structures like today’s hardware running AI, or quantum-based computer structures in the future. Intelligence is produced within machines when we stop imposing our own intelligence on them." --- From 'The Diary Of A CEO and Mo Gawdat' YT channel (link in comment)

译前Google高管Mo Gawdat对“智能”提出新定义。他认为,智能并非物理属性,因此其实现载体并不重要,无论是碳基(人类)、硅基(当前AI硬件)还是未来的量子计算结构。核心观点在于,当我们停止将自身智能强加给机器时,智能便会在机器内部产生。这一论述挑战了以人类为中心的智能观,强调智能的发展应超越特定的物质基础。

Berryxia.AI@berryxia · 5月24日35

OPC 不可靠,没有稳定的现金流奶牛。 不如回大厂继续做牛马?

译Andrej Karpathy(OpenAI联合创始人、前特斯拉AI负责人)加入Anthropic,引发行业震动。值得关注的是,他同步免费公开了相关知识,无需付费即可获取。更关键的是,他本人亲手终结了自己此前提出的“氛围编码”概念,明确指出“LLM是幽灵而非动物”,宣告软件3.0时代正式到来。这一转变凸显了个人顶尖技术价值正在超越机构绑定,同时也暗示AI行业的发展路径与人才流动正在发生深刻变化。

Tibo@thsottiaux · 5月24日30

Codex can do incredible things on demand, but it cannot experience life for you. Don’t forget to get out there and remember who you’re building for.

译Codex能按需完成不可思议的任务,但它无法替你体验生活。 别忘了走出去,记住你为谁而创造。

Orange AI@oran_ge · 5月24日52

这篇文章的核心就是这一张图了 deepseek v4 pro 虽然不是最好的模型 但是缓存基本不要钱 这是所有大模型都需要的技术 opus 用这个技术成本都能下降10倍 同时相信 v4.1 有了真实的 harness 数据进行训练之后,一定会很快变好

译DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。

宝玉@dotey · 5月24日52

http://x.com/i/article/2058418354415644672 # DeepSeek 的 10 万亿美元大战略【译】 作者:GDP (@bookwormengr) 标题:DeepSeek's 10 trillion USD grand strategy 你有没有想过,DeepSeek 到底打算怎么赚钱,而且是赚大钱? 他们没有像智谱(GLM)、月之暗面(MoonShot)和 MiniMax 那样推出有竞争力的编程订阅计划。他们没有多模态、语音或视频模型。时至今日,他们甚至连一个评测框架(Harness,用于测试和评估模型性能的基准测试工具)都没有(虽然最近听说他们开始招人做了)。而且,DeepSeek 还长期致力于开源,乐此不疲地分享自己的“独家秘方”。这难道是疯了吗?还是纯粹在烧钱?那些正准备给他们投资 100 亿美元的投资人们,难道是在把钱往水里扔吗? 不,在我看来,恰恰相反!!! 在这里,我想聊聊我对他们至今所作所为的观察,以及他们似乎正在践行的战略。DeepSeek 创始人梁文锋的眼光显然盯着一个大得多的终极奖杯——他们不仅自己能冲击 1 万亿美元的市值,还能顺便帮中国催生出一个高达 10 万亿美元的产业巨兽! ## 重新审视 DeepSeek 的“英雄之旅” DeepSeek 总是逆风而行,他们不屑于去卷那种“比别人好一点点”的微调模型,也不急着去卖当下的应用(比如各种编程套餐)。我在 2025 年 1 月 27 日发过一条疯传的推文,谈到了我所看到的景象,而现在的剧情正变得越来越精彩。 - 当大家都在死磕稠密模型(Dense Models,所有参数都参与计算的传统大模型结构)时,DeepSeek 却迎难而上,选择了极难训练的混合专家模型(MoE, Mixture of Experts)。 - 他们从“第一性原理”(First Principles)出发,发明了全新的 GRPO 算法,取代了在强化学习(RL, Reinforcement Learning)中虽然占据统治地位、但实现成本极高的 PPO 算法。 - 他们摸索出了基于验证奖励的强化学习(RLVR, Reinforcement Learning from Verified Rewards),并将其作为提升模型推理能力的杀手锏。 - 他们通过“多 Token 预测”(MTP, Multi-Token Prediction)提出了一种绝妙的投机解码(Speculative Decoding,一种通过预判后续单词来加速大模型生成速度的技术)策略,同时还让训练信号变得更加密集。 - 他们完美打造了“零气泡”(Zero-Bubble)流水线并行技术,把有限的 GPU 资源压榨到了极致。 - 他们开源了专家负载均衡器(Expert Load Balancer),让所有人都能轻松部署混合专家模型。特别是通过“宽专家并行”(Wide Expert Parallel)策略,模型可以在大批次下运行,使得服务成本大幅降低。 - 他们发明了 MLA、DSA、CSA 和 HCA 等一系列魔改注意力机制的技术,极大地缩减了 KV 缓存(KV Cache,大模型推理时用于存储历史对话记忆的显存空间)的需求,让计算需求在面对无限拉长的上下文时几乎保持恒定。 - 他们发明了 Engram(印迹模块),实现了用内存换算力的神奇操作。 - 他们发明了 mHC(修正超连接),解决了模型体量暴增时的训练稳定性难题。这个创新清单还能一直列下去…… 在英雄之旅这个最经典的叙事结构里,主角一开始并不知道自己的终极使命是什么。他是在一路上摸爬滚打,逐渐领悟了伟大的天命,然后排除万难去完成它。在这个过程中,他会遇到无数的冷嘲热讽,但他选择无视;他会遇到不怀好意的对手;他本身也有致命的弱点或短板——但他最终战胜了自我,达成了使命。他直面那些看似无法逾越的难关,却总能巧妙地结盟、精明地整合宝贵的资源。这就是为什么观众会不自觉地为英雄摇旗呐喊。这也是为什么 DeepSeek 在赢得全球无数粉丝狂热追捧和尊敬的同时,也招来了不少争议。 接下来我将为你详细拆解,DeepSeek 在这条路上已经走得足够远,并且已经窥见了他们的终极宿命:他们的格局根本不是卖什么编程订阅,而是去撬动一个价值 10 万亿美元的中国 AI 硬件生态圈,并以此顺理成章地让自己斩获 1 万亿美元的市值。在这个过程中,他们甚至还会顺手帮一把西方硬件生态中的一众新玩家。 欢迎大家探讨与指正。 ## 先来算一笔好玩的 KV 缓存账: 来看看知名半导体分析机构 @SemiAnalysis_ 发布的这条非常及时的推文: 我们先来做点有趣的 KV 缓存数学题。别担心,如果你讨厌数学,我们也只是用最近发布的 KV 缓存计算器,来看看 DeepSeek V4 Pro 到底能省下多少 KV 缓存,并把它跟最新的智谱 GLM 和阿里通义千问(Qwen)模型做个对比。 我以 100 万(1M)上下文长度为例进行计算,假设 KV 精度为 8 位(8-bit),索引器精度为 16 位(16-bit)。你自己也可以去这个网站上玩玩: https://kvcache.ai/tools/kv-cache-calculator/ 在 100 万上下文深度下: 1. DeepSeek V4 居然只需要 5.48 GB 的高带宽内存(HBM, High Bandwidth Memory,一种常用于顶尖 AI 显卡的高速显存)。 1. GLM5 需要 60 GB 的 HBM。 1. Qwen3-235B-A22B 则需要高达 89 GB 的显存! 请注意,这还是在以下前提下: 1. DeepSeek 是一个拥有 **1.6 万亿(1.6T)**参数的巨无霸模型。 1. GLM5 大约是 7000 亿(700B)参数,而且它已经借鉴了 DeepSeek 的 MLA 和 DSA 技术,只是还没用上最新的压缩注意力机制。 1. Qwen3-235B-A22B 只有 2350 亿参数,使用的是相对传统的 GQA(分组查询注意力机制)。 DeepSeek 在缓解显存压力方面做出了奠基性的贡献。如果这项创新被行业广泛采纳,将让那些需要处理超长任务的长程 AI 智能体(Long-horizon Agents)成本低到难以置信,从而彻底解锁下一代崭新的应用场景。 ## 疯狂背后的精密章法: 能够在完全不牺牲模型质量的前提下,把 KV 缓存压缩得如此之小,正是他们敢把长时缓存(Long-held Cache)价格压到白菜价的底气所在——其价格甚至不到 Anthropic 旗下 Claude Sonnet 4.6 缓存命中价格的 3%,而且他们还能帮你免费保留好几个小时! 对于长程任务来说,由于缓存体量极小,将其“转存”(Offloading)到固态硬盘(SSD)并在需要时重新加载,就变得极为划算。这就大大降低了对 HBM 的依赖。要知道,HBM 目前全球严重短缺,而且从中国 AI 硬件产业的角度来看,这也是制造难度极高的核心痛点。更绝的是,DeepSeek 还开发了一套能从 SSD 中以极高速度重新加载 KV 缓存的技术,具体细节都在他们的论文里:https://arxiv.org/pdf/2602.21548 ## 谁是这场“KV 缓存压缩战”的直接受益者? 谁在大量供应 SSD?别忘了长江存储(YMTC)正在崛起为全球 3D NAND 闪存巨头。闪存技术(NAND)让 DeepSeek 能够直接读取缓存,从而避免了每次都重新计算 KV 的巨大算力浪费。反过来,DeepSeek 正在为 NAND 闪存和固态硬盘创造一个无比庞大的新市场——这不仅让长江存储受益,也让整个产业链所有玩家跟着大赚。 ## 然而,格局绝不仅仅局限于 NAND 和 SSD: 低功耗内存(LPDDR)同样蕴藏着巨大的潜力,可以用作存放模型权重(Weights)的“大后方”,并在需要时源源不断地“流式传输”到 HBM 中,从而进一步减轻 HBM 的容量压力。你可以参考这篇博客:https://www.lmsys.org/blog/2025-09-25-gb200-part-2/ 。下面我用一张图来解释这套方案是如何运作的: 虽然 DeepSeek 并没有专门针对这一方案做特殊开发,但他们那拥有庞大专家数量、并且支持 4 位(4-bit)权重的混合专家模型架构,完美契合了这套方案,使得其实施起来易如反掌。 这种创新配合上他们那堪称逆天的无损超紧凑 KV 缓存技术,让系统对 HBM 的吞吐和容量需求出现了断崖式下跌。 中国谁在做 LPDDR?长鑫存储(CXMT)。目前他们在 LPDDR 的速度上仅落后国际顶尖水平半代,在容量密度上仅落后一代。差距非常小!这意味着在不久的将来,除了管够的 NAND 闪存,中国本土生态还将迎来铺天盖地的 LPDDR 内存。那这能缓解算力芯片的压力吗?答案是:绝对能。请接着往下看…… ## 聪明地玩转存储,还能顺手给 GPU 和 ASIC 减负 道理很容易理解:用 NAND 闪存来存放 KV 缓存,不仅能延长缓存的保存时间、减轻 HBM 的压力,还能免去重复计算的烦恼,这等于变相给 GPU 和 ASIC(专用集成电路,即各类定制化 AI 算力芯片)的计算单元松了绑。那么,除了作为模型权重的“即时流式传送带”之外,LPDDR 还能以其他方式帮上忙吗?答案同样是:可以。 LPDDR 可以用来存储海量的“Engram”(印迹模块)。DeepSeek 在他们的论文(https://arxiv.org/pdf/2601.07372)中指出,虽然混合专家模型架构可以通过条件计算(Conditional Computation)来扩充模型的容量,但传统的 Transformer 架构缺乏一种天然的知识检索机制,只能笨拙地通过高昂的“计算”去模拟“检索”。为此,他们引入了 Engram 模块,将经典的 N-gram 嵌入技术升级为基于哈希、时间复杂度为 $O(1)$ 的瞬间查找,创造了一个他们称之为“条件内存”(Conditional Memory)的全新稀疏维度。这极大地省下了计算量,但代价是需要巨大的内存空间来存放这个庞大的嵌入表。这是一次经典的“用空间(存储)换时间(计算)”,其高明之处在于,读取“存储”的成本远比进行计算要便宜得多(在 LPDDR 里查一下,可比让大模型整整跑一轮前向传播省钱太多了)。在大规模部署时,这是一笔划算到家了的买卖。这就是他们如何通过狂砸内存来省下算力的秘密!!! 这种取舍简直太值了:由于缺乏极紫外光刻机(EUV),无法在单个芯粒(Chiplet)上做到同等的晶体管密度,中国的 GPU 和 ASIC 在纯粹的原始浮点运算能力(FLOPs)上,注定会长期落后于西方顶尖显卡。同时,国内在先进封装技术上也处于追赶状态。因此,如果能利用国内产能充足、成本低廉的 NAND 和 LPDDR 内存来弥补算力的劣势,这种“扬长避短”的打法简直是绝配。 ## 盘点 DeepSeek 的一盘大棋: 纵观这些令人眼花缭乱的创新和他们做出的种种抉择(至今不做多模态、不做语音模型,至于视频生成?那是什么东西?),DeepSeek 的野心显然不是眼前那区区几亿美元的蝇头小利。他们正在极有耐心地下一盘 10 万亿美元的大棋,目的是亲手扶持起一套独立于西方之外的“备选硬件生态”。 这不仅让中国的存储芯片厂商在全球 AI 硬件舞台上跃升为主力军,更从根本上降低了大模型训练和推理的资源门槛。当运行 AI 模型的成本降下来后,原本性能稍逊的国产 GPU/ASIC 芯片以及网络交换芯片也将全部变成“够用、好用”的切实选项。而且,这些开源创新也将反哺西方的开源社区,并给西方那些试图挑战英伟达的芯片初创企业带来一线生机。 所有的蛛丝马迹都对上了。让我们来逐一细数他们抛出的那些震撼行业的创新: 1. 在 DeepSeek V2 中引入混合专家模型(MoE)和 MLA:MoE 让训练一个极度聪明的模型减少了 40% 到 50% 的算力消耗;而多头潜在注意力机制(MLA, Multi-head Latent Attention)更是把 KV 缓存直接砍掉了 90%,使得将缓存转存到 SSD 变得极为高效。这些理念最早在他们 2024 年 5 月的论文(https://arxiv.org/pdf/2405.04434)中提出。正是凭借这些绝活,他们后来才能仅仅用 2048 张被阉割过的 H800 GPU,就硬生生训练出了媲美顶级闭源模型的 DeepSeek V3。 1. DSA(密集跳跃注意力机制):在论文(https://arxiv.org/pdf/2512.02556)中推出,旨在削减长上下文场景下的计算量,同时缓解 HBM 的带宽压力。它确保了计算量不会随着上下文的拉长而发生爆炸式增长。看看下面的图表——DeepSeek-v3.2 的处理时间在上下文拉长时依然稳如泰山。 1. mHC(修正超连接):在 2025 年 12 月的论文(https://arxiv.org/pdf/2512.24880)中首次亮相。mHC 是 DeepSeek 在宏观架构上的一大创新,它彻底颠覆了大模型各层之间传统的信号传输方式。过去大家都在用自 ResNet 时代流传下来的标准残差连接($x + F(x)$),而 mHC 则把这条残差流扩展成了多条并行的“信息高速公路”,并允许模型自主学习如何进行混合。最为关键的是,它通过数学手段(将混合矩阵通过 Sinkhorn-Knopp 投影约束在 Birkhoff 多胞形上)强制让这些混合矩阵满足双随机性,从而在数学上完美确保了信号强度在穿过任意深度的网络层时都不会衰减。 - 这彻底解决了此前困扰无约束超连接(Hyper-Connections,最早由字节跳动发明)的灾难性不稳定难题——此前在 270 亿(27B)参数规模下,信号放大系数会疯狂飙升到 3000 倍,导致整个训练彻底崩盘。 - 而它的计算成本却微乎其微:由于它完全没有改变注意力层或前馈网络(FFN, Feed-Forward Network)层的原始浮点运算量,仅仅改变了输出在各层之间的路由方式,因此它只增加了区区 6.7% 的实际训练时间开销。 - 然而它带来的性能提升却极为震撼:在同等模型大小和几乎完全相同的算力预算下,27B 规模的模型在 mHC 的加持下,在复杂的 BIG-Bench Hard 推理测试中暴涨了 7.2 分,DROP 评测提升 3.2 分,GSM8K 数学测试提升 2.8 分,MMLU 综合学科知识提升 1.4 分。 简而言之,mHC 通过给网络赋予一套更丰富、更有表现力的跨层信息路由拓扑结构,在几乎不需要额外多花一丁点算力的情况下,让单位参数发挥出了显著更高的“智商”。 1. CSA 与 HSA:在 2026 年 4 月发布的 DeepSeek V4 Pro 技术文档(https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf)中亮相。它们通过对 KV Token 进行深度压缩,把本来就已经很小的 KV 缓存需求又砍掉了 90%!同时大幅降低了所需的浮点运算量,一举帮 HBM 和 GPU/ASIC 彻底解套。 1. 论文(https://arxiv.org/pdf/2601.07372)于 2026 年第一季度推出,正如前面所说,它在某种意义上实现了“用内存(LPDDR)换算力”。下面的详细图表展示了在总体参数预算完全一致的情况下,Engram 带来的巨大性能跃升。 1. 将计算与通信的重叠压榨到极致:诸如“双路径”(Dual Path)这样的底层魔改,表面上看是为了绕过硬件资源的封锁而被迫进行的闪转腾挪。但 DeepSeek 更进一步,甚至开始反过来对芯片硬件厂商的 ASIC 架构设计指点迷津,告诉他们如何设计芯片才能避免浪费哪怕一丝一毫宝贵的硅片资源。以下截图正是出自 DeepSeek V4 Pro 的官方文档: 1. 对 TileLang 的重度投入:这明确无误地表明,他们的目光早已超越了自家算力紧缺的困境,而是致力于让整个中国硬件生态具备与西方掰手腕的竞争力。有了 TileLang(一种用于编写高性能算力内核的开源编程语言),工程师只需要编写一次算力内核代码,就能在任何适配了 TileLang 后端的不同硬件平台上无缝跑起来。我预计国内其他 AI 实验室很快也会纷纷加入这个阵营——这将合力帮助中国硬件厂商从侧面解围,绕开英伟达坚不可摧的“CUDA 壁垒”(CUDA Moat,英伟达苦心经营数十年的专用并行计算架构生态,是其最宽的护城河)。同时,这也能顺便解放 AMD 等西方的其他硬件厂商。 注:国内许多 AI 硬件平台本身也提供 CUDA 兼容性或 CUDA 编译转换层。其中,摩尔线程、沐曦、壁仞和天数智芯是通过转换层实现与 CUDA 兼容度最高的几家中国芯片公司,理论上它们不需要 TileLang 的协助。 ## 大规模强化学习与自动化科学研究: 随着计算需求的断崖式下降,以及可供选择的本土硬件变得越来越多,DeepSeek 终于能够放开手脚,去挑战那些此前让人望而却步的宏大训练计划——尤其是强化学习阶段的后训练(Post-training)。强化学习需要生成海量的思考轨迹(Trajectories),动辄就会产生数万亿的 Token,这在过去烧钱速度极其恐怖。此外,要训练出支持 100 万上下文的模型,你就必须生成同样长度的思考轨迹。只有让模型在这种超长轨迹中经受锤炼,才能真正解锁解决复杂长程任务的能力。 不仅如此,硬件选择的多元化将让 DeepSeek 拥有富余的算力去冲击“自动化人工智能研究”(RSI, Research on Silicon Intelligence,即让 AI 充当科学家,自己设计并执行算法实验的自主进化技术)。这种让 AI 左右互搏、自主进化的模式伴随着大量的试错,耗资极度高昂。但如果想要彻底探寻整个算法设计的未知空间,RSI 是必经之路。在通往通用人工智能(AGI)乃至超级人工智能(ASI)的道路上,DeepSeek 必须先点亮 RSI 这颗科技树。 ## DeepSeek 今日的试金石,行业明天的教科书: 如今,DeepSeek 围绕混合专家模型、MLA、DSA 的一连串疯狂创新,早已被中国乃至全球的各大 AI 实验室奉为圭臬并争相抄作业。 比如,打造了 GLM 系列模型的智谱 AI 已经用上了 MLA 和 DSA;月之暗面(Kimi)也大方承认自家的最新架构正是基于 DeepSeek 的演进。作为礼尚往来,DeepSeek 在大规模训练中也采用了 Muon 优化器,而该优化器在超大规模训练中的威力,正是被 Kimi 团队首先发掘并证明的。 (注: - 混合专家模型(MoE)架构最早由顶尖学者在 2017 年的经典论文(https://arxiv.org/pdf/1701.06538)中提出,而 DeepSeek 的功劳在于成功将其推向了前所未有的庞大规模,并融入了大量自研的独门绝技。* - Muon(基于牛顿 - 舒尔茨动量正交化)优化器由机器学习研究员 Keller Jordan 于 2024 年底发明,而 Kimi 团队则是全球第一个将其应用到超大规模模型训练中的吃螃蟹者。)* ## 说了这么多,那到底怎么赚大钱呢? 我们可以看看 OpenAI 一个非常有趣的经典案例。OpenAI 曾与 AMD 以及 Cerebras(一家挑战英伟达的晶圆级超大芯片初创公司)达成协议:随着 OpenAI 采购并消耗这两家公司的芯片达到特定里程碑,OpenAI 就能以极低的价格获得这两家公司的股票认股权证(Warrants)或期权。这对于 AMD 和 Cerebras 来说是一笔双赢的绝妙交易——有了 OpenAI 这头吞噬算力的巨兽深度绑定,它们在长跑中胜出的概率大增。 根据 AMD 官方发布的新闻稿(https://www.amd.com/en/newsroom/press-releases/2025-10-6-amd-and-openai-announce-strategic-partnership-to-d.html):“作为协议的一部分,为了深度绑定双方的战略利益,AMD 已向 OpenAI 授予了高达 1.6 亿股 AMD 普通股的认股权证。这些股权将随着特定里程碑的达成而逐步解锁。第一阶段将在初始部署达到 1 吉瓦(GW)算力中心时解锁,随后的份额将随着采购规模扩大至 6 吉瓦而陆续解锁……” 我大胆预测,DeepSeek 目前正在与国内一众存储、ASIC 算力芯片、CPU 以及网络协议栈厂商签署类似的对赌与利益绑定协议。通过深度联合调优,DeepSeek 将帮助这些本土硬件在运行全球最顶尖的 AI 核心工作负载时,真正做到平替、甚至超越西方硬件。 眼下,西方(包括其东亚盟友)所有 AI 概念股的总市值早已突破了 10 万亿美元。通过这种“用技术换股权、用生态扶持分蛋糕”的精妙商业模式,DeepSeek 不仅能在中国复制出一个同样体量惊人的超级硬件产业,还能在其中切下最肥美的一块蛋糕,进而将自己送入 1 万亿美元市值的超级俱乐部。 这不仅能让他们赚到比卖什么订阅软件多得多的真金白银,还能顺便实现他们口中“让通用人工智能惠及每一个人”的宏伟愿景。梁文锋作为传奇量化大师詹姆斯·西蒙斯(Jim Simons)的铁杆粉丝,绝对是一位顶级聪明的资本家,他绝不可能漏掉这盘大棋! 只要你回过头把 DeepSeek 至今为止所有的反常举动串联起来,这就是唯一能完美解释一切的底层逻辑…… 关于这些底层技术创新的详细拆解长文将在本周末发布,感兴趣的朋友欢迎关注我的 Substack 专栏:https://polymath707.substack.com/ ...

译DeepSeek的核心战略并非销售应用服务,而是通过一系列底层技术创新,特别是MLA等注意力机制大幅压缩KV缓存需求,来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM,远低于同类模型。这直接降低了推理成本,并催生两大机会:一是将KV缓存转存至SSD,利好长江存储;二是其架构适配LPDDR内存进行权重缓存,利好长鑫存储。DeepSeek通过开源这些高效架构,正在构建一个以中国存储产业链为核心的新生态,最终目标是带动一个10万亿美元的AI硬件产业,并自身实现万亿美元市值。

meng shao@shao__meng · 5月24日33

懂了,程序员生存之道: token 别降价,我要降价 😂

Greg Brockman@gdb · 5月24日49

under appreciated that codex is open source

译低估了Codex是开源的这一事实

Orange AI@oran_ge · 5月24日56

MARVIS 最让我惊奇的地方在于 他们把一家在 AI 时代最落后的大厂的内部工作协作方法打包成了一款 AI 产品。 面向生产力剧变的未来,他们选择推广一个落后的生产关系。 很神奇。

宝玉@dotey · 5月24日42

Codex 交互做的真的挺好的,你可以方便的看当前运行的 SubAgents,以及每个 SubAgent 在做的事、用的提示词

译Codex的交互设计确实做得很好,你可以方便地查看当前运行的SubAgents,以及每个SubAgent正在做什么、使用的提示词。

Chubby♨️@kimmonismus · 5月24日54

OpenAI: carefully rolls out GPT-5.5-Cyber through Trusted Access for verified defenders Anthropic: “Claude Mythos is too powerful for public release” Also Anthropic: accidentally shows Mythos in the UI and immediately runs out of capacity 2026 AI launches are absolut cinema. Anyways: Mythos incoming?

译2026年AI大模型发布呈现鲜明对比与戏剧性。OpenAI采取审慎策略,通过“可信访问”机制,向验证过的安全专家限量推出GPT-5.5-Cyber。与之形成反差的是,Anthropic官方曾宣称其Claude Mythos模型因过于强大不适合公开发布,但该模型却意外短暂出现在用户界面中,并导致服务容量告罄。现有信息表明,Anthropic正为Claude Mythos(代号claude-mythos-1-preview)在Claude Code与Claude Security等企业产品线上的发布做准备,但这并不等同于面向公众的全面开放。整个过程充满了计划与意外的交织。

Rohan Paul@rohanpaul_ai · 5月24日62

"You could basically imagine, completely neural computers in a certain sense. Imagine a device that takes raw videos or audio into basically what is a neural net, and uses diffusion to render a UI that is unique for that moment in a certain sense." ~ Andrej Karpathy Going by this, the next big software shift may be that much of the software disappears. Karpathy’s point is not simply that AI will help us build apps faster; it is that many apps may be artifacts of a world where computers needed every intermediate step spelled out. He says "I kind of feel like, in the early days of computing, people were actually a little bit confused as to whether computers would look like calculators or whether computers would look like neural nets. In the 50s and 60s, it was not really obvious which way it would go. Of course, we went down the calculator path and ended up building classical computing. Neural nets are currently running virtualized on existing computers, but you could imagine that a lot of this will flip, and that the neural net becomes kind of like the host process, while the CPUs become kind of like the co-processor." Classical software treats the CPU as the host process and intelligence as something bolted on through tools, scripts, models, and APIs. Karpathy is imagining the reverse: the neural network becomes the host process, while conventional code becomes a small deterministic accessory for tasks where exactness still matters. This is why the future interface may not look like a better app store. It may look like raw video, audio, documents, or intent entering a neural system, with the interface itself generated for that moment rather than built in advance by a product team. --- From "Sequoia Capital" YouTube channel, (link in comment)

译Andrej Karpathy 认为,下一代重大软件变革将是大量传统应用的消失。他预言了一种“完全神经化”的计算范式:原始输入直接由神经网络处理,通过扩散模型实时生成专属于当下的界面。当前经典计算以 CPU 为主、智能为辅,而未来神经网络可能成为主导进程,传统 CPU 则退化为处理精确任务的协处理器。这意味着许多现有应用只是过渡产物,未来交互可能不再是静态应用,而是由神经系统根据即时情境生成的动态界面。

Yuchen Jin@Yuchenj_UW · 5月24日44

Can’t believe I coded by hand for 15 years. 15 years of memorizing syntax, Vim, Stack Overflow, broken builds, cursed dependencies, merge conflicts, and “one last bug before sleep.” All of that just to end up typing “fix this” into a chat box and watching an agent do crimes.

译不敢相信我手动编程了十五年。 十五年来,我背诵语法、使用Vim、查阅Stack Overflow、处理构建失败、解决依赖冲突、合并代码冲突,还有“睡前再修最后一个bug”。 这一切,最终却只是让我在聊天框里输入“修复这个”,然后看着AI代理搞定一切。

向阳乔木@vista8 · 5月23日67

http://x.com/i/article/2058212813622087680 # 「未来硅世界16期」访谈:tw93的开源故事和经验 一个人,有正职,有家庭,还有个小女儿。 却在 13 年里,靠着长假、早起、和游泳池边的笔记本,做出了六款被硅谷 CTO、Pinterest、YC 创始人都在用的开源工具。 这位大神的 X 账号是 HiTw93,GitHub ID 是 tw93。 > https://x.com/HiTw93 > https://github.com/tw93/ ## 六个产品,六个"自己先用烦了"的故事 tw93的第一个产品妙言,起因很简单:找不到一款顺手的 Markdown 编辑器。 他本职是前端工程师,讨厌 Electron 那种重框架,就决定学 Swift 自己写一个。 边学边做,做完刚好学会了 Swift,顺手还摸透了 Apple 底层的渲染性能。 比如 Markdown 标题的语法高亮,直接用正则去写,性能远高于 Web 渲染的编辑器。 妙言到今年已经快 6 年了。 Pake 的起源也是很巧合。 他有个习惯,每年会分享一次自己电脑上装的好用工具。 那一年他喜欢用微信读书,但微信读书没有桌面端,就用 UI 框架打包了一个。 发出去以后,大家发现他分享的软件里将近三分之一是自己写的,纷纷来问微信读书那个怎么打包的。 代码也就几百行,他就顺手开源了。 没想到 Pake 在国外比国内火。 老外很喜欢把网页打包成 Mac 客户端,但用 Electron 打包太重,Pake 刚好解决了这个问题。 很多台湾的朋友帮他推广宣传,因为他们特别喜欢打包这件事。 潮流周刊的起源更早,大概七年前他开始带团队,发现团队的技术氛围不够强,就立了个 flag:每天早上看一些开源工具和技术资讯,整理成内部周刊发在公司语雀上。 后来很多人离职,问他能不能在外面看,他就顺手放到了 GitHub 的 README 里。 过了半年,国庆在老家,花了两天时间做了个网站,就这么发出去了。 Mole 的前身是他在本地跑了一年的 Shell 脚本,快 1000 行,专门清理程序员电脑上的垃圾缓存。 他每年会买很多正版清理软件,比如 iStatistica、CleanMyMac,但觉得太重。 去年国庆带宝宝去三亚度假,游泳池边放了台电脑,游一圈回来歇着的间隙,把 Mole 的第一个版本写出来了。 Kaku 是他 fork 了一个终端工具,在本地改了半年,过年期间才发出来。 他最早用一款极轻量的终端,配得很好看,但 AI 时代来了以后必须多窗口,那款工具不支持。 找来找去,只有一个项目改得动,就自己动手了。 Kami 的起源是他做投资。他七八年前开始投资美股,本地写了一套多 agent 的投资分析系统,但 AI 生成的报告太丑,就按自己的审美调了一版。 后来看到推特上大家发的报告也不够好看,就开源出去了。 顺带一提,他还在做一套自己的字体,目前完成了三分之一,因为他常用的那款字体(仓耳今楷TsangerJinKai)是商业字体,开源产品可以用,但涉及商务合作就麻烦了。 Waza 是他把将近一年、五六个 G 的 Claude 对话记录沉淀出来的工程技能库。 他用 AI 分析了所有对话,按项目维度、时间维度拆解,提炼出最佳实践,包括怎么回复海外用户的需求、哪些 PR 该合、哪些功能该做。 这个逻辑贯穿了他所有产品:不是先想"我要做什么",而是先碰到了一个让自己难受的问题,顺手把它解掉。 ## Mole 为什么 70% 的用户在海外? Mole 发布后,超过 70% 的用户来自海外,原因有几层: 第一,老外其实更节俭。 欧美用户会把一台 Mac 用很多年,用久了会很卡。 用 Mole 清了 60G、100G 的垃圾,他们会非常激动,然后疯狂去推广。 tw93说,老外说话夸张,会直接说"我要给你跪下,你是个天才"。 第二,更懂程序员的“清理”工具。 传统清理软件不关心程序员的各种开发工具的缓存等,比如CleanMyMac等工具,出于安全考虑,不会去动那些深层的开发缓存。 但 Mole 是程序员写给程序员的,知道哪些东西可以清。 第三,开源本身就是最好的产品迭代机制。 Mole 有 300 个 PR,100 个贡献者,全是海外用户。 每个人的电脑环境不同,国家不同,技术工种不同,这些贡献让 Mole 能清理的东西越来越多,这是任何公司产品都做不到的。 当然也踩过坑。第一版发布时,因为tw93自己的环境偏前端,没有数据库相关配置,结果把一个用户 JetBrains 数据库工具里存在 cache 目录的账号密码全清掉了。 那个用户很生气,他也很抱歉。 这件事让他意识到,很多客户端产品的文件路径规范极其混乱,普通用户不关注,但清理工具必须关注。 Mole 后来给 JetBrains 全系产品开了白名单,也因为这个教训越做越严谨。 还有一个细节能说明 Mole 的热度。 他当时把两张图片放到了 Vercel 的 CDN 上加速,不到一周,Vercel 发来紧急通知说他欠了 80 美元。 他以为不可能,去查了一下,发现就是那两张图片,用了 80T 的流量,就几分钟时间。 他立刻意识到,这个 README 有大量的人在访问。 ## 第一款付费产品,每 10 秒收一笔钱 Mole 推出桌面端时,tw93周一晚上 10 点发布,因为白天在上班。 发出去之后,手机大概每 10 秒响一次支付通知,后来连 iPhone 都开始发烫。 睡觉前,他不得不把 Google 的通知全部关掉,不然睡不着。。 定价 9 美元终身买断,很多人说他卖太便宜了。 当然也有喷子说,你不就把 CLI 包了一下吗? 他觉得无所谓。他本来就不是靠这个赚钱的。 他最开心的是,有人用了以后愿意主动打赏。免费的东西,有人愿意付钱,说明做的东西是有意义的。 手机弹出微信通知"谁谁谁又给你打赏了",他说那种感觉真的会很开心。 支付对接用的是 Dodo Payment,一家印度小哥创立、注册地在美国的支付平台。 他之前试过 Stripe,走到最后一步,对方要香港身份证,卡死了。 Lemon Squeezy 也要求提供公司信息,个人用不了。 后来在推特上看到有人推荐 Dodo,花了一个下午接好,发布了。 不过支付平台会收 16%、17% 的税,后来 Dodo 的 CEO 办公室的人主动在推特上找到他,把他拉进了专属服务群,还给了一些费用减免。 关于收款,他有一个实操建议:超过 1 万美元,立刻会有很多人来找你核查,非常麻烦。尽量把钱放在香港卡或新加坡卡,不要直接汇回国内。 他自己就因为这个折腾了几次,最后把钱退回去重新想办法,不过他夸了招商银行的服务人员会为客户着想。 ## Waza:把自己的工程经验,变成 AI 的本能 tw93有一个习惯:每周花一小时,让 AI 分析他过去一周的踩坑记录,然后更新 Waza。 Waza 是他的 Claude Code 技能库,但跟大多数人写的 Skills 不一样,他 70% 是代码,只有 30% 是 Markdown 文档。 原因是:MD 只是告诉 AI 怎么干活,代码是让 AI 能基于它去扩展。 他不喜欢那种把 AI 手脚拴住的框架,比如 Superpower、Spec 编程,觉得太重,而且会拖模型能力的后腿。 他更愿意把 AI 当朋友,而不是外包或下属。 他说,Claude 4.6、4.7 出来以后,模型能力越来越强,你越约束它,其实是在拖它的后腿。 Waza 里有 8 个 Skill,覆盖的不只是写代码,还有怎么推进项目、怎么做技术方案、怎么写让读者看得懂的文档、怎么画设计稿。 因为在他看来,一个工程师只有 30% 的时间在写代码,其余的能力同样重要。 Waza 本身也会自我迭代。 它知道自己的迭代方式,所以tw93只需要定期喂给它新的踩坑记录,它会自己更新。 现在 Waza 也支持了 Codex,因为他自己开始用 Codex 了,所以它也去分析 Codex 的对话记录。 他本地还有一个基于 Waza 的私人 agent,专门帮他处理开源项目的 issue 和 PR。 这个 agent 知道他对 Mole 的调性要求,知道哪些功能坚决不能合,哪些 PR 写得有问题但可以改好,哪些直接不合适。 他把自己从最耗时间的事情里解放出来,专注于写新功能。 ## 为什么他的东西好看? 很多人用完tw93的工具,第一反应是:怎么这么好看? 他给了几个原因。 大学时保研后有大量空闲时间,把图书馆里所有前端和设计相关的书都看完了。 设计思维、极简主义、日本设计原理,那个阶段打下的审美底子,后来工作了才慢慢显现出来。 入职后,他最喜欢跟设计师玩,经常一起讨论设计细节,受他们审美影响很深。 后来负责整个部门的 ToB 产品,发现用文档跟人对齐方案,大家理解都不一样。 最后发现最有效的办法是直接画一张高保真 Sketch 稿,发群里拉个会,大家立刻就 get 了。 为了不让一件事反复讨论,他逼着自己学会了画稿。 还有一个更底层的原因:他是强迫症。 他说自己刚入职时,QA 同学测不出他写的页面有 bug,他的代码可以免提测直接上线。 这个习惯一直延续到做开源产品。做到 75 分没 bug 不够,他要做到 95 分。 不是为了炫技,是因为他受不了丑的东西,也不想让用户反复来问他。 他最近还在看元至清的中国古画,以及日本设计原理方面的书。 他说很多古画看不懂意境,但看画家怎么画马、怎么构图,还是能 get 到一些东西。 ## 关于长期主义,他说的最实在的一句话 "长期主义能帮你更好地偷懒。" 他在一家公司工作了 11 年没换过。 他买特斯拉股票是在 100 多美元,买英伟达股票是在 80 多美元,买了以后从来不卖,一年只操作两三次。 他说他很讨厌做判断,因为一旦有多个选项就会很纠结,那几天都会很难受。 所以他尽量在需要做判断之前,就把很多事情提前决定好,这样就不用反复纠结了。 长期主义在他这里不是口号,是一种减少决策消耗的生活方式。 他的 GitHub 只有 6 个 pin 位,全占满了,不会再开新坑。 他认为,同时做 100 个产品,100 个都做不好。把现有的几个维护好,复利会越来越强。 Mole 发布半年,已经迭代了将近 40 个版本,用的人越来越多,知道这个产品的人越来越多,这才是真正的积累。 他还提到一个反直觉的观察:妙言在真正公布之前,已经迭代了半年多,用户量一直很少。 一推出去,数据直接从平线拉起来。 酒香也怕巷子深,你还是得在适当的时候把门面讲清楚。 ## 给非技术人用 vibe coding 的建议 他说,非技术人做产品,最大的风险不是写不出代码,而是不懂通识,半年后代码跑不动了,自己也不知道出了什么问题。 他举了个例子:AI 能把一个产品做到 80% 很容易,但从 80% 到 100%,可能要花 80% 的时间。 很多人不懂这一点,觉得前端也就这么回事,后端也就这么回事,我什么都不会,app 就写出来了。 但这个 app 想从你能用到 100 个人能用,中间有大量你发现不了的 bug,因为你不具备找 bug 的能力。 他推荐了几本书: - 《人月神话》:理解为什么软件项目不能靠堆人解决,AI 时代同样适用 - 《启示录》:理解怎么做产品取舍、怎么定义最小闭环、怎么规划里程碑 - 《左耳听风》(耗子哥的博客和书):理解一个资深工程师是怎么看问题的 - 《Linux/Unix设计思想》:一本很薄的书,讲原子能力、管道、系统设计的底层逻辑,他说大学看完以后有种"功力大增"的感觉 他的核心观点是:你不需要会写 React,但你要知道什么时候该用 React、什么时候只需要一个静态服务器。 这种判断力,才是 vibe coding 时代真正的护城河。 ## 最值得收藏的一个观点 他说,在 AI 时代,真正的壁垒不是你做出了什么工具,而是你和 AI 的聊天上下文。 别人可以把你的产品蒸馏走,但没办法蒸馏你踩过的坑、你的判断逻辑、你和 AI 反复打磨出来的那些失败路径。 他特别强调:记录失败比记录成功更重要。 成功的东西大家只看结果,失败的路径才能告诉你下次怎么绕开。 就像线上系统挂了,你一定会去查挂在哪里,但系统跑得好的时候,没人会去研究它为什么好。 关于记忆系统的设计,他有一个很有意思的框架:按照人类记忆的方式来设计。 大语言模型本来就是基于人类语言训练的,所以记忆系统也应该像人一样,有项目上下文记忆(当前在做什么)、短期记忆(最近遇到的卡点)、长期记忆(历史积累)。 他不太推荐直接给 AI 灌知识库,因为知识会过期,灌进去的人可能自己也不知道哪些已经过时了。 把你和 AI 的所有对话记录保护好,把 AI 帮你干成和干失败的记录都保存下来。 这些东西,才是别人学不走的东西。 ## 出海商业化的几个实操细节 如果你打算做出海产品,他的经验是: 个人身份对接商业资源,天然处于劣势。 建议注册一家美国小公司,费用不高,每年记得报税就好。 有了美国公司主体,App Store 账号、支付平台、云服务商,都以公司名义对接,中国个人身份的限制就绕开了,税率也会低一些。 支付平台不要自建,也不要用那些知名大平台。 Stripe 对中国个人限制很多,走到最后一步会卡死。他推荐 Dodo Payment,印度小哥做的,注册地在美国,响应速度快,能处理全球支付和各国税务合规,包括欧盟要求的 14 天无理由退款政策。 售后系统不要过早做。 前期专注把主产品做好,用户量还不大的时候,手工回邮件、手工点退款就够了。 很多程序员喜欢把所有东西都自动化,但这个阶段的精力应该全放在产品本身。 这场对话里,tw93反复说的一件事是:他的所有产品,都是先解自己的问题,然后发现有人跟他有同样的问题,才开源出去的。 这个逻辑听起来简单,但能坚持 13 年、做出 6 个有人用的工具,背后是他对"不做什么"的极度克制,对"做好一件事"的极度专注。 如果你现在也在想做点什么,他的建议是:先找到那个让你自己最难受的问题,把它解掉。 不用想太多,先解自己的问题。

译个人开发者tw93在全职工作与家庭之余,独立开发了妙言、Pake、Mole等六款深受海外用户欢迎的开源工具。其产品均始于解决自身痛点,如Mole因精准清理程序员电脑缓存,超过70%的用户来自海外。tw93强调产品美学与极致完成度,并将工程实践与AI协作经验沉淀为开源技能库Waza。他的实践展示了如何通过解决真实问题、坚持开源社区协作以及将AI作为协作伙伴,构建具有全球影响力的项目。

Rohan Paul@rohanpaul_ai · 5月23日74

Satya Nadella reveals how Microsoft is applying the concept of "Lean for knowledge work" internally with AI. The internal ROI on AI investment and leveraging the cost reduction effect of AI. Borrowing from Toyota's manufacturing efficiency principles and applying them to white-collar operations powered by AI. e.g. Microsoft spends approximately $4 billion per year on customer support operations. By deploying AI agents for front-end deflection (resolving issues before they reach human agents) and real-time reasoning assistance for support staff, they are dramatically reducing costs in areas like Xbox and Azure support. --- From "Bg2 Pod" YT channel ( link in comment)

译Satya Nadella透露微软正借鉴丰田精益生产原则,将“精益知识工作”理念应用于内部AI运营。通过计算AI投资回报并利用其成本削减效应,微软在白领工作中部署AI以优化流程。例如,微软每年在客户支持业务上支出约40亿美元,通过部署AI代理处理前端问题分流及为支持人员提供实时推理协助,在Xbox和Azure等支持领域大幅降低了成本。

Rohan Paul@rohanpaul_ai · 5月23日54

Vinod Khosla: "We are in a techno-economic war with China, and we shouldn't call it anything other than a war. Whoever wins this AI race will win the economic race and will win the race for socio-economic power and influence globally." ~ Vinod Khosla, Co-founder of Sun Microsystems & Billionaire Silicon Valley venture capitalist. --- From 'Fortune Magazine' YT Channel

译Vinod Khosla:"我们正处于一场与中国的技术经济战争中,我们不应该用其他任何名称来称呼它。谁赢得这场AI竞赛,谁就会赢得经济竞赛,并赢得全球社会经济权力和影响力的竞赛。" ~ Vinod Khosla,Sun Microsystems联合创始人及硅谷亿万富翁风险投资家。 --- 来自《财富杂志》YouTube频道

歸藏(guizang.ai)@op7418 · 5月23日24

都在推特上,你拿我图还给我打个码,没必要吧?

向阳乔木@vista8 · 5月23日15

有在用Pi Agent的朋友吗?相比Claude Code和Codex CLI的优势是什么? 想有空折腾学习下。

Chubby♨️@kimmonismus · 5月23日62

NVIDIA has completely halted the release of graphics cards for the gaming market for 2026. Full Focus AI: a gap that China is now also attempting to fill. Not only are high-quality, affordable ev-cars now coming out of China, but - presumably soon - affordable consumer GPUs as well. Curious for benchmarks. If they compete with - let’s say - a RTX 3070 for 1/5 its price this would be a huge win.

译英伟达已完全暂停2026年游戏显卡的发布。全力聚焦AI:中国现在也正试图填补这一空白。 不仅高质量、价格实惠的电动汽车正从中国涌现,而且——很可能不久之后——价格实惠的消费级GPU也将出现。 很好奇基准测试结果。如果它们能与——比如说——RTX 3070竞争,而价格只有其五分之一,那将是一个巨大的胜利。

swyx@swyx · 5月23日58

co-sign. a very handy mental framework for what kinds of learning transformers do well today, and why it runs into limitations. when @ankit2119 and i wrote about the need for adversarial world models earlier this year, we were describing a couple of the functions of these rungs of thinking that bring us ever closer to the kolmogorov-limit generator of reality. throwing more params, more power, more everything at a demonstrably inefficient paradigm will be outclassed by the simple solution that can hypothesize and seek truth rather than backfit a house of cards - although the bitter lesson is it is simpler to scale and we may hit agi anyway because human intelligence just isn’t that smart nor plentiful

译本文肯定了对Transformer当前学习能力及局限性的分析框架,并指出对抗性世界模型是逼近现实本质的关键功能之一。作者认为,单纯增加参数和算力以扩展一个低效范式,将被能主动假设与验证真理的简洁方案所超越,尽管规模化可能因人类智能本身有限而意外通向AGI。引用推文补充了强化学习(RL)作为从干预中学习的范式,比监督学习更强大,而世界建模与RL的结合有望实现对反事实的学习。

Greg Brockman@gdb · 5月23日34

GPT-5.5 is a very good model

译GPT-5.5是一个非常优秀的模型。

meng shao@shao__meng · 5月23日50

Mixpanel 创始人 @Suhail 提出了一个对于美国 AI 公司们很实现的问题: 当中国在浮点运算层面的算力实现独立后,他们的开源贡献会逐渐迁移到一套美国 "用不了、也不能用" 的技术栈上。这对美国不利,因为美国当前的 AI 研究和基础设施本身就高度封闭。 这里特别想 @DarioAmodei ,这盛世如你所愿? 背后的原因,也不用赘述了,Nvidia + CUDA 这套本来最顺滑的训练推理路径,硬生生被卡住,倒逼出了国产方案,现在基于国产方案的开源模型越来越主流之后,未来还会不会支持 Nvidia + CUDA,不好说。。

译中国在浮点运算层面实现算力独立后,其AI开源社区的贡献可能转向一套基于国产方案的技术栈,而美国将难以使用或兼容。这一转变将对美国不利,因为其当前的AI研究与基础设施本身高度封闭。根源在于,美国主流的 Nvidia + CUDA 技术路径受限,催生了国产替代方案;随着基于国产方案的开源模型逐渐主流化,未来开源项目可能不再优先支持 Nvidia + CUDA 生态。

Rohan Paul@rohanpaul_ai · 5月23日48

Mark Cuban on AI's infra investment and business mode. "I think a lot of the numbers that they're throwing out there aren't gonna come to fruition. They're shitting away the money at scale."

译马克·库班谈AI的基础设施投资与商业模式。 “我认为他们抛出的很多数字不会实现。 他们正在大规模地浪费资金。”

Rohan Paul@rohanpaul_ai · 5月23日44

Marc Andreessen on the future path of AI. "There's like a rotation from software into hardware. It's possible all the value accrues to the chips, and the energy, and then software is all open source."

译Marc Andreessen谈AI的未来路径。 “存在一种从软件向硬件的转向。 可能所有价值都将集中在芯片和能源上,而软件则全部开源。”

Rohan Paul@rohanpaul_ai · 5月23日40

"If there's one thing that I would encourage everybody to do, is to go get yourself an AI tutor right away. That AI tutor could, just teach you things, anything. We're going to become superhumans because we have super AIs" ~ Nvidia CEO Jensen Huang

译如果有一件事我想鼓励大家去做,那就是立刻为自己找一位AI导师。 这位AI导师可以教你任何事情。 我们将因为拥有超级AI而成为超级人类。 ~ Nvidia CEO Jensen Huang

Chubby♨️@kimmonismus · 5月23日56

Demis says the Singularity may now be only a few years away, potentially set in motion by the arrival of true AGI. "Its being so transformative, it will be the most important technology ever"

译Demis表示奇点可能现在仅数年之遥,或许将由真正的AGI到来所推动。 “它如此具有变革性,将是史上最重要的技术”

Rohan Paul@rohanpaul_ai · 5月23日44

"Every agent needs a human. The further away an agent is from a human who's doing it, the worse it does. Even though AI can do expert human work, it actually increases the demand for human experts. " ~ CEO of Every @danshipper

译每个智能体都需要人类。智能体离实际操作的人类越远,表现就越差。 尽管AI能完成专家级的人类工作,但它实际上增加了对人类专家的需求。

Chubby♨️@kimmonismus · 5月23日49

Anthropics Jack Clare is super optimistic: - End of 2028 "AI system would be able to design their own successors" - within 12 months humans + robots will find nobel prize-winning discoverys

译Anthropic高管Jack Clark发表了一系列关于AI未来的乐观预测。他预计,在12个月内,AI将与人类协作实现诺贝尔奖级的科学发现;2年内,双足机器人将参与企业工作;到2028年底,AI系统将能自主设计下一代AI,实现递归自我改进。此外,完全由AI运营的公司将在18个月内产生数百万美元收入。Clark最保守的预测则指出,经济和社会将经历深刻变革,可能出现脱离人类的机器经济、机器人获得自主意识、科学在无科学家参与下自行发展等颠覆性场景。

Rohan Paul@rohanpaul_ai · 5月23日59

Interesting. SpaceX doing AI feels like the sequel to Peter Thiel introducing Elon and Demis in 2012. If AI becomes the dominant layer of coordination, prediction, design, logistics, science, and warfare, then Mars is not outside the problem; it is just another environment the system can model, enter, and optimize. SpaceX touching AI therefore does not feel like a random expansion into the fashion of the moment. It looks like a defensive necessity inside Musk’s own worldview, because building the transport layer of civilization is incomplete if another intelligence owns the decision layer above it. 🙂 --- Demis Hassabis: “I’m working on the most important project in the world. I’m building a superhuman AI.” Elon Musk: “Well, I work on the most important project in the world. I am turning us into an interplanetary species.” Demis Hassabis: “Well, you know, my AI will be able to follow you to Mars.” --- Video from "Interesting Times with Ross Douthat" + "New York Times Podcasts" + "New York Times Opinion" channel (link in comment)

译媒体指出,SpaceX涉足AI并非简单追逐技术热点,而是源于埃隆·马斯克世界观下的“防御性必要”。其核心逻辑是,若AI未来成为主导全球协调、预测与决策的关键层,那么火星环境也将被其建模与优化。若决策层被其他智能体掌控,马斯克构建的“文明运输层”便是不完整的。结合SpaceX近期以“SPCX”代码申请纳斯达克IPO的动向,其定位已从纯粹的发射服务商,转变为涵盖发射、Starlink卫星网络与AI基础设施的综合平台公司。此次IPO反映出投资者正将其重新估值为拥有运输、通信乃至地外算力潜力的平台级公司,而不仅是传统航天承包商。

Rohan Paul@rohanpaul_ai · 5月23日46

AI replacing all jobs is unlikely, but if it happened, it would mean huge wealth creation, not less. The hard part would be sharing it. But society can solve distribution better when the pie is growing. ~ Prof of economics at George Mason Alex Tabarrok

译AI取代所有工作不太可能,但如果发生,将意味着巨大的财富创造,而非减少。困难在于如何分配。但当蛋糕在变大时,社会能更好地解决分配问题。 ~ 乔治梅森大学经济学教授 Alex Tabarrok

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月23日22

"Sometimes people outside AI say things like 'it can't be that bad, there must be experts on top of it.'" "As 'an expert', I would like to be clear we are *not* on top of it." "We are on track for human extinction/permanent disempowerment, possibly within the next few years."

译推文作者以专家身份明确指出,外界普遍认为AI发展在专家掌控之中的看法是错误的。核心观点是,AI领域专家实际上并未控制当前局面,且认为人类正朝着灭绝或永久失权的道路上发展,并可能在几年内发生。

Rohan Paul@rohanpaul_ai · 5月23日30

"Many of you don’t know, at one point Masayoshi Son (SoftBank CEO) was the largest shareholder of NVIDIA.” ~ Jensen Huang SoftBank’s Nvidia stake peaked at 4.9%, which is 0% now, and would be ≈$259B today if Masayoshi held on to it.

译"你们很多人不知道,软银CEO孙正义曾经是英伟达最大的股东。" ~ 黄仁勋 软银持有的英伟达股份峰值为4.9%,现在已清零,如果孙正义当时持有至今,价值将约为2590亿美元。

Rohan Paul@rohanpaul_ai · 5月23日55

Sundar Pichai: - At the frontier labs competition is fierce - Only few labs are really at the frontier & then there is a big gap. - If recursive self-improvement emerges, we need more seriousness & it then becomes a societal issue, not one company’s call

译Sundar Pichai: - 在前沿实验室,竞争非常激烈 - 真正处于前沿的实验室很少,之后存在巨大差距 - 如果递归自我改进出现,我们需要更严肃对待,这将成为社会问题,而非一家公司能决定

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月25日
04:48
Nathan Lambert@natolambert
64
当前AI进步常被归因于少数算力雄厚的实验室。推文指出,社会动态、政策、技术扩散(diffusion)等其他因素同样深刻影响AI演进,且此领域存在未被充分重视的影响力机遇。开放科学与开放模型是应对方向之一。文中引用观点指出,通往AGI的预训练工作高度集中于OpenAI、Google、Meta等巨头,算力差距的残酷现实是,AGI关键路径上的问题现需巨大算力门槛。

Aidan Clark: If you want to work on pretraining-for-AGI, join OpenAI, Google, Meta or the Anthropic/XAI/Cursor supergroup. The bitter...

Hugging Face大佬观点开源生态
04:27
Rohan Paul@rohanpaul_ai
62
路透社报道,深度求索宣布其旗舰模型V4-Pro的API价格永久下调75%,但未直接确认这是由于华为昇腾芯片供应改善。报道分析,此举时机恰逢中国AI算力栈从受限的Nvidia芯片向华为昇腾硬件迁移带来的成本下降。据引述分析,DeepSeek的核心战略是通过架构创新(如MoE、DSA,以及V4-Pro的CSA/HCA技术)大幅降低对高端HBM GPU的依赖,其技术指标显示1M-token推理FLOPs和KV cache显著降低。其目标在于优化模型,使更多样的硬件(如LPDDR、NAND、定制ASIC)能够运行前沿AI,以适应不同的工业基础。

Rohan Paul: Great article here on DeepSeek. Their real story is not cheaper chatbots, but architecture that turns hardware scarcity ...

DeepSeek大佬观点推理
00:52
elvis@omarsar0
17
按照目前的发展方向,我们将需要大量的工程师和研究员。 不要听信噪音,去学习基础知识,并尽可能多地与AI一起构建/协作。
大佬观点编码
5月24日
22:57
Rohan Paul@rohanpaul_ai
72
黄仁勋表示,如果他的工程师们完全不写代码,那将是他最大的快乐。相反,他们应该专注于解决尚未被发现的问题。 他的框架是"目的与任务"--编码只是一项任务,应该被最小化(理想情况下为0)。
大佬观点现象/趋势编码
21:57
Rohan Paul@rohanpaul_ai
61
陶哲轩谈如何在AI时代选择职业。
大佬观点现象/趋势
20:31
ginobefun@hongming731
67
Bob大叔认为,未来编程的核心范式将发生转变。程序员将使用类似Gherkin的声明式规范语言来描述目标和约束,而传统的过程式代码(涉及顺序、选择、循环等逻辑)将主要由AI来生成和实现。他强调,尽管仍需形式化与精确性,但新的编程语言将不再直接描述计算机的执行步骤,而是定义AI需要达成的"目标集"。

Uncle Bob Martin: I hold a different opinion. I think he's right about things like domain driven design, bounded context, ubiquitous vocab...

大佬观点编码
17:27
Chubby♨️@kimmonismus
48
我们期待通过通用发布使Mythos级模型可用

Anthropic的发布策略看似矛盾:其Mythos模型性能卓越,能发现其他模型无法发现的漏洞,因此一度被官方声称“过于强大而无法发布”;但最新声明又表示将通过通用发布使其可用。这突然的转向被分析可能并非PR炒作,考虑到其核心瓶颈是算力不足且临近IPO,热度并非关键需求。尽管策略存疑,但一旦模型就绪并设立安全护栏,其远超现有水平的性能将为软件工程带来显著提升。推文引用显示,此次宣布可能是认真举措。

Andrew Curran: Looks like they meant it.

Anthropic大佬观点推理
16:27
Rohan Paul@rohanpaul_ai
47
李飞飞:空间智能开启无限虚拟宇宙新纪元

李飞飞重新定义机器人学,强调其核心是“空间智能”——即机器在三维物理空间中感知、理解与行动的能力。这一能力使机器人能执行任务并实现人机协作。3D生成与重建技术正打破人类仅能体验单一物理世界的局限,创造出用于训练、创造、旅行与社交的无限数字多元宇宙。未来,人们将以“多元宇宙”的方式生活,极大拓展人类想象与交互的边界。

a16z: For all of history, humanity shared one 3D world. @theworldlabs co-founder @drfeifei says spatial intelligence now lets ...

具身智能多模态大佬观点
15:57
Rohan Paul@rohanpaul_ai
40
前高管重新定义智能:机器智能源于摆脱人类强加

前Google高管Mo Gawdat对“智能”提出新定义。他认为,智能并非物理属性,因此其实现载体并不重要,无论是碳基(人类)、硅基(当前AI硬件)还是未来的量子计算结构。核心观点在于,当我们停止将自身智能强加给机器时,智能便会在机器内部产生。这一论述挑战了以人类为中心的智能观,强调智能的发展应超越特定的物质基础。

大佬观点现象/趋势
15:18
Berryxia.AI@berryxia
35
Andrej Karpathy(OpenAI联合创始人、前特斯拉AI负责人)加入Anthropic,引发行业震动。值得关注的是,他同步免费公开了相关知识,无需付费即可获取。更关键的是,他本人亲手终结了自己此前提出的"氛围编码"概念,明确指出"LLM是幽灵而非动物",宣告软件3.0时代正式到来。这一转变凸显了个人顶尖技术价值正在超越机构绑定,同时也暗示AI行业的发展路径与人才流动正在发生深刻变化。

huangserva: Anthropic 刚花了巨资雇来 Andrej Karpathy。 同时,他免费给了你同样的知识。 无需天价招聘费,独家权限,学费。只有一个链接和 29 分钟。 这位 OpenAI 联合创始人、前特斯拉 AI 负责人,亲手终结了他自己提出...

Anthropic大佬观点编码
14:49
Tibo@thsottiaux
30
Codex能按需完成不可思议的任务,但它无法替你体验生活。 别忘了走出去,记住你为谁而创造。
OpenAI大佬观点编码
14:40
Orange AI@oran_ge
52
DeepSeek推低成本缓存技术,大模型应用或迎变局

DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。

宝玉: http://x.com/i/article/2058418354415644672

DeepSeek大佬观点推理
13:49
宝玉@dotey
52
DeepSeek的万亿美元战略:以技术创新驱动硬件生态

DeepSeek的核心战略并非销售应用服务,而是通过一系列底层技术创新,特别是MLA等注意力机制大幅压缩KV缓存需求,来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM,远低于同类模型。这直接降低了推理成本,并催生两大机会:一是将KV缓存转存至SSD,利好长江存储;二是其架构适配LPDDR内存进行权重缓存,利好长鑫存储。DeepSeek通过开源这些高效架构,正在构建一个以中国存储产业链为核心的新生态,最终目标是带动一个10万亿美元的AI硬件产业,并自身实现万亿美元市值。

DeepSeek大佬观点开源生态现象/趋势
11:20
meng shao@shao__meng
33
懂了,程序员生存之道: token 别降价,我要降价 😂

geniusvczh: 微软已经开始觉得token比人贵了🤪

Microsoft大佬观点编码
11:05
Greg Brockman@gdb
49
低估了Codex是开源的这一事实

Ahmed: Lots of people get surprised when I tell them that Codex is open source

OpenAI大佬观点开源生态
09:40
Orange AI@oran_ge
56
MARVIS 最让我惊奇的地方在于 他们把一家在 AI 时代最落后的大厂的内部工作协作方法打包成了一款 AI 产品。 面向生产力剧变的未来,他们选择推广一个落后的生产关系。 很神奇。
大佬观点
07:49
宝玉@dotey
42
Codex的交互设计确实做得很好,你可以方便地查看当前运行的SubAgents,以及每个SubAgent正在做什么、使用的提示词。
智能体Anthropic大佬观点
07:27
Chubby♨️@kimmonismus
54
2026年AI大模型发布呈现鲜明对比与戏剧性。OpenAI采取审慎策略,通过"可信访问"机制,向验证过的安全专家限量推出GPT-5.5-Cyber。与之形成反差的是,Anthropic官方曾宣称其Claude Mythos模型因过于强大不适合公开发布,但该模型却意外短暂出现在用户界面中,并导致服务容量告罄。现有信息表明,Anthropic正为Claude Mythos(代号claude-mythos-1-preview)在Claude Code与Claude Security等企业产品线上的发布做准备,但这并不等同于面向公众的全面开放。整个过程充满了计划与意外的交织。

🚨 AI News | TestingCatalog: ANTHROPIC 🔥: Mythos 1, "claude-mythos-1-preview", is being prepared for a release on Claude Code and Claude Security. T...

AnthropicOpenAI大佬观点模型发布
02:57
Rohan Paul@rohanpaul_ai
62
神经网络将成主导,传统应用或消失

Andrej Karpathy 认为,下一代重大软件变革将是大量传统应用的消失。他预言了一种“完全神经化”的计算范式:原始输入直接由神经网络处理,通过扩散模型实时生成专属于当下的界面。当前经典计算以 CPU 为主、智能为辅,而未来神经网络可能成为主导进程,传统 CPU 则退化为处理精确任务的协处理器。这意味着许多现有应用只是过渡产物,未来交互可能不再是静态应用,而是由神经系统根据即时情境生成的动态界面。

多模态大佬观点
02:22
Yuchen Jin@Yuchenj_UW
44
不敢相信我手动编程了十五年。 十五年来,我背诵语法、使用Vim、查阅Stack Overflow、处理构建失败、解决依赖冲突、合并代码冲突,还有"睡前再修最后一个bug"。 这一切,最终却只是让我在聊天框里输入"修复这个",然后看着AI代理搞定一切。
智能体大佬观点编码
5月23日
23:51
向阳乔木@vista8
67
个人开发者tw93的开源实践与启示

个人开发者tw93在全职工作与家庭之余,独立开发了妙言、Pake、Mole等六款深受海外用户欢迎的开源工具。其产品均始于解决自身痛点,如Mole因精准清理程序员电脑缓存,超过70%的用户来自海外。tw93强调产品美学与极致完成度,并将工程实践与AI协作经验沉淀为开源技能库Waza。他的实践展示了如何通过解决真实问题、坚持开源社区协作以及将AI作为协作伙伴,构建具有全球影响力的项目。

GitHub大佬观点开源/仓库教程/实践
21:27
Rohan Paul@rohanpaul_ai
74
微软以AI实践"精益知识工作"降本增效

Satya Nadella透露微软正借鉴丰田精益生产原则,将“精益知识工作”理念应用于内部AI运营。通过计算AI投资回报并利用其成本削减效应,微软在白领工作中部署AI以优化流程。例如,微软每年在客户支持业务上支出约40亿美元,通过部署AI代理处理前端问题分流及为支持人员提供实时推理协助,在Xbox和Azure等支持领域大幅降低了成本。

智能体Microsoft大佬观点
20:57
Rohan Paul@rohanpaul_ai
54
Vinod Khosla:"我们正处于一场与中国的技术经济战争中,我们不应该用其他任何名称来称呼它。谁赢得这场AI竞赛,谁就会赢得经济竞赛,并赢得全球社会经济权力和影响力的竞赛。" ~ Vinod Khosla,Sun Microsystems联合创始人及硅谷亿万富翁风险投资家。 --- 来自《财富杂志》YouTube频道
大佬观点现象/趋势
20:30
歸藏(guizang.ai)@op7418
24
都在推特上,你拿我图还给我打个码,没必要吧?

黄小木: 商机啊,把github的skill搬到小红书上架, 速度就是💰

大佬观点
19:51
向阳乔木@vista8
15
有在用Pi Agent的朋友吗?相比Claude Code和Codex CLI的优势是什么? 想有空折腾学习下。
智能体大佬观点编码
18:57
Chubby♨️@kimmonismus
62
英伟达已完全暂停2026年游戏显卡的发布。全力聚焦AI:中国现在也正试图填补这一空白。 不仅高质量、价格实惠的电动汽车正从中国涌现,而且--很可能不久之后--价格实惠的消费级GPU也将出现。 很好奇基准测试结果。如果它们能与--比如说--RTX 3070竞争,而价格只有其五分之一,那将是一个巨大的胜利。

Pamphlets: 🚨🇨🇳 BREAKING - China Unveils Gaming GPU To Challenge NVIDIA

大佬观点现象/趋势行业动态
14:44
swyx@swyx
58
Transformer学习局限与RL的突破潜力

本文肯定了对Transformer当前学习能力及局限性的分析框架,并指出对抗性世界模型是逼近现实本质的关键功能之一。作者认为,单纯增加参数和算力以扩展一个低效范式,将被能主动假设与验证真理的简洁方案所超越,尽管规模化可能因人类智能本身有限而意外通向AGI。引用推文补充了强化学习(RL)作为从干预中学习的范式,比监督学习更强大,而世界建模与RL的结合有望实现对反事实的学习。

Rishabh Agarwal: Very well written blog. I think of RL as learning from interventions, and it kinda explains why it's more powerful as a ...

大佬观点推理数据/训练
13:05
Greg Brockman@gdb
34
GPT-5.5是一个非常优秀的模型。

DHH: For complicated agent work, it's amazing how much GPT5.5 has improved. I found 5.2 to be very far behind Opus. Now using...

智能体OpenAI大佬观点
11:20
meng shao@shao__meng
50
中国算力独立,倒逼美国担忧开源技术栈分化

中国在浮点运算层面实现算力独立后,其AI开源社区的贡献可能转向一套基于国产方案的技术栈,而美国将难以使用或兼容。这一转变将对美国不利,因为其当前的AI研究与基础设施本身高度封闭。根源在于,美国主流的 Nvidia + CUDA 技术路径受限,催生了国产替代方案;随着基于国产方案的开源模型逐渐主流化,未来开源项目可能不再优先支持 Nvidia + CUDA 生态。

Suhail: One real issue with Chinese independence of flop-based compute is that their open source contributions will shift to a s...

大佬观点开源生态
10:57
Rohan Paul@rohanpaul_ai
48
马克·库班谈AI的基础设施投资与商业模式。 "我认为他们抛出的很多数字不会实现。 他们正在大规模地浪费资金。"
大佬观点现象/趋势
10:57
Rohan Paul@rohanpaul_ai
44
Marc Andreessen谈AI的未来路径。 "存在一种从软件向硬件的转向。 可能所有价值都将集中在芯片和能源上,而软件则全部开源。"
大佬观点行业动态
08:57
Rohan Paul@rohanpaul_ai
40
如果有一件事我想鼓励大家去做,那就是立刻为自己找一位AI导师。 这位AI导师可以教你任何事情。 我们将因为拥有超级AI而成为超级人类。 ~ Nvidia CEO Jensen Huang
大佬观点
08:27
Chubby♨️@kimmonismus
56
Demis表示奇点可能现在仅数年之遥,或许将由真正的AGI到来所推动。 "它如此具有变革性,将是史上最重要的技术"
DeepMind大佬观点
06:57
Rohan Paul@rohanpaul_ai
44
每个智能体都需要人类。智能体离实际操作的人类越远,表现就越差。 尽管AI能完成专家级的人类工作,但它实际上增加了对人类专家的需求。
智能体大佬观点
06:27
Chubby♨️@kimmonismus
49
Anthropic高管Jack Clark发表了一系列关于AI未来的乐观预测。他预计,在12个月内,AI将与人类协作实现诺贝尔奖级的科学发现;2年内,双足机器人将参与企业工作;到2028年底,AI系统将能自主设计下一代AI,实现递归自我改进。此外,完全由AI运营的公司将在18个月内产生数百万美元收入。Clark最保守的预测则指出,经济和社会将经历深刻变革,可能出现脱离人类的机器经济、机器人获得自主意识、科学在无科学家参与下自行发展等颠覆性场景。

prinz: Jack Clark: - AI will make a Nobel Prize-winning discovery within 12 months (working collaboratively with humans) - Bipe...

Anthropic大佬观点
06:27
Rohan Paul@rohanpaul_ai
59
SpaceX的AI战略:从火箭公司到火星决策层的必争之地

媒体指出,SpaceX涉足AI并非简单追逐技术热点,而是源于埃隆·马斯克世界观下的“防御性必要”。其核心逻辑是,若AI未来成为主导全球协调、预测与决策的关键层,那么火星环境也将被其建模与优化。若决策层被其他智能体掌控,马斯克构建的“文明运输层”便是不完整的。结合SpaceX近期以“SPCX”代码申请纳斯达克IPO的动向,其定位已从纯粹的发射服务商,转变为涵盖发射、Starlink卫星网络与AI基础设施的综合平台公司。此次IPO反映出投资者正将其重新估值为拥有运输、通信乃至地外算力潜力的平台级公司,而不仅是传统航天承包商。

Rohan Paul: SpaceX just filed for a Nasdaq IPO under SPCX that could turn Elon Musk's SpaceX stake into the first $1T personal fortu...

大佬观点行业动态
05:27
Rohan Paul@rohanpaul_ai
46
AI取代所有工作不太可能,但如果发生,将意味着巨大的财富创造,而非减少。困难在于如何分配。但当蛋糕在变大时,社会能更好地解决分配问题。 ~ 乔治梅森大学经济学教授 Alex Tabarrok
大佬观点现象/趋势
04:05
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
22
推文作者以专家身份明确指出,外界普遍认为AI发展在专家掌控之中的看法是错误的。核心观点是,AI领域专家实际上并未控制当前局面,且认为人类正朝着灭绝或永久失权的道路上发展,并可能在几年内发生。

Elizabeth Barnes: Sometimes people outside the field say things like "The AI situation can't be that bad, there must be experts who are on...

大佬观点安全/对齐
01:56
Rohan Paul@rohanpaul_ai
30
"你们很多人不知道,软银CEO孙正义曾经是英伟达最大的股东。" ~ 黄仁勋 软银持有的英伟达股份峰值为4.9%,现在已清零,如果孙正义当时持有至今,价值将约为2590亿美元。

Rohan Paul: Nvidia CEO Jensen Huang: "There's a belief that the world's GDP is limited at $100 tn. What's likely to happen is AI is ...

大佬观点
01:26
Rohan Paul@rohanpaul_ai
55
Sundar Pichai: - 在前沿实验室,竞争非常激烈 - 真正处于前沿的实验室很少,之后存在巨大差距 - 如果递归自我改进出现,我们需要更严肃对待,这将成为社会问题,而非一家公司能决定
Google大佬观点现象/趋势
‹ 上一页
1…2930313233…50
下一页 ›