AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2410 条
全部一手资讯X论文
标签「大佬观点」清除
jason@jxnlco · 6月2日17

First time reading something that’s not the codex app or Slack

译第一次读到不是 Codex 应用或 Slack 的内容。

meng shao@shao__meng · 6月2日60

吴恩达老师谈「AI FDE」和「AI Engineer」 AI 在创造新岗位,但长期岗位规模上,企业内部的 AI Engineer 会远大于厂商派驻的 Forward Deployed Engineer (FDE);眼下最有价值的是能搭应用、会用 AI 编程工具的通才型 AI 工程师。 回顾一下 AI FDE:驻场 + 深度集成 + 强交付 · 约 20 年前由 Palantir 开创:工程师进驻客户现场(如政府、隔离网环境)做深度交付 · OpenAI、Anthropic 等组建 AI FDE 团队,把工程师嵌入客户组织 · 把通用 LLM 改造成贴合业务的 定制化智能体工作流(搭建、调优、落地) · 技术 + 沟通 + 有时还需商业判断:挖需求、排优先级、讲清技术、合理 push back 和「AI Engineer」的数量关系:吴老师的判断 吴老师明确反对把 FDE 当成 AI 时代的主航道职业: 1. 企业更愿意养自己的兵 可能接受少量外部 FDE,但更希望 大量自有员工 做 AI 项目——他自己的组织也是「招 FDE,但招远更多 AI Engineer」。 2. 厂商绑定 vs 选择权(optionality) · FDE 往往深度集成 某一厂商产品,客户担心 供应商锁定 · 在「一年后哪家 AI 服务最好还说不清」的阶段,保持技术/vendor 可选性 比快速深度绑定更值钱 · 让 FDE 把流程绑死在一家厂商上,会 显著削弱未来换栈空间 结论:FDE 是重要但相对小众的交付形态;AI Engineer 才是更大、更稳的就业池。 当下真正抢手的是什么人? 吴老师观察到需求集中在 AI Engineer,尤其是能: · 用 LLM 能力做 软件应用(prompt、智能体框架、evals 等) · 高效使用 AI Coding Agent(Claude Code、Codex、Antigravity CLI、OpenCode 等) 这是 「用 AI 组件写产品」的工程师,不一定非要驻场,也不一定代表某一家模型公司。 职业演化:会像传统 Software Engineer 一样分化 他认为 AI Engineer 会像几十年前的「软件工程师」一样 从通才裂成专才,可能包括(他也在猜测): · AI FDE(厂商侧或咨询侧驻场型) · LLMOps Engineer · Evals Engineer · AI Data Engineer · Harness Engineer(智能体/评测 harness) · 以及 尚未命名的角色 现阶段:通才型、技能全面的 AI Engineer 仍能创造很大价值——专业化是十年量级的趋势,不是今天的入场门槛。 对「AI 砸就业」叙事的态度 他用 FDE 复兴举例:AI 在创造新工种(FDE、AI Engineer 及未来专才),因此 「工作末日 / jobocalypse」叙事过于简单。 更准确的说法是:岗位结构在变,总量与类型会重组,而不是单向消灭。

译吴恩达对比了AI Forward Deployed Engineer (FDE)和AI Engineer两种岗位。他指出,FDE由厂商派驻客户现场进行深度集成,但企业更倾向于培养大量自有AI工程师。他判断,AI Engineer岗位数量将远多于FDE,因为客户担心供应商锁定,在AI技术快速演进时更需要保持技术选型灵活性。当下最有价值的是能使用Claude Code、Codex等AI编程工具构建应用的通才型AI工程师。未来该角色可能像传统软件工程师一样,分化出LLMOps、Evals等专才,但现阶段综合型人才价值依然很大。

SemiAnalysis@SemiAnalysis_ · 6月2日61

AWS margins jumping 10 points while Azure and Cloud fall flat. The Tokenomics Team deep dives into selling tokens vs renting GPU's, Anthropics $65 Billion Raise in Series H, and stablized token margins. New Episode Out Now: https://youtu.be/3zGmZfZnChs

译AWS利润率跃升10个百分点,而Azure和Cloud表现平淡。Tokenomics团队深入探讨了出售token与出租GPU的对比,Anthropic的650亿美元H轮融资,以及稳定的token利润率。 新一期节目现已上线:https://youtu.be/3zGmZfZnChs

Rohan Paul@rohanpaul_ai · 6月2日76

Sam Altman's new interview: AI should not be designed to pursue goals that are disconnected from human needs. People must remain at the center of AI development. “I have no interest in building a super-smart AI that accomplishes some non-human goals. People should react. People should say, ‘Hey, this is what I want, and this is what I do not want.’ I do not think the issue is that we have failed to explain the benefits. We say, ‘AI is going to cure a bunch of diseases,’ and people say, ‘Okay, that is great, but that is not really my question. My question is: What is my role in the future? What is my economic future? What is my agency? How do I know that my kids and my family will still be able to have fulfilling, creative expression, struggle, drive the world forward, grow, and do this thing together in a way that has worked for a long time?’ When people in AI say, ‘Sure, there are going to be no jobs,’ or ‘50% of jobs are going to go away,’ or ‘90% of jobs are going to go away,’ and ‘AI is going to be smarter than you at everything,’ and ‘We will give you some basic income, but you are not really going to have a role,’ that is horrible. And by the way, if an AI company says, ‘Maybe we are going to destroy all the jobs, and we will be the most valuable company in the world,’ people should look at you like, ‘Yeah, that is a terrible message.’ I do not think the problem is that we have not articulated the upsides. I think people actually believe us. They hear, ‘AI may cure your cancer,’ and they think, ‘That sounds great.’ I think we, as an industry, have failed to explain how people stay in control of determining the future at every step, and how people can still have a meaningful life in all the ways we care about.” ---- From "CNBC Television" YouTube channel, (link in comment)

译Sam Altman在采访中表示,AI不应被设计为追求脱离人类需求的目标,人类必须始终处于AI发展的中心。他批判了行业内“AI将摧毁大量工作”等言论,认为人们担忧的并非AI带来的好处,而是自身在未来的角色、经济前景与自主权。他指出,AI行业的失败在于未能清晰解释人类如何在每一步保持对未来的控制权,以及如何在AI时代继续拥有充实、有意义的生活。

宝玉@dotey · 6月2日58

It would be great if AI agents like Codex and Cursor could expose an API to web views. This would allow a webpage opened in the right pane to send prompts (including text and images) directly back to the agent. For instance, if I build a webpage similar to Claude Design, I could add an in-page input box. When a user enters a prompt and clicks "send", the webpage would call an API like "window.codex.sendPrompt(text, attachments)" to push that content straight into the chat interface on the left. This would enable much deeper interaction between the agent and the webpage, unlocking a lot more possibilities. cc @thsottiaux @jxnlco @Dimillian

译推文建议,Codex、Cursor等AI智能体应提供API接口,允许右侧面板的网页视图直接向智能体发送包含文本和附件的提示词。例如,用户可构建类似Claude Design的网页,通过调用"window.codex.sendPrompt(text, attachments)"等API,将输入内容直接推送到左侧聊天界面。此举旨在实现智能体与网页间更深层的交互,从而解锁更多可能性。

Rohan Paul@rohanpaul_ai · 6月2日68

"Every 10 seconds, global token demand is around 31.7 billion in 2026. By 2030 its 1.27 trillion, a 40x increase." ~ Qualcomm CEO Cristiano Amon: --- The token explosion is not mainly about smarter answers; it is about AI moving from human-paced interaction to Agent-paced activity. Once agents become persistent, the economy of AI stops will be the background infrastructure. Every useful action has a hidden bill: context must be carried, memory must be updated, sensors may need to be interpreted, and mistakes must be caught before they become expensive. ---- From "Reuters" YouTube channel, (link in comment)

译高通CEO Cristiano Amon预测,全球token需求到2026年每10秒将达317亿,到2030年将增至1.27万亿,实现40倍增长。他指出,这一增长主要源于AI正从人类节奏的交互转向智能体驱动的活动。智能体AI将消耗远超聊天机器人的token,因其执行自主任务时需调用工具、读取输出、协调系统并更新记忆,形成隐藏的微决策链。因此,软件使用模式可能从按点击或席位计量,转变为按其消耗的机器推理token量计量。

Yuchen Jin@Yuchenj_UW · 6月2日50

OpenAI slept on coding, so Anthropic stole the crown. Anthropic didn’t secure enough GPUs/TPUs to turn that lead into a monopoly. Now Codex has caught up. Gemini will catch up too. It’s only a matter of time. AI coding is becoming a three-body problem.

译OpenAI 在编程领域睡着了,于是 Anthropic 抢走了王冠。 Anthropic 没有获得足够的 GPU/TPU 来将这一领先优势转化为垄断。现在 Codex 已经追上来了。 Gemini 也会追上来。这只是时间问题。 AI 编程正在成为一个三体问题。

Ethan Mollick@emollick · 6月2日64

I find debates over whether companies find AI useful to be odd at this point I talk to leadership teams at lots of big firms, and it is pretty universal that they are getting obvious and real value. The challenges now are going from individual uses to firm-level & how to scale.

译我发现现在争论企业是否觉得AI有用很奇怪 我与许多大公司的领导团队交流过,他们普遍获得了明显且真实的价值。现在的挑战是如何从个人应用扩展到公司层面,以及如何规模化。

Ethan Mollick@emollick · 6月2日65

Lots of companies are in the "encourage AI adoption" phase, whether teaching them ChatGPT/Claude or (sigh) tokenmaxxing. That dodges the harder problems of firm leadership: What do you want people to use AI for? What work should be reserved for people? What else needs to change?

译许多公司正处于“鼓励采用AI”的阶段,无论是教员工使用ChatGPT/Claude,还是(叹气)堆砌token。 这回避了企业领导层更棘手的问题:你希望人们用AI做什么?哪些工作应保留给人类?还需要改变什么?

swyx@swyx · 6月2日71

This pod was an incredible gift to the community: not only our first pod about @xAI, but Ethan really indulged on all our questions on how to train a SOTA Videogen world model, including specific areas (consistent extending/editing, voice) that Grok @Imagine is *still* SOTA, on top of the factual overviews he ALSO came loaded with opinions/predictions: - why he's quitting Videogen for LLMs: video models get most of their intelligence from LLMs, not from scaling video data - why the next frontier for videogen also happens to be video agent models - agentic models trained to orchestrate video models - why deterministic compression (like MP4) is a useless target vs VAE compression - Videomaxxing: if you truly believe in the "Moore's law" of AI/genmedia, then video models become the final boss UI of everything, like Flipbook (below)

译前xAI世界模型负责人Ethan He在播客中分享了对Grok Imagine及视频生成未来的看法。他指出,视频模型的智能主要来自LLM,而非单纯扩大视频数据规模,因此正从视频生成转向LLM领域。他认为,视频生成的下一个前沿是训练用于编排视频模型的**视频Agent模型**。AI视频的发展将类似编程Agent路径,当前文本到视频仅是“自动补全”阶段。未来,世界模型将变得实时交互,语言模型或成为视频的控制层。

Emad@EMostaque · 6月1日50

Let’s say half of OpenAI and Anthropic goes to the American people, $1 trillion That works out at $2,800 per American. With a 5% dividend (optimistic) that would be $142 a year Which alas would barely cover the cost of an OpenAI or Anthropic subscription.

译美国参议员桑德斯提出《美国AI主权财富基金法案》,旨在让公众直接拥有AI公司股份。推文设想若OpenAI和Anthropic的一半股份归美国人民所有,总价值约1万亿美元,相当于每人2800美元。按5%股息率计算,每人每年可获142美元,但仅勉强够支付一家AI公司的订阅费用。该法案基于“AI建立在人类集体知识之上”的理念,旨在让AI产生的财富惠及全人类而非少数寡头。

宝玉@dotey · 6月1日64

你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude Design,然后把 Claude Design 设计好的结果分别给 GPT-5.5 和 Opus 4.8 去实现一下看看差异。 然后系统设计和计划方面,质量也是很高的,一个复杂一点任务通常要先做 Plan、做系统设计,这方面 Opus 4.8 也是非常好的。 另外和你用的 Agent 有关系,每个模型都有自己的特性,需要重新设计提示词反复调优,如果你在 Claude Code 和 Cursor 里面用 Opus 4.8,除了写作,其他任务的效果是没有什么问题的。

译推文建议像“渣男”一样组合使用多个AI模型,发掘各自优势。具体指出 Opus 4.8 在UI设计与实现上优于 GPT-5.5,推荐用 Claude Design 后交由不同模型实现;其在系统设计和计划方面质量也高,但在写作上较弱。在 Claude Code、Cursor 等智能体中使用时,除写作外效果良好。引用内容提及 Opus 4.8 近期负面评价与退订增多,并有人预测 Anthropic 未来可能面临困境。

Nathan Lambert@natolambert · 6月1日60

Can closed labs can create margins with very high cost services in the long-term? Yes, but only in niches like high end knowledge work. This’ll propel OpenAI/Anthropic to huge valuations soon, while the open model economy slowly grows to be bigger & enable the long-tail of use.

译推文探讨了闭源模型与开源模型未来不同的发展轨迹。观点认为,闭源实验室可以通过提供成本高昂的高端服务(如高端知识工作)来创造并维持利润,这将推动 OpenAI、Anthropic 等公司获得高估值。与此同时,开源模型经济体将逐步发展并壮大,服务于更广泛的长尾应用市场。这表明两种模型体系将在不同的维度上增长,其中闭源模型在边际智能价值驱动溢价的领域优势明显,而开源模型则在其他场景下逐步扩大影响。

Ethan Mollick@emollick · 6月1日57

The default wall of text is a flawed way to connect with AIs, partially because people don't want to read all that & partially because, if they do, it is full of too many distractions which cause excess cognitive load (as paper shows) & partially because AI writing is only okay.

译默认的长文本墙是与AI建立连接的一种有缺陷的方式,部分原因是人们不想阅读所有内容,部分原因是即使阅读,其中也充满了太多导致认知负荷过高的干扰(正如论文所示),还有部分原因是AI写作本身只是尚可。

AYi@AYi_AInotes · 6月1日66

Damn,英伟达和老黄真的是憋了个大的啊,真特么牛逼🤯 今天全网都在转黄仁勋这台拔了电源还能满帧跑 3A 的笔记本,但大多数人看错了重点,游戏其实只是这台机器的糖衣。 真正的核弹是那 128GB 统一内存,它意味着你桌上一台轻薄本,能在本地直接跑起 200B 参数的大模型,这在过去是只有数据中心机柜才干得动的事。 所以 NVIDIA 这次干的根本已经不是又一个游戏本那么简了,它把数据中心那套 Grace CPU 加 Blackwell GPU 整个下放, 1 PetaFLOP 的 FP4 算力、RTX 5070 级的显卡、CPU 和 GPU 共享的统一内存,一起塞进一个能背着走的壳子里。 拔电不掉帧、续航炸裂,这些是讲给所有人听的甜头,这回真正瞄准的,是要在本地跑 AI 的那波人。 如果把游戏本三个字去掉,你会看见一件更大的事。 这就像一个一直只卖发动机的厂商,突然开始造整车,顺手还把高速公路也给铺了,CUDA 是发动机,Grace 是底盘,Windows on Arm 是路, 从今往后你想跑得快,就只能在它修的这条路上跑。 当然,舞台上拔电不掉帧是十分钟的高光,长时间满载会不会降频、ARM 版 Windows 靠兼容层跑老软件会掉多少性能、这套东西最后卖一个什么价,发布会一个都没回答。 但方向已经很清楚了,Intel 和 AMD 还能追性能追制程,但CUDA 攒了十几年的那群开发者肯定是追不上了, 老黄卖的从来不是一台更强的电脑,是一条你用顺手了,就再也下不来的路!

译NVIDIA发布了基于ARM架构的RTX Spark处理器。其核心是一台搭载该芯片的笔记本,具备128GB统一内存,可直接本地运行200B参数的大语言模型。该芯片提供1 PetaFLOP的FP4算力,GPU性能与RTX 5070相当,旨在将数据中心级性能(Grace CPU + Blackwell GPU架构)集成到移动设备中。引用推文指出,该笔记本在拔掉电源后仍能保持性能不下降,并预计于2026年秋季推出。分析认为,NVIDIA此举的关键在于巩固其CUDA生态的护城河。

数字生命卡兹克@Khazix0918 · 6月1日76

http://x.com/i/article/2061360923009564672 # 英伟达发布全新RTX Spark - 个人PC的新时代。 今天,英伟达的NVIDIA GTC Taipei 2026,在早上11点,终于如约而至了了。 发布了很多的东西,但是有一个东西,是我觉得真正具有历史意义的,必须要单独拿出来的说的。 甚至,它让英伟达喊出了,个人电脑诞生40年以来,这次,要重新定义。 “A New Line,A New Beginning” 而这一切,都是因为一个全新的消费级芯片。 也就是传说中的,被各种爆料了很久的代号为N1X的芯片。 RTX Spark。 就是这么个小小的东西。 可以说,这是我在今年上半年最期待的一场AI大会,因为在这个时代,你几乎很难看到,几个巨头联手预热,只为这一场发布会。 PC的新时代。 可能也只有英伟达,能攒起这样的局了。 那一串奇怪的数字,正是这次老黄演讲的地点,台北流行音乐中心。 在看完今天的发布会以后,我相信没有人会不再相信这句话了。 整个上半年的AI的进展,几乎都是OpenClaw、Claude Code、Codex等等等等。 背后,全部都是云端大模型。 但是ToC端的硬件层面,几乎毫无进展。 可试问,又有谁不想真正的把大模型和Agent,部署在自己的本地端呢,低延迟、隐私保护、无需网络,不仅仅是进行推理,甚至可以微调,那种自由又安全的感觉,永远会让人迷恋。 我们需要新的硬件,也需要新的芯片,需要一些更有趣的想象。 而这一切的目光,几乎都聚焦在了这次的NVIDIA GTC Taipei 2026上。 终于,RTX Spark如约而至。 如果比较关注英伟达或者过去打游戏比较多的朋友,可能对RTX和Spark这两个独立的单词都比较熟。 RTX就是英伟达的消费级产品线,大家见的最多的,就是各种显卡,比如RTX 5080。 Spark其实同源于去年的一个面向开发者的DGX Spark,只不过这次被正式升级成了一整套英伟达全新的业务线。 于是,RTX Spark出炉了。 直播的时候看的我起鸡皮疙瘩了。 整体参数如下。 RTX Spark的底层应该是跟DGX Spark相同的GB10芯片,因为我看这次的旗舰版的参数和之前差不多。 最高1 PFLOP的FP4 AI性能,20个CPU核心、6144个GPU核心和128GB的LPDDR5X统一内存。 能直接在本地轻轻松松跑120B的模型。 这次发布会上,老黄还秀了一把未来所谓搭载RTX Spark的合作品牌方做的电脑。 你可以在一台厚度为14mm、未插电的笔记本电脑上渲染一个90GB的3D场景、编辑12K分辨率视频。 非常离谱。。。 而且,不仅有很薄但性能爆炸的全新笔记本,还有类似于Mac Mini那种功耗很低的小盒子。 所以最近联想、HP、ARM大涨啥的,不是没有原因的。 能在个人消费级的电脑里,直接用统一内存的方式,以超高速+全面CUDA生态支持,来本地跑AI大模型,这应该是整个PC领域头一遭。 而且微软会跟英伟达一起,全面重构Windows系统,让搭载RTX Spark的电脑,原生支持本地Agent的运行。 Windows生态,感觉有救了,英伟达来当救世主了。 真的,无愧于个人PC新时代这个比喻。 感觉上,明年全新的Windows系列的换机潮要来了。 我觉得要理解RTX Spark的历史意义,还是得说一个我觉得大家需要知道的东西: 就是到底啥是统一内存?它有啥用? 在过去,我们传统的电脑里,一般有两个大家所熟知的最核心的东西,一个叫CPU,一个叫GPU。 这个叫CPU,我用AI画了一张。 GPU大家肯定都很熟了,在电脑上,经常就是我们常说的显卡,比如我的这个5080。 CPU和GPU他两呢,各有各的内存,是分开的两块。 CPU用的叫系统内存(RAM),GPU用的叫显存(VRAM),两边要交换数据得通过一条通道来回搬。 而统一内存呢,大概就是把这两块合成一块,CPU和GPU共用同一个内存池,谁都能直接访问。 苹果把这套玩意搞成了自己的主流,你现在买的Mac,几乎都是统一内存了。 但是Windows生态,CPU和GPU都是不同厂家做的做的,受限于过去的生态,过去也有人搞过,但是也都拉了,也从来没有人能把这么多上下游,联合起来大搞特搞。 这么大的阵仗,英伟达是第一个。 而这个统一内存,对于跑大模型来说,真的几乎就是决定生死的差别。 上面我们也说了,传统PC的内存架构是分裂的,CPU有自己的系统内存(RAM),GPU有自己的显存(VRAM),两者之间靠一条叫PCIe的东西连起来。 比如,CPU有一块系统内存,我们按64GB RAM来算,GPU又有一块自己的显存,比如RTX5080的16GB VRAM。 你想在本地跑一个大模型,比如量化后的70B模型,可能要几十G内存,你的电脑内存看起来有64GB,但GPU真正能高速使用的只有那16GB显存。 一旦模型太大,显存放不下,就要把一部分权重放在CPU的系统内存里,GPU每次需要这部分权重,就得通过PCIe去系统内存里拿。 GPU读自己的显存,带宽大概1TB/s,非常快。 但是PCIe这条连接CPU内存和GPU的通道,像PCIe 4.0 x16单向带宽只有大概32GB/s,差了三十倍,纯龟速。 所以,你的模型还是跑不动,或者跑的很慢。 统一内存解决的主要问题就是这个。 它可以把CPU和GPU的内存变成一个共享池,比如一台机器有128GB统一内存,那么GPU就可以直接使用这个大池子里的很大一部分。那这样你跑本地大模型的时候,就不再被一张显卡的 16GB、24GB、32GB显存限制得那么死。 统一内存在消费级单机上,几乎是跑本地大模型唯一优雅的解法。 数据中心就是另一个世界了,那条路跟我们普通消费者就没啥关系了。 说到这,那我觉得,你肯定想问,那既然统一内存这么牛逼,我买Mac不就行了,Mac也有128G的统一内存的版本,我买RTX Spark干啥? 这是个非常好的问题,有一个答案还是挺重要的,那就是英伟达真正的杀手锏。 CUDA。 CUDA这个词,很多关注AI的朋友应该都听过,但它到底是什么,为什么这么重要,我觉得还是值得认真聊一下。 很多人以为CUDA就是英伟达的显卡驱动,或者只是什么GPU加速技术。 这么理解也不能说错,但它远不止于此。 CUDA是一整套的生态,最牛逼的生态。 底层,它让你能把GPU当成通用计算器来编程,除了渲染画面,还能做数学计算。 中层,是一堆被打磨了将近二十年的数学库。cuBLAS做线性代数,cuDNN做深度学习的基础运算,TensorRT做推理优化,NCCL做多卡通信,FlashAttention这类关键优化,CUDA 路线最成熟,很多新特性也会优先围绕NVIDIA GPU做适配。 还有老黄这次演讲里反复强调的CUDA-X,为所有的Agent,开放的CUDA库,能让Agent直接调用,这下更离谱了。。。 里面有一整套横跨科学计算、工程仿真、芯片设计、基因组学、通信网络、机器人和物理仿真等等的加速库。 比如cuLitho做计算光刻,cuOpt做决策优化,cuDSS做稀疏矩阵求解,AI-Q做对结构和非结构化文档做深度研,Warp做可微分物理,Parabricks做基因组学等等等等。 用老黄的话说,数学,太美妙了。 CUDA,太牛逼了。 上层,就是PyTorch、TensorFlow、JAX,几乎所有深度学习框架的GPU后端,默认且首先支持的就是CUDA。 从2006年做到现在,CUDA积累了海量的优化库、教程、代码、生态等等。你今天去看学术论文放出来的开源代码,绝大多数都是在CUDA上写和测的,你今天遇到任何深度学习的问题去搜解法,搜出来的答案也几乎都是默认假设你在用CUDA。 整个AI工程界的母语,就是CUDA。 这也是Apple一直以来的一个痛点。 它的统一内存确实牛逼,但它的GPU用的是Metal,机器学习框架是MLX。 社区里绝大部分开源模型、训练代码、微调工具,都是先在CUDA上做好的,然后才慢慢有人移植到MLX,而且推理还好说,但是训练和微调在Apple上的生态到今天还是非常薄弱。 所以你现在应该能理解,RTX Spark为什么让整个行业都在期待了。 因为在RTX Spark之前,想要CUDA和想要统一内存的能效,这两件事在PC上,是不可兼得的。 RTX Spark第一次把这以前打架的东西捏到了一起。 这是以前任何一个单一平台都给不了的组合。 这才是RTX Spark真正的最牛逼的地方,也是最大的差异化。 运行人类至今创造过的一切,外加Agent。 而基于CUDA生态,这次,像Adobe之类的,会针对RTX Spark进行全面优化。 比如Adobe直接重新为RTX Spark设计了Photoshop和Premiere的核心架构,拥有高达两倍的速度,而且,还原生支持Agent调用。 而且,这一次,英伟达和微软还要一起携手,来重塑Windows上的Agent生态,虽然这块是后面才会跟纳德拉具体直播去聊,但是也透了一点东西出来。 包括全新的Windows安全基元,能为Agent的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。 还有英伟达自己的Open Shell。 一套面向Agent的Windows PC平台就能看出来了。 底层是RTX Spark提供的硬件能力。 第二层是Windows的系统,微软会把Windows往Agent时代来改。 第三层就是是安全运行环境。 也就是Windows security primitives + NVIDIA OpenShell。 可以说,未来任何一个想要在本地电脑上跑大模型的开发者或者创作者,从硬件上来说,RTX Spark的机器,几乎就是最优解。 如果你还想打游戏,那相信我,你没有别的选择了。 仅此一家,只有RTX Spark。 A New Line,A New Beginning。 这就是,个人电脑的新时代。 它,不止是为你设计的,还是为Agent所设计的。 不止兼容着过去,还带着过去。 走进了,下一个未来。

译英伟达在GTC Taipei 2026发布消费级芯片RTX Spark。该芯片基于GB10,提供最高1 PFLOP的FP4 AI性能、20个CPU核心、6144个GPU核心及128GB LPDDR5X统一内存,支持在本地运行120B参数的大模型。其核心突破在于首次将统一内存架构与CUDA生态结合于消费级PC,解决了以往统一内存在AI开发生态上的短板。微软将重构Windows以原生支持本地AI智能体运行。这被称为个人电脑诞生40年来“重新定义”的时刻。

DogeDesigner@cb_doge · 6月1日33

"I resisted AI for too long, living in denial. Now it is game on." — Elon Musk

译"我抗拒AI太久了,一直活在否认中。 现在,游戏开始了。" — Elon Musk

Emad@EMostaque · 6月1日54

With Nemotron & Cosmos NVIDA gonna commoditise everyone's complement

译借助Nemotron与Cosmos,NVIDIA将把所有人的互补能力商品化。

Rohan Paul@rohanpaul_ai · 6月1日59

Jensen Huang just said this is the greatest era in history to build software. AI agents will not kill software. They will do the exact opposite: create a massive new wave of software demand. at NVIDIA GTC Taipei 2026 "Click and type. We now replace that with explaining to the AI what we want, our intent, and the AI generates the code or uses tools to produce the necessary output. This is how computers are going to work in the future. This is Agentic AI. For two years, we've been building toward this, and now it has arrived. One of the big breakthroughs, of course, is tool use. A lot of people have said, “Jensen, AI is coming. Agentic AI is coming. Therefore, all the software companies are going to go out of business.” This is exactly the opposite. Because there are going to be so many agents, the world is no longer limited by the number of people. Therefore, those agents are going to use more tools than ever. This is actually an incredible time to be a software company. But the software has to be presented to the agent in a way that the agent can use it. This is a big breakthrough. And in fact, what we have done, as you know, what Nvidia’s treasure..." ---- From 'NVIDIA' YT channel (link in comment)

译黄仁勋在NVIDIA GTC台北2026上表示,我们正处在构建软件的最伟大时代。他断言,AI智能体不会消灭软件,反而会创造巨大的新软件需求浪潮。核心在于,未来计算机的交互将从“点击和输入”转变为向AI解释意图,由AI生成代码或使用工具完成输出,这就是智能体AI。随着智能体数量激增,它们对工具的使用将前所未有。这对软件公司是非凡机遇,但关键突破在于,软件必须以智能体能使用的方式呈现。

Berryxia.AI@berryxia · 6月1日42

前几天有人还在疯狂转发日本人用Opus 4.8 的做小游戏,觉得amazing… 其实在Codex 中GPT-5.5的时候早就可以做的很好了。 不信你看看0 基础的人都可以使用Codex0-1 完成游戏的开发,而且看起来和玩起来不错的呢! 强烈推荐给大家看看~

译推文指出,当人们还在关注使用 Opus 4.8 制作小游戏的案例时,Codex 中的 GPT-5.5 模型早就能很好地完成这类开发任务。作者强调,即使是零基础的用户,也可以通过 Codex(或其“0-1”版本)完成一款体验不错的游戏开发,并对此进行了强烈推荐。此观点建立在与日本人使用 Opus 4.8 开发游戏这一被广泛传播的案例的对比之上。

SemiAnalysis@SemiAnalysis_ · 6月1日56

F TIER KEYNOTEMAX: Jensen ComputeX presentation was one of the worst keynotes he has done. He announced nothing new on the AI datacenter side, and he only announced Windows on NVIDIA ARM CPU which the transition will not go work unlike Apple transition from x86 to M1 ARM. The NVIDIA laptop chip is already delayed by 6 to 8 months from its original expected launch window.  During development, the high-speed connection between the Nvidia and MediaTek parts caused so much interference that the video output was completely broken, Laptop makers are reportedly being told definitely not let anyone turn them on or run benchmarks. That screams "immature hardware."

译演讲被评为黄仁勋最差之一,AI数据中心方面未发布新内容。仅宣布Windows on NVIDIA ARM CPU,但该转型被认为难以成功。NVIDIA笔记本芯片已比原计划延迟6-8个月,开发中因高速连接干扰导致视频输出完全故障。据报道,笔记本厂商被告知禁止开机或运行基准测试,暗示硬件不成熟。

DogeDesigner@cb_doge · 6月1日28

One day, anyone will be able to generate an entire movie with Grok.

译有一天,任何人都能用Grok生成一整部电影。

Rohan Paul@rohanpaul_ai · 6月1日65

A study reveals how huge paychecks from tech giants are pulling top AI researchers away from universities. The top 1% of AI scientists in industry now earn around $2 mn a year. Researchers who move to these private companies stop writing public papers and instead file 530% more patents to keep their work secret. This study tracked 42,000 AI researchers --- nber. org/system/files/working_papers/w34964/w34964.pdf

译一项研究揭示,科技巨头的巨额薪酬正将顶尖AI研究人员从高校吸引走。 工业界前1%的AI科学家现在年薪约200万美元。 转投这些私营公司的研究人员不再发表公开论文,而是提交多530%的专利以保密其工作。 这项研究追踪了42,000名AI研究人员。

Rohan Paul@rohanpaul_ai · 6月1日27

Sam Altman talks about how in 2014, the so-called "elderly" in the field thought the idea of OpenAI is baseless. "In 2014, we started saying, "You know, we should really do something about this." It was incredibly unpopular at the time. We had said we want to make an AGI lab, and all the elders of the field were like, "You're insane. You're a scammer." This is because, at the time, people thought AGI was 100 years away and none of these approaches were going to work. We really said, "Let's just push on this one idea that scaling deep learning seems to matter." We didn't know at the time how beautifully predictable the scaling laws were, but it was at least clear back in those days that if you threw more compute at something, you got better results most of the time. We kind of just decided we were going to push on it as far as we could." --- From 'TreeHacks" YT channel (link in comment)

译Sam Altman回顾2014年OpenAI成立之初,业界普遍认为AGI遥不可及,团队因此被指为“疯子”和“骗子”。其核心押注在于持续扩展深度学习的规模,尽管当时团队并未完全理解扩展定律的精确预测性,但已观察到投入更多计算通常能提升效果,并决心坚持这一路径探索。

Emad@EMostaque · 6月1日44

My review of Claude Opus 4.8: We should worry less about being turned into paper clips & more about being annoyed to death.

译我对 Claude Opus 4.8 的评测: 我们应该少担心被变成回形针,多担心被烦死。

Rohan Paul@rohanpaul_ai · 6月1日28

For orbital datacenters, space has lots of energy, but cooling is hard there. Without convection, heat must radiate away, which needs large surfaces. But it is solvable because "there's a lot of space in space" ~ Nvidia CEO Jensen Huang

译对于轨道数据中心,太空有大量能源,但散热很难。没有对流,热量只能辐射出去,这需要很大的表面积。但这是可以解决的,因为“太空里有很多空间” ~ Nvidia CEO Jensen Huang

swyx@swyx · 6月1日39

every evals/analytics startup is going through a onetime generational upgrade into a continual learning platform in 2026 many will fail but as always the tasteful ones win

译每家评估/分析初创公司都将在2026年经历一次性的代际升级,转型为持续学习平台。许多公司会失败,但一如既往,有品味的公司会胜出。

Emad@EMostaque · 6月1日22

your upbringing is your system prompt

译你的成长背景就是你的系统提示词

Ethan Mollick@emollick · 6月1日67

/goal and other fully automated AI agents are cool, but not a great model for the future of work with people. Instead you want your AI to know when to ask you GOOD questions, maybe because it is stuck, maybe because your taste matters, maybe because you would find it interesting.

译/goal 和其他完全自动化的 AI 智能体很酷,但并非人类未来工作的理想模式。相反,你希望你的 AI 知道何时向你提出好问题——可能因为它卡住了,可能因为你的品味很重要,也可能因为你会觉得有趣。

elvis@omarsar0 · 6月1日58

As we target more complex use of coding agents (e.g., dynamic workflows and /goals) on long-horizon tasks, you will start to see all kinds of bizarre issues like this. This is just about user experience; it's even more insane what happens behind the scenes (ridiculous use of tokens, infinite loops, inefficient agent-to-agent interactions). You really want to own that harness and be in more control of it as we target more advanced use cases of coding agents. Multi-agent systems are just another beast to deal with.

译该推文指出,当编程智能体被用于处理更复杂的长时间任务时,会产生从用户体验到后台系统的多重挑战。前端表现为各种奇怪问题,后端则存在严重的token浪费、无限循环和智能体间低效交互。作者强调,在这种更复杂的用例下,拥有并控制运行框架变得至关重要,并指出多智能体系统是另一个需要应对的难题。

AYi@AYi_AInotes · 6月1日63

Paul Graham这句话简直能骂醒90%公司的 CEO, 他说"唯一比CEO亲自深度参与用AI造东西更糟糕的事, 就是CEO完全不亲自深度参与用AI造东西" 看到很多人都在骂他不懂管理,说CEO就该做战略,不该插手执行, 但其实他们压根没看懂这句话的真正分量。 他没说要让CEO去当全职工程师写生产代码, 核心表达是别再只看PPT听汇报了, 别再把AI全丢给那个AI转型负责人了,你得自己亲手去写Prompt,去造Agent,去用AI自动化你的工作流 去撞墙,去感受AI在哪里优雅, 在哪里崩坏,在哪里需要人判断。 AI是一场每周都在迭代的认知革命, 今天不可能的事,明天可能就变成了10倍效率,今天看起来很坚固的护城河,明天可能就被AI一脚踩平, 你靠二手信息建立起来的战略, 本质上就是在看后视镜开车, 等你反应过来的时候, 你的公司已经被那些天天泡在AI里的创始人甩得连尾灯都看不见了, 很多人说过度参与会让CEO忽略大局 但Paul Graham说的很清楚, 这两种错误的危害根本不在一个量级, 过度参与最多是效率低一点, 但完全不参与是直接判了公司的死刑, 所以建议所有CEO们: 1. 每天强制留出1小时,什么都不干,只用AI做你自己的真实工作 2. 不要做高大上的Demo,去做最脏最累的活:处理邮件、写文档、分析数据 3. 每周至少用AI造一个能真正用起来的小工具 4. 不要问你的团队"AI能做什么",你自己得先搞清楚"AI不能做什么" 在工业时代, 不摸机器的工厂主会被淘汰, 在互联网时代, 不用互联网的老板会被淘汰, 在AI时代, 不亲手用AI的CEO, 可能会旁观自己公司的被淘汰。

译Paul Graham警示CEO:比亲自深度参与用AI构建更糟的,是完全不参与。核心观点是CEO不能只依赖汇报与PPT,必须亲手写提示词、造智能体、用AI自动化工作流,亲身感受其能力与局限。AI认知每周都在迭代,依赖二手信息制定战略如同看后视镜开车,公司会被天天泡在AI里的创始人甩开。文章建议CEO:每天花1小时用AI处理实际工作、每周造一个能用的小工具,并先弄清AI不能做什么。在AI时代,不亲手实践的CEO可能旁观公司被淘汰。

Rohan Paul@rohanpaul_ai · 6月1日72

Jensen Huang thinks Dario Amodei's prediction of $1T in AI revenue by 2030 is too conservative. "I believe Dario and Anthropic are going to do way better than that. Way better than that. And the reason for that is the one part that he hasn't considered: I believe every single enterprise software company will also be a value-added reseller of Anthropic's tokens. And they’re going to get this logarithmic expansion. Their go-to-market is going to expand tremendously this year." --- From @theallinpod YT channel (link in comment)

译Jensen Huang认为Dario Amodei预测的2030年AI收入达$1T的预期过于保守。他指出,Anthropic的token将成为众多企业软件公司的增值服务,其市场将因此实现对数级扩张。有观点补充认为,当各实验室的模型能力趋同时,真正的优势可能源于独特的私有数据输入。这类数据(如特殊工作流、医疗记录等)能为AI系统带来难以复制的差异化和提升,未来或成为并购的关键标的。

Chubby♨️@kimmonismus · 6月1日45

Claude Mythos is $25 per million input tokens and $125 per million output tokens. I assume that the Mythos-like model that Anthropic will release in the coming weeks will be just as expensive. lets see

译Claude Mythos的输入token价格为每百万25美元,输出token价格为每百万125美元。 我预计Anthropic将在未来几周内发布的类似Mythos的模型,价格也会同样昂贵。 让我们拭目以待。

Rohan Paul@rohanpaul_ai · 6月1日60

Terence Tao summarized how AI is massively accelerating math career and math research. "In math, you previously had to basically go through years and years of education to be a math PhD before you could contribute to the frontier of math research. But now it's quite possible at the high school level or whatever, that you could get involved in a math project and actually make a real contribution because of all these AI tools and lean and everything else." From @dwarkesh_sp podcast (link to full video in comment)

译陶哲轩指出,AI工具和Lean等技术正在改变数学研究的参与门槛。过去需要多年博士训练才能触及前沿,而现在高中生也有可能参与项目并做出实质贡献。他强调,研究时间大多消耗在核查、验证等重复性工作上,AI降低了这类循环的成本,使研究者更敢于尝试“更疯狂”的想法。许多非常规思路并非因错误被否,而是因验证成本过高而被放弃;AI让犹豫变得廉价,这往往是科学发现的起点。

StepFun@StepFun_ai · 6月1日32

Intelligence got us here. Efficiency is what gets real work done. At ClawCon Macao, our GM of Developer Business @EileenTal laid out the next frontier for agents — and the thinking behind Step 3.7 Flash. 👏

译阶跃星辰(Step)发布Step 3.7 Flash模型。公司开发者业务负责人指出,模型竞争的新前沿不再是单纯的智能,而是智能体效率。新的目标是让AI智能体能够可靠、高效、规模化地完成真实世界的工作任务。

StepFun@StepFun_ai · 6月1日65

Intelligence got us here. Efficiency is what gets real work done. At ClawCon Macao, our GM of Developer Business @EileenTal laid out the next frontier for agents — and the thinking behind Step 3.7 Flash. 👏

译阶跃星辰在BEYOND ClawCon Macao活动上提出,模型竞争的新前沿是智能体效率,即可靠、高效、大规模地完成实际工作的能力,而不仅仅是智能本身。Step 3.7 Flash模型正是基于这一思考推出的。

Peter Steinberger 🦞@steipete · 6月1日49

Haven't seen codex writing ad-hoc codemods before, but it just did for a bigger TypeScript migration. Impressed.

译之前没见过 Codex 写临时代码修改,但它刚刚为一个更大的 TypeScript 迁移项目完成了。印象深刻。

Rohan Paul@rohanpaul_ai · 5月31日64

Chamath: AI advantage may come less from models than from private inputs. "When labs can build similar models, the real win comes from one unique ingredient in order to monetize it well. Here is a basic thing about machine learning that is worth knowing: if you take 1,000 of the same inputs and give them to Facebook, Microsoft, Google, and Amazon, they will all come up with the same machine learning model. But if you have one extra thing, one little ingredient that all of those other companies do not have, your output can be markedly different. It is like giving two great chefs three ingredients, but giving the third chef one extra ingredient. That person has the ability to do something very special. Right now, we are in a world where everybody is crawling the open web. We are going to move to a world where, as everybody gets sophisticated enough and information is widely available, somebody is going to say, “You know what? This site, I am not going to allow anybody else to access. It is only for me, only for my models.” Those models will become better. So we have to let that play out a little bit. It is going to be a really interesting arms race. The next wave of M&A, for example, could be companies like Google, Microsoft, and Facebook looking at these companies and saying, “Can they be viable inputs to my large language models or to my other machine learning and AI models?” --- A company with unique workflows, transactions, medical records, industrial logs, legal archives, design files, or user behavior can turn boring private data into a compounding advantage. Some startups may never become great public companies on their own, yet still become valuable because they own a data stream that makes a larger AI system sharper, more differentiated, or harder to copy. That turns acquisition strategy upside down: the buyer may not be purchasing revenue, brand, or even software, but a private ingredient for intelligence. ---- From "iConnections" YouTube channel, (link in comment)

译Chamath认为,当各大实验室能构建相似模型时,真正的竞争优势将来自独特的“私有数据输入”。他以厨师比喻:若给三位厨师相同食材,其中一位若多一味独特食材,便能做出非凡菜品。当前大家都依赖公开网络数据,但未来数据所有者可能将独家数据用于训练自己的模型,从而建立优势。这将引发一场围绕私有数据的“军备竞赛”,并可能改变大型科技公司的收购逻辑——未来的并购可能旨在获取能提升其大语言模型性能的独特数据流,而非仅仅购买收入或品牌。

Rohan Paul@rohanpaul_ai · 5月31日48

🎯“The people who invented refrigeration made some money, but most of the money was made by Coca-Cola, who used refrigeration to build an empire. LLMs are like as refrigeration & the Coca-Cola has yet to be built” ~Chamath Palihapitiya (@chamath) ---- From "iConnections" YouTube channel, (link in comment)

译🎯“发明制冷技术的人赚了一些钱,但大部分钱是可口可乐赚的,他们用制冷技术建立了一个帝国。 LLM就像制冷技术,而可口可乐尚未出现” ~Chamath Palihapitiya (@chamath) ---- 来自“iConnections” YouTube频道(链接在评论区)

Peter Steinberger 🦞@steipete · 5月31日61

The idea of OpenClaw is always that it should be yours. It's modular and lean, only add what you need. Fewer skills, fewer tools = your agent can work more efficiently.

译OpenClaw的理念始终是它应该属于你。 它是模块化且精简的,只添加你需要的功能。更少的技能,更少的工具 = 你的智能体可以更高效地工作。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月2日
11:37
jason@jxnlco
17
第一次读到不是 Codex 应用或 Slack 的内容。
大佬观点
08:35
meng shao@shao__meng
60
吴恩达老师谈「AI FDE」和「AI Engineer」

吴恩达对比了AI Forward Deployed Engineer (FDE)和AI Engineer两种岗位。他指出,FDE由厂商派驻客户现场进行深度集成,但企业更倾向于培养大量自有AI工程师。他判断,AI Engineer岗位数量将远多于FDE,因为客户担心供应商锁定,在AI技术快速演进时更需要保持技术选型灵活性。当下最有价值的是能使用Claude Code、Codex等AI编程工具构建应用的通才型AI工程师。未来该角色可能像传统软件工程师一样,分化出LLMOps、Evals等专才,但现阶段综合型人才价值依然很大。

Andrew Ng: One of the new, buzzy jobs in Silicon Valley is the AI Forward Deployed Engineer (FDE), an engineer who is embedded with...

AnthropicOpenAI大佬观点
07:44
SemiAnalysis@SemiAnalysis_
61
AWS利润率跃升10个百分点,而Azure和Cloud表现平淡。Tokenomics团队深入探讨了出售token与出租GPU的对比,Anthropic的650亿美元H轮融资,以及稳定的token利润率。 新一期节目现已上线:https://youtu.be/3zGmZfZnChs
Anthropic大佬观点行业动态
07:10
Rohan Paul@rohanpaul_ai
同事件精选76
Sam Altman强调AI发展应以人为本

Sam Altman在采访中表示,AI不应被设计为追求脱离人类需求的目标,人类必须始终处于AI发展的中心。他批判了行业内“AI将摧毁大量工作”等言论,认为人们担忧的并非AI带来的好处,而是自身在未来的角色、经济前景与自主权。他指出,AI行业的失败在于未能清晰解释人类如何在每一步保持对未来的控制权,以及如何在AI时代继续拥有充实、有意义的生活。

OpenAI大佬观点安全/对齐
同一事件,精选展示《OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重:我很高兴自己当时错了》
推荐理由:Sam Altman罕见正面回应“AI夺走工作”的恐惧,明确说人类必须始终有否决权,这是OpenAI领导层少有的、直接谈及普通人经济未来的表态。
06:00
宝玉@dotey
58
Codex、Cursor等AI智能体开放API与网页深度交互

推文建议,Codex、Cursor等AI智能体应提供API接口,允许右侧面板的网页视图直接向智能体发送包含文本和附件的提示词。例如,用户可构建类似Claude Design的网页,通过调用"window.codex.sendPrompt(text, attachments)"等API,将输入内容直接推送到左侧聊天界面。此举旨在实现智能体与网页间更深层的交互,从而解锁更多可能性。

智能体MCP/工具大佬观点
02:40
Rohan Paul@rohanpaul_ai
68
高通CEO预测:智能体时代全球AI token需求将爆炸式增长

高通CEO Cristiano Amon预测,全球token需求到2026年每10秒将达317亿,到2030年将增至1.27万亿,实现40倍增长。他指出,这一增长主要源于AI正从人类节奏的交互转向智能体驱动的活动。智能体AI将消耗远超聊天机器人的token,因其执行自主任务时需调用工具、读取输出、协调系统并更新记忆,形成隐藏的微决策链。因此,软件使用模式可能从按点击或席位计量,转变为按其消耗的机器推理token量计量。

Rohan Paul: New video of Qualcomm CEO Cristiano Amon: AI will require "gazillions" of tokens. Because, Agentic AI will consume drama...

智能体MCP/工具大佬观点
02:09
Yuchen Jin@Yuchenj_UW
50
OpenAI 在编程领域睡着了,于是 Anthropic 抢走了王冠。 Anthropic 没有获得足够的 GPU/TPU 来将这一领先优势转化为垄断。现在 Codex 已经追上来了。 Gemini 也会追上来。这只是时间问题。 AI 编程正在成为一个三体问题。
AnthropicOpenAI大佬观点编码
02:05
Ethan Mollick@emollick
64
我发现现在争论企业是否觉得AI有用很奇怪 我与许多大公司的领导团队交流过,他们普遍获得了明显且真实的价值。现在的挑战是如何从个人应用扩展到公司层面,以及如何规模化。
大佬观点现象/趋势
00:35
Ethan Mollick@emollick
65
许多公司正处于"鼓励采用AI"的阶段,无论是教员工使用ChatGPT/Claude,还是(叹气)堆砌token。 这回避了企业领导层更棘手的问题:你希望人们用AI做什么?哪些工作应保留给人类?还需要改变什么?
大佬观点现象/趋势
00:28
swyx@swyx
71
Ethan He论视频生成未来

前xAI世界模型负责人Ethan He在播客中分享了对Grok Imagine及视频生成未来的看法。他指出,视频模型的智能主要来自LLM,而非单纯扩大视频数据规模,因此正从视频生成转向LLM领域。他认为,视频生成的下一个前沿是训练用于编排视频模型的视频Agent模型。AI视频的发展将类似编程Agent路径,当前文本到视频仅是“自动补全”阶段。未来,世界模型将变得实时交互,语言模型或成为视频的控制层。

Latent.Space: 🆕Grok Imagine's Video Agent Moment: Cosmos, xAI, World Models, Generative UI, & the Codex Phase for Video! https://www....

智能体xAI大佬观点视频
6月1日
23:48
Emad@EMostaque
50
美国参议员桑德斯提出《美国AI主权财富基金法案》,旨在让公众直接拥有AI公司股份。推文设想若OpenAI和Anthropic的一半股份归美国人民所有,总价值约1万亿美元,相当于每人2800美元。按5%股息率计算,每人每年可获142美元,但仅勉强够支付一家AI公司的订阅费用。该法案基于"AI建立在人类集体知识之上"的理念,旨在让AI产生的财富惠及全人类而非少数寡头。

Sen. Bernie Sanders: AI is built on humanity's collective knowledge. The wealth it generates must benefit humanity - not just Elon Musk, Sam ...

AnthropicOpenAI大佬观点政策/监管
22:59
宝玉@dotey
64
像"渣男"一样组合使用AI模型

推文建议像“渣男”一样组合使用多个AI模型,发掘各自优势。具体指出 Opus 4.8 在UI设计与实现上优于 GPT-5.5,推荐用 Claude Design 后交由不同模型实现;其在系统设计和计划方面质量也高,但在写作上较弱。在 Claude Code、Cursor 等智能体中使用时,除写作外效果良好。引用内容提及 Opus 4.8 近期负面评价与退订增多,并有人预测 Anthropic 未来可能面临困境。

Ding: 全网都在骂 Opus 4.8,退订的人越来越多。实在想不明白,一家所有产品都是二流甚至三流水平的公司,是怎么火起来的???????? 我赌三年内 Anthropic 就会消失或被收购。

智能体AnthropicOpenAI大佬观点
22:28
Nathan Lambert@natolambert
60
推文探讨了闭源模型与开源模型未来不同的发展轨迹。观点认为,闭源实验室可以通过提供成本高昂的高端服务(如高端知识工作)来创造并维持利润,这将推动 OpenAI、Anthropic 等公司获得高估值。与此同时,开源模型经济体将逐步发展并壮大,服务于更广泛的长尾应用市场。这表明两种模型体系将在不同的维度上增长,其中闭源模型在边际智能价值驱动溢价的领域优势明显,而开源模型则在其他场景下逐步扩大影响。

Interconnects: Open and closed models are on different exponentials Where marginally higher intelligence drives value, and where it doe...

大佬观点开源生态
21:34
Ethan Mollick@emollick
57
默认的长文本墙是与AI建立连接的一种有缺陷的方式,部分原因是人们不想阅读所有内容,部分原因是即使阅读,其中也充满了太多导致认知负荷过高的干扰(正如论文所示),还有部分原因是AI写作本身只是尚可。
大佬观点现象/趋势
19:48
AYi@AYi_AInotes
66
NVIDIA发布基于ARM架构的RTX Spark处理器与新笔记本电脑

NVIDIA发布了基于ARM架构的RTX Spark处理器。其核心是一台搭载该芯片的笔记本,具备128GB统一内存,可直接本地运行200B参数的大语言模型。该芯片提供1 PetaFLOP的FP4算力,GPU性能与RTX 5070相当,旨在将数据中心级性能(Grace CPU + Blackwell GPU架构)集成到移动设备中。引用推文指出,该笔记本在拔掉电源后仍能保持性能不下降,并预计于2026年秋季推出。分析认为,NVIDIA此举的关键在于巩固其CUDA生态的护城河。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

大佬观点端侧
16:40
数字生命卡兹克@Khazix0918
76
英伟达发布RTX Spark芯片

英伟达在GTC Taipei 2026发布消费级芯片RTX Spark。该芯片基于GB10,提供最高1 PFLOP的FP4 AI性能、20个CPU核心、6144个GPU核心及128GB LPDDR5X统一内存,支持在本地运行120B参数的大模型。其核心突破在于首次将统一内存架构与CUDA生态结合于消费级PC,解决了以往统一内存在AI开发生态上的短板。微软将重构Windows以原生支持本地AI智能体运行。这被称为个人电脑诞生40年来“重新定义”的时刻。

智能体大佬观点端侧
关联讨论 9 条X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)IT之家(RSS)Hugging Face:Blog(RSS)X:Satya Nadella (@satyanadella)X:Perplexity (@perplexity_ai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)LMSYS:Blog(Chatbot Arena 团队)
16:21
DogeDesigner@cb_doge
33
"我抗拒AI太久了,一直活在否认中。 现在,游戏开始了。" - Elon Musk
xAI大佬观点
15:48
Emad@EMostaque
54
借助Nemotron与Cosmos,NVIDIA将把所有人的互补能力商品化。
大佬观点开源生态
15:08
Rohan Paul@rohanpaul_ai
59
黄仁勋在GTC台北重申:软件时代迎来巨变

黄仁勋在NVIDIA GTC台北2026上表示,我们正处在构建软件的最伟大时代。他断言,AI智能体不会消灭软件,反而会创造巨大的新软件需求浪潮。核心在于,未来计算机的交互将从“点击和输入”转变为向AI解释意图,由AI生成代码或使用工具完成输出,这就是智能体AI。随着智能体数量激增,它们对工具的使用将前所未有。这对软件公司是非凡机遇,但关键突破在于,软件必须以智能体能使用的方式呈现。

智能体大佬观点
14:42
Berryxia.AI@berryxia
42
Codex 的 GPT-5.5 早已能助零基础用户开发游戏

推文指出,当人们还在关注使用 Opus 4.8 制作小游戏的案例时,Codex 中的 GPT-5.5 模型早就能很好地完成这类开发任务。作者强调,即使是零基础的用户,也可以通过 Codex(或其“0-1”版本)完成一款体验不错的游戏开发,并对此进行了强烈推荐。此观点建立在与日本人使用 Opus 4.8 开发游戏这一被广泛传播的案例的对比之上。

Smith铜匠・十点睡觉: http://x.com/i/article/2061202487412215808

OpenAI大佬观点编码
13:36
SemiAnalysis@SemiAnalysis_
56
黄仁勋ComputeX演讲被批缺乏AI新进展

演讲被评为黄仁勋最差之一,AI数据中心方面未发布新内容。仅宣布Windows on NVIDIA ARM CPU,但该转型被认为难以成功。NVIDIA笔记本芯片已比原计划延迟6-8个月,开发中因高速连接干扰导致视频输出完全故障。据报道,笔记本厂商被告知禁止开机或运行基准测试,暗示硬件不成熟。

大佬观点部署/工程
11:51
DogeDesigner@cb_doge
28
有一天,任何人都能用Grok生成一整部电影。
xAI大佬观点视频
09:03
Rohan Paul@rohanpaul_ai
65
一项研究揭示,科技巨头的巨额薪酬正将顶尖AI研究人员从高校吸引走。 工业界前1%的AI科学家现在年薪约200万美元。 转投这些私营公司的研究人员不再发表公开论文,而是提交多530%的专利以保密其工作。 这项研究追踪了42,000名AI研究人员。
大佬观点数据/训练现象/趋势
08:01
Rohan Paul@rohanpaul_ai
27
Sam Altman回顾OpenAI成立初期面临的质疑

Sam Altman回顾2014年OpenAI成立之初,业界普遍认为AGI遥不可及,团队因此被指为“疯子”和“骗子”。其核心押注在于持续扩展深度学习的规模,尽管当时团队并未完全理解扩展定律的精确预测性,但已观察到投入更多计算通常能提升效果,并决心坚持这一路径探索。

OpenAI大佬观点
07:45
Emad@EMostaque
44
我对 Claude Opus 4.8 的评测: 我们应该少担心被变成回形针,多担心被烦死。
Anthropic大佬观点安全/对齐
07:28
Rohan Paul@rohanpaul_ai
28
对于轨道数据中心,太空有大量能源,但散热很难。没有对流,热量只能辐射出去,这需要很大的表面积。但这是可以解决的,因为"太空里有很多空间" ~ Nvidia CEO Jensen Huang
大佬观点部署/工程
06:16
swyx@swyx
39
每家评估/分析初创公司都将在2026年经历一次性的代际升级,转型为持续学习平台。许多公司会失败,但一如既往,有品味的公司会胜出。
大佬观点现象/趋势评测/基准
05:39
Emad@EMostaque
22
你的成长背景就是你的系统提示词
其他大佬观点
05:22
Ethan Mollick@emollick
67
/goal 和其他完全自动化的 AI 智能体很酷,但并非人类未来工作的理想模式。相反,你希望你的 AI 知道何时向你提出好问题--可能因为它卡住了,可能因为你的品味很重要,也可能因为你会觉得有趣。
智能体大佬观点
04:52
elvis@omarsar0
58
编程智能体复杂性:从体验到系统的挑战

该推文指出,当编程智能体被用于处理更复杂的长时间任务时,会产生从用户体验到后台系统的多重挑战。前端表现为各种奇怪问题,后端则存在严重的token浪费、无限循环和智能体间低效交互。作者强调,在这种更复杂的用例下,拥有并控制运行框架变得至关重要,并指出多智能体系统是另一个需要应对的难题。

智能体大佬观点编码
04:39
AYi@AYi_AInotes
63
CEO必须亲手参与AI建设,否则公司将被淘汰

Paul Graham警示CEO:比亲自深度参与用AI构建更糟的,是完全不参与。核心观点是CEO不能只依赖汇报与PPT,必须亲手写提示词、造智能体、用AI自动化工作流,亲身感受其能力与局限。AI认知每周都在迭代,依赖二手信息制定战略如同看后视镜开车,公司会被天天泡在AI里的创始人甩开。文章建议CEO:每天花1小时用AI处理实际工作、每周造一个能用的小工具,并先弄清AI不能做什么。在AI时代,不亲手实践的CEO可能旁观公司被淘汰。

Paul Graham: The only thing worse than having the CEO knee-deep in building stuff with AI is not having the CEO knee-deep in building...

智能体大佬观点
03:53
Rohan Paul@rohanpaul_ai
72
黄仁勋看好Anthropic token市场将大幅扩张

Jensen Huang认为Dario Amodei预测的2030年AI收入达$1T的预期过于保守。他指出,Anthropic的token将成为众多企业软件公司的增值服务,其市场将因此实现对数级扩张。有观点补充认为,当各实验室的模型能力趋同时,真正的优势可能源于独特的私有数据输入。这类数据(如特殊工作流、医疗记录等)能为AI系统带来难以复制的差异化和提升,未来或成为并购的关键标的。

Rohan Paul: Chamath: AI advantage may come less from models than from private inputs. "When labs can build similar models, the real ...

Anthropic大佬观点数据/训练
03:53
Chubby♨️@kimmonismus
45
Claude Mythos的输入token价格为每百万25美元,输出token价格为每百万125美元。 我预计Anthropic将在未来几周内发布的类似Mythos的模型,价格也会同样昂贵。 让我们拭目以待。
Anthropic大佬观点行业动态
02:50
Rohan Paul@rohanpaul_ai
60
陶哲轩:AI正在降低数学研究的门槛与试错成本

陶哲轩指出,AI工具和Lean等技术正在改变数学研究的参与门槛。过去需要多年博士训练才能触及前沿,而现在高中生也有可能参与项目并做出实质贡献。他强调,研究时间大多消耗在核查、验证等重复性工作上,AI降低了这类循环的成本,使研究者更敢于尝试“更疯狂”的想法。许多非常规思路并非因错误被否,而是因验证成本过高而被放弃;AI让犹豫变得廉价,这往往是科学发现的起点。

Rohan Paul: Terence Tao: "We lived in a world with cognitive friction until very recently, where every task required us to use our b...

大佬观点现象/趋势
02:47
StepFun@StepFun_ai
32
阶跃星辰(Step)发布Step 3.7 Flash模型。公司开发者业务负责人指出,模型竞争的新前沿不再是单纯的智能,而是智能体效率。新的目标是让AI智能体能够可靠、高效、规模化地完成真实世界的工作任务。

Ailing Teng: Today at BEYOND ClawCon Macao, I shared our view on the next phase of model competition:The new frontier is agent effici...

智能体大佬观点
02:17
StepFun@StepFun_ai
65
阶跃星辰在BEYOND ClawCon Macao活动上提出,模型竞争的新前沿是智能体效率,即可靠、高效、大规模地完成实际工作的能力,而不仅仅是智能本身。Step 3.7 Flash模型正是基于这一思考推出的。

Ailing Teng: Today at BEYOND ClawCon Macao, I shared our view on the next phase of model competition:The new frontier is agent effici...

智能体大佬观点
00:20
Peter Steinberger 🦞@steipete
49
之前没见过 Codex 写临时代码修改,但它刚刚为一个更大的 TypeScript 迁移项目完成了。印象深刻。
OpenAI大佬观点编码
5月31日
23:49
Rohan Paul@rohanpaul_ai
64
Chamath:AI优势可能更多来自私有数据而非模型

Chamath认为,当各大实验室能构建相似模型时,真正的竞争优势将来自独特的“私有数据输入”。他以厨师比喻:若给三位厨师相同食材,其中一位若多一味独特食材,便能做出非凡菜品。当前大家都依赖公开网络数据,但未来数据所有者可能将独家数据用于训练自己的模型,从而建立优势。这将引发一场围绕私有数据的“军备竞赛”,并可能改变大型科技公司的收购逻辑——未来的并购可能旨在获取能提升其大语言模型性能的独特数据流,而非仅仅购买收入或品牌。

大佬观点数据/训练现象/趋势
22:19
Rohan Paul@rohanpaul_ai
48
🎯"发明制冷技术的人赚了一些钱,但大部分钱是可口可乐赚的,他们用制冷技术建立了一个帝国。 LLM就像制冷技术,而可口可乐尚未出现" ~Chamath Palihapitiya (@chamath) ---- 来自"iConnections" YouTube频道(链接在评论区)
大佬观点现象/趋势
21:20
Peter Steinberger 🦞@steipete
61
OpenClaw的理念始终是它应该属于你。 它是模块化且精简的,只添加你需要的功能。更少的技能,更少的工具 = 你的智能体可以更高效地工作。

EdgeDimi: @theo Seeing different paths ioenclaw started as a heavy package and became lean now hermes becomes the heabty trash pac...

智能体大佬观点开源生态
‹ 上一页
1…2324252627…50
下一页 ›