AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 301 条
全部一手资讯X论文
标签「端侧」清除
郭明錤|Ming-Chi Kuo@mingchikuo · 6月3日63

A few thoughts on NVIDIA RTX Spark, setting aside the specs for now: the on-device AI agent narrative, a reality check on delivery, and Apple’s WWDC. 1. At the heart of it are two things: Jensen Huang’s “reinvent the PC” slogan and a concept demo of an on-device AI agent workflow. (I call it a concept demo because there was no live demo.) The slogan and concept demo should help speed up market consensus around on-device AI agents in the near term. 2. The key elements of the on-device AI agent concept: OS + cloud/local LLM switching + agent harness + cross-app workflow + sandbox The concept isn't new, but thanks to GTC's reach, it will likely shape how people talk about on-device AI agent use cases for the foreseeable future. 3. Jensen laid out the vision and narrative for on-device AI agents earlier than most. But over the next two years, RTX Spark devices will still be a niche slice of the laptop market, so it's too early to call who wins commercially. 4. Before GTC, most discussion and predictions around RTX Spark / N1X focused on its codename, specs, and supply chain. The operating system rarely came up. In his keynote, Jensen placed the OS alongside the chip platform at the heart of “reinventing the PC.” That echoes my earlier point: the operating system is the key to on-device AI driving the next upgrade cycle. 5. Software is what makes or breaks the user experience. For users to actually experience the agentic workflow Jensen showed, a lot still has to happen. At a minimum, NVIDIA’s CUDA Toolkit needs to officially support Windows Arm64, while Microsoft needs to move Windows’ on-device AI agent stack from preview to general availability (GA), including MCP on Windows, ODR, and agent connectors (all still in public preview), plus Agent Workspace (still in private preview). If these developer and OS tools still aren't in place when the hardware ships, RTX Spark devices will struggle to deliver on the keynote’s core promise: enabling users to actually create and experience AI agent workflows, the product’s core selling point. 6. After Huang's "reinvent the PC" pitch, how Apple responds to on-device AI agent workflows at WWDC (expected June 8) becomes another thing to watch, alongside how much Siri improves. For NVIDIA and Microsoft, even if RTX Spark's development or shipping timeline slips, it won't dent their strong growth in AI infrastructure. Apple is in a different position: consumer electronics is its entire hardware business, and on-device AI is where consumer electronics innovation is heading. So beyond a compelling narrative, Apple also needs to show a concrete plan to deliver, including clearer developer tools and an agent-ready OS update timeline.

译郭明錤分析了NVIDIA在GTC上提出的RTX Spark笔记本及设备端AI智能体概念。他指出,该概念演示(无实际现场展示)包含操作系统、云/本地LLM切换、智能体框架等要素。供应链调查显示,配备相关N1X芯片的设备未来两年出货量约1000万台,仍属利基市场。当前PC端主流AI应用仍依赖云端算力。若设备出厂时,NVIDIA CUDA Toolkit未正式支持Windows Arm64,且Microsoft的设备端AI智能体栈(包括MCP on Windows、ODR等)仍处于预览状态,则RTX Spark将难以兑现其核心卖点。此外,Apple在WWDC上如何应对设备端AI智能体工作流也值得关注。

Chubby♨️@kimmonismus · 6月3日53

Open claw windows companion app

译这出乎意料:微软发布了用于控制个人智能体的手持和桌面设备。 这让我想起了我曾对OpenAI用于控制智能体的独立硬件设备的期待。

Perplexity@perplexity_ai · 6月3日55

Today we're announcing that hybrid agentic inference is coming to Perplexity Computer. Computer can split tasks between a local model running on your machine and frontier models in the cloud. This keeps private data on your device and maximizes token efficiency. Coming soon.

译今天我们宣布,混合智能体推理将登陆 Perplexity Computer。 Computer 可以将任务分配给本地运行的模型和云端的前沿模型。这能将私有数据保留在您的设备上,并最大化 token 效率。 即将推出。

Chubby♨️@kimmonismus · 6月3日33

RTX spark running 120b parameter model locally. Ngl, pretty cool

译RTX显卡本地运行1200亿参数模型。 说实话,挺酷的。

AYi@AYi_AInotes · 6月3日73

Damn,一个独立开发者用 23.5 小时 + Codex, 把 Whoop 5.0 的订阅墙拆了。 没有破解,没有越狱, 就是一个开源 App,连上你的 Whoop, 心率、血氧、恢复数据直接看, zero 订阅费。 这大概是订阅制硬件今年最不想看到的故事。 这个 App 叫 Goose, GitHub 上完全开源。 作者Bennett晒了时间线, 从 0 到能连上 Whoop 5.0 并读出 HR、SpO2、皮肤温度、恢复分数, 总共 23.5 小时, 而且大比例代码是 Codex 写的。 能做到这件事,不是因为 Whoop 太弱, 是因为它的 BLE 广播协议本身没封死。 Judes Club 之前就有过完整的 Whoop BLE 分析, Goose 本质上是在这个公开协议底子上, 用 Rust 搭了座桥,SwiftUI 做了层皮, 把原本必须走 Whoop 服务器的数据, 直接留在了本地。 很多人以为 Whoop 的护城河是硬件精度, 其实不是。 Whoop 真正的护城河,是你一旦戴了半年, 历史数据、恢复曲线、睡眠趋势全锁在服务器里, 你根本懒得走。 Goose 撕开的不是技术缺口, 是订阅制硬件最脆弱的那层窗户纸: 用户惯性。 这就好比住高级酒店和买房的区别。 Whoop 让你交年费,给你一张房卡, 房间里确实打扫得挺干净, 但你的所有行李、照片、生活习惯, 退房那天全得留在房间里。 Goose 不是另盖了一家酒店, 是告诉你:这房子本来就有扇后门, 你自己拿钥匙进去,东西全带走, 不用看前台脸色。 过去两年 AI 写代码的故事, 大家都在比谁写得更快。 但 Bennett 这件事真正的信号是, AI 把一人挑战封闭硬件生态的成本, 压到了一天之内。 以前逆向硬件需要团队、需要数月、需要固件提取, 现在一个开发者 + Codex, 23.5 小时就能让订阅墙看起来像个笑话。 当然,我非律师,这只是我作为开发者的技术观察。 硬件公司的护城河不会明天消失, 但定义已经在变。 过去的护城河是传感器精度和 App 封闭, 未来的护城河,可能是你愿不愿意把数据主权交出去。 当一个人的周末就能拆一扇墙, 订阅制硬件的终局可能不是被另一家硬件公司打败, 是被一群不想交月租的开发者,一人一天,逐个拆光。 所以说,Whoop 真正的对手不是 Apple Watch, 是每一个周末有空、手边有 Codex、 还觉得 30 美金月费有点贵的开发者。 GitHub 仓库我放一楼了, 有用自取。

译独立开发者Bennett利用Codex AI编程工具,在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据,无需订阅。实现基于公开的BLE协议分析,使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性,并展示了AI工具如何降低个人挑战封闭生态的成本。

🚨 AI News | TestingCatalog@testingcatalog · 6月3日54

OpenAI is leading a $40 million investment into Opal, according to Wired. > Opal, previously known cameras, is working on a few devices that will release in the next year. The next big hardware move? 👀

译据《连线》报道,OpenAI正领投对Opal的4000万美元投资。 > Opal(前身为知名摄像头公司)正在研发几款将于明年发布的设备。 下一个重大硬件举措?👀

Chubby♨️@kimmonismus · 6月2日50

At @Google I/O, I sat down with @osanseviero and @DynamicWebPaige from Google DeepMind to talk about Gemma, open models, AI Studio, on-device AI, sovereign AI and the future of AI development. A great conversation on how building with AI is becoming more open, local and accessible.

译在 Google I/O 上,我与 Google DeepMind 的 @osanseviero 和 @DynamicWebPaige 坐下来,聊了聊 Gemma、开源模型、AI Studio、端侧 AI、主权 AI 以及 AI 开发的未来。 一场关于 AI 构建如何变得更开放、更本地化、更易获取的精彩对话。

AYi@AYi_AInotes · 6月2日66

同样站在 2009 年那个路口,有人只看见一块显卡, 有人看见了往后二十年整个计算的样子。 那年 Nvidia 市值 40 亿,是 Intel 的零头, 所有人都笑黄仁勋不过是个卖游戏配件的。 那时候 Nvidia 市值 40 亿,Intel 1000 亿,差了 25 倍。 他说了句在场没人当回事的话:PC 的杀手应用是 Word 和 Excel,所以串行架构的 CPU 是王者,但未来电脑要处理的不是打字和算数,是图像、3D 虚拟世界、艺术表达。 这些东西全是并行任务,CPU 搞不定。 17 年后,Nvidia 5 万亿,Intel 五千多亿,25 倍的劣势,变成了接近 10 倍的反超。 但我看了两遍才发现,这条视频最狠的不是老黄预测对了 AI,他 2009 年根本没提 AI。 他预测对的是另一件事:异构计算的必然性。 CPU 管串行,GPU 管并行,两个都要,但 GPU 的相关性在上升,这个判断后来成了现代计算的铁律——手机 SoC、AI PC、数据中心,全是这个逻辑。 而且他在 2005-2006 年就把 CUDA 押上去了,一个显卡公司搞通用计算平台,投资人觉得他疯了。 打个比方,就像在一片荒地上挖了口井,当年所有人都在笑,自来水不香吗你挖什么井,但十几年后城市盖起来了,才发现只有你这口井挖到了最深的蓄水层——所有房子的水管都只能接你这一口。 CUDA 就是这口井,黄仁勋挖了二十年。 他没去追 Intel 的赛道,默默在在修自己的路,从图形到科学计算到深度学习到生成式 AI 到物理世界模拟——每一步迁移,这条路都在变宽,十七年后,所有的车都拐上了他修的这条路。 远见从来不稀缺,酒桌上人人都有。 稀缺的是认准之后,肯花十年时间,把一句没人信的判断,亲手浇筑成一条别人绕不过去的护城河。 今天这个路口也站满了人,有人在盯更强的模型,有人在看下一个计算平台长在哪。 我们最该盯的其实不是市值曲线,应该是创始人嘴里那个词,黄仁勋在访谈里反复说 relevance——他不纠结谁更大,只纠结自己做的事跟未来还相关吗。 我觉得这句话比任何技术判断都值钱。 2009 年人人都说 Nvidia 就是个做显卡的,跟今天有人说某家 AI 公司就是个做 XX 的一模一样。 但真正的 alpha,永远藏在对工作负载演进方向的预判里。

译NVIDIA发布RTX Spark芯片,这是一款3nm制程SoC,集成ARM CPU、Blackwell GPU与128GB统一内存,号称可本地运行120B大模型并满帧运行3A游戏。此举被视为NVIDIA从图形计算到AI时代持续押注并行计算与异构计算路线的成果,凭借积累二十年的CUDA生态,直接挑战Intel、AMD主导的传统PC架构,标志着PC行业竞争转向AI算力与软件生态。文章同时指出,该芯片的ARM版Windows兼容性、散热与最终定价等问题,是后续需要观察的现实挑战。

🚨 AI News | TestingCatalog@testingcatalog · 6月2日41

Claude for iOS will get a redesigned settings menu along with a support for the upcoming Memory Files feature. > A slightly redesigned UI is being prepared for both Claude web and mobile, primarily revamping settings and navigation bar. > Memory Files is the upcoming new knowledge based memory system for Claude.

译Claude for iOS 将获得重新设计的设置菜单,并支持即将推出的 Memory Files 功能。 > Claude 网页版和移动版正在准备一个略微重新设计的 UI,主要改进设置和导航栏。 > Memory Files 是 Claude 即将推出的基于知识的新记忆系统。

AYi@AYi_AInotes · 6月2日62

Damn!老黄这波操作真TMD封神了,竟然复刻了乔布斯的第五口袋, 这是要正式接过乔布斯的接力棒,做定义下一个计算时代人的节奏啊😲 昨晚Computex 2026, 黄仁勋穿着他标志性的黑色皮衣 复刻了乔布斯2005年最经典的"第五口袋"桥段, 从牛仔裤的小表袋里掏出了N1X芯片, 那一刻全场沸腾, 21年前, 乔布斯也是从牛仔裤口袋里掏出了iPod Nano, 说"现在我们知道这个口袋是干嘛的了" 他把1000首歌放进了你的口袋 彻底改变了音乐产业, 21年后 老黄从同一个口袋里掏出了N1X 说"这是人类有史以来最惊人的芯片" 他把整个数据中心放进了你的口袋 即将彻底改变个人计算, 没错这确实是一波对乔布斯的致敬, 但没人看懂老黄背后真正的野心, 这个复刻黄仁勋不是简单的抄作业, 更像是一次权力交接的宣言, 乔布斯定义了个人计算的第一个时代, 而老黄正在定义个人计算的第二个时代, N1X到底有多恐怖? 台积电3nm工艺 20核Arm CPU+6144个CUDA核心Blackwell GPU 128GB统一内存 1 Petaflop AI算力 能本地流畅跑120B参数的大模型, 能同时运行几十个Agent, 能跑所有Windows应用和CUDA生态 功耗只有45-80W, 这意味着什么? 意味着你的下一台电脑, 不再是一个需要你亲手操作的工具 而是一个24小时为你工作的AI员工, 你出门的时候 它在家里帮你写代码、做研究、处理邮件, 你用手机给它发个指令, 它就能在后台完成所有工作, 这回英特尔和AMD肯定都要慌了, 因为他们卖了几十年的CPU, 突然变得不重要了,

译在Computex 2026上,黄仁勋复刻乔布斯经典场景,从牛仔裤口袋中拿出N1X芯片。该芯片采用台积电3nm工艺,集成了20核Arm CPU和6144个CUDA核心的Blackwell GPU,配备128GB统一内存,可提供1 Petaflop的AI算力,功耗仅45-80W。其性能足以在本地流畅运行120B参数的大模型,并支持同时运行多个AI智能体以及Windows与CUDA生态。此举被视为黄仁勋定义以AI为核心、个人计算新时代的宣言。

swyx@swyx · 6月2日69

whoah - Grace + Blackwell chips in a laptop. @Microsoft + @NVIDIA teaming up to take on 6 years of total dominance of Apple Silicon

译哇哦——Grace + Blackwell 芯片装进了笔记本电脑。 微软与英伟达联手,挑战苹果Silicon长达六年的绝对主导地位。

AYi@AYi_AInotes · 6月2日65

苹果、Intel、AMD、高通, 今晚大概率睡不好了。 统治了 PC 整整 30年的 Wintel 王朝,今天被一个卖显卡的,连桌子一起掀了。 NVIDIA 的 RTX Spark,一块 3nm 的 SoC, 把 ARM CPU、Blackwell GPU、128GB 统一内存焊进同一颗芯片, 塞进 14mm 的超薄本, 本地跑 120B 大模型, 1440p 满帧跑 3A, 拔了电源帧数硬是一格没掉。 但真正让那四家睡不着的,还不只是这些参数。 过去三十年的 PC, 像一群车厂在比谁的排量大, 所有人盯着 CPU 跑分, Intel Inside 就是品质保证,竞争全在同一套规则里打。 NVIDIA 今天开进来一辆电动车, 直接说规则换了, 以后比的是 AI 算力和谁的软件生态更深, 而它那张生态网,叫 CUDA,已经铺了二十年。 这一下,每一家被点到的,都得正面回应: Intel 和 AMD 还能追性能、追制程,追不上的是那二十年攒下的开发者。 苹果 2020 年就用 M 系列证明了 ARM 加统一内存能有多强, 可它把 CUDA 拦在门外, NVIDIA 干脆绕开,在 Windows 这边复刻了一遍, 还多带了苹果永远不肯给的东西, 完整 GPU 生态、3A 游戏、CUDA 全栈。 高通的 Snapdragon X 先跑了一年 Windows on ARM,没有 GPU 生态撑腰,整个故事还只讲了一半,没想到今天这个位置被人抢了 当然,发布会上说的,和真正用起来之间,向来隔着一段距离。 ARM 版 Windows 的兼容层跑老软件掉多少、满载久了降不降频、这套东西最后卖什么价,老黄一个都没交代。 但方向似乎已经钉死了, 过去你买电脑,Intel Inside 是贴在机身上的那张品质标签, 但是往后这张标签,得换人贴了。 NVIDIA 今天卖的不只是一颗芯片,还有下一个三十年 PC 行业的入场券。

译NVIDIA发布RTX Spark,一款3nm制程的SoC,整合了ARM CPU、Blackwell GPU及128GB统一内存。它被应用于超薄笔记本,可本地运行120B大模型,并在1440p分辨率下满帧运行3A游戏,拔电后性能不降。此举被视为PC行业竞争规则的转变,从比拼CPU性能转向比拼AI算力与CUDA软件生态,标志着NVIDIA对Wintel王朝的挑战。该方案绕开了苹果对CUDA的限制,并抢先在Windows平台复刻了ARM架构加完整GPU生态的路径,旨在争夺未来三十年的PC行业主导权。

Chubby♨️@kimmonismus · 6月2日66

God f*cking damn, i love it.

译我真他妈爱死这个了。

Chubby♨️@kimmonismus · 6月2日67

NVIDIA's quieter Computex drop actually matters more than RTX Spark: DGX Station for Windows. A GB300 (!) superchip under your desk that runs trillion-parameter models locally, 748GB coherent memory, 20 petaflops FP4, shipping Q4. GB300 Grace Blackwell Ultra Desktop Superchip -72-core Grace CPU + Blackwell Ultra GPU over NVLink-C2C -Up to 748GB coherent memory -up to 20 petaflops FP4 -ConnectX-8 SuperNIC, up to 800Gb/s (chain multiple units) -Runs models up to 1 trillion parameters locally -Optional RTX PRO 6000 Blackwell for ray-traced simulation Frontier models fully on-prem, hundreds of agents in parallel, local pretrain/fine-tune/inference, Linux toolchains via WSL, 748GB datasets in coherent memory. NVIDIA OpenShell, an open-source runtime that sandboxes each agent and enforces policy at the OS level via Windows containment primitives. Lets freaking go!

译NVIDIA发布了DGX Station for Windows,这是一款桌面级AI超级计算机,搭载新的GB300 Grace Blackwell Ultra Desktop Superchip。其核心规格包括72核Grace CPU与Blackwell Ultra GPU通过NVLink-C2C连接,提供最高748GB统一内存与20 petaflops FP4算力,可本地运行最高达1万亿参数的模型。该设备计划于2026年第四季度发货。同时,NVIDIA推出了开源运行时OpenShell,可在Windows系统层面为AI智能体构建安全沙箱。

Berryxia.AI@berryxia · 6月2日62

绝了!世界就是如此的有趣😄 一个128G 内存的笔记本领大奖都高潮了! 我今天刷到NVIDIA的发布会,老黄直接把ARM架构的RTX Spark SoC端了出来。 里面集成RTX 5070级GPU,核心卖点就一个:在笔记本拔掉电源后,性能几乎不衰,1440P游戏还能稳住高帧,电池续航也拉满。 我盯着这个参数表,突然觉得历史在开一个特别有味道的玩笑。 7年前苹果推M系列统一内存时,整个PC圈几乎一边倒地开喷。 焊死内存、不能扩容、价格死贵,大家一致认为这是封闭落后的设计,注定被市场教育。 结果现在老黄亲自带队,把高度集成的统一内存、高效共享、电池模式下的强性能,当成新一代SoC的核心竞争力来宣传。 当年被当成反面教材的架构,今天成了顶级玩家验证过的正确路径。 这不是简单的抄袭,而是整个行业在功耗墙和内存墙前,被迫走向同一条高效一体化路线。 苹果当年不是走偏了,而是早几年把未来看清楚了。 老黄用行动说明其实苹果的有些独到的远见。 兄弟们, 你现在回头看苹果统一内存的争议,是不是觉得当时的反共识其实才是共识? 未来高性能个人设备,传统分离式架构还会继续主导,还是统一内存这种一体化哲学会成为主流?

译NVIDIA发布了基于ARM架构的RTX Spark SoC,集成RTX 5070级GPU。其核心卖点在于拔掉电源后性能几乎不衰减,能在1440P分辨率下保持高帧率游戏体验,并大幅提升电池续航。该产品面向笔记本与桌面平台,AI算力亦高,预计2026年秋季上市。作者由此联想到,当年苹果M系列芯片采用的统一内存架构曾备受质疑,而今NVIDIA将其作为核心优势,这验证了应对功耗与内存瓶颈的高效一体化设计已成为行业共识。

Chubby♨️@kimmonismus · 6月2日67

At Computex, NVIDIA walked into a market it never owned: the PC itself. RTX Spark is an ARM superchip: 20-core Grace CPU, Blackwell GPU with 6,144 CUDA cores, up to 128GB unified memory, 1 PetaFLOP FP4. The GPU core count sits at RTX 5070 (!) level, in a laptop as thin as a MacBook. However, the strategy is the story: NVIDIA used to sell graphics cards. Now it builds the whole system: CPU, GPU, memory and software stack on one package, all on Windows on ARM. That puts it head to head with Intel, AMD, Qualcomm and Apple at the same time. Four rivals, one chip. The framing is as important as the gaming demos, even with Jensen holding up two laptops running 007 First Light and Forza Horizon 6. NVIDIA calls this a "personal AI computer." The pitch: your PC becomes a teammate, with local agents working next to you while you do something else. 128GB unified memory means 120B-parameter models running locally, no cloud. NVIDIA is wagering that the PC of the next few years gets built around local AI (!) rather than apps. If that lands, the company has done more than ship a product. It's set the frame everyone else has to compete in. What's still open: the GPU is power-limited (45–80W), the FPS and battery claims are unbenchmarked, and Windows on ARM still drags a long list of gaming and x86-emulation problems behind it. Ships Fall 2026. Until then, these are slides, not reviews. This is the most interesting AI launch of the year is a chip.

译NVIDIA在Computex发布了RTX Spark ARM超级芯片,采用系统级封装,集成了20核Grace CPU、6,144 CUDA核心的Blackwell GPU、最高128GB统一内存,并提供1 PetaFLOP FP4算力。此举标志着NVIDIA从显卡供应商转变为构建完整系统(包括CPU、GPU、内存和软件栈),直接与Intel、AMD、Qualcomm和Apple竞争。产品被定位为“个人AI计算机”,其128GB统一内存旨在支持本地运行120B参数的大语言模型。目前,该芯片的GPU存在功耗限制(45–80W),实际性能和电池表现待验证,且Windows on ARM平台仍面临游戏和x86兼容性挑战。产品计划于2026年秋季发货。

OpenBMB@OpenBMB · 6月1日53

Just a quick reminder: Build Small Hackathon sign-up closes on June 3! 🏆Total cash prizes: ~$40K $10K @OpenBMB Special Awards for the best projects using #MiniCPM models. Don’t miss out! Register now:https://huggingface.co/build-small-hackathon We highly recommend using MiniCPM models — they’re small, powerful, and perfect for this hackathon. Let’s build something awesome together!🤗🚀

译快速提醒:Build Small黑客松报名将于6月3日截止! 🏆总现金奖金:约4万美元 其中1万美元为@OpenBMB特别奖,授予使用#MiniCPM模型的最佳项目。 别错过!立即注册:https://huggingface.co/build-small-hackathon 我们强烈推荐使用MiniCPM模型——它们小巧、强大,非常适合本次黑客松。 让我们一起构建精彩项目!🤗🚀

小互@xiaohu · 6月1日53

OpenAI Voice Hack Night 上一个团队的现场 demo 为手机做的 "agentic 操作系统" 这个应该是我们大家都向往的AI助理形态,而且也是会颠覆手机商业模式的一种全新形态 因为演示的所有界面都是「即时生成」的,无需调用任何APP界面,也就是苹果的App Store商业模式要完蛋了... 核心思路是是「UI 即系统」:手机没有传统 app,界面由端侧本地模型实时生成(on the fly),重推理甩给云端 GPT。 开发者全程用语音指挥它订机票、删日历日程、查 AI 新闻、发邮件、列待办。中途还翻了车(发邮件因"登录没配置"失败)...

译OpenAI Voice Hack Night现场演示了为手机设计的“AI智能体操作系统”。其核心思路是“UI即系统”——手机没有传统App,界面由端侧本地模型实时生成,复杂推理任务由云端GPT处理。演示中开发者全程语音指挥完成订机票、删日历、查AI新闻、发邮件等操作,但中途因“登录未配置”导致发邮件失败。该演示展示了无需调用App界面的交互形式,可能颠覆传统移动应用生态和商业模式。

AYi@AYi_AInotes · 6月1日66

Damn,英伟达和老黄真的是憋了个大的啊,真特么牛逼🤯 今天全网都在转黄仁勋这台拔了电源还能满帧跑 3A 的笔记本,但大多数人看错了重点,游戏其实只是这台机器的糖衣。 真正的核弹是那 128GB 统一内存,它意味着你桌上一台轻薄本,能在本地直接跑起 200B 参数的大模型,这在过去是只有数据中心机柜才干得动的事。 所以 NVIDIA 这次干的根本已经不是又一个游戏本那么简了,它把数据中心那套 Grace CPU 加 Blackwell GPU 整个下放, 1 PetaFLOP 的 FP4 算力、RTX 5070 级的显卡、CPU 和 GPU 共享的统一内存,一起塞进一个能背着走的壳子里。 拔电不掉帧、续航炸裂,这些是讲给所有人听的甜头,这回真正瞄准的,是要在本地跑 AI 的那波人。 如果把游戏本三个字去掉,你会看见一件更大的事。 这就像一个一直只卖发动机的厂商,突然开始造整车,顺手还把高速公路也给铺了,CUDA 是发动机,Grace 是底盘,Windows on Arm 是路, 从今往后你想跑得快,就只能在它修的这条路上跑。 当然,舞台上拔电不掉帧是十分钟的高光,长时间满载会不会降频、ARM 版 Windows 靠兼容层跑老软件会掉多少性能、这套东西最后卖一个什么价,发布会一个都没回答。 但方向已经很清楚了,Intel 和 AMD 还能追性能追制程,但CUDA 攒了十几年的那群开发者肯定是追不上了, 老黄卖的从来不是一台更强的电脑,是一条你用顺手了,就再也下不来的路!

译NVIDIA发布了基于ARM架构的RTX Spark处理器。其核心是一台搭载该芯片的笔记本,具备128GB统一内存,可直接本地运行200B参数的大语言模型。该芯片提供1 PetaFLOP的FP4算力,GPU性能与RTX 5070相当,旨在将数据中心级性能(Grace CPU + Blackwell GPU架构)集成到移动设备中。引用推文指出,该笔记本在拔掉电源后仍能保持性能不下降,并预计于2026年秋季推出。分析认为,NVIDIA此举的关键在于巩固其CUDA生态的护城河。

Chubby♨️@kimmonismus · 6月1日62

Holy, NVIDIA revealed RTX Spark and its nuts. Superchip. Blackwell-GPU (RTX-5070-Cores) 128GB, 1 PetaFLOP KI, 1440p/100FPSand so much for Laptops. Insane

译天啊,NVIDIA公布了RTX Spark,这太疯狂了。超级芯片。Blackwell GPU(RTX-5070核心)128GB,1 PetaFLOP AI算力,1440p/100FPS,还有笔记本版本。太离谱了。

数字生命卡兹克@Khazix0918 · 6月1日76

http://x.com/i/article/2061360923009564672 # 英伟达发布全新RTX Spark - 个人PC的新时代。 今天,英伟达的NVIDIA GTC Taipei 2026,在早上11点,终于如约而至了了。 发布了很多的东西,但是有一个东西,是我觉得真正具有历史意义的,必须要单独拿出来的说的。 甚至,它让英伟达喊出了,个人电脑诞生40年以来,这次,要重新定义。 “A New Line,A New Beginning” 而这一切,都是因为一个全新的消费级芯片。 也就是传说中的,被各种爆料了很久的代号为N1X的芯片。 RTX Spark。 就是这么个小小的东西。 可以说,这是我在今年上半年最期待的一场AI大会,因为在这个时代,你几乎很难看到,几个巨头联手预热,只为这一场发布会。 PC的新时代。 可能也只有英伟达,能攒起这样的局了。 那一串奇怪的数字,正是这次老黄演讲的地点,台北流行音乐中心。 在看完今天的发布会以后,我相信没有人会不再相信这句话了。 整个上半年的AI的进展,几乎都是OpenClaw、Claude Code、Codex等等等等。 背后,全部都是云端大模型。 但是ToC端的硬件层面,几乎毫无进展。 可试问,又有谁不想真正的把大模型和Agent,部署在自己的本地端呢,低延迟、隐私保护、无需网络,不仅仅是进行推理,甚至可以微调,那种自由又安全的感觉,永远会让人迷恋。 我们需要新的硬件,也需要新的芯片,需要一些更有趣的想象。 而这一切的目光,几乎都聚焦在了这次的NVIDIA GTC Taipei 2026上。 终于,RTX Spark如约而至。 如果比较关注英伟达或者过去打游戏比较多的朋友,可能对RTX和Spark这两个独立的单词都比较熟。 RTX就是英伟达的消费级产品线,大家见的最多的,就是各种显卡,比如RTX 5080。 Spark其实同源于去年的一个面向开发者的DGX Spark,只不过这次被正式升级成了一整套英伟达全新的业务线。 于是,RTX Spark出炉了。 直播的时候看的我起鸡皮疙瘩了。 整体参数如下。 RTX Spark的底层应该是跟DGX Spark相同的GB10芯片,因为我看这次的旗舰版的参数和之前差不多。 最高1 PFLOP的FP4 AI性能,20个CPU核心、6144个GPU核心和128GB的LPDDR5X统一内存。 能直接在本地轻轻松松跑120B的模型。 这次发布会上,老黄还秀了一把未来所谓搭载RTX Spark的合作品牌方做的电脑。 你可以在一台厚度为14mm、未插电的笔记本电脑上渲染一个90GB的3D场景、编辑12K分辨率视频。 非常离谱。。。 而且,不仅有很薄但性能爆炸的全新笔记本,还有类似于Mac Mini那种功耗很低的小盒子。 所以最近联想、HP、ARM大涨啥的,不是没有原因的。 能在个人消费级的电脑里,直接用统一内存的方式,以超高速+全面CUDA生态支持,来本地跑AI大模型,这应该是整个PC领域头一遭。 而且微软会跟英伟达一起,全面重构Windows系统,让搭载RTX Spark的电脑,原生支持本地Agent的运行。 Windows生态,感觉有救了,英伟达来当救世主了。 真的,无愧于个人PC新时代这个比喻。 感觉上,明年全新的Windows系列的换机潮要来了。 我觉得要理解RTX Spark的历史意义,还是得说一个我觉得大家需要知道的东西: 就是到底啥是统一内存?它有啥用? 在过去,我们传统的电脑里,一般有两个大家所熟知的最核心的东西,一个叫CPU,一个叫GPU。 这个叫CPU,我用AI画了一张。 GPU大家肯定都很熟了,在电脑上,经常就是我们常说的显卡,比如我的这个5080。 CPU和GPU他两呢,各有各的内存,是分开的两块。 CPU用的叫系统内存(RAM),GPU用的叫显存(VRAM),两边要交换数据得通过一条通道来回搬。 而统一内存呢,大概就是把这两块合成一块,CPU和GPU共用同一个内存池,谁都能直接访问。 苹果把这套玩意搞成了自己的主流,你现在买的Mac,几乎都是统一内存了。 但是Windows生态,CPU和GPU都是不同厂家做的做的,受限于过去的生态,过去也有人搞过,但是也都拉了,也从来没有人能把这么多上下游,联合起来大搞特搞。 这么大的阵仗,英伟达是第一个。 而这个统一内存,对于跑大模型来说,真的几乎就是决定生死的差别。 上面我们也说了,传统PC的内存架构是分裂的,CPU有自己的系统内存(RAM),GPU有自己的显存(VRAM),两者之间靠一条叫PCIe的东西连起来。 比如,CPU有一块系统内存,我们按64GB RAM来算,GPU又有一块自己的显存,比如RTX5080的16GB VRAM。 你想在本地跑一个大模型,比如量化后的70B模型,可能要几十G内存,你的电脑内存看起来有64GB,但GPU真正能高速使用的只有那16GB显存。 一旦模型太大,显存放不下,就要把一部分权重放在CPU的系统内存里,GPU每次需要这部分权重,就得通过PCIe去系统内存里拿。 GPU读自己的显存,带宽大概1TB/s,非常快。 但是PCIe这条连接CPU内存和GPU的通道,像PCIe 4.0 x16单向带宽只有大概32GB/s,差了三十倍,纯龟速。 所以,你的模型还是跑不动,或者跑的很慢。 统一内存解决的主要问题就是这个。 它可以把CPU和GPU的内存变成一个共享池,比如一台机器有128GB统一内存,那么GPU就可以直接使用这个大池子里的很大一部分。那这样你跑本地大模型的时候,就不再被一张显卡的 16GB、24GB、32GB显存限制得那么死。 统一内存在消费级单机上,几乎是跑本地大模型唯一优雅的解法。 数据中心就是另一个世界了,那条路跟我们普通消费者就没啥关系了。 说到这,那我觉得,你肯定想问,那既然统一内存这么牛逼,我买Mac不就行了,Mac也有128G的统一内存的版本,我买RTX Spark干啥? 这是个非常好的问题,有一个答案还是挺重要的,那就是英伟达真正的杀手锏。 CUDA。 CUDA这个词,很多关注AI的朋友应该都听过,但它到底是什么,为什么这么重要,我觉得还是值得认真聊一下。 很多人以为CUDA就是英伟达的显卡驱动,或者只是什么GPU加速技术。 这么理解也不能说错,但它远不止于此。 CUDA是一整套的生态,最牛逼的生态。 底层,它让你能把GPU当成通用计算器来编程,除了渲染画面,还能做数学计算。 中层,是一堆被打磨了将近二十年的数学库。cuBLAS做线性代数,cuDNN做深度学习的基础运算,TensorRT做推理优化,NCCL做多卡通信,FlashAttention这类关键优化,CUDA 路线最成熟,很多新特性也会优先围绕NVIDIA GPU做适配。 还有老黄这次演讲里反复强调的CUDA-X,为所有的Agent,开放的CUDA库,能让Agent直接调用,这下更离谱了。。。 里面有一整套横跨科学计算、工程仿真、芯片设计、基因组学、通信网络、机器人和物理仿真等等的加速库。 比如cuLitho做计算光刻,cuOpt做决策优化,cuDSS做稀疏矩阵求解,AI-Q做对结构和非结构化文档做深度研,Warp做可微分物理,Parabricks做基因组学等等等等。 用老黄的话说,数学,太美妙了。 CUDA,太牛逼了。 上层,就是PyTorch、TensorFlow、JAX,几乎所有深度学习框架的GPU后端,默认且首先支持的就是CUDA。 从2006年做到现在,CUDA积累了海量的优化库、教程、代码、生态等等。你今天去看学术论文放出来的开源代码,绝大多数都是在CUDA上写和测的,你今天遇到任何深度学习的问题去搜解法,搜出来的答案也几乎都是默认假设你在用CUDA。 整个AI工程界的母语,就是CUDA。 这也是Apple一直以来的一个痛点。 它的统一内存确实牛逼,但它的GPU用的是Metal,机器学习框架是MLX。 社区里绝大部分开源模型、训练代码、微调工具,都是先在CUDA上做好的,然后才慢慢有人移植到MLX,而且推理还好说,但是训练和微调在Apple上的生态到今天还是非常薄弱。 所以你现在应该能理解,RTX Spark为什么让整个行业都在期待了。 因为在RTX Spark之前,想要CUDA和想要统一内存的能效,这两件事在PC上,是不可兼得的。 RTX Spark第一次把这以前打架的东西捏到了一起。 这是以前任何一个单一平台都给不了的组合。 这才是RTX Spark真正的最牛逼的地方,也是最大的差异化。 运行人类至今创造过的一切,外加Agent。 而基于CUDA生态,这次,像Adobe之类的,会针对RTX Spark进行全面优化。 比如Adobe直接重新为RTX Spark设计了Photoshop和Premiere的核心架构,拥有高达两倍的速度,而且,还原生支持Agent调用。 而且,这一次,英伟达和微软还要一起携手,来重塑Windows上的Agent生态,虽然这块是后面才会跟纳德拉具体直播去聊,但是也透了一点东西出来。 包括全新的Windows安全基元,能为Agent的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。 还有英伟达自己的Open Shell。 一套面向Agent的Windows PC平台就能看出来了。 底层是RTX Spark提供的硬件能力。 第二层是Windows的系统,微软会把Windows往Agent时代来改。 第三层就是是安全运行环境。 也就是Windows security primitives + NVIDIA OpenShell。 可以说,未来任何一个想要在本地电脑上跑大模型的开发者或者创作者,从硬件上来说,RTX Spark的机器,几乎就是最优解。 如果你还想打游戏,那相信我,你没有别的选择了。 仅此一家,只有RTX Spark。 A New Line,A New Beginning。 这就是,个人电脑的新时代。 它,不止是为你设计的,还是为Agent所设计的。 不止兼容着过去,还带着过去。 走进了,下一个未来。

译英伟达在GTC Taipei 2026发布消费级芯片RTX Spark。该芯片基于GB10,提供最高1 PFLOP的FP4 AI性能、20个CPU核心、6144个GPU核心及128GB LPDDR5X统一内存,支持在本地运行120B参数的大模型。其核心突破在于首次将统一内存架构与CUDA生态结合于消费级PC,解决了以往统一内存在AI开发生态上的短板。微软将重构Windows以原生支持本地AI智能体运行。这被称为个人电脑诞生40年来“重新定义”的时刻。

OpenClaw🦞@openclaw · 6月1日46

We are proud to continue our collaboration with @nvidia with support for thier NVIDIA RTX Spark Laptop. Strengthening our support to support OpenShell and @Microsoft Security Primitives. Building ontop of our earlier work with NemoClaw and our existing fully-native Windows support.

译我们很自豪能继续与@nvidia合作,为其NVIDIA RTX Spark笔记本提供支持。加强我们对OpenShell和@Microsoft Security Primitives的支持。 基于我们早期与NemoClaw的合作以及现有的完全原生Windows支持。

Satya Nadella@satyanadella · 6月1日65

Our goal is to deliver unmetered intelligence to every home and every desk with Windows. NVIDIA RTX Spark marks a real breakthrough toward that vision. Looking forward to sharing more with Jensen, who will be joining us live from Taiwan, at Build this week! https://blogs.windows.com/windowsexperience/2026/05/31/introducing-a-powerful-new-chapter-for-windows-pcs-accelerated-by-nvidia-rtx-spark/

译我们的目标是通过Windows,为每个家庭和每张办公桌提供无限制的智能。 NVIDIA RTX Spark 标志着朝着这一愿景迈出的真正突破。 期待在本周的Build大会上,与从台湾现场连线的黄仁勋分享更多内容!

SemiAnalysis@SemiAnalysis_ · 6月1日65

BREAKING NEWS: Jensen just announced WINDOWS on NVIDIA ARM consumer PC. Unlike Apple transition to ARM M1 with Rosetta 2 transpiler, we are not convinced that Windows on NVIDIA ARM will work well.

译突发新闻:黄仁勋刚宣布英伟达ARM消费PC将搭载Windows。与苹果通过Rosetta 2转译器过渡到ARM M1不同,我们对Windows在英伟达ARM上的表现持怀疑态度。

Chubby♨️@kimmonismus · 5月31日75

Interesting updates on Apple AI: As Apple's WWDC lands next month, and the long-delayed Siri and on-device AI upgrades are expected to be the centerpiece: a smaller, distilled version of Google's Gemini running locally on iPhone silicon, pitched on privacy and lower token costs. Most of that stack is sourced from elsewhere. The local model is distilled from Gemini. Queries too heavy for the device route to Google Cloud (!), where Apple has now signed off on Nvidia's confidential-compute tech to process them. Apple is also reportedly hunting for small on-device-AI startups to speed up the model-shrinking work, having looked at Liquid AI among others. One quiet shift from the 2024 rollout: Apple promised then that anything leaving your iPhone would run on Apple silicon inside Private Cloud Compute. It couldn't get the full Gemini running there, so those queries now sit in Google Cloud. The Private Cloud Compute name is staying anyway. Via The Information

译苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级,核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型,以强调隐私与降低token成本。但该技术栈大部分源自外部:本地模型由Gemini蒸馏,设备无法处理的复杂查询将路由至Google Cloud处理,并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。此外,苹果2024年承诺的Private Cloud Compute方案原计划使用苹果芯片,因无法承载完整Gemini模型,现已部分转向谷歌云,但该名称仍将保留。

郭明錤|Ming-Chi Kuo@mingchikuo · 5月31日61

Nvidia's Much-Anticipated, Reportedly Upcoming N1X / Windows PC Processor: Supply Chain Checks and Key Takeaways ▌Supply chain checks point to around 10M shipments of N1X-based devices over the next two years. ➡ Still a niche market, aimed at power users who need on-device AI compute. ➡ Whether shipments get revised up will come down to price, but mainly to whether Windows can deliver apps and workflows that truly orchestrate on-device AI compute. ▌Today, the main ways people use AI on a PC (both Windows and Mac) are accessing cloud LLM services through a browser and calling LLMs via API to consume a cloud provider's compute / tokens: ➡ In both cases, the core AI compute happens in the cloud, not on the device. ▌So far in 2026, the two hottest stories in the PC market have had almost nothing to do with on-device AI compute: ➡ Strong MacBook Neo sales. My industry checks suggest 2026 shipments of Neo models were revised up by roughly 100% (5M → 10M). Buyers are paying for price, design, and ecosystem, not for on-device AI compute. ➡ Cheap mini PCs, still niche, are drawing a lot of attention because they can run AI agents (like OpenClaw) around the clock (e.g., Mac mini). These agents also run inference in the cloud. ➡ Bottom line: neither the sales nor the buzz has much to do with on-device AI compute. ▌The key to on-device AI driving an upgrade cycle is the operating system (OS): ➡ What really sets on-device AI apart from the cloud is its ability to deeply integrate a user's data and workflows across apps while keeping things private. But that needs OS support. ➡ AI in today's PC OS is still mostly about adding AI features to first-party apps and loosely connecting workflows across apps. ➡ Some apps already make good use of on-device AI compute, like speech-to-text, but not enough to drive meaningful upgrade demand. ▌The N1X devices could give AI power users another solid option: ➡ Thanks to the N1X, device makers can strike a better new balance across AI compute, memory, design, and portability. ➡ For power users running LLMs on-device, an N1X device is a solid alternative to the Mac when it comes to capable on-device AI compute and large memory. ➡ But if the goal is a real upgrade cycle, then beyond price, OS support (Windows) is still what matters.

译供应链信息显示,Nvidia即将推出的N1X处理器设备未来两年出货量约1000万台,仍属面向需要设备端AI算力的性能用户的小众市场。2026年PC市场热点是MacBook Neo销量上调和可运行AI智能体的小型PC,但两者均与设备端AI算力无关。真正的设备端AI优势在于操作系统层面的隐私与深度整合,而当前Windows的支持尚不足。N1X设备能为需要本地运行大语言模型的用户,提供一个更平衡的选择,但能否驱动升级周期,关键仍在于Windows能否提供相应的应用与工作流支持。

郭明錤|Ming-Chi Kuo@mingchikuo · 5月31日56

許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未來出貨能否上修,除售價因素,還是取決於 Windows 能否提供真正調度裝置端 AI 算力的應用與工作流。 ▌目前 PC(Windows 與 Mac)的主流 AI 應用為「用瀏覽器上 LLM 網站」與「透過 API 消耗雲端 LLM 的算力 / token」: ➡ 核心都是使用雲端 AI 算力,非裝置端。 ▌2026 年 目前為止 PC 產業的兩個熱門事件,都與裝置端 AI 算力幾乎無關: ➡ MacBook Neo 的熱賣。我的產業調查顯示,2026 年該機種出貨量顯著調升約 100% (5M → 10M)。消費者買的是「低價 + 設計 + 生態」,不是買裝置端 AI 算力。 ➡ 便宜的小 PC 主機雖仍屬利基市場,但因能長時間掛機跑 AI agent(如OpenClaw)而受到高度關注(如 Mac mini)。這類 agent 的推論算力幾乎也來自雲端。 ➡ 小結:無論銷量(裡子)或話題(面子),都與裝置端 AI 算力幾乎無關。 ▌裝置端 AI 推動升級換機潮的關鍵為作業系統: ➡ 裝置端 AI 與雲端最大差異,在於兼顧隱私下,能高度整合跨應用程式的用戶資料與工作流,然這需作業系統支援。 ➡ 目前 PC 作業系統 AI 化主要仍處於「為本家應用程式增加 AI 功能」與「輕度整合跨應用程式的工作流」。 ➡ 已有善用裝置端 AI 算力的應用,如語音轉錄文字,但不足以推動顯著升級換機需求。 ▌N1X 裝置可望提供 AI 重度使用者另一個好選擇: ➡ 受益於 N1X,裝置設計能在 AI 算力、記憶體、外觀與攜帶性之間,取得一個更好的新平衡點。 ➡ 對在本地端跑 LLM 的重度使用者而言,在不錯的裝置端 AI 算力與大容量記憶體裝置的選擇上,N1X 裝置是除了 Mac 以外的另一個好選擇。 ➡ 若欲帶動顯著升級換機潮,除售價外,作業系統(Windows)支援仍是關鍵。

译供应链调查显示,配备Nvidia N1X的Windows PC未来两年出货量约1000万台,仍属瞄准重度用户的利基市场。当前PC主流AI应用(如通过浏览器访问大语言模型网站或API调用token)核心仍依赖云端算力。2026年产业热点(如MacBook Neo出货量预计翻倍至1000万台,以及可长时间挂机运行AI智能体的小型主机)均与本地AI算力无关。推动装置端AI换机潮的关键在于操作系统需支持深度整合跨应用工作流。N1X为本地运行大语言模型的用户提供了除Mac外兼具算力与大内存的新选择,但能否引爆换机潮仍取决于Windows的生态支持和定价。

Orange AI@oran_ge · 5月31日48

AI 这么刚需的东西 微信官方应该早点自己支持 他们的 agent 至少应该支持吧 听说张小龙亲自操刀 如果不支持 md 渲染… 有点说不过去

译推文批评微信作为主流通讯工具,却不支持 Markdown 和 HTML 文件格式的渲染与便捷打开,导致文件分享封闭,尤其在移动场景下造成困扰。作者呼吁微信应更早重视并支持这类基础功能,并特别指出“AI这么刚需的东西”,微信至少应该在其智能体(Agent)功能上提供良好支持。引用推文也反映了相同的痛点:周围人频繁使用 Markdown 和 HTML 发文件,但微信对此一窍不通且封闭。

Rohan Paul@rohanpaul_ai · 5月31日60

atomic[.]chat (a desktop app that runs LLMs locally) ran a very revealing comparison for local AI agents, on a MacBook Pro M5 Max, 64GB. Liquid’s much smaller LFM2.5-8B-A1B beat gpt-oss-20b by finishing every required tool call, cutting runtime by more than half, and using 4.8GB RAM instead of 11GB. The task was not normal chat, because the model had to plan a trip by calling outside tools for 3 weather checks, 2 currency conversions, 1 email, and 1 reminder. The striking part is that LFM2.5-8B-A1B is much smaller in active compute, yet it hit every required call at 266tok/s, while gpt-oss-20b used 11GB RAM, made only 3/7 calls, and ran at 146tok/s. Now, tool calling is a control problem before it is a language problem. The model has to preserve a checklist across context, decide when language should stop and action should begin, and resist the temptation to answer as if partial completion were enough. A smaller mixture-of-experts model with only a fraction of its parameters active can win if its training shaped those control habits more sharply than a larger model’s general fluency did.

译在MacBook Pro M5 Max 64GB上的本地测试中,Liquid的LFM2.5-8B-A1B模型在需要完成7个工具调用的旅行规划任务上,显著优于OpenAI的gpt-oss-20b。LFM2.5-8B-A1B仅使用4.8GB内存,以266tok/s的速度成功完成了全部7/7工具调用,耗时6.9秒。相比之下,gpt-oss-20b消耗了11GB内存,仅完成3/7工具调用,速度为146tok/s,耗时15秒。这表明,一个活跃参数规模更小(1B)的MoE模型,通过更精准的训练,在工具调用这一智能体任务上可以战胜活跃参数规模约其2.5倍的更大模型。

AYi@AYi_AInotes · 5月31日75

damn,NVIDIA 这回真是憋了个大的啊, 官号只发了三个词,A new era of PC,配一个坐标:25.0528, 121.5990。 微软和 Arm 几乎同一时间,发了几乎一样的内容。 那个坐标点开,是台北音乐中心——6 月 1 号黄仁勋 keynote 的场地。 三家巨头同时塞给你一张藏宝图,图上就画了个叉,这件事本身就是一个巨大的信号了。 藏在后面的,大概率是传了快一年的 N1X——NVIDIA 和联发科合做的一颗 ARM 笔记本芯片,联发科出 CPU,NVIDIA 把 Blackwell 显卡直接做进同一颗芯片里,两块 die 拼一起,跑 Windows、原生跑 AI。 泄露的口风很猛,说轻薄本里能摸到接近 RTX 4070 的图形,但具体还得等 6 月 1 号发布会,先别太当真。 我觉得真正值得琢磨的可能还不是这颗芯片有多强,关键是NVIDIA 站的位置已经完全变了。 过去在一台笔记本里,NVIDIA 就是被请进来装那块独立显卡的供应商,整机怎么设计、配谁家的 CPU、装什么系统,轮不到它说话, 它像个上门装空调的师傅,活儿干得全场最好,可房子是别人的。 这次老黄不装空调了,他想要把 CPU、GPU、AI 单元打包成一整颗芯,直接卖给戴尔、联想去做整机。 相当于那个最好的装空调师傅,转头自己当起了开发商,整套户型都按他的图纸来,这才是那三个词真正的分量。 说白了,NVIDIA 不想再只卖那块最贵的配件了,它想定义整台机器的心脏长什么样,走的是 Apple M 系列那条垂直整合的老路, 只不过这次的目标,是整个 Windows 阵营。 真要走通了,最先慌的是 Intel 和 AMD,甚至连刚站稳脚跟的高通骁龙都得抖一抖。 当然,新纪元这词,科技圈喊过太多次,喊完没下文的也不少。 还得看一年后你换的那台笔记本,开机角落里,那个贴了几十年的 Intel inside是不是已经换了。

译NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。

Berryxia.AI@berryxia · 5月31日71

我今天刷到Ivan Fioravanti在mlx-vlm项目里的更新。 Step 3.7 Flash模型正式加进去了。 转换到MLX之后,视觉理解和文本生成全部跑通。 这个模型速度特别快。 4bit量化版本在128GB Apple Silicon机器上就能支持32K上下文。 他直接在Mac Studio上测了benchmark,生成速度达到53 tokens/s以上。 拿一张截图让它分析,模型把结构信息、关键元素提取得又快又准。 以前我们总觉得高质量视觉语言任务必须靠云端。 现在它把这种能力真正塞进了个人Mac。 隐私、速度、零额外费用,全都兼顾到位。 本地多模态AI又往前走了一步,真正能落地到日常项目里。

译Ivan Fioravanti 在 mlx-vlm 项目中成功将阶跃星辰的 Step 3.7 Flash 模型移植到 MLX 框架,实现了视觉理解和文本生成。测试表明,该模型的 4bit 量化版本在 128GB Apple Silicon Mac 上支持 32K 上下文,生成速度超过 53 tokens/s。对截图的分析也准确高效。这意味着高质量的本地多模态 AI 能力可以在个人 Mac 上运行,兼顾了隐私与性能。

Chubby♨️@kimmonismus · 5月31日51

Nvidia, Microsoft and Arm posted the same “a new era of PC” teaser this week, with coordinates pointing at Jensen Huang’s Computex keynote. The reveal everyone expects is N1X, Nvidia’s first Arm-based Windows laptop chip. Nvidia tried to buy Arm outright for $40 billion and gave up in 2022 after regulators lined up against the deal. Now it’s about to ship the most important Arm processor in the Windows market without owning any of the architecture underneath it.

译Nvidia、微软与Arm本周同步发布预告,指向Computex主题演讲,外界普遍期待发布N1X——这是Nvidia首款基于Arm架构的Windows笔记本电脑处理器。此前,Nvidia曾在2022年试图以400亿美元收购Arm未果。如今,Nvidia即将推出这款被认为将是Windows市场最重要Arm处理器之一的芯片,尽管其并未拥有Arm架构的底层所有权。

StepFun@StepFun_ai · 5月30日55

Curious to hear your verdict once it’s loaded. 👀

译等加载完想听听你的看法。👀

Rohan Paul@rohanpaul_ai · 5月30日74

The information: Meta is preparing its biggest AI wearable push yet, with a AI pendant, more AI glasses, and a business service called Wearables for Work. Meta’s bet is that the next AI interface is not a chat box, but a sensor-rich device tied to an assistant that can remember meetings, summarize conversations, answer visual questions, and trigger actions. The reported target is huge: 10M wearable sales in the second half of 2026 and 6.8M monthly active wearable users by year-end. The software layer may matter more than the hardware, because Meta AI Assistant, Hatch, subscriptions, and wearable apps turn a device sale into recurring AI revenue. The pressure is obvious: Reality Labs posted a $4.03B operating loss on only $402M revenue in Q1-26, so Meta needs wearables to become a platform, not another expensive gadget line. --- theinformation .com/briefings/meta-plans-ai-pendant-part-ambitious-wearables-expansion

译Meta正准备迄今规模最大的AI可穿戴设备推进,包括AI项链、更多AI眼镜以及企业服务“Wearables for Work”。其押注下一代AI交互界面不是聊天框,而是具备丰富传感器、能记住会议、总结对话、回答视觉问题并触发操作的AI助手设备。报道的销售目标宏大:2026年下半年销量目标1000万台,年底月活用户目标680万。软件层被视作关键,可将设备销售转化为持续性AI收入。此举背后的财务压力明显:Reality Labs在2026年第一季度录得40.3亿美元运营亏损,营收仅为4.02亿美元,因此Meta亟需将可穿戴设备发展成一个平台,而非又一条昂贵的硬件产品线。

StepFun@StepFun_ai · 5月30日62

Small is a feature. 😌

译小即是美。😌

Berryxia.AI@berryxia · 5月30日77

Windows的兄弟们终于等到了~ 很多人以为AI agent的电脑操作还得靠Mac或云端,OpenAI直接把Codex的Computer Use推到Windows上了。 现在Codex能在Windows真实桌面执行任务,ChatGPT手机App还能远程启动、查看和指挥,整个流程边走边控,电脑继续干活。 早期体验,但对Windows主力用户来说,跨设备agent落地一步到位。

译OpenAI宣布其AI智能体Codex的Computer Use功能现已登陆Windows,允许Codex在Windows真实桌面执行任务。同时,ChatGPT手机App新增了对Windows端Codex的支持,用户可在移动端远程启动、查看和控制任务,实现跨设备协同。该功能目前处于早期体验阶段。

🚨 AI News | TestingCatalog@testingcatalog · 5月30日60

Microsoft ❤️ NVIDIA > NVIDIA GTC Keynote is happening on June 1 > Microsoft Build Keynote event is happening on June 2 > Both Windows and NVIDIA accounts teased an upcoming announcement, saying "A new era of PC." A new Windows hardware is coming 👀

译Microsoft ❤️ NVIDIA > NVIDIA GTC 主题演讲将于6月1日举行 > Microsoft Build 主题演讲活动将于6月2日举行 > Windows和NVIDIA的账号都预告了即将发布的公告,称“PC的新时代”。 新的Windows硬件即将到来 👀

Chubby♨️@kimmonismus · 5月30日41

The 2026 collaboration i did not see coming.

译2026年的这次合作,我完全没料到。

Berryxia.AI@berryxia · 5月30日57

很多人还在等参数更大的模型才能跑好本地Agent! Liquid AI的LFM2.5-8B-A1B却用1.5B active参数就已经做到了。 这个8B MoE训练了38T tokens加大规模RL,上下文直接128K,工具调用和多步agent能力很强,能接近4倍参数模型的表现。 单台笔记本就能跑完整本地agent loop,延迟低、全程隐私安全,不用调用GPT-4o或Claude。 支持llama.cpp、MLX、vLLM等框架,覆盖Apple、NVIDIA、AMD硬件。 本地Agent落地比多数人想的快多了。 你已经在本地跑Agent了吗?

译Liquid AI发布了LFM2.5-8B-A1B,一款为设备端优化的模型。它采用8B MoE架构,但仅有1.5B active参数,在38T tokens上进行了大规模RL训练,并将上下文扩展至128K。该模型的工具调用与多步智能体能力强劲,表现可接近4倍参数规模的模型。它支持在单台笔记本上完整运行本地智能体循环,具备低延迟与隐私优势。该模型兼容llama.cpp、MLX、vLLM等框架,覆盖Apple、NVIDIA、AMD硬件。

X.PIN@thexpin · 5月29日65

http://x.com/i/article/2060305879338029061 # Huawei can't win the Nanometer race. So it is changing the game. Unable to compete at the frontier of transistor scaling, Huawei is betting that the future of chip performance lies in integration, interconnects, and light. Huawei cannot reliably win the nanometer race. So it has decided to run a different one. On May 25, 2026, He Tingbo, Huawei’s borad member and president of semiconductor business, took the stage at the International Symposium on Circuits and Systems in Shanghai and announced what she called the τ (Tau) Law, a new principle for how chips should be made faster in an era when making transistors smaller is no longer a reliable path forward. Huawei described it as the first attempt by a Chinese company to articulate a post-Moore scaling framework with global ambitions. The announcement generated a wave of coverage, most of it focused on whether this constituted a genuine scientific contribution or a rebranding of known techniques. Both framings miss the more consequential question: why is Huawei doing this at all, and what does it reveal about where the company is placing its bets? The answer starts with a set of circumstances Huawei did not choose, and a moment in the industry’s trajectory that made those circumstances easier to work with. The timing is not accidental. As transistor scaling slows globally, AI systems are becoming increasingly constrained by data movement rather than raw compute. The bottleneck is shifting from how fast a single chip can calculate to how efficiently thousands of chips can share data across a system. The industry was already moving toward advanced packaging, chiplets, and optical interconnects to address that shift. Huawei’s contribution was to turn those scattered trends into a single narrative, and claim the naming rights before anyone else did. Since 2020, U.S.-led export controls have effectively cut Huawei off from the ecosystem required to manufacture chips at the industry’s leading edge. The result is that Huawei cannot access leading-edge manufacturing on the same terms as Apple, Nvidia, or Qualcomm. The Mate 60’s appearance of 7nm-class chips, achieved through SMIC, showed that the door is not entirely shut. But competing at the industry’s true frontier has become extraordinarily difficult in a way that is structural, not temporary. That frontier has a straightforward competitive logic. Smaller transistors fit more computing power into the same area, consume less energy per operation, and run faster. This is what Moore’s Law predicted in 1965 and what the industry has organized itself around ever since. Every two years or so, the leading foundries push to a new node: 7nm, 5nm, 3nm. The companies that can access those nodes gain a measurable performance advantage over those that cannot. Competing there, at the very frontier, is what Huawei cannot currently do on equal terms. That is the constraint within which the τ Law was designed. ## A Different Variable to Optimize The τ Law proposes an answer to that constraint. In Huawei’s formulation, τ refers to the effective RC time constant that governs how quickly signals can propagate and switch states within a chip. Smaller τ means faster signals, more operations per second, higher effective performance. Moore’s Law, underneath all the transistor-count language, was always producing performance gains by reducing τ: shrink the transistors, shorten the wires connecting them, signals arrive faster. Huawei’s argument is not that this was wrong. It is that there are other ways to reduce τ that do not require a new process node: through the circuit layout, the chip architecture, and the systems connecting chips together. Huawei defines a four-layer optimization stack: the transistor itself, the circuit connecting transistors, the chip connecting circuits, and the system connecting chips. Each layer has its own version of τ, and each offers opportunities to compress signal travel time without shrinking transistor dimensions. The τ Law is a framework for pursuing all four simultaneously. Here is the honest assessment of what this represents: Huawei did not discover this direction. The physics pointing toward it, with RC delay as the binding constraint as geometric scaling slows, has been in semiconductor textbooks for decades. Intel, TSMC, and Samsung are all working on versions of the same techniques. What Huawei did was name the direction, formalize it into a single framework, and build a public roadmap around it. That is a different kind of contribution than inventing the underlying physics. But it is not nothing. Moore’s Law itself was not a discovery of new physics. It was a prediction that became a commitment that became a coordination mechanism for an entire industry. ## Folding Is Not Stacking The most tangible expression of the τ Law at the chip level is Logic Folding, and understanding it requires separating it from something it superficially resembles: conventional 3D chip stacking. The semiconductor industry has been stacking chips for years. TSMC’s SoIC, Intel’s Foveros, and Samsung’s X-Cube all take multiple finished chips and connect them vertically to reduce the distance signals travel between them. It is a genuine and increasingly important technique. But each chip in the stack is still internally structured the same way it always was: circuits laid flat across a single layer, signals running long horizontal paths to reach neighboring gates. Logic Folding addresses the interior of the chip, not the space between chips. Rather than finishing the chip and then connecting it to others, Huawei redesigns the circuit layout during the design phase, redistributing logic gates across multiple vertical layers within a single chip. Connections between layers are made through face-to-face hybrid bonding, routing signals vertically across short distances rather than horizontally across long ones. 3D stacking shortens the distance between chips. Logic Folding shortens the distance inside a chip. One is a packaging innovation applied after manufacture. The other is a design innovation applied before it. They address different layers of the same problem, which is also why they are complementary rather than competing. On the first commercial implementation, the new Kirin chip expected this autumn, Huawei claims transistor density rises from 155 million to 238 million per square millimeter, and says energy efficiency improves by 41%. These numbers come from Huawei and have not been independently verified. What can be said without qualification is that the improvement is achieved without a new manufacturing process, on existing foundry infrastructure, which is the point the τ Law is making. The goal is approaching the transistor density associated with leading-edge nodes through design rather than fabrication. This is a meaningful achievement if the numbers hold up. It is also, importantly, a packaging and integration achievement more than a transistor achievement. The performance gain comes from rethinking how circuit elements connect to each other, not from making them individually smaller. And that logic, followed to its conclusion at the system level, leads directly to co-packaged optics. CONTINUE READING AT https://www.thexpin.com/p/huawei-post-moore-chip-strategy

译由于美国出口管制,华为在芯片先进制程竞赛中面临困难。为此,华为于2026年5月提出“τ(Tau)定律”,旨在为后摩尔时代的芯片性能提升提供新框架。该定律的核心是优化有效RC时间常数(τ)以提升信号传播速度。其方法是不完全依赖制程微缩,而是从晶体管、电路、芯片互连及系统架构四个层次进行优化,以压缩τ值。华为将其描述为中国公司首次提出具有全球影响力的后摩尔扩展框架。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
01:58
郭明錤|Ming-Chi Kuo@mingchikuo
63
郭明錤分析NVIDIA RTX Spark:设备端AI智能体愿景与现实挑战

郭明錤分析了NVIDIA在GTC上提出的RTX Spark笔记本及设备端AI智能体概念。他指出,该概念演示(无实际现场展示)包含操作系统、云/本地LLM切换、智能体框架等要素。供应链调查显示,配备相关N1X芯片的设备未来两年出货量约1000万台,仍属利基市场。当前PC端主流AI应用仍依赖云端算力。若设备出厂时,NVIDIA CUDA Toolkit未正式支持Windows Arm64,且Microsoft的设备端AI智能体栈(包括MCP on Windows、ODR等)仍处于预览状态,则RTX Spark将难以兑现其核心卖点。此外,Apple在WWDC上如何应对设备端AI智能体工作流也值得关注。

郭明錤|Ming-Chi Kuo: 許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...

智能体现象/趋势端侧
01:47
Chubby♨️@kimmonismus
53
这出乎意料:微软发布了用于控制个人智能体的手持和桌面设备。 这让我想起了我曾对OpenAI用于控制智能体的独立硬件设备的期待。

Chubby♨️: This came as a surprise: Microsoft has unveiled handheld and desktop devices designed to control one's agents. It remind...

智能体Microsoft产品更新端侧
01:31
Perplexity@perplexity_ai
55
今天我们宣布,混合智能体推理将登陆 Perplexity Computer。 Computer 可以将任务分配给本地运行的模型和云端的前沿模型。这能将私有数据保留在您的设备上,并最大化 token 效率。 即将推出。
产品更新端侧
01:17
Chubby♨️@kimmonismus
33
RTX显卡本地运行1200亿参数模型。 说实话,挺酷的。
产品更新推理端侧
01:11
AYi@AYi_AInotes
73
独立开发者用Codex在23.5小时内开发开源App,绕过Whoop 5.0订阅限制

独立开发者Bennett利用Codex AI编程工具,在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据,无需订阅。实现基于公开的BLE协议分析,使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性,并展示了AI工具如何降低个人挑战封闭生态的成本。

开源/仓库现象/趋势端侧编码
00:53
🚨 AI News | TestingCatalog@testingcatalog
54
据《连线》报道,OpenAI正领投对Opal的4000万美元投资。 > Opal(前身为知名摄像头公司)正在研发几款将于明年发布的设备。 下一个重大硬件举措?👀

Opal: the table. an update on opal electronics. http://op.al/table

OpenAI端侧行业动态
6月2日
20:44
Chubby♨️@kimmonismus
50
在 Google I/O 上,我与 Google DeepMind 的 @osanseviero 和 @DynamicWebPaige 坐下来,聊了聊 Gemma、开源模型、AI Studio、端侧 AI、主权 AI 以及 AI 开发的未来。 一场关于 AI 构建如何变得更开放、更本地化、更易获取的精彩对话。
DeepMindGoogle大佬观点开源生态
16:09
AYi@AYi_AInotes
66
NVIDIA发布RTX Spark芯片,挑战传统PC架构

NVIDIA发布RTX Spark芯片,这是一款3nm制程SoC,集成ARM CPU、Blackwell GPU与128GB统一内存,号称可本地运行120B大模型并满帧运行3A游戏。此举被视为NVIDIA从图形计算到AI时代持续押注并行计算与异构计算路线的成果,凭借积累二十年的CUDA生态,直接挑战Intel、AMD主导的传统PC架构,标志着PC行业竞争转向AI算力与软件生态。文章同时指出,该芯片的ARM版Windows兼容性、散热与最终定价等问题,是后续需要观察的现实挑战。

AYi: 苹果、Intel、AMD、高通, 今晚大概率睡不好了。 统治了 PC 整整 30年的 Wintel 王朝,今天被一个卖显卡的,连桌子一起掀了。 NVIDIA 的 RTX Spark,一块 3nm 的 SoC, 把 ARM CPU、Black...

大佬观点端侧
15:51
🚨 AI News | TestingCatalog@testingcatalog
41
Claude for iOS 将获得重新设计的设置菜单,并支持即将推出的 Memory Files 功能。 > Claude 网页版和移动版正在准备一个略微重新设计的 UI,主要改进设置和导航栏。 > Memory Files 是 Claude 即将推出的基于知识的新记忆系统。
Anthropic产品更新端侧
13:08
AYi@AYi_AInotes
62
黄仁勋发布N1X芯片

在Computex 2026上,黄仁勋复刻乔布斯经典场景,从牛仔裤口袋中拿出N1X芯片。该芯片采用台积电3nm工艺,集成了20核Arm CPU和6144个CUDA核心的Blackwell GPU,配备128GB统一内存,可提供1 Petaflop的AI算力,功耗仅45-80W。其性能足以在本地流畅运行120B参数的大模型,并支持同时运行多个AI智能体以及Windows与CUDA生态。此举被视为黄仁勋定义以AI为核心、个人计算新时代的宣言。

AYi: http://x.com/i/article/2061406941541240838

产品更新端侧
06:00
swyx@swyx
69
哇哦--Grace + Blackwell 芯片装进了笔记本电脑。 微软与英伟达联手,挑战苹果Silicon长达六年的绝对主导地位。
Microsoft端侧行业动态
03:49
AYi@AYi_AInotes
65
NVIDIA RTX Spark发布,3nm SoC整合ARM CPU、Blackwell GPU及128GB统一内存

NVIDIA发布RTX Spark,一款3nm制程的SoC,整合了ARM CPU、Blackwell GPU及128GB统一内存。它被应用于超薄笔记本,可本地运行120B大模型,并在1440p分辨率下满帧运行3A游戏,拔电后性能不降。此举被视为PC行业竞争规则的转变,从比拼CPU性能转向比拼AI算力与CUDA软件生态,标志着NVIDIA对Wintel王朝的挑战。该方案绕开了苹果对CUDA的限制,并抢先在Windows平台复刻了ARM架构加完整GPU生态的路径,旨在争夺未来三十年的PC行业主导权。

推理现象/趋势端侧
03:41
Chubby♨️@kimmonismus
66
我真他妈爱死这个了。

Nous Research: We have been working closely with @nvidia to ensure Hermes Agent works smoothly on their new @NVIDIARTXSpark superchip a...

智能体Microsoft开源生态端侧
01:41
Chubby♨️@kimmonismus
67
NVIDIA发布桌面级AI超级计算机DGX Station for Windows

NVIDIA发布了DGX Station for Windows,这是一款桌面级AI超级计算机,搭载新的GB300 Grace Blackwell Ultra Desktop Superchip。其核心规格包括72核Grace CPU与Blackwell Ultra GPU通过NVLink-C2C连接,提供最高748GB统一内存与20 petaflops FP4算力,可本地运行最高达1万亿参数的模型。该设备计划于2026年第四季度发货。同时,NVIDIA推出了开源运行时OpenShell,可在Windows系统层面为AI智能体构建安全沙箱。

NVIDIA Newsroom: Introducing NVIDIA DGX Station for Windows, the world's most powerful deskside AI supercomputer with Windows powered by ...

智能体产品更新端侧部署/工程
00:43
Berryxia.AI@berryxia
62
NVIDIA RTX Spark SoC发布,统一内存架构再获验证

NVIDIA发布了基于ARM架构的RTX Spark SoC,集成RTX 5070级GPU。其核心卖点在于拔掉电源后性能几乎不衰减,能在1440P分辨率下保持高帧率游戏体验,并大幅提升电池续航。该产品面向笔记本与桌面平台,AI算力亦高,预计2026年秋季上市。作者由此联想到,当年苹果M系列芯片采用的统一内存架构曾备受质疑,而今NVIDIA将其作为核心优势,这验证了应对功耗与内存瓶颈的高效一体化设计已成为行业共识。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

现象/趋势端侧
00:41
Chubby♨️@kimmonismus
67
NVIDIA进军PC市场,发布RTX Spark超级芯片

NVIDIA在Computex发布了RTX Spark ARM超级芯片,采用系统级封装,集成了20核Grace CPU、6,144 CUDA核心的Blackwell GPU、最高128GB统一内存,并提供1 PetaFLOP FP4算力。此举标志着NVIDIA从显卡供应商转变为构建完整系统(包括CPU、GPU、内存和软件栈),直接与Intel、AMD、Qualcomm和Apple竞争。产品被定位为“个人AI计算机”,其128GB统一内存旨在支持本地运行120B参数的大语言模型。目前,该芯片的GPU存在功耗限制(45–80W),实际性能和电池表现待验证,且Windows on ARM平台仍面临游戏和x86兼容性挑战。产品计划于2026年秋季发货。

智能体产品更新端侧
6月1日
22:12
OpenBMB@OpenBMB
53
快速提醒:Build Small黑客松报名将于6月3日截止! 🏆总现金奖金:约4万美元 其中1万美元为@OpenBMB特别奖,授予使用#MiniCPM模型的最佳项目。 别错过!立即注册:https://huggingface.co/build-small-hackathon 我们强烈推荐使用MiniCPM模型--它们小巧、强大,非常适合本次黑客松。 让我们一起构建精彩项目!🤗🚀
Hugging Face端侧行业动态
20:04
小互@xiaohu
53
OpenAI演示AI智能体操作系统,或颠覆手机应用生态

OpenAI Voice Hack Night现场演示了为手机设计的“AI智能体操作系统”。其核心思路是“UI即系统”——手机没有传统App,界面由端侧本地模型实时生成,复杂推理任务由云端GPT处理。演示中开发者全程语音指挥完成订机票、删日历、查AI新闻、发邮件等操作,但中途因“登录未配置”导致发邮件失败。该演示展示了无需调用App界面的交互形式,可能颠覆传统移动应用生态和商业模式。

智能体OpenAI多模态现象/趋势
19:48
AYi@AYi_AInotes
66
NVIDIA发布基于ARM架构的RTX Spark处理器与新笔记本电脑

NVIDIA发布了基于ARM架构的RTX Spark处理器。其核心是一台搭载该芯片的笔记本,具备128GB统一内存,可直接本地运行200B参数的大语言模型。该芯片提供1 PetaFLOP的FP4算力,GPU性能与RTX 5070相当,旨在将数据中心级性能(Grace CPU + Blackwell GPU架构)集成到移动设备中。引用推文指出,该笔记本在拔掉电源后仍能保持性能不下降,并预计于2026年秋季推出。分析认为,NVIDIA此举的关键在于巩固其CUDA生态的护城河。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

大佬观点端侧
19:39
Chubby♨️@kimmonismus
62
天啊,NVIDIA公布了RTX Spark,这太疯狂了。超级芯片。Blackwell GPU(RTX-5070核心)128GB,1 PetaFLOP AI算力,1440p/100FPS,还有笔记本版本。太离谱了。
产品更新端侧
16:40
数字生命卡兹克@Khazix0918
76
英伟达发布RTX Spark芯片

英伟达在GTC Taipei 2026发布消费级芯片RTX Spark。该芯片基于GB10,提供最高1 PFLOP的FP4 AI性能、20个CPU核心、6144个GPU核心及128GB LPDDR5X统一内存,支持在本地运行120B参数的大模型。其核心突破在于首次将统一内存架构与CUDA生态结合于消费级PC,解决了以往统一内存在AI开发生态上的短板。微软将重构Windows以原生支持本地AI智能体运行。这被称为个人电脑诞生40年来“重新定义”的时刻。

智能体大佬观点端侧
关联讨论 8 条X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)IT之家(RSS)Hugging Face:Blog(RSS)X:Perplexity (@perplexity_ai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)LMSYS:Blog(Chatbot Arena 团队)
14:30
OpenClaw🦞@openclaw
46
我们很自豪能继续与@nvidia合作,为其NVIDIA RTX Spark笔记本提供支持。加强我们对OpenShell和@Microsoft Security Primitives的支持。 基于我们早期与NemoClaw的合作以及现有的完全原生Windows支持。
产品更新端侧
13:26
Satya Nadella@satyanadella
同事件精选65
我们的目标是通过Windows,为每个家庭和每张办公桌提供无限制的智能。 NVIDIA RTX Spark 标志着朝着这一愿景迈出的真正突破。 期待在本周的Build大会上,与从台湾现场连线的黄仁勋分享更多内容!
Microsoft产品更新端侧
同一事件,精选展示《NVIDIA 发布 RTX Spark 及本地 AI 智能体安全与性能更新》
推荐理由:微软+NVIDIA 的 RTX Spark 合作,把无计量智能塞进 PC,AI 从云到桌面的实质性一步,Build 大会值得蹲。
13:06
SemiAnalysis@SemiAnalysis_
65
突发新闻:黄仁勋刚宣布英伟达ARM消费PC将搭载Windows。与苹果通过Rosetta 2转译器过渡到ARM M1不同,我们对Windows在英伟达ARM上的表现持怀疑态度。
产品更新端侧
5月31日
20:18
Chubby♨️@kimmonismus
同事件精选75
苹果WWDC将推AI升级:Gemini蒸馏模型本地运行,但技术栈外部依赖显著

苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级,核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型,以强调隐私与降低token成本。但该技术栈大部分源自外部:本地模型由Gemini蒸馏,设备无法处理的复杂查询将路由至Google Cloud处理,并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。此外,苹果2024年承诺的Private Cloud Compute方案原计划使用苹果芯片,因无法承载完整Gemini模型,现已部分转向谷歌云,但该名称仍将保留。

Google端侧行业动态
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:苹果Siri的救命稻草原来是Gemini,更扎心的是那些‘离开iPhone的查询’现在跑在Google Cloud上,Private Cloud Compute只剩个名字,做端侧推理和隐私计算的同行该注意风向变了。
13:11
郭明錤|Ming-Chi Kuo@mingchikuo
61
Nvidia N1X处理器供应链信息出炉,设备端AI算力仍属小众

供应链信息显示,Nvidia即将推出的N1X处理器设备未来两年出货量约1000万台,仍属面向需要设备端AI算力的性能用户的小众市场。2026年PC市场热点是MacBook Neo销量上调和可运行AI智能体的小型PC,但两者均与设备端AI算力无关。真正的设备端AI优势在于操作系统层面的隐私与深度整合,而当前Windows的支持尚不足。N1X设备能为需要本地运行大语言模型的用户,提供一个更平衡的选择,但能否驱动升级周期,关键仍在于Windows能否提供相应的应用与工作流支持。

推理端侧行业动态
13:11
郭明錤|Ming-Chi Kuo@mingchikuo
56
Nvidia N1X Windows PC处理器供应链调查与重点分析

供应链调查显示,配备Nvidia N1X的Windows PC未来两年出货量约1000万台,仍属瞄准重度用户的利基市场。当前PC主流AI应用(如通过浏览器访问大语言模型网站或API调用token)核心仍依赖云端算力。2026年产业热点(如MacBook Neo出货量预计翻倍至1000万台,以及可长时间挂机运行AI智能体的小型主机)均与本地AI算力无关。推动装置端AI换机潮的关键在于操作系统需支持深度整合跨应用工作流。N1X为本地运行大语言模型的用户提供了除Mac外兼具算力与大内存的新选择,但能否引爆换机潮仍取决于Windows的生态支持和定价。

现象/趋势端侧
10:33
Orange AI@oran_ge
48
推文批评微信作为主流通讯工具,却不支持 Markdown 和 HTML 文件格式的渲染与便捷打开,导致文件分享封闭,尤其在移动场景下造成困扰。作者呼吁微信应更早重视并支持这类基础功能,并特别指出"AI这么刚需的东西",微信至少应该在其智能体(Agent)功能上提供良好支持。引用推文也反映了相同的痛点:周围人频繁使用 Markdown 和 HTML 发文件,但微信对此一窍不通且封闭。

歸藏(guizang.ai): 现在周围人发文件都变成 Markdown 和 HTML 了,但是微信这俩格式一个都不支持,而且相当封闭,想用其他应用打开都费劲,真是受不了。 如果是在外面用手机,别人发过来的 Markdown 和 HTML 文件都不知道怎么打开。 感觉得做...

智能体大佬观点端侧
04:47
Rohan Paul@rohanpaul_ai
60
本地运行的大语言模型比较:小参数MoE模型在智能体工具调用任务上击败大模型

在MacBook Pro M5 Max 64GB上的本地测试中,Liquid的LFM2.5-8B-A1B模型在需要完成7个工具调用的旅行规划任务上,显著优于OpenAI的gpt-oss-20b。LFM2.5-8B-A1B仅使用4.8GB内存,以266tok/s的速度成功完成了全部7/7工具调用,耗时6.9秒。相比之下,gpt-oss-20b消耗了11GB内存,仅完成3/7工具调用,速度为146tok/s,耗时15秒。这表明,一个活跃参数规模更小(1B)的MoE模型,通过更精准的训练,在工具调用这一智能体任务上可以战胜活跃参数规模约其2.5倍的更大模型。

atomic.chat: Liquid's LFM2.5-8B-A1B smashed OpenAI's gpt-oss-20b on tool calling We ran both locally on a MacBook Pro M5 Max, 64GB, a...

MCP/工具端侧评测/基准
02:34
AYi@AYi_AInotes
精选75
NVIDIA 或将于六月发布整合 Blackwell GPU 与 AI 单元的 ARM 笔记本芯片 N1X

NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。

NVIDIA: A new era of PC. 25.0528, 121.5990

大佬观点端侧

推荐理由:三家巨头同发三个词和一个坐标,这比芯片参数更值得嗅的信号是,NVIDIA要从装空调的变成盖房子的,Windows 阵营的 Intel inside 可能真要换标了。
00:34
Berryxia.AI@berryxia
71
阶跃星辰 Step 3.7 Flash 模型成功移植到 mlx-vlm 项目

Ivan Fioravanti 在 mlx-vlm 项目中成功将阶跃星辰的 Step 3.7 Flash 模型移植到 MLX 框架,实现了视觉理解和文本生成。测试表明,该模型的 4bit 量化版本在 128GB Apple Silicon Mac 上支持 32K 上下文,生成速度超过 53 tokens/s。对截图的分析也准确高效。这意味着高质量的本地多模态 AI 能力可以在个人 Mac 上运行,兼顾了隐私与性能。

Ivan Fioravanti ᯅ: Step 3.7 Flash support added to mlx-vlm! 🚀 ✅ Conversion to MLX ✅ Vision ✅ Text This model is ultra fast! I'm gonna publ...

多模态开源/仓库端侧
00:16
Chubby♨️@kimmonismus
51
Nvidia、微软与Arm本周同步发布预告,指向Computex主题演讲,外界普遍期待发布N1X--这是Nvidia首款基于Arm架构的Windows笔记本电脑处理器。此前,Nvidia曾在2022年试图以400亿美元收购Arm未果。如今,Nvidia即将推出这款被认为将是Windows市场最重要Arm处理器之一的芯片,尽管其并未拥有Arm架构的底层所有权。

The Verge: Nvidia, Microsoft, and Arm are all teasing Nvidia's new N1X laptop processors https://www.theverge.com/news/940275/nvidi...

Microsoft端侧行业动态
5月30日
20:11
StepFun@StepFun_ai
55
等加载完想听听你的看法。👀

Ivan Fioravanti ᯅ: Step 3.7 Flash was another one I was really looking for! Big jump compared to 3.5, multi modal and even better than Deep...

多模态模型发布端侧
19:46
Rohan Paul@rohanpaul_ai
74
Meta计划大规模推进AI可穿戴设备

Meta正准备迄今规模最大的AI可穿戴设备推进,包括AI项链、更多AI眼镜以及企业服务“Wearables for Work”。其押注下一代AI交互界面不是聊天框,而是具备丰富传感器、能记住会议、总结对话、回答视觉问题并触发操作的AI助手设备。报道的销售目标宏大:2026年下半年销量目标1000万台,年底月活用户目标680万。软件层被视作关键,可将设备销售转化为持续性AI收入。此举背后的财务压力明显:Reality Labs在2026年第一季度录得40.3亿美元运营亏损,营收仅为4.02亿美元,因此Meta亟需将可穿戴设备发展成一个平台,而非又一条昂贵的硬件产品线。

Meta端侧行业动态
19:11
StepFun@StepFun_ai
62
小即是美。😌

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 - ∞): I've been waiting for this! They managed to do it before June, and they open sourced it right away! @antirez I've been s...

多模态开源/仓库模型发布端侧
09:34
Berryxia.AI@berryxia
77
OpenAI Codex登陆Windows,支持手机远程控制

OpenAI宣布其AI智能体Codex的Computer Use功能现已登陆Windows,允许Codex在Windows真实桌面执行任务。同时,ChatGPT手机App新增了对Windows端Codex的支持,用户可在移动端远程启动、查看和控制任务,实现跨设备协同。该功能目前处于早期体验阶段。

OpenAI: Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....

智能体OpenAI产品更新端侧
关联讨论 3 条X:OpenAI Developers (@OpenAIDevs)IT之家(RSS)X:OpenAI (@OpenAI)
06:20
🚨 AI News | TestingCatalog@testingcatalog
60
Microsoft ❤️ NVIDIA > NVIDIA GTC 主题演讲将于6月1日举行 > Microsoft Build 主题演讲活动将于6月2日举行 > Windows和NVIDIA的账号都预告了即将发布的公告,称"PC的新时代"。 新的Windows硬件即将到来 👀

Microsoft: Loud and clear. #MSBuild kicks off on June 2.

Microsoft端侧行业动态
01:45
Chubby♨️@kimmonismus
41
2026年的这次合作,我完全没料到。

NVIDIA AI: A new era of PC. 25.0528, 121.5990

端侧行业动态
00:34
Berryxia.AI@berryxia
57
Liquid AI发布设备端优化模型LFM2.5-8B-A1B

Liquid AI发布了LFM2.5-8B-A1B,一款为设备端优化的模型。它采用8B MoE架构,但仅有1.5B active参数,在38T tokens上进行了大规模RL训练,并将上下文扩展至128K。该模型的工具调用与多步智能体能力强劲,表现可接近4倍参数规模的模型。它支持在单台笔记本上完整运行本地智能体循环,具备低延迟与隐私优势。该模型兼容llama.cpp、MLX、vLLM等框架,覆盖Apple、NVIDIA、AMD硬件。

Liquid AI: Today, we're releasing LFM2.5-8B-A1B, a device-optimized model designed to power real-life applications on phones, lapto...

智能体模型发布端侧
5月29日
23:09
X.PIN@thexpin
65
华为提出τ定律应对芯片制程瓶颈

由于美国出口管制,华为在芯片先进制程竞赛中面临困难。为此,华为于2026年5月提出“τ(Tau)定律”,旨在为后摩尔时代的芯片性能提升提供新框架。该定律的核心是优化有效RC时间常数(τ)以提升信号传播速度。其方法是不完全依赖制程微缩,而是从晶体管、电路、芯片互连及系统架构四个层次进行优化,以压缩τ值。华为将其描述为中国公司首次提出具有全球影响力的后摩尔扩展框架。

推理现象/趋势端侧部署/工程
‹ 上一页
123456…8
下一页 ›