6月3日

01:58

郭明錤｜Ming-Chi Kuo@mingchikuo

郭明錤分析了NVIDIA在GTC上提出的RTX Spark笔记本及设备端AI智能体概念。他指出，该概念演示（无实际现场展示）包含操作系统、云/本地LLM切换、智能体框架等要素。供应链调查显示，配备相关N1X芯片的设备未来两年出货量约1000万台，仍属利基市场。当前PC端主流AI应用仍依赖云端算力。若设备出厂时，NVIDIA CUDA Toolkit未正式支持Windows Arm64，且Microsoft的设备端AI智能体栈（包括MCP on Windows、ODR等）仍处于预览状态，则RTX Spark将难以兑现其核心卖点。此外，Apple在WWDC上如何应对设备端AI智能体工作流也值得关注。

郭明錤|Ming-Chi Kuo: 許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...

智能体现象/趋势端侧

01:47

Chubby♨️@kimmonismus

这出乎意料：微软发布了用于控制个人智能体的手持和桌面设备。这让我想起了我曾对OpenAI用于控制智能体的独立硬件设备的期待。

Chubby♨️: This came as a surprise: Microsoft has unveiled handheld and desktop devices designed to control one's agents. It remind...

智能体 Microsoft 产品更新端侧

01:31

Perplexity@perplexity_ai

今天我们宣布，混合智能体推理将登陆 Perplexity Computer。 Computer 可以将任务分配给本地运行的模型和云端的前沿模型。这能将私有数据保留在您的设备上，并最大化 token 效率。即将推出。

产品更新端侧

01:17

Chubby♨️@kimmonismus

RTX显卡本地运行1200亿参数模型。说实话，挺酷的。

产品更新推理端侧

01:11

AYi@AYi_AInotes

独立开发者用Codex在23.5小时内开发开源App，绕过Whoop 5.0订阅限制

独立开发者Bennett利用Codex AI编程工具，在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据，无需订阅。实现基于公开的BLE协议分析，使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性，并展示了AI工具如何降低个人挑战封闭生态的成本。

开源/仓库现象/趋势端侧编码

00:53

🚨 AI News | TestingCatalog@testingcatalog

据《连线》报道，OpenAI正领投对Opal的4000万美元投资。 > Opal（前身为知名摄像头公司）正在研发几款将于明年发布的设备。下一个重大硬件举措？👀

Opal: the table. an update on opal electronics. http://op.al/table

OpenAI 端侧行业动态

6月2日

20:44

Chubby♨️@kimmonismus

在 Google I/O 上，我与 Google DeepMind 的 @osanseviero 和 @DynamicWebPaige 坐下来，聊了聊 Gemma、开源模型、AI Studio、端侧 AI、主权 AI 以及 AI 开发的未来。一场关于 AI 构建如何变得更开放、更本地化、更易获取的精彩对话。

DeepMind Google 大佬观点开源生态

16:09

AYi@AYi_AInotes

NVIDIA发布RTX Spark芯片，挑战传统PC架构

NVIDIA发布RTX Spark芯片，这是一款3nm制程SoC，集成ARM CPU、Blackwell GPU与128GB统一内存，号称可本地运行120B大模型并满帧运行3A游戏。此举被视为NVIDIA从图形计算到AI时代持续押注并行计算与异构计算路线的成果，凭借积累二十年的CUDA生态，直接挑战Intel、AMD主导的传统PC架构，标志着PC行业竞争转向AI算力与软件生态。文章同时指出，该芯片的ARM版Windows兼容性、散热与最终定价等问题，是后续需要观察的现实挑战。

AYi: 苹果、Intel、AMD、高通, 今晚大概率睡不好了。统治了 PC 整整 30年的 Wintel 王朝,今天被一个卖显卡的,连桌子一起掀了。 NVIDIA 的 RTX Spark,一块 3nm 的 SoC, 把 ARM CPU、Black...

大佬观点端侧

15:51

🚨 AI News | TestingCatalog@testingcatalog

Claude for iOS 将获得重新设计的设置菜单，并支持即将推出的 Memory Files 功能。 > Claude 网页版和移动版正在准备一个略微重新设计的 UI，主要改进设置和导航栏。 > Memory Files 是 Claude 即将推出的基于知识的新记忆系统。

Anthropic 产品更新端侧

13:08

AYi@AYi_AInotes

黄仁勋发布N1X芯片

在Computex 2026上，黄仁勋复刻乔布斯经典场景，从牛仔裤口袋中拿出N1X芯片。该芯片采用台积电3nm工艺，集成了20核Arm CPU和6144个CUDA核心的Blackwell GPU，配备128GB统一内存，可提供1 Petaflop的AI算力，功耗仅45-80W。其性能足以在本地流畅运行120B参数的大模型，并支持同时运行多个AI智能体以及Windows与CUDA生态。此举被视为黄仁勋定义以AI为核心、个人计算新时代的宣言。

AYi: http://x.com/i/article/2061406941541240838

产品更新端侧

06:00

swyx@swyx

哇哦--Grace + Blackwell 芯片装进了笔记本电脑。微软与英伟达联手，挑战苹果Silicon长达六年的绝对主导地位。

Microsoft 端侧行业动态

03:49

AYi@AYi_AInotes

NVIDIA RTX Spark发布，3nm SoC整合ARM CPU、Blackwell GPU及128GB统一内存

NVIDIA发布RTX Spark，一款3nm制程的SoC，整合了ARM CPU、Blackwell GPU及128GB统一内存。它被应用于超薄笔记本，可本地运行120B大模型，并在1440p分辨率下满帧运行3A游戏，拔电后性能不降。此举被视为PC行业竞争规则的转变，从比拼CPU性能转向比拼AI算力与CUDA软件生态，标志着NVIDIA对Wintel王朝的挑战。该方案绕开了苹果对CUDA的限制，并抢先在Windows平台复刻了ARM架构加完整GPU生态的路径，旨在争夺未来三十年的PC行业主导权。

推理现象/趋势端侧

03:41

Chubby♨️@kimmonismus

我真他妈爱死这个了。

Nous Research: We have been working closely with @nvidia to ensure Hermes Agent works smoothly on their new @NVIDIARTXSpark superchip a...

智能体 Microsoft 开源生态端侧

01:41

Chubby♨️@kimmonismus

NVIDIA发布桌面级AI超级计算机DGX Station for Windows

NVIDIA发布了DGX Station for Windows，这是一款桌面级AI超级计算机，搭载新的GB300 Grace Blackwell Ultra Desktop Superchip。其核心规格包括72核Grace CPU与Blackwell Ultra GPU通过NVLink-C2C连接，提供最高748GB统一内存与20 petaflops FP4算力，可本地运行最高达1万亿参数的模型。该设备计划于2026年第四季度发货。同时，NVIDIA推出了开源运行时OpenShell，可在Windows系统层面为AI智能体构建安全沙箱。

NVIDIA Newsroom: Introducing NVIDIA DGX Station for Windows, the world's most powerful deskside AI supercomputer with Windows powered by ...

智能体产品更新端侧部署/工程

00:43

Berryxia.AI@berryxia

NVIDIA RTX Spark SoC发布，统一内存架构再获验证

NVIDIA发布了基于ARM架构的RTX Spark SoC，集成RTX 5070级GPU。其核心卖点在于拔掉电源后性能几乎不衰减，能在1440P分辨率下保持高帧率游戏体验，并大幅提升电池续航。该产品面向笔记本与桌面平台，AI算力亦高，预计2026年秋季上市。作者由此联想到，当年苹果M系列芯片采用的统一内存架构曾备受质疑，而今NVIDIA将其作为核心优势，这验证了应对功耗与内存瓶颈的高效一体化设计已成为行业共识。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

现象/趋势端侧

00:41

Chubby♨️@kimmonismus

NVIDIA进军PC市场，发布RTX Spark超级芯片

NVIDIA在Computex发布了RTX Spark ARM超级芯片，采用系统级封装，集成了20核Grace CPU、6,144 CUDA核心的Blackwell GPU、最高128GB统一内存，并提供1 PetaFLOP FP4算力。此举标志着NVIDIA从显卡供应商转变为构建完整系统（包括CPU、GPU、内存和软件栈），直接与Intel、AMD、Qualcomm和Apple竞争。产品被定位为“个人AI计算机”，其128GB统一内存旨在支持本地运行120B参数的大语言模型。目前，该芯片的GPU存在功耗限制（45–80W），实际性能和电池表现待验证，且Windows on ARM平台仍面临游戏和x86兼容性挑战。产品计划于2026年秋季发货。

智能体产品更新端侧

6月1日

22:12

OpenBMB@OpenBMB

快速提醒：Build Small黑客松报名将于6月3日截止！ 🏆总现金奖金：约4万美元其中1万美元为@OpenBMB特别奖，授予使用#MiniCPM模型的最佳项目。别错过！立即注册：https://huggingface.co/build-small-hackathon 我们强烈推荐使用MiniCPM模型--它们小巧、强大，非常适合本次黑客松。让我们一起构建精彩项目！🤗🚀

Hugging Face 端侧行业动态

20:04

小互@xiaohu

OpenAI演示AI智能体操作系统，或颠覆手机应用生态

OpenAI Voice Hack Night现场演示了为手机设计的“AI智能体操作系统”。其核心思路是“UI即系统”——手机没有传统App，界面由端侧本地模型实时生成，复杂推理任务由云端GPT处理。演示中开发者全程语音指挥完成订机票、删日历、查AI新闻、发邮件等操作，但中途因“登录未配置”导致发邮件失败。该演示展示了无需调用App界面的交互形式，可能颠覆传统移动应用生态和商业模式。

智能体 OpenAI 多模态现象/趋势

19:48

AYi@AYi_AInotes

NVIDIA发布基于ARM架构的RTX Spark处理器与新笔记本电脑

NVIDIA发布了基于ARM架构的RTX Spark处理器。其核心是一台搭载该芯片的笔记本，具备128GB统一内存，可直接本地运行200B参数的大语言模型。该芯片提供1 PetaFLOP的FP4算力，GPU性能与RTX 5070相当，旨在将数据中心级性能（Grace CPU + Blackwell GPU架构）集成到移动设备中。引用推文指出，该笔记本在拔掉电源后仍能保持性能不下降，并预计于2026年秋季推出。分析认为，NVIDIA此举的关键在于巩固其CUDA生态的护城河。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

大佬观点端侧

19:39

Chubby♨️@kimmonismus

天啊，NVIDIA公布了RTX Spark，这太疯狂了。超级芯片。Blackwell GPU（RTX-5070核心）128GB，1 PetaFLOP AI算力，1440p/100FPS，还有笔记本版本。太离谱了。

产品更新端侧

16:40

数字生命卡兹克@Khazix0918

英伟达发布RTX Spark芯片

英伟达在GTC Taipei 2026发布消费级芯片RTX Spark。该芯片基于GB10，提供最高1 PFLOP的FP4 AI性能、20个CPU核心、6144个GPU核心及128GB LPDDR5X统一内存，支持在本地运行120B参数的大模型。其核心突破在于首次将统一内存架构与CUDA生态结合于消费级PC，解决了以往统一内存在AI开发生态上的短板。微软将重构Windows以原生支持本地AI智能体运行。这被称为个人电脑诞生40年来“重新定义”的时刻。

智能体大佬观点端侧

关联讨论 8 条

14:30

OpenClaw🦞@openclaw

我们很自豪能继续与@nvidia合作，为其NVIDIA RTX Spark笔记本提供支持。加强我们对OpenShell和@Microsoft Security Primitives的支持。基于我们早期与NemoClaw的合作以及现有的完全原生Windows支持。

产品更新端侧

13:26

Satya Nadella@satyanadella

同事件精选65

我们的目标是通过Windows，为每个家庭和每张办公桌提供无限制的智能。 NVIDIA RTX Spark 标志着朝着这一愿景迈出的真正突破。期待在本周的Build大会上，与从台湾现场连线的黄仁勋分享更多内容！

Microsoft 产品更新端侧

同一事件，精选展示《NVIDIA 发布 RTX Spark 及本地 AI 智能体安全与性能更新》

推荐理由：微软+NVIDIA 的 RTX Spark 合作，把无计量智能塞进 PC，AI 从云到桌面的实质性一步，Build 大会值得蹲。

13:06

SemiAnalysis@SemiAnalysis_

突发新闻：黄仁勋刚宣布英伟达ARM消费PC将搭载Windows。与苹果通过Rosetta 2转译器过渡到ARM M1不同，我们对Windows在英伟达ARM上的表现持怀疑态度。

产品更新端侧

5月31日

20:18

Chubby♨️@kimmonismus

同事件精选75

苹果WWDC将推AI升级：Gemini蒸馏模型本地运行，但技术栈外部依赖显著

苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级，核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型，以强调隐私与降低token成本。但该技术栈大部分源自外部：本地模型由Gemini蒸馏，设备无法处理的复杂查询将路由至Google Cloud处理，并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。此外，苹果2024年承诺的Private Cloud Compute方案原计划使用苹果芯片，因无法承载完整Gemini模型，现已部分转向谷歌云，但该名称仍将保留。

Google 端侧行业动态

同一事件，精选展示《受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》

推荐理由：苹果Siri的救命稻草原来是Gemini，更扎心的是那些‘离开iPhone的查询’现在跑在Google Cloud上，Private Cloud Compute只剩个名字，做端侧推理和隐私计算的同行该注意风向变了。

13:11

郭明錤｜Ming-Chi Kuo@mingchikuo

Nvidia N1X处理器供应链信息出炉，设备端AI算力仍属小众

供应链信息显示，Nvidia即将推出的N1X处理器设备未来两年出货量约1000万台，仍属面向需要设备端AI算力的性能用户的小众市场。2026年PC市场热点是MacBook Neo销量上调和可运行AI智能体的小型PC，但两者均与设备端AI算力无关。真正的设备端AI优势在于操作系统层面的隐私与深度整合，而当前Windows的支持尚不足。N1X设备能为需要本地运行大语言模型的用户，提供一个更平衡的选择，但能否驱动升级周期，关键仍在于Windows能否提供相应的应用与工作流支持。

推理端侧行业动态

13:11

郭明錤｜Ming-Chi Kuo@mingchikuo

Nvidia N1X Windows PC处理器供应链调查与重点分析

供应链调查显示，配备Nvidia N1X的Windows PC未来两年出货量约1000万台，仍属瞄准重度用户的利基市场。当前PC主流AI应用（如通过浏览器访问大语言模型网站或API调用token）核心仍依赖云端算力。2026年产业热点（如MacBook Neo出货量预计翻倍至1000万台，以及可长时间挂机运行AI智能体的小型主机）均与本地AI算力无关。推动装置端AI换机潮的关键在于操作系统需支持深度整合跨应用工作流。N1X为本地运行大语言模型的用户提供了除Mac外兼具算力与大内存的新选择，但能否引爆换机潮仍取决于Windows的生态支持和定价。

现象/趋势端侧

10:33

Orange AI@oran_ge

推文批评微信作为主流通讯工具，却不支持 Markdown 和 HTML 文件格式的渲染与便捷打开，导致文件分享封闭，尤其在移动场景下造成困扰。作者呼吁微信应更早重视并支持这类基础功能，并特别指出"AI这么刚需的东西"，微信至少应该在其智能体（Agent）功能上提供良好支持。引用推文也反映了相同的痛点：周围人频繁使用 Markdown 和 HTML 发文件，但微信对此一窍不通且封闭。

歸藏(guizang.ai): 现在周围人发文件都变成 Markdown 和 HTML 了,但是微信这俩格式一个都不支持,而且相当封闭,想用其他应用打开都费劲,真是受不了。如果是在外面用手机,别人发过来的 Markdown 和 HTML 文件都不知道怎么打开。感觉得做...

智能体大佬观点端侧

04:47

Rohan Paul@rohanpaul_ai

本地运行的大语言模型比较：小参数MoE模型在智能体工具调用任务上击败大模型

在MacBook Pro M5 Max 64GB上的本地测试中，Liquid的LFM2.5-8B-A1B模型在需要完成7个工具调用的旅行规划任务上，显著优于OpenAI的gpt-oss-20b。LFM2.5-8B-A1B仅使用4.8GB内存，以266tok/s的速度成功完成了全部7/7工具调用，耗时6.9秒。相比之下，gpt-oss-20b消耗了11GB内存，仅完成3/7工具调用，速度为146tok/s，耗时15秒。这表明，一个活跃参数规模更小（1B）的MoE模型，通过更精准的训练，在工具调用这一智能体任务上可以战胜活跃参数规模约其2.5倍的更大模型。

atomic.chat: Liquid's LFM2.5-8B-A1B smashed OpenAI's gpt-oss-20b on tool calling We ran both locally on a MacBook Pro M5 Max, 64GB, a...

MCP/工具端侧评测/基准

02:34

AYi@AYi_AInotes

精选75

NVIDIA 或将于六月发布整合 Blackwell GPU 与 AI 单元的 ARM 笔记本芯片 N1X

NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标，暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元，目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变：从显卡供应商，转型为定义整机核心方案的提供商，将直接冲击 Intel、AMD 和高通在 PC 市场的地位。

NVIDIA: A new era of PC. 25.0528, 121.5990

大佬观点端侧

推荐理由：三家巨头同发三个词和一个坐标，这比芯片参数更值得嗅的信号是，NVIDIA要从装空调的变成盖房子的，Windows 阵营的 Intel inside 可能真要换标了。

00:34

Berryxia.AI@berryxia

阶跃星辰 Step 3.7 Flash 模型成功移植到 mlx-vlm 项目

Ivan Fioravanti 在 mlx-vlm 项目中成功将阶跃星辰的 Step 3.7 Flash 模型移植到 MLX 框架，实现了视觉理解和文本生成。测试表明，该模型的 4bit 量化版本在 128GB Apple Silicon Mac 上支持 32K 上下文，生成速度超过 53 tokens/s。对截图的分析也准确高效。这意味着高质量的本地多模态 AI 能力可以在个人 Mac 上运行，兼顾了隐私与性能。

Ivan Fioravanti ᯅ: Step 3.7 Flash support added to mlx-vlm! 🚀 ✅ Conversion to MLX ✅ Vision ✅ Text This model is ultra fast! I'm gonna publ...

多模态开源/仓库端侧