5月6日

03:57

Rohan Paul@rohanpaul_ai

NVIDIA与Span计划利用家庭未充分利用的电力容量，将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点，并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证，目标是从2027年起实现年容量超过1吉瓦的分布式算力网络，同时为参与家庭降低电费成本。

产品更新端侧部署/工程

5月5日

23:14

Berryxia.AI@berryxia

OpenAI将推AI Agent手机，联发科获处理器订单

OpenAI正加速开发其首款AI Agent手机，预计2027年上半年量产。该手机将AI Agent能力深度集成至系统层，使其成为可感知、决策与执行的随身智能底座。供应链方面，联发科独家提供基于天玑9600的定制处理器，采用台积电N2P工艺，并配备强化ISP、双NPU、LPDDR6内存及UFS 5.0存储等硬件。预计2027-2028年出货量约3000万台。此举标志OpenAI从软件模型商转向硬件领域，可能引发手机行业新一轮竞争。

郭明錤|Ming-Chi Kuo: http://x.com/i/article/2048582573291606016

OpenAI 端侧行业动态

10:48

Chubby♨️@kimmonismus

这是我最近见过最酷的事情之一： MIT Hackathon Team Builds A Wearable AI System That Can Guide Your Physical Movements

端侧行业动态

08:26

meng shao@shao__meng

KroWork：通过"对话生成软件"模式，将AI对话转化为本地持久应用

KroWork的核心创新在于“chat-to-software”模式，旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体，能通过20多种内置技能端到端自动化执行任务，并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单，像常规软件一样运行，且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成，保障数据隐私，无需云端依赖，用户也无需具备编程背景即可创建属于自己的可复用软件。

KroWork: Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...

智能体产品更新开源/仓库端侧

01:18

Chubby♨️@kimmonismus

精选72

KroWork是一款创新的桌面AI智能体，其核心在于"应用固化"能力，能将对话直接转化为持久可用的本地软件。它不止于生成代码建议，而是端到端自主执行任务，并将完整工作流保存为名为"Kro App"的独立应用。用户一键安装后，该应用即可像常规软件一样运行，无需重复消耗tokens或重建流程。所有操作均在本地设备完成，无需编程背景，且数据完全脱离云端。这标志着AI从对话助手向能构建并交付实体软件的工具转变。

KroWork: Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...

智能体 MCP/工具产品更新端侧

推荐理由：当别人还在帮你写代码，KroWork 直接把对话冻成 App 放在你桌面上。不建仓库不费 token，跟用 Excel 一样打开，这种 chat-to-software 的思路比所有 coding agent 都更接近普通人想要的 AI。

5月3日

23:13

Berryxia.AI@berryxia

兄弟们！苹果又在偷偷干一件大事

苹果近期悄然调整Mac产品线内存配置与定价。Mac mini取消599美元256GB入门款，起售价升至799美元/512GB；Mac Studio也移除了512GB统一内存选项，且256GB升级价暴涨400美元。这并非简单存储升级，而是因AI数据中心导致全球DRAM供应紧张、价格飙升。Tim Cook指出AI需求超预期，导致Mac供货紧张数月。苹果通过砍掉低配和高配、整体上移配置阶梯变相提价，对依赖统一内存进行本地大模型推理的用户而言，高性价比硬件窗口期可能快速关闭。

stevibe: The Mac mini price hike doesn't look like a one-off. It looks like a pattern, and if you run local LLMs, you should pay ...

现象/趋势端侧

06:19

Orange AI@oran_ge

做马桶的 Toto 也是 AI 概念股了但做智能马桶的做芯片好像也挑不出毛病？

端侧行业动态

5月2日

16:14

-Zho-@ZHO_ZHO_ZHO

作者提出一种名为iA的AI硬件设计构想，其核心是手机与专用AI硬件配合使用的过渡方案。该硬件主体设计灵感来源于iPod Shuffle，具备小巧、可夹持的特性，并设有语音交互按键和调用手机功能的按键。作者认为，未来手机与AI硬件终将融合，但目前阶段分离设计有助于避免增加手机复杂度。此次构想是继经典的iPod shuffle方案后，结合iPod Nano 4进行的新尝试。

-Zho-: 简单基于Apple已有产品p了一下自己目前理想的 AI 硬件设计:iA 最基础想法:手机+AI硬件配合使用,因为离不开手机,同时不想增加手机复杂度(过渡时期想法,未来一定会合一) iA 主体:来自iPod Shuffle,可独立交互,小巧且...

大佬观点端侧

14:48

宝玉@dotey

一位中国开发者在跨大西洋航班上，为节省25美元机上WiFi费用，利用MacBook Pro M4本地离线运行Llama 3.3 70B大模型，自主处理客户任务长达11小时。他编写了一个具备资源感知能力的编排器，该系统明确知晓自身处于离线状态，且受限于电池和内存。它能自动从队列获取任务，通过本地推理服务处理，并定期保存检查点。当电池低于5%时，系统会暂停并等待切换至充电宝后恢复运行，最终在无人干预下清空所有任务。这一案例展示了完整的"自我感知计算"离线AI工作流。

huangserva: 这个也太屌了! 这个中国开发者在飞机上用 MacBook 本地跑 Llama 70B,整整 11 小时没有网络,处理了完整的客户项目。他坐在跨大西洋航班的靠窗位置,设备是 MacBook Pro M4,64GB 内存。机上 WiFi 要价...

Meta 推理教程/实践端侧

5月1日

01:44

TestingCatalog News 🗞@testingcatalog

苹果 🍎： "AFM Plus 150B Instruct" Apple Foundation Model 在内部的 AFM Playground 应用中被发现。这个应用正在被苹果员工内部使用，以测试 Apple Foundation 模型。 WWDC26 将会很火爆 🔥

MWR: ( #appleinternal ) Apple Internally uses an application that looks pretty similar to ChatGPT named AFM Playground, which...

端侧行业动态

4月29日

22:17

Tencent Hy@TencentHunyuan

精选67

腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型，440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型，其参数量为18亿，经量化后仅440MB，可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向，包括藏语、蒙古语等少数语言。在标准测试中，其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特，模型内存占用从FP16格式的3.3GB大幅降低，比之前的1.67比特方法体积缩小25%、速度提升约10%，且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一，并部署于腾讯多个产品中。

Hugging Face 开源生态模型发布端侧

推荐理由：440MB的模型能在手机上跑33种语言翻译，还宣称比谷歌翻译强，这个量化技术让离线翻译不再是‘能看不能用’，出差党可以试试看。

20:33

Qwen@Alibaba_Qwen

精选60

闪存QLA：基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang构建的高性能线性注意力内核，专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核，通过提升流处理器利用率，在前向传播上实现2-3倍加速，反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著，虽然在大批次处理时内存I/O开销略高，但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。

开源/仓库推理端侧

推荐理由：2 倍加速的背后是 Warp 特化流水线和自动 Copy 策略，像给手机 GPU 开了条专用跑道，做端侧 Agent 的可以直接拉代码试试。

20:33

Qwen@Alibaba_Qwen

精选66

闪速QLA：基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang开发的高性能线性注意力内核，专为提升个人设备上智能体AI性能而设计。它实现了2-3倍的前向传播加速和2倍的反向传播加速。其核心技术包括门控驱动的片上自动计算与通信重叠、硬件友好的代数重构，以及TileLang融合的Warp专用内核。该设计通过自动片上通信重叠显著提升了流处理器利用率，在张量并行、小模型和长上下文任务中效果突出。尽管在大批量处理时，其将GDN流程拆分为两个内核的策略会带来额外内存开销，但在边缘设备和长上下文实际场景中性能更优。反向传播部分通过构建16级、严格片上内存限制下的Warp专用流水线，实现了超过2倍的内核级加速。

GitHub 开源/仓库推理端侧

推荐理由：Qwen 把线性注意力的推理效率压到了新台阶，2-3 倍加速对想做本地 Agent 的开发者是实打实的，不是论文灌水，是能跑在设备上的代码。

09:38

ginobefun@hongming731

NVIDIA发布多模态模型Nemotron 3 Nano Omni

NVIDIA发布了多模态模型Nemotron 3 Nano Omni，专为处理长上下文设计，能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中，Nemotron 3 Nano Omni均展现出领先的准确性和效率。

多模态模型发布端侧

08:38

Berryxia.AI@berryxia

OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型，实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流，无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash，并专为边缘AI设计，支持完全离线运行，提供Windows/macOS一键安装（仅需12G显存），保障100%数据隐私，同时开源权重并提供免费社区API。

OpenBMB: 🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...

GitHub 多模态开源生态模型发布

08:38

Berryxia.AI@berryxia

Google Gemma 官方教你本地跑 Coding Agent！本地完美组合来了： • Pi Agent • Gemma 4 26B 模型 • LM Studio / Ollama / llama.cpp 等 serving engine 完全离线运行、零 API 费用、100% 隐私保护、零延迟！本地开发者 Agentic 开发神器！附 @patloeber 详细一步步搭建教程👇 https://patloeber.com/gemma-4-pi-agent/

Google Gemma: Learn how to run a local coding agent! Use: - Pi agent - Gemma 4 26B - Serving engine of choice: e.g. LM Studio

智能体 Google 教程/实践端侧

07:38

Berryxia.AI@berryxia

Apple Vision Pro辅助完成全球首例白内障手术

纽约眼科医生Eric Rosenberg于2025年10月使用Apple Vision Pro结合ScopeXR混合现实平台，完成了全球首例由该设备辅助的白内障手术，并已成功实施数百例。该应用提供了3D立体显微视野、实时数据叠加和远程专家协作功能，标志着空间计算技术正式进入手术室。主推文同时指出，国内沈阳和北大医院此前已有使用AVP进行手术的案例，因此此次并非严格意义上的“全球首例”。

MacRumors.com: Apple Vision Pro Used in World-First Cataract Surgery https://www.macrumors.com/2026/04/28/apple-vision-pro-cataract-sur...

多模态现象/趋势端侧

07:07

Rohan Paul@rohanpaul_ai

圣地亚哥一位眼科医生佩戴Apple Vision Pro完成了白内障手术。该头显将数字显微镜的实时3D影像和患者数据直接叠加在他的视野中。无需再转头查看单独的显示器。

多模态端侧行业动态

06:07

Chubby♨️@kimmonismus

Sigma：一款完全私密的AI浏览器，可在您的设备上本地运行智能体。 -无需云端。 -数据不会离开您的设备。 -开源 Qwen、Gemma、Nemotron--全部直接在浏览器中运行。这才是浏览器AI应有的发展方向！【引用 @Sigma_Browser】：搭载OpenClaw智能体的私密AI浏览器，基于免费本地模型运行在浏览器中直接使用Qwen、Gemma或Nemotron运行您的智能体开源。私密。在您的本地设备上运行

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体开源/仓库端侧

05:39

AK@_akhaliq

Nvidia发布了Nemotron 3 Nano Omni 在Hugging Face上为其制作了一个gradio应用

多模态开源/仓库端侧

05:37

Chubby♨️@kimmonismus

作者推崇将AI智能体完全本地化运行的浏览器模式，认为这是浏览器AI应有的发展方向。这种模式的核心在于隐私保护与开源，所有数据处理均在用户设备本地完成，无需依赖云端，确保数据不外泄。当前，已有如Sigma Browser等产品实现了这一理念，支持在浏览器内直接运行Qwen、Gemma、Nemotron等开源模型。作者对此表示高度赞赏，并表达了强烈的合作意愿。

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体产品更新开源生态端侧

05:37

Rohan Paul@rohanpaul_ai

Sigma推出开源私有AI浏览器，本地模型驱动智能体直接操作网页

Sigma发布了一款开源私有AI浏览器，其核心是将本地大语言模型（如Qwen、Gemma、Nemotron）与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体，能直接读取页面内容、理解用户意图，并执行点击、输入、总结等自动化操作，从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险，所有计算均在用户本地设备完成，确保了隐私安全和响应速度。

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体产品更新开源生态端侧

04:39

TestingCatalog News 🗞@testingcatalog

现在你可以在Sigma浏览器内直接运行由本地模型驱动的私有OpenClaw智能体。 &gt；可选Gemma 4、Qwen、3.5或Nemotron 3模型。所有浏览器数据均保留在本地设备。 &gt；私有AI智能体可管理标签页、跳转页面，功能丰富！

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体产品更新开源生态端侧

01:03

Ant Ling@AntLingAGI

AntLingAGI宣布将其模型Ling-2.6-flash正式开源，该模型此前在OpenRouter平台上曾以"Elephant Alpha"为名提供API服务。目前，模型已在Hugging Face和ModelScope平台全面开放，供公众自由使用与构建。模型关键参数为总参数量1040亿，激活参数量74亿，在Artificial Analysis基准测试中输出速度约为每秒215个token，并支持BF16、FP8和INT4多种精度格式。此次开源得到了合作伙伴Novita Labs，以及lmsysorg的SGLang团队和vllm项目的技术支持。

Novita AI: Ling-2.6-flash is now officially open-sourced 🚀 (from @AntLingAGI) Was "Elephant Alpha" on OpenRouter. Now fully open f...

开源/仓库模型发布端侧

4月28日

22:35

阿绎 AYi@AYi_AInotes

G2智能眼镜终端模式引领程序员移动开发革命

Even Realities推出的G2智能眼镜具备“终端模式”，可将完整的Claude AI终端直接投射到用户视野中。开发者能在移动场景（如散步、通勤）中通过语音与AI交互，实时获取代码、设计规范等内容，实现开发环境与物理世界的无缝融合。该技术彻底消除了上下文切换成本，将碎片时间转化为生产力，被视为“vibe coding”的终极形态。尽管引发工作与生活界限的担忧，但这代表了程序员工作流的革命性变革，被形容为“巅峰性能”和“新物种”的诞生。

Beff (e/acc): You may not like it, but this is what peak performance looks like. Vibe coding everywhere, straight to your eyeballs. Ma...

产品更新端侧编码

10:42

歸藏(guizang.ai)@op7418

精选74

小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型，采用宽松的MIT协议，允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型：专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro，以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时，小米推出Orbit 100T Token计划，包含面向AI开发者的“百万亿Token创造者激励计划”，提供最高价值659元的Credits，以及面向Agent框架团队的“Agent生态共建计划”，为其用户提供MiMo token限免支持。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布端侧

推荐理由：小米把 MiMo-V2.5 全线 MIT 开源，Pro 版在 agent 和编码榜单冲到开源第一，百万亿 Token 激励计划更是直接送钱让你用，做 Vibe Coding 的人没理由不去薅一把。

10:21

OpenClaw🦞@openclaw

OpenClaw 2026.4.26 🦞 🎙️ Google 直播访谈 🦙 更好的 Ollama/本地模型 🧳 迁移 Claude + Hermes 配置 🔐 单命令 Matrix 端到端加密重大发布。本地模型享用盛宴。 https://github.com/openclaw/openclaw/releases/tag/v2026.4.26

产品更新开源/仓库端侧

09:45

meng shao@shao__meng

精选75

小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型，包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro，以及支持多模态代理的310B参数MoE模型MiMo-V2.5，两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术，以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式，通过多教师策略蒸馏提升模型综合能力。同时，小米推出100T Token的创造者激励计划，为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

Fuli Luo: Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...

智能体开源/仓库模型发布端侧

推荐理由：小米把万亿参数 MoE 做到开源且百万上下文，MTP 三层原生集成让推理速度翻三倍，这在国内大厂开源里是第一个真正敢放权重的万亿级模型，做 Agent 的值得认真看看。

09:34

Ethan Mollick@emollick

这款仅基于1931年前文本训练的新LLM体积小巧，甚至可能在设备上直接运行，因此借助合适的工具，你能获得一个完全复古版的Siri，不过是来自《唐顿庄园》时代的版本。在此，我让它为我在费城安排寿司外卖。嗯……

现象/趋势端侧

07:53

宝玉@dotey

OpenAI 或将重新定义智能手机；联发科、高通与立讯精密，可能成为其 AI 智能体手机的关键伙伴

据报道，OpenAI正与联发科和高通合作开发智能手机处理器，立讯精密为独家设计与制造伙伴，目标2028年量产。此举旨在通过完全掌控硬件与操作系统，提供完整的AI智能体服务。智能手机被视为能持续捕捉用户实时状态的关键设备，是AI实时推理的重要输入。未来手机将深度结合云端与端侧AI，处理器设计需重点考量功耗与上下文理解。该项目对联发科和高通意味着长期增长机会，对立讯精密则是切入下一代智能手机核心供应链的关键。

郭明錤|Ming-Chi Kuo: http://x.com/i/article/2048582516391751680

OpenAI 现象/趋势端侧行业动态

06:57

Berryxia.AI@berryxia

浏览器本地智能体Gemma 4 E2B发布

一个完全本地的 Agent，就生活在你的浏览器里。由 Gemma 4 E2B 和 WebGPU 驱动，它使用原生工具调用来实现： 🔍 搜索浏览历史 📄 阅读并总结页面内容 🔗 管理标签页 100% 本地运行！无需任何服务器！

Google Gemma: A completely local agent that lives right inside your browser. Powered by Gemma 4 E2B and WebGPU, it uses native tool ca...

智能体 Google 产品更新端侧

4月27日

20:28

meng shao@shao__meng

用 Gemma 4 + Pi Agent 搭建本地编程助手

开发者@patloeber分享了一套完全本地的Coding Agent方案，核心是Pi Agent框架与Gemma 4 26B A4B模型。Gemma 4因原生支持function calling和thinking mode，首次真正适合作为Agent；其MoE架构在质量与速度间取得平衡。Pi框架设计极简，仅提供read、write等四个核心工具以节省宝贵的上下文窗口。文中强调了上下文长度与显存的权衡，并给出安全警告：本地模型可能产生危险命令幻觉，建议至少安装permission-gate等扩展进行防护。

Patrick Loeber: Lately I've been having fun with running coding agents fully locally. The setup I landed on is: - Pi agent - Gemma 4 26B...

智能体教程/实践端侧编码

14:21

阿绎 AYi@AYi_AInotes

OpenAI被曝携手芯片巨头研发AI手机处理器，欲颠覆手机生态

分析师郭明錤透露，OpenAI正与联发科、高通合作开发手机专用AI处理器，并由立讯精密独家负责系统设计与制造，预计2028年量产。此举旨在从根本上颠覆当前以App为中心的手机逻辑，将手机转变为AI Agent执行平台，用户只需表达意图，AI即可自动调用跨应用、跨云端服务完成任务。OpenAI选择自研硬件的核心原因在于，云端模型无法获取手机本地实时数据（如位置、传感器、日程等），而这些是AI Agent有效运作的关键。此举可能彻底重塑运行多年的App生态，并将AI硬件竞争从云端延伸至个人设备。

郭明錤|Ming-Chi Kuo: http://x.com/i/article/2048582573291606016

智能体 OpenAI 端侧行业动态

14:06

Kimi.ai@Kimi_Moonshot

🎁 限时充值奖励上新。领取奖励券，继续探索 Kimi K2.6。 🔹充值 $100 - $299 享 20% 奖励 🔹充值 $300 - $999 享 25% 奖励 🔹充值 $1，000+ 享 30% 奖励活动截止于 5月3日。 🔗详情：https://platform.kimi.ai/docs/pricing/promotion

端侧行业动态

09:19

Berryxia.AI@berryxia

古尔曼爆料苹果六大AI新品管线

据爆料人古尔曼透露，苹果前CEO Tim Cook在卸任前为新任CEO John Ternus规划了六个全新的产品类别，全部由AI驱动。这些产品包括AI AirPods（集成Apple Intelligence）、Apple Glasses智能眼镜、AI智能吊坠Pendant（带摄像头和视觉计算）、带屏HomePod智能显示屏、Tabletop Robot桌面机器人以及隐私安全摄像头。这些创新覆盖穿戴设备和智能家居领域，可能推动苹果硬件在Ternus领导下迈向新高度。

端侧行业动态

4月26日

20:53

Nathan Lambert@natolambert

与 @_TobiasLee 和 @XiaomiMiMo 的 Alex 会面非常愉快（还有 @xeophon）我预感很快会有大事发生！

端侧行业动态

4月25日

09:09

Berryxia.AI@berryxia

是时候让你的Mac Studio 256G 可以开始使用DeepSeek4-Flash-4bit 量化版版本了！至于速度嘛… https://github.com/ml-explore/mlx-lm/pull/1192

Prince Canuma: You can now run DeepSeek4-Flash on 256GB Mac. Next up speed 🚀 PR: https://github.com/ml-explore/mlx-lm/pull/1192

DeepSeek 开源生态教程/实践端侧

4月23日

13:49

Chubby♨️@kimmonismus

M4 Mac mini全线缺货，存储芯片短缺波及苹果供应链

Apple M4 Mac mini全线供应紧张，256GB型号在官方商店已无货，更高存储型号也面临6至10周的发货延迟。这一状况并非简单的产品线过渡所致，而是反映了更广泛的供应链压力。核心原因在于行业范围内的内存和存储组件短缺，同时苹果似乎优先将资源分配给了需求更高的MacBook产品线，而非台式机。这表明持续的半导体供应限制正在引发更多问题。

端侧行业动态

4月22日

14:14

Rohan Paul@rohanpaul_ai

超越记忆基础设施：AirJelly让AI主动执行工作

AirJelly突破OpenAI Chronicle代表的"记忆基础设施"局限，成为始终运行的桌面AI代理。它不仅实时监测Figma、GitHub等跨应用屏幕活动，更主动推断用户意图，自动创建任务、时间线与提醒，将原始上下文转化为有组织的执行。与传统工具需人工提示才激活记忆不同，它在无需指令的情况下主动完成工作闭环。所有数据本地处理，在保护隐私的同时构建跨应用连续上下文层，实现从被动记录到主动执行的范式转变。

AirJelly: 🚨The world just started talking about AI Screen Context. We've been building something deeper - AirJelly can see your s...

智能体 OpenAI 产品更新端侧

08:38

Chubby♨️@kimmonismus

不错：一键部署，你的自我改进 AI agent 全天候运行--主标语完整 Hermes 能力，零终端 43，200+ 星标的 Hermes agent，现已支持原生界面你的全天候同事，上线运行！：））

atomicbot.ai: Hermes Agent by @NousResearch (100k+ ⭐) now inside Atomic Bot: - Free Local models: Qwen, Gemma or - Use your API keys f...

智能体开源/仓库端侧