5月29日

22:42

歸藏(guizang.ai)@op7418

推文指出，Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例：在手机安装谷歌框架遇到问题时，通过Claude Code自动完成了下载安装包、安装和调试的全过程，体现了这类工具在解决日常技术问题上的潜在实用价值。

智能体 Anthropic 教程/实践端侧

17:40

小互@xiaohu

苹果 iOS 27 曝光：Siri 将大改造

苹果iOS 27或将对Siri进行大改造，将其转变为类似ChatGPT的独立聊天App，并可能整合进灵动岛。核心变化是允许Siri接入ChatGPT、Gemini、Claude等多种外部AI模型。交互界面将变为“Search or Ask（搜索或提问）”，体验更偏向对话式。

产品更新端侧语音

5月28日

11:31

Berryxia.AI@berryxia

Google发布新一代Coral板，本地AI进入生产力时代

Google发布最新Coral开发板，搭载Gemma系列模型，实现高效的本地设备端AI。核心演示包括板载实时语音翻译、通过自然语言控制硬件，以及利用视觉与声音生成音乐。此次升级的关键在于无需云端联网，解决了传统本地AI在延迟、隐私和成本方面的痛点。通过硬件与模型的深度结合，Google将AI的应用场景从云端拉回设备本地，计划于今年夏天推出。

Google Gemma: Introducing the newest Coral board, for efficient, on-device AI! Check out the demos in the video: - On-board speech tra...

Google 产品更新端侧语音

5月27日

23:05

Rohan Paul@rohanpaul_ai

华为LogicFolding芯片技术：垂直堆叠实现性能提升

华为推出“LogicFolding”芯片设计技术，旨在不依赖单纯缩小晶体管制程，以缩小与竞争对手的差距。其核心思想是通过垂直堆叠活跃电路层，将关键信号路径“折叠”向上，从而缩短导线长度、减少寄生延迟并收紧时钟偏差，最终在不改变器件节点的情况下提升芯片频率。此技术并非传统3D封装，其深层创新在于将芯片拓扑结构本身变为一种性能缩放工具。华为指出，该技术能大幅压缩相邻触发器间的传播时间，收紧关键路径。预计其高端芯片将在2031年实现等效于14 Å（1.4 nm）工艺的晶体管密度。

Huawei: What is LogicFolding? For circuit design, it aggressively compresses propagation time between adjacent flip-flops, tight...

端侧行业动态

10:27

Berryxia.AI@berryxia

PrismML推出官方iOS应用"Bonsai Studio"，允许用户在iPhone或iPad上完全本地运行Bonsai Image 4B图像生成模型。该模型基于FLUX.2 Klein，通过1-bit/3-bit量化将权重从7.75GB压缩至0.93GB。在iPhone 15 Pro及以上设备，生成一张512×512图片约占1.5GB内存，1024×1024约占2GB，全程离线推理，无需联网或支付token费用。应用免费，支持多种风格，可用于教学素材等轻量场景，但生成中文文字存在乱码。此外，M芯片的Mac电脑也可下载该iOS客户端使用，不过需要重启并降低设备安全策略。Android端暂无官方App，可通过网页版体验。

Berryxia.AI: iPhone 上直接用 App Store 下载就行: 👉 Bonsai Studio - PrismML 官方 iOS 应用,免费安装,模型在手机本地跑我觉得给学校老师做一些素材展示,或者幼儿园小朋友教学还是可以的。不需要额外的TO...

图像生成教程/实践端侧

09:27

Berryxia.AI@berryxia

Bonsai Studio：iPhone端侧离线图像生成应用上线

PrismML发布官方iOS应用Bonsai Studio，用户可免费下载，在iPhone上本地离线运行其Bonsai Image 4B扩散模型。该模型基于FLUX.2 Klein，其1-bit压缩版仅0.93GB，比全精度版小8.3倍。在iPhone 15 Pro及以上机型生成512×512图像耗时约几十秒，内存占用约1.5GB。应用支持多种风格，但中文文字生成目前为乱码。Android用户可通过WebGPU网页版体验。

Berryxia.AI: 兄弟们,端侧生图模型又有新东西了! 之前有客户端Drawthing 客户端也是支持iPad 手机进行文生图~ 今天PrismML也来了一个好玩的... 他们发布了1-bit和Ternary版本的Bonsai Image 4B扩散模型。 1-...

图像生成端侧评测/基准

08:27

Berryxia.AI@berryxia

oMLX发布v0.3.11：专注稳定性，打造"开箱即用"的本地AI体验

oMLX项目发布了v0.3.11版本，这是一个基于Apple MLX框架、旨在提升Apple设备端侧模型性能的项目。本次及前几轮更新均以在高内存压力下的稳定性为首要目标，开发者正呼吁用户对此进行更多测试。该项目由一位有全职工作的独立开发者维护，其核心目标是提供“开箱即用”的本地AI体验——让用户无需阅读文档或调整参数，甚至在模型下载过程中即可开始对话，从而降低本地AI的使用门槛。

Jun Kim: Just released oMLX v0.3.11. The last few updates have focused on stability as my top priority, and I'm planning to ship ...

GitHub 产品更新开源/仓库端侧

07:37

Artificial Analysis@ArtificialAnlys

OpenBMB发布1B参数模型MiniCPM5-1B，在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B（Non-reasoning），一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分，成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B（10.5分）和Qwen3.5 2B（16.3分），性能超越前代模型MiniCPM-V 4.6 1.3B（12.7分）。MiniCPM5-1B为纯文本模型，上下文窗口128K，采用Apache 2.0许可证。在AA-Omniscience测试中，其通过选择“拒绝回答”而非猜测，避免了模型幻觉惩罚，获得了同尺寸类别的最高分。

开源生态模型发布端侧

07:27

Berryxia.AI@berryxia

PrismML发布Bonsai Image 4B极致压缩版本

PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB，比全精度模型缩小8.3倍；Ternary版本为1.21GB，采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍，且生成质量可与更大模型相媲美。同时，PrismML推出了配套的iOS应用Bonsai Studio，支持在iPhone上完全离线、本地生成图像。

PrismML: Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...

图像生成模型发布端侧

5月26日

18:28

X.PIN@thexpin

华为AI芯片：绕过制程限制的扩展路径

华为将不依赖更小制程节点，通过封装与架构创新来扩展其昇腾AI芯片。根据何庭波的论文，华为计划在2025年至2030年间，通过Chiplets、2.5D扇出封装和3D堆叠技术，推进其昇腾SuperPoD系列，具体产品包括2025年的910C、2026年的950及后续的990。约2030年，Ascend 990将引入LogicFolding技术，目标是到2035年实现100倍的集成度跃升。

端侧论文/研究部署/工程

03:58

Chubby♨️@kimmonismus

同事件精选79

苹果据称正使用定制版1.2T参数Google模型重塑下一代Siri

据报道，苹果为改造下一代Siri，正使用一个定制版、参数规模达1.2T的Google大模型作为其核心，这显著大于预估约300B参数的Gemini 3.5 Flash。该模型将驱动Siri的部分功能，其中简单查询预期会在本地设备运行。苹果面临的关键挑战是确保该大模型能够足够快速地响应日常问题。此外，下个月AI领域预计将有多项重要发布，包括WWDC上的Apple Intelligence与Gemini整合、GPT-5.6、可能的Sonnet 4.8/Opus 4.8，以及已确认的Gemini 3.5 Pro。

Google 端侧行业动态

同一事件，精选展示《受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》

推荐理由：Apple 把 1.2T 参数的定制 Gemini 塞进 Siri，简单查询还打算跑本地，这比单纯集成 Gemini 激进得多，WWDC 见真章。

5月25日

19:28

Rohan Paul@rohanpaul_ai

华为发布突破性芯片设计方法"LogicFolding"

华为提出了“τ缩放”和“LogicFolding”两种新方法，旨在不依赖最先进光刻工具的前提下，缩小与台积电的性能差距。其核心思想是将衡量芯片进步的指标从晶体管尺寸转向信号传输延迟（τ）。LogicFolding作为具体实现，通过垂直堆叠逻辑电路层并采用混合键合，将需要通信的电路紧邻放置，从而缩短关键线路、降低电阻和寄生电电容，提升信号速度。华为表示，其下一代麒麟手机芯片将是对τ缩放规律的首次全面测试。

Rohan Paul: 🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap...

端侧论文/研究

关联讨论 1 条

18:52

X.PIN@thexpin

端侧行业动态

17:28

Chubby♨️@kimmonismus

华为无法获得EUV，于是制定了自己的缩放定律。

华为在IEEE ISCAS上公布了Tau（τ）Scaling Law框架，通过时间维度优化替代传统的晶体管几何尺寸微缩。公司六年内设计量产了381款芯片，采用新LogicFolding架构的麒麟芯片将于今年秋季出货。其目标是到2031年，实现等效于1.4nm工艺的晶体管密度，而无需依赖受ASML禁运影响的EUV光刻技术。这一基于架构创新的路径若成功，将削弱美国出口管制的效力。

Andrew Curran: Huawei says it has made a breakthrough and expects to design high-end chips with transistor density equivalent to 1.4 nm...

端侧行业动态

15:28

Rohan Paul@rohanpaul_ai

华为提出"τ缩放定律"，以侧向创新突破芯片与存储瓶颈

华为提出τ缩放定律，旨在不依赖更先进制程的情况下，通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片，并计划于2031年实现等效1.4nm（14Å）密度，该定律以海思负责人何庭波命名。同样，华为在存储领域也展示了类似的“侧向创新”路径，其通过改变封装方式（Die-on-Board）而非追求最先进的NAND层数，推出了容量达122.88TB的AI SSD。

Rohan Paul: 🇨🇳 🇺🇸 China's Huawei's new 122TB SSD shows how export controls can move innovation sideways instead of simply stoppi...

大佬观点推理端侧

5月24日

14:27

Rohan Paul@rohanpaul_ai

二手显卡与过时内存成功本地运行万亿参数大模型

近期有技术爱好者成功在单张二手RTX 3060 12GB显卡上，运行了拥有1万亿参数的Kimi K2.5大语言模型，速度约为每秒4个token。这一成果得益于模型的混合专家架构，虽然总参数量巨大，但每次推理仅激活32B参数。实现的关键在于将延迟敏感的核心组件置于GPU显存，而将庞大的专家权重存储在由二手英特尔傲腾持久内存（PMem）构成的768GB大容量内存池中，并以DDR4内存作为缓存。通过llama.cpp工具进行混合调度，该方案为本地部署超大规模模型提供了一条低成本的技术路径。

开源生态教程/实践端侧部署/工程

5月23日

16:30

歸藏(guizang.ai)@op7418

M5 Stack 新出的 Paper Color 彩色墨水屏也做了适配

歸藏(guizang.ai): http://x.com/i/article/2057775296712196096

产品更新端侧

08:27

Rohan Paul@rohanpaul_ai

谷歌新研究：AI学习生理模式提升可穿戴设备价值

谷歌研究院提出基础模型SensorFM，通过学习超过500万人产生的逾1万亿分钟可穿戴设备传感器数据，掌握了人类生理活动的一般性模式。该模型超越了将数据压缩为简单指标的传统方法，能够从数据中提取出有意义的结构并将其复用于多种健康预测任务。实验显示，模型规模和数据量越大性能越强，且其学习到的数据表征在35项预测任务中的34项上，均优于基于工程特征的基线方法。

Google 数据/训练端侧论文/研究

5月22日

23:50

向阳乔木@vista8

在AJ安利下，歸藏买了安克 AI 录音豆。在歸藏安利下，我也买了。初步体验，这是目前个人最喜欢、最实用的 AI 硬件产品。就是绳子带着不舒服，打算淘宝换个。

端侧评测/基准语音

22:56

Rohan Paul@rohanpaul_ai

精选75

首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN，这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术，使模型内存占用相比BF16降低约6倍，可高效部署于手机、电脑、车载设备等边缘端。更关键的是，整个训练全栈（从量化算子到框架）均在昇腾上原生构建与验证，而非简单移植。该模型家族（0.5B-8B）在多项基准测试上保持了全精度模型95-97%的性能，为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧

关联讨论 1 条

推荐理由：首个开源的1.58-bit三元LLM，直接在昇腾芯片上原生训练，内存压缩到BF16的六分之一，8B模型就能跑在手机上，做端侧部署的可以立刻上手试试了。