谷歌将 Gemma 4 12B 与 Google AI Edge 深度整合,开发者可在笔记本上运行 100% on-device 的 Agentic workflow。Mac 用户新增两款工具:AI Edge Gallery 直接生成代码,AI Edge Eloquent 支持语音输入并实时编辑文本。底层通过 LiteRT-LM 本地 serve 模型,实现零网络、零延迟、数据完全留在设备端。Google 将模型、推理引擎和开发工具链打包,让开发者拥有私有的、可连续执行的本地 AI 队友。
端侧模型的能力还是在被放大! Gemma 4 12B和Google AI Edge彻底打通,现在直接在笔记本上就能跑100% on-device的Agentic workflow。
Mac用户最爽:AI Edge Gallery直接生成代码,AI Edge Eloquent支持语音输入然后实时编辑文本,两者都是全新上线。
底层用LiteRT-LM把Gemma 4 12B本地Serve起来,整个过程零网络、零延迟、数据全在自己机器里。
以前我们总觉得12B模型本地跑agentic任务还差得远,结果Google这次把模型、推理引擎、开发工具链一次性打包好,让普通开发者在笔记本上就能把AI当成真正私有的、可连续执行的本地队友。
这其实把行业当前最主流的路径直接反转了。
大家都在卷云端更大模型、更低延迟,现在Google却用12B本地模型告诉你:真正的生产力跃迁,是把agentic能力彻底下沉到设备端,让AI成为你操作系统的一部分。