# Gemma 4 12B Coder GGUF 发布：将 Fable 5 推理链蒸馏至本地可跑

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-06-15 16:14
- AIHOT 分数：60
- AIHOT 链接：https://aihot.virxact.com/items/cmqey535w012tslwazal3x4nb
- 原文链接：https://x.com/berryxia/status/2066434120436285872

## AI 摘要

Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型，训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行，甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化，无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构，目前下载量已破六千，社区反馈其在本地 coding 场景表现出色，填补了云端模型与本地可用之间的鸿沟。

## 正文

一个12B的本地模型，直接把Fable 5的推理链条蒸馏进去了，现在你能在消费级显卡上离线跑顶级coding能力。

这个Gemma 4 12B Coder GGUF是基于Google的gemma-4-12B-it微调的，专门针对代码生成和复杂推理。

训练数据里用了Composer 2.5的真实通过案例，还让Fable 5帮着补全那些难搞的case，结果就是每一步推理都导向能真正跑通的代码。

最爽的是它走GGUF格式，12GB显卡就能顺畅跑，甚至CPU也能用。

调试、补全代码、生成复杂算法、做链式思考提示，全都本地搞定，不用交API费、不用担心导出管制。

以前大家觉得前沿模型要么云端用要么根本跑不了，现在开源社区直接把Fable 5的思考方式打包成能塞进你笔记本的版本。

模型还在快速迭代，下载量已经破六千，社区反馈它在本地coding场景里特别能打。

这波操作把"强大但受限"和"本地可用"之间的鸿沟给填上了。

真正的AI生产力，从来不是等大厂放行，而是社区自己动手把能力解放出来。

### 引用推文

> Hugging Models：Gemma 4 12B Coder is here and it's a game changer for local code generation. This GGUF model packs Google's latest gemma-4 architecture into a compact 12B size,...