Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。
一个12B的本地模型,直接把Fable 5的推理链条蒸馏进去了,现在你能在消费级显卡上离线跑顶级coding能力。
这个Gemma 4 12B Coder GGUF是基于Google的gemma-4-12B-it微调的,专门针对代码生成和复杂推理。
训练数据里用了Composer 2.5的真实通过案例,还让Fable 5帮着补全那些难搞的case,结果就是每一步推理都导向能真正跑通的代码。
最爽的是它走GGUF格式,12GB显卡就能顺畅跑,甚至CPU也能用。
调试、补全代码、生成复杂算法、做链式思考提示,全都本地搞定,不用交API费、不用担心导出管制。
以前大家觉得前沿模型要么云端用要么根本跑不了,现在开源社区直接把Fable 5的思考方式打包成能塞进你笔记本的版本。
模型还在快速迭代,下载量已经破六千,社区反馈它在本地coding场景里特别能打。
这波操作把"强大但受限"和"本地可用"之间的鸿沟给填上了。