# Unsloth打通本地开源模型运行Claude Code工作流

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-05-05 22:48
- AIHOT 分数：64
- AIHOT 链接：https://aihot.virxact.com/items/cmosrrmzo00wpslpltcuki6ky
- 原文链接：https://x.com/berryxia/status/2051675300506058871

## AI 摘要

Unsloth发布指南，演示如何利用Gemma 4和Qwen3.6的GGUF模型，在仅需24GB RAM的本地机器上运行完整的agentic coding工作流。该方案通过Unsloth API端点和llama.cpp驱动，支持自愈式tool calls、代码执行和网页搜索。此举打破了以往必须在Claude Code等高端界面的性能与本地部署的隐私/成本之间二选一的困境，使得开发者能以近乎零成本在本地享受顶级交互体验，标志着开源模型开始无缝接管复杂的AI智能体工作流。

## 正文

如今，最让人意外的是

你以为想在Claude Code里跑agentic coding，必须用Anthropic的闭源模型？

Unsloth直接把这条路彻底打通了。

他们刚刚发布完整指南：
用Gemma 4和Qwen3.6的GGUF模型，在仅24GB RAM的机器上，就能本地跑起完整agentic coding。

支持自愈式tool calls、代码执行、网页搜索，全程通过Unsloth API端点 + llama.cpp驱动。

也就是说：
你既能享受Claude Code/Codex/OpenClaw的顶级桌面级交互体验，
又能把模型完全跑在本地，数据不离机，成本接近于零。

这波操作，直接把"本地开源模型"和"Claude高端界面"之间的最后一堵墙拆掉了。

以前你得在"性能"和"隐私/成本"之间二选一，
现在Unsloth告诉你：两者可以兼得。

完整指南在这里：https://unsloth.ai/docs/basics/api

当本地开源模型开始无缝接管Claude的agent工作流，
真正属于开发者的AI生产力时代，才算真正开始了。

未来不知道是不是全部可以让更多人享用自己的机器自己给算力管饱的时代？

### 引用推文

> Unsloth AI：We made a guide on how to run open LLMs in Claude Code, Codex and OpenClaw. Use Gemma 4 and Qwen3.6 GGUFs for local agentic coding on 24GB RAM Run with self-hea...