5x for Free:本地编程栈
阅读原文· tomtunguz.com本地模型在编码上正逼近云端前沿,Qwen 35B-A3B 已成社区标配,免费且完全离线让这场替代变得真实,选型逻辑可能从此改变。
Hacker News 讨论揭示:Qwen 3.6 35B-A3B 模型提及率 33% 领先,27B 变体以 20% 紧随其后,DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称,Claude Opus 可带来 15 倍加速,而本地离线 Qwen 提供 5 倍加速,且完全免费、保护隐私。SWE-bench Verified 基准测试显示,Qwen 3.6 27B 得分 77.2%,35B-A3B 得分 73.4%,接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。
今天,Hacker News 上一个帖子问了一个简单的问题:“有没有人已经用本地模型取代了 Claude/GPT 进行日常编码?”¹ 500 多条评论之后,本地编码技术栈的清晰图景浮现出来。
Qwen 3.6 35B-A3B 在模型提及率中以 33% 占据主导地位,紧随其后的是 27B 版本(20%)。DeepSeek Pro 和 Gemma4 31B 构成了前四名。共同点是:在消费级硬件上运行快速的混合专家架构。²
在智能体方面,Pi 以 49% 领先,OpenCode 以 45% 紧随其后。两者都是为本地推理设计的轻量级框架。
这个帖子揭示了一个引人入胜的权衡。一位评论者完美地概括道:
将智能体的 Qwen3.6 35b 与 Claude Opus 进行比较,就像是一位知识全面的初级员工,需要你仔细引导,对比一位与你一起思考架构的高级员工。如果 Opus 带来 15 倍加速,那么完全离线的本地 Qwen 则带来 5 倍加速。
但对许多人来说,这种权衡是值得的。隐私、零成本以及完全离线能力至关重要。
考虑到它完全免费,这仍然让我感到难以置信。
本地编码技术栈正在快速成熟。Qwen 3.6 35B-A3B 已成为事实上的标准,Pi 则是领先的框架。
基准测试数据支持了这种看法。Qwen3.6 27B 得分为 77.2%,MoE 变体 Qwen3.6 35B-A3B 达到 73.4%。这两个本地模型与 Claude Sonnet 4.6(79.6%)的差距非常小。³
这就是“微型工厂”模式在实时上演。它不仅仅适用于 CRM 更新和网络研究。当前这一代本地模型已经足够胜任合理的编码任务。
-
https://news.ycombinator.com/item?id=48542100 ↩︎
-
MoE 模型是大型模型,但只激活其总参数中的一小部分。Qwen 3.6 35B-A3B 拥有 350 亿总参数,但在推理时仅激活 30 亿,而 27B 版本每次运行所有 270 亿参数。 ↩︎
-
SWE-bench Verified 得分来自 llm-stats.com 和 morphllm.com,2026 年 6 月。 ↩︎