5x for Free：本地编程栈

2026-06-16 08:00·16天前

精选理由

本地模型在编码上正逼近云端前沿，Qwen 35B-A3B 已成社区标配，免费且完全离线让这场替代变得真实，选型逻辑可能从此改变。

AI 摘要

Hacker News 讨论揭示：Qwen 3.6 35B-A3B 模型提及率 33% 领先，27B 变体以 20% 紧随其后，DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称，Claude Opus 可带来 15 倍加速，而本地离线 Qwen 提供 5 倍加速，且完全免费、保护隐私。SWE-bench Verified 基准测试显示，Qwen 3.6 27B 得分 77.2%，35B-A3B 得分 73.4%，接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。

AI 翻译 · 中文

今天，Hacker News 上一个帖子问了一个简单的问题：“有没有人已经用本地模型取代了 Claude/GPT 进行日常编码？”¹ 500 多条评论之后，本地编码技术栈的清晰图景浮现出来。

Qwen3.6 35B-A3B dominates model mentions in local coding setups

Qwen 3.6 35B-A3B 在模型提及率中以 33% 占据主导地位，紧随其后的是 27B 版本（20%）。DeepSeek Pro 和 Gemma4 31B 构成了前四名。共同点是：在消费级硬件上运行快速的混合专家架构。²

Pi and OpenCode lead local coding agents

在智能体方面，Pi 以 49% 领先，OpenCode 以 45% 紧随其后。两者都是为本地推理设计的轻量级框架。

这个帖子揭示了一个引人入胜的权衡。一位评论者完美地概括道：

将智能体的 Qwen3.6 35b 与 Claude Opus 进行比较，就像是一位知识全面的初级员工，需要你仔细引导，对比一位与你一起思考架构的高级员工。如果 Opus 带来 15 倍加速，那么完全离线的本地 Qwen 则带来 5 倍加速。

但对许多人来说，这种权衡是值得的。隐私、零成本以及完全离线能力至关重要。

考虑到它完全免费，这仍然让我感到难以置信。

本地编码技术栈正在快速成熟。Qwen 3.6 35B-A3B 已成为事实上的标准，Pi 则是领先的框架。

Local models approach frontier performance on SWE-bench Verified

基准测试数据支持了这种看法。Qwen3.6 27B 得分为 77.2%，MoE 变体 Qwen3.6 35B-A3B 达到 73.4%。这两个本地模型与 Claude Sonnet 4.6（79.6%）的差距非常小。³

这就是“微型工厂”模式在实时上演。它不仅仅适用于 CRM 更新和网络研究。当前这一代本地模型已经足够胜任合理的编码任务。

https://news.ycombinator.com/item?id=48542100 ↩︎
MoE 模型是大型模型，但只激活其总参数中的一小部分。Qwen 3.6 35B-A3B 拥有 350 亿总参数，但在推理时仅激活 30 亿，而 27B 版本每次运行所有 270 亿参数。 ↩︎
SWE-bench Verified 得分来自 llm-stats.com 和 morphllm.com，2026 年 6 月。 ↩︎

Tomer Tunguz 博客（VC 分析）

精选62导出 Markdown