Liquid AI发布了LFM2.5-8B-A1B,一款为设备端优化的模型。它采用8B MoE架构,但仅有1.5B active参数,在38T tokens上进行了大规模RL训练,并将上下文扩展至128K。该模型的工具调用与多步智能体能力强劲,表现可接近4倍参数规模的模型。它支持在单台笔记本上完整运行本地智能体循环,具备低延迟与隐私优势。该模型兼容llama.cpp、MLX、vLLM等框架,覆盖Apple、NVIDIA、AMD硬件。
很多人还在等参数更大的模型才能跑好本地Agent!
Liquid AI的LFM2.5-8B-A1B却用1.5B active参数就已经做到了。
这个8B MoE训练了38T tokens加大规模RL,上下文直接128K,工具调用和多步agent能力很强,能接近4倍参数模型的表现。
单台笔记本就能跑完整本地agent loop,延迟低、全程隐私安全,不用调用GPT-4o或Claude。
支持llama.cpp、MLX、vLLM等框架,覆盖Apple、NVIDIA、AMD硬件。
本地Agent落地比多数人想的快多了。
你已经在本地跑Agent了吗?