面壁智能 MiniCPM-V 4.6 发布开源:1.3B 参数仅需 6G 内存即可流畅运行
阅读原文· ithome.com面壁智能联合清华大学及 OpenBMB 开源社区发布新一代端侧多模态大模型 MiniCPM-V 4.6。该模型参数为 1.3B,仅需约 6GB 内存即可在端侧设备运行。其在通用图文理解、STEM 推理等任务上超越同尺寸模型,Artificial Analysis 评测得 13 分。效率方面,Token 吞吐量为竞品的 1.5 倍,计算消耗仅为其 2.5%。模型采用 LLaVA-UHD v4 架构,图像编码计算量降低 55.8%,并支持高分辨率图像快速处理。目前已全面开源,提供完整工具链,适配主流微调与推理框架。
IT之家 5 月 13 日消息,5 月 11 日,面壁智能联合清华大学及 OpenBMB 开源社区正式发布并开源了新一代端侧多模态大模型 MiniCPM-V 4.6。
该模型参数规模为 1.3B,在端侧设备上仅需约 6GB 内存即可流畅运行,大幅降低了多模态 AI 在各类智能终端的落地门槛。
目前,MiniCPM-V 4.6 已在 GitHub 和 Hugging Face 等平台全面开源,并提供 Testflight 测试版本,可在 iOS、Android 和 HarmonyOS 等主流操作系统的手机上使用。
在性能表现方面,MiniCPM-V 4.6 在多个权威基准评测中展现出优于同尺寸主流模型的能力。
据介绍,它的 Instruct 和 Thinking 两个版本均在通用图文理解、STEM 数理推理、文档 OCR 及视频时序理解等任务上超越了 Qwen3.5-0.8B 和 Gemma4-E2B-it 等模型。
在最新的 Artificial Analysis 评测中,MiniCPM-V 4.6 以 13 分的成绩超越了 Ministral 3 3B 等更大尺寸的模型,整体能力接近 Qwen3.5-2B 级别。
在效率方面,MiniCPM-V 4.6 实现了“参数更大、效率更高”的反超。尽管参数规模比 Qwen3.5-0.8B 更大,但在基于 vLLM 框架的推理测试中,它的 Token 吞吐量达到前者的 1.5 倍,而计算 Token 消耗仅为后者的 2.5% 左右。