OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型,实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流,无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash,并专为边缘AI设计,支持完全离线运行,提供Windows/macOS一键安装(仅需12G显存),保障100%数据隐私,同时开源权重并提供免费社区API。
🚀 OpenBMB 重磅发布!MiniCPM-o 4.5 技术报告来了!
9B 参数多模态模型实现突破性实时交互:
• Omni-Flow 框架:原生全双工流式交互(视频+音频+文本毫秒级同步)
• Native Full-Duplex + Proactive Interaction(无需VAD,可主动提醒)
• 多模态基准接近 Gemini 2.5 Flash(MMBench 87.6 / MathVista 80.1)
• 极致 Edge AI:完全离线运行,一键安装 Windows / macOS(12G VRAM 即可)
• 100% 本地隐私 + 免费社区 API
真正的实时、自然人机交互时代来了!🔥
技术报告、GitHub、HuggingFace、Web Demo 已开放。