美团 LongCat:HuggingFace 新模型
美团开源全模态模型LongCat-Flash-Omni
精选理由
美团开源 560B 参数多模态模型,27B 激活即可实现实时音视频交互
AI 摘要
美团开源全模态模型LongCat-Flash-Omni,采用5600亿参数MoE架构(激活270亿),支持128K上下文与实时音视频交互。模型基于快捷连接MoE与零计算专家,配备轻量级编解码器及分块特征交错机制,通过课程式渐进训练提升效率。在OmniBench、WorldSense等基准测试中超越Qwen3-Omni与Gemini-2.5-Pro,在文档理解、语音识别及GUI控制等任务中达到领先水平。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文huggingface.co