AI 摘要
网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。
网易有道今天开源了 Confucius4 双模型:
一个做数学视觉推理,一个做语音克隆
有的公司在卷参数规模,有道这次卷的是工程精度和落地成本
开源直接放的是完整权重,不是只给 API
诚意满满
多模态:http://huggingface.co/netease-youdao/Confucius4 语音:http://github.com/netease-youdao/Confucius4-TTS