网易有道发布子曰4,一个27B参数的全模态大语言模型,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下,实现了多模态与纯文本数理推理的双重优势。同时,子曰4全模态模型和TTS引擎已同步开源,开放参数权重,支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度达95%以上。
以前只知道有个乐队叫子曰,没想到网易有道大模型也叫子曰。
最新发布的子曰4是一个全模态模型,27B参数,视觉数理方向同规模SOTA,纯文本数理难题准确率81.4%。
在27B这个"甜点级"参数规模里,子曰4做到了中文学习场景下多模态+纯文本数理推理的双料极佳。
这次,子曰4全模态模型和TTS引擎同步开源,开放参数权重,支持本地部署、二次训练。
尤其是 TTS 模型,看介绍有点强:只需3秒就能克隆原声,支持14种语言,克隆准确度超97%,音色还原度 95%以上。
在线录了13秒音频,克隆我的声音,然后朗读朋友写的诗,效果如下: