# 网易有道子曰4全模态模型开源，27B参数，TTS支持3秒声音克隆

- 来源：向阳乔木 (@vista8)
- 发布时间：2026-05-26 14:04
- AIHOT 分数：70
- AIHOT 链接：https://aihot.virxact.com/items/cmpm98mja0mnksl01vfwepiij
- 原文链接：https://x.com/vista8/status/2059153797235228955

## AI 摘要

网易有道发布子曰4，一个27B参数的全模态大语言模型，在视觉数理方向达到同规模SOTA，纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下，实现了多模态与纯文本数理推理的双重优势。同时，子曰4全模态模型和TTS引擎已同步开源，开放参数权重，支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声，支持14种语言，克隆准确度超97%，音色还原度达95%以上。

## 正文

以前只知道有个乐队叫子曰，没想到网易有道大模型也叫子曰。

最新发布的子曰4是一个全模态模型，27B参数，视觉数理方向同规模SOTA，纯文本数理难题准确率81.4%。

在27B这个"甜点级"参数规模里，子曰4做到了中文学习场景下多模态+纯文本数理推理的双料极佳。

这次，子曰4全模态模型和TTS引擎同步开源，开放参数权重，支持本地部署、二次训练。

尤其是 TTS 模型，看介绍有点强：只需3秒就能克隆原声，支持14种语言，克隆准确度超97%，音色还原度 95%以上。

在线录了13秒音频，克隆我的声音，然后朗读朋友写的诗，效果如下：
