# 商汤开源 SenseNova U1 图文交错生成增强版模型：支持多页连续创作，角色风格不"跑偏"

- 来源：IT之家（RSS）
- 发布时间：2026-06-12 16:56
- AIHOT 分数：69
- AIHOT 链接：https://aihot.virxact.com/items/cmqaqdeth0nveslldtx38rgwh
- 原文链接：https://www.ithome.com/0/963/606.htm

## AI 摘要

商汤科技开源日日新 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 图文交错增强版模型。该模型面向图文交错创作与生成场景强化，支持绘本、故事书、多页 PPT 等连续内容创作，解决了多轮生成后角色形象飘移、画风断裂、图文脱节等痛点。核心升级包括叙事一致性与角色连贯性提升、图文对应关系增强、视觉质量改善，以及新增多页 PPT 自动生成能力。模型已开源。

## 正文

IT之家 6 月 12 日消息，商汤科技今日宣布开源商汤日日新 SenseNova U1 系列新成员 —— U1-8B-MoT-Interleaved 图文交错增强版模型。

官方表示，该模型面向图文交错创作与生成（Interleaved Generation）场景进行了专项强化，更好地支持绘本、故事书、多页 PPT、图文教程等连续内容创作，解决传统多模态模型“多轮生成后角色形象飘移、画风断裂、图文脱节”等痛点。

据介绍，该模型核心升级主要体现在四个方面：

叙事一致性与角色连贯性大幅提升：模型显著提升了长周期创作中的叙事连贯性、角色一致性与画风统一性。故事线在整个生成过程中被严格遵循，人物形象从第一页到最后一页均保持高度一致；

图文对应关系增强，告别“图文脱节”：经过专项训练，模型大幅改善了图像内容与文字描述之间的语义对齐能力。生成的画面能更准确地呈现文本所描述的复杂场景、动态动作与物体间的空间关系；

视觉质量与 Artifact 明显改善：针对人物结构、文字渲染、页面排版等高频高难区域进行了定向优化，显著降低了生成物中的视觉瑕疵（Artifact）；

全新能力：多页 PPT 自动生成：新版本首次支持了多页 PPT 自动生成能力。模型能够智能从输入内容中提取要点，自行完成排版设计与文字渲染。

IT之家附开源链接如下：

https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved