Ideogram 发布首个开源 AI 图像模型 Ideogram 4.0,主推文字渲染与版面控制。模型引入 bounding box(边界框)控制,允许用坐标精确指定元素位置;支持结构化 JSON 提示词格式,不再仅限纯文本;英文 OCR 准确率达 0.97(X-Omni 基准),支持跨语言密集文字渲染,涵盖中日韩等非拉丁文字。
Ideogram 发布首个开源AI图像模型:Ideogram 4.0
宣称文字渲染和版面控制拉到了开源天花板
传统文生图只能写一段 prompt 然后祈祷模型把东西放对位置
Ideogram 4.0 引入了 bounding box(边界框)控制:你可以用坐标精确指定每个元素放在画面的哪个区域。
结构化 JSON 提示词:Ideogram 4.0 不只接受纯文本 prompt,还支持一套结构化 JSON 提示词格式。
多语言文字渲染:英文 OCR 准确率达到 0.97(X-Omni 基准测试),并支持跨语言的密集文字渲染,支持(中日韩等非拉丁文字)