# Ideogram 4.0 开源：边界框控制+多语言文字渲染

- 来源：小互 (@xiaohu)
- 发布时间：2026-06-04 09:38
- AIHOT 分数：73
- AIHOT 链接：https://aihot.virxact.com/items/cmpytwqgn03aksli3ptvdd9u6
- 原文链接：https://x.com/xiaohu/status/2062348355787956717

## AI 摘要

Ideogram 发布首个开源 AI 图像模型 Ideogram 4.0，主推文字渲染与版面控制。模型引入 bounding box（边界框）控制，允许用坐标精确指定元素位置；支持结构化 JSON 提示词格式，不再仅限纯文本；英文 OCR 准确率达 0.97（X-Omni 基准），支持跨语言密集文字渲染，涵盖中日韩等非拉丁文字。

## 正文

Ideogram 发布首个开源AI图像模型：Ideogram 4.0

宣称文字渲染和版面控制拉到了开源天花板

传统文生图只能写一段 prompt 然后祈祷模型把东西放对位置

Ideogram 4.0 引入了 bounding box（边界框）控制：你可以用坐标精确指定每个元素放在画面的哪个区域。

结构化 JSON 提示词：Ideogram 4.0 不只接受纯文本 prompt，还支持一套结构化 JSON 提示词格式。

多语言文字渲染：英文 OCR 准确率达到 0.97（X-Omni 基准测试），并支持跨语言的密集文字渲染，支持（中日韩等非拉丁文字）
