7月1日

00:30

Logan Kilpatrick@OfficialLoganK

推出 Nano Banana 2 Lite 🍌 和 Gemini Omni Flash 🔮，我们在 Gemini API 和 AI Studio 中新的生成媒体模型！ Nano Banana 2 Lite 极快（图像 <4 秒）且便宜（$0.034 / 1K 图像）。 Omni Flash 在视频编辑上达到 SOTA，$0.10 / 秒，与 Veo 3.1 Fast 相同！

Google 多模态模型发布视频

关联讨论 2 条

00:26

Google AI Developers@googleaidevs

我们发布了 Nano Banana 2 Lite，这是我们最快、最具成本效益的 Gemini 图像模型，专为高吞吐量开发者流水线优化。同时，我们的视频生成与编辑模型 Gemini Omni Flash 现已向开发者提供。这两个模型即日起可通过 @GoogleAIStudio 和 Gemini API 访问，助你扩展工作流程👇

Google 图像生成多模态模型发布

00:08

Google DeepMind：Blog（RSS）

精选70

Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

Google DeepMind 推出 Nano Banana 2 Lite（gemini-3.1-flash-lite-image），为 Nano Banana 系列速度最快、成本最低的图像模型，文本到图像输出仅需 4 秒，每 1K 分辨率图像成本 $0.034，已上线 Google AI Studio、Gemini API 及消费者产品（AI Mode in Search、Gemini app 等）。同时推出 Gemini Omni Flash（gemini-omni-flash-preview），支持高画质视频生成与对话式编辑，视频输出定价 $0.10/秒，面向开发者开放 API。

Google 图像生成多模态模型发布

关联讨论 2 条

推荐理由：Nano Banana 2 Lite 把图像生成拉到 4 秒延迟和 0.034 美元单价，很适合高频草稿流，Omni Flash 首次对开发者开放视频生成和对话编辑，两个模型串起来的快速迭代工作流是这次最实用的更新。

00:02

IT之家（RSS）

华为"博观文旅大模型"在西安规模应用

2026年6月29日，华为与陕文投联合开发的全球首个商用多模态文旅大模型“博观文旅大模型”在西安实现规模化应用。截至今年3月，其AI伴游智能体已覆盖超400万用户，非遗数字IP衍生产品销售额超200万元。该模型依托昇腾算力底座及超1.2PB数据集（含3100万张文旅图片等），支持高精度多模态历史内容生成，实现文物活化与非遗IP开发。同期，中国电信陕西公司与华为在大唐不夜城部署5G-A网络，上下行峰值速率分别达600Mbps和3.5Gbps，五一假期支持约2.3万用户同时接入。

产品更新多模态

6月30日

23:29

Berryxia.AI@berryxia

ByteDance 推 Seed Audio 1.0：多模态音频生成模型

ByteDance 通过 BytePlus 推出 Seed Audio 1.0，一个非流式 TTS 模型，可在一次生成中同时输出语音、音乐和音效。支持参考音频引导、图像引导音频，以及语速、音量、音调等精细控制。与传统仅生成语音的 TTS 不同，它更像多模态音频生成模型，一次性完成复杂场景音频。目前仅对企业开放申请，早期反馈音频自然，但缺少对时长的精细控制。

BytePlus: Meet Seed Audio 1.0 - Now open for enterprise access application. A pioneering non-streaming TTS model that generates vo...

产品更新多模态语音