# 第三方AI客户端暂缺音视频解析功能与豆包全模态模型升级

- 来源：向阳乔木 (@vista8)
- 发布时间：2026-05-14 11:19
- AIHOT 分数：49
- AIHOT 链接：https://aihot.virxact.com/items/cmp4xg2ll09issljx54kcr56d
- 原文链接：https://x.com/vista8/status/2054763589492469830

## AI 摘要

用户认为某模型表现不错，但指出当前多数第三方AI Chat客户端（如CherryStuido、Chatwise）尚不支持音视频上传解析功能。同时，豆包大模型的Doubao-Seed-2.0-lite 0428版本已完成重要升级，新增音频理解能力，成为其家族首款支持图片、视频、音频、文本四种输入的全模态理解模型，且Agent、Coding和GUI能力据称也有显著提升。

## 正文

这个模型还是挺不错的。

就是现在基本上所有第三方AI Chat客户端都不支持音视频上传解析。

无论CherryStuido、Chatwise还是其他，不知道现在有没有了。

### 引用推文

> 向阳乔木：前段时间参与了 Doubao-Seed-2.0-lite 0428 内测。 这个版本升级,增加了音频理解,能同时支持图片、视频、音频、文本四种输入,成为豆包大模型家族首款全模态理解模型。 除了全模态理解,据说 Agent、Coding、GUI 能力这次也都有明显提升。 拿 API 做了一些测试,分享几个场景:前端动效复...
