# 藏师傅前端视频生成Skill完成与优化分析

- 来源：歸藏(guizang.ai) (@op7418)
- 发布时间：2026-05-19 11:18
- AIHOT 分数：57
- AIHOT 链接：https://aihot.virxact.com/items/cmpc3u0zs1cndslnz3ydvc2lo
- 原文链接：https://x.com/op7418/status/2056575297810751506

## AI 摘要

“藏师傅”前端视频生成技能已完成，当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示，总消耗达145万Token，其中视频组合部分占比极高，但得益于92%的缓存率成本可控。该方案由PPT Skill（美学动效）、HyperFrames（时间线渲染）、Listenhub Skill（配音）及即梦CLI（生成演示镜头）协同完成。

## 正文

藏师傅这个通过前端生成讲解视频的 Skill 其实已经搞完了。

但是还是想优化一下效果，提高一下工程化，以及降低一下 Token 的用量。

所以我让 Claude Code 跑了一个 40 秒钟的案例，然后让他对其中的 Token 进行了一下分析，看一下哪边占比比较多，然后再进行针对性的优化。

看起来其中视频组合消耗的百分比非常大。如果用 Claude Code 的话，会有 92% 的缓存，所以还好。

具体分析如下：
1. 总消耗：一个 40 秒的视频是 145 万 Token
2. 消耗结构：
（a） 输入占比非常高
（b） 输出占比很低，仅占 0.7%

视频组合和 Skills 占了最大的大头。

### 引用推文

> 歸藏(guizang.ai)：让 Codex 自己做了一条视频介绍了一下这个视频生成方案 藏师傅的 PPT Skill 负责美学、版式、动效 HyperFrames 负责时间线和渲染、字幕 Listenhub Skill 负责配音 即梦 CLI 负责 前端无法生成的演示和短 B-roll
