“藏师傅”前端视频生成技能已完成,当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示,总消耗达145万Token,其中视频组合部分占比极高,但得益于92%的缓存率成本可控。该方案由PPT Skill(美学动效)、HyperFrames(时间线渲染)、Listenhub Skill(配音)及即梦CLI(生成演示镜头)协同完成。
藏师傅这个通过前端生成讲解视频的 Skill 其实已经搞完了。
但是还是想优化一下效果,提高一下工程化,以及降低一下 Token 的用量。
所以我让 Claude Code 跑了一个 40 秒钟的案例,然后让他对其中的 Token 进行了一下分析,看一下哪边占比比较多,然后再进行针对性的优化。
看起来其中视频组合消耗的百分比非常大。如果用 Claude Code 的话,会有 92% 的缓存,所以还好。
具体分析如下: 1. 总消耗:一个 40 秒的视频是 145 万 Token 2. 消耗结构: (a) 输入占比非常高 (b) 输出占比很低,仅占 0.7%
视频组合和 Skills 占了最大的大头。