开发者@zicohacks利用AI构建了一个实时世界杯解说员。系统像观众一样观看直播,采样最新帧,让GPT-5.4-mini理解比赛内容并生成解说词,再通过ElevenLabs以体育解说员语气播报。整个过程端到端实时调用,已能较自然跟上比赛节奏,支持英语和法语切换。项目已开源,目前主要挑战是延迟和解说精准度,但方向明确——AI正从辅助内容变为实时内容生产者。
我靠,这个项目还挺有意思的!
有人用AI做了一个能实时解说世界杯的解说员,而且不只支持英语,还能切换成法语。
它实时抓取直播画面帧,让GPT-5.4-mini看比赛并生成解说词,再用ElevenLabs以体育解说员的语气播报出来。
整个过程是端到端的实时调用,已经能比较自然地跟上比赛节奏。
更关键的是,这个系统不是死板的模板生成,直接让模型真正"看"比赛内容后再组织语言。
这意味着理论上它可以适应不同语言、不同风格的解说,甚至未来还能做双解说员对喷这种更有趣的玩法。
目前最大的挑战还是延迟和解说的精准度,但方向已经很明确了:AI正在从"辅助内容"变成"实时内容生产者"。
这让我想到2个玩法,一个是已经有的产品叠叠社的一个字母实时互动,一个是声音多种声线克隆或者直接使用有些比如建国的声音来解说,就会比较有意思。
项目已经开源,地址见评论👇🏻