用AI自动剪辑视频
视频粗剪也可以让AI自动完成了。再加上之前介绍过的AI做动画,现在做口播类视频真的高效许多!自媒体产量又要上一个台阶了。
Key Takeaway
Codex实现视频初剪自动化:输入原始视频+脚本后,Codex可自动完成A Roll剪辑(提取音频 → Whisper中文转录 → 与脚本匹配删除错误片段 + 保留0.4秒气口),几分钟内输出FCPXML文件,导入达芬奇即可生成完整时间线。
显著效率提升:以50分钟原始素材剪成19分钟成片为例,传统手工需2小时,现在AI几分钟完成,效率提升约10倍以上,彻底解放口播类视频中最耗时的A Roll剪辑环节。
实用工具链:先用Perplexity出方案 → Codex开发本地项目(支持达芬奇和Final Cut Pro),B Roll部分可继续用Codex + Remotion/HyperFrame完成。作者已实际用于课程制作,项目压缩包已在星球发布,推荐尝试。
现在,我所有视频的初剪,都由Codex帮我完成。
我只需要把原始视频和脚本给到Codex。等一小会儿,它就会导出一个FCPXML文件。我把文件导入达芬奇这个剪辑软件,一条剪好的时间线就出来了。然后,我只需要把B Roll做了,把颜色和声音调一调,一个视频就搞定了。
像我这种口播类的视频,在制作的时候,最费时间的就是A Roll的剪辑。所谓A Roll就是我对着镜头说的部分。虽然有提词器,但还是会讲错,需要重来好几遍。
于是在剪辑A Roll的时候,我就得花时间把大量不需要的片段剪掉。而且剪的时候还得注意,要把气口留住。否则两个片段之间没了换气,听起来就非常奇怪了。
那么,这个过程究竟会花多少时间呢?
以我正在做的第二套课程《AI产业链投资大逻辑》为例。我昨天刚把第一集发到知识星球newtype里。这一集的原始素材有50多分钟,最终成片是19分钟。也就是说,差不多60%的内容需要剪掉。
按照过去的做法,我手工来做的话,这一步就得花我2个小时。而现在,AI几分钟就帮我搞定了。
那么,这一切都是怎么做的呢?
我先把想法告诉Perplexity,让它去网上搜索资料,给我一个初版方案。然后把这个方案给到Codex,让它评估可行性,并且给出优化过的方案。最终由Codex交付一个在本地运行的项目。
这个项目的原理很简单,我前两天在星球内有发过。
它并不是直接操作剪辑软件,而是先把视频里的音频提取出来,然后用本地Whisper模型做中文转录。
由于我提供了脚本作为参考,它会把转录的结果跟脚本进行匹配。把讲错的地方删掉,并且在每个片段的前后都留下气口,我预设了0.4秒。
最后,它会导出一份FCPXML文件。在达芬奇里导入之后,软件会根据文件里的时间码,去原始视频里找对应的片段,最后生成一条时间线。
这个FCPXML文件,达芬奇和Final Cut Pro都支持。至于剪映,我自己没用它,问了Perplexity,说是也支持。
这个项目可以自己手动运行,但我都是让Codex操作它。有了Agentic AI之后,真没必要自己再去操作终端里。而且这个项目也是Codex做的,它最清楚怎么回事。
我在星球里已经发布项目的压缩包了。小伙伴们可以自取。至于B Roll部分,之前我也分享过,需要做动画的话,让Codex去调用Remotion或者HyperFrame插件就可以完成。
所以,这年头要高效制作口播视频,真的方便许多。大家一定试一试。
OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!

