用AI自动剪辑视频

现在，我所有视频的初剪，都由Codex帮我完成。

我只需要把原始视频和脚本给到Codex。等一小会儿，它就会导出一个FCPXML文件。我把文件导入达芬奇这个剪辑软件，一条剪好的时间线就出来了。然后，我只需要把B Roll做了，把颜色和声音调一调，一个视频就搞定了。

像我这种口播类的视频，在制作的时候，最费时间的就是A Roll的剪辑。所谓A Roll就是我对着镜头说的部分。虽然有提词器，但还是会讲错，需要重来好几遍。

于是在剪辑A Roll的时候，我就得花时间把大量不需要的片段剪掉。而且剪的时候还得注意，要把气口留住。否则两个片段之间没了换气，听起来就非常奇怪了。

那么，这个过程究竟会花多少时间呢？

以我正在做的第二套课程《AI产业链投资大逻辑》为例。我昨天刚把第一集发到知识星球newtype里。这一集的原始素材有50多分钟，最终成片是19分钟。也就是说，差不多60%的内容需要剪掉。

按照过去的做法，我手工来做的话，这一步就得花我2个小时。而现在，AI几分钟就帮我搞定了。

那么，这一切都是怎么做的呢？

我先把想法告诉Perplexity，让它去网上搜索资料，给我一个初版方案。然后把这个方案给到Codex，让它评估可行性，并且给出优化过的方案。最终由Codex交付一个在本地运行的项目。

这个项目的原理很简单，我前两天在星球内有发过。

它并不是直接操作剪辑软件，而是先把视频里的音频提取出来，然后用本地Whisper模型做中文转录。

由于我提供了脚本作为参考，它会把转录的结果跟脚本进行匹配。把讲错的地方删掉，并且在每个片段的前后都留下气口，我预设了0.4秒。

最后，它会导出一份FCPXML文件。在达芬奇里导入之后，软件会根据文件里的时间码，去原始视频里找对应的片段，最后生成一条时间线。

这个FCPXML文件，达芬奇和Final Cut Pro都支持。至于剪映，我自己没用它，问了Perplexity，说是也支持。

这个项目可以自己手动运行，但我都是让Codex操作它。有了Agentic AI之后，真没必要自己再去操作终端里。而且这个项目也是Codex做的，它最清楚怎么回事。

我在星球里已经发布项目的压缩包了。小伙伴们可以自取。至于B Roll部分，之前我也分享过，需要做动画的话，让Codex去调用Remotion或者HyperFrame插件就可以完成。

所以，这年头要高效制作口播视频，真的方便许多。大家一定试一试。

OK，以上就是本期内容。想了解AI，想成为超级个体，想找到志同道合的人，就来我们newtype社群。那咱们下期见！