Clips AI:为开发者提供的 AI 视频再利用工具
Clips AI 是一个强大的开源 Python 库,专门为音频为中心、基于叙事的视频,如播客、访谈、演讲和布道等而设计。它具有将长视频自动转换为多个片段,并调整视频宽高比的功能。
使用 Clips AI 进行视频处理非常简便。首先,需要安装 Python 依赖项。建议使用虚拟环境(如 venv)来避免依赖冲突。通过执行pip install clipsai
和pip install whisperx@git+https://github.com/m-bain/whisperx.git
命令来完成安装。此外,还需要安装libmagic
和ffmpeg
。
在创建片段方面,由于片段是通过视频的转录本找到的,所以视频必须首先进行转录。这是通过 WhisperX 完成的,它是 Whisper 的一个开源包装器,具有检测每个单词的开始和结束时间的附加功能。使用以下代码进行转录和查找片段:
from clipsai import ClipFinder, Transcriber
transcriber = Transcriber()
transcription = transcriber.transcribe(audio_file_path="/abs/path/to/video.mp4")
clipfinder = ClipFinder()
clips = clipfinder.find_clips(transcription=transcription)
print("StartTime: ", clips[0].start_time)
print("EndTime: ", clips[0].end_time)
对于调整视频的宽高比,需要一个 Hugging Face 访问令牌,因为使用了 Pyannote 进行说话人区分。您不会因为使用 Pyannote 而被收费,相关说明可以在 Pyannote HuggingFace 页面上找到。使用以下代码进行视频宽高比的调整:
from clipsai import resize
crops = resize(
video_file_path="/abs/path/to/video.mp4",
pyannote_auth_token="pyannote_token",
aspect_ratio=(9, 16)
)
print("Crops: ", crops.segments)
总的来说,Clips AI 为开发者提供了一种高效、便捷的视频处理方式,有助于更好地利用和再利用视频资源。