当前位置:首页 > 资讯 > 正文

部署

部署

文本所说的这个仓库,可以有效提升的速度。而且使用了 提供的免费GPU资源,可以快速实现需求。

有个弊端,就是10分钟的视频,非得的时间完成。本文测试了的一段,大概。大大节约了时间。

仓库地址:faster-whisper-youtube

https://github.com/lewangdev/faster-whisper-youtube

虽然名字里有 ,但所使用的的视频下载库,支持。本文我们测试的是。

3步跑通模型

本文所使用的 ,还有,在文末获取

在仓库首页,点击  文档内  链接,直接打开的地址,并自动加载仓库对应的最新的 ipynb 文件内容。

你也可以手动访问google colab fast-whisper-youtube

colab project

点击单元格运行按钮,如下图箭头所指位置。

check gpu type

免费额度已足以跑起来开源的 whisper 模型了。我们这个笔记使用的资源配置如下。

runtime gpu
cell running

本项目使用了两个项目依赖:

  • · ,用于实现语音识别

  • · ,用于下载视频文件,提升语音文件

点击单元格按钮,直接运行:

pip install library

运行结果:

pip result

主要是为了把。打开google drive,依次创建路径:

Colab Notebooks/Faster Whisper Youtube

google drive path

目录创建完毕,运行单元格代码:

mount google driver path

授权允许colab访问google drive空间。

access

根据支持的模型列表,我们选择 ,有参数,精准度比较高。

model选择

选择完毕,执行单元格代码。

执行选择的参数

会自动下载和加载。

model download

第三步所执行的依赖安装中, 就是用来下载视频数据。这一节,我们选择的一段视频。我们在首页找一个短一些的热门视频,比如。

【罗翔】村民修桥收费被判处寻衅滋事,这件事应该如何看?

把需要设置的参数填上去。

设置视频url

从代码上看,执行了,并。

视频下载声音提取

这样,基础的,可以执行下一步的任务了。

准备好数据之后,需要指定一些参数。比如声音的,这里选择“”。代码内自带的初始化提示词,是有助于的,我们暂不做更改。

选择中文

右侧可以查看计算资源的使用情况。

CPU, GPU

这是一段,识别速度还是挺快的。

视频字幕

大概花了,就识别好了。输出的默认是繁体中文。可以有处理:

  • · ,language 部分实现简体中文;

  • · 识别的文件,使用;网上这类工具比较多。

到这里,就大功告成了。生成的字幕文件,以 srt 格式,存储在google drive指定的目录下。

在 colab 上,没有遇到特别的问题。

如果你本地有,或者充裕的,那么把仓库内的 ipynb 文件,也是完全可以的。

对于需要,对用户而言,这个仓库让大家又