电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效

前几天有很多小伙伴问我,如何语音转文字,我下意识的想到了讯飞语记,之前我经常使用的,但是现在好像没有免费的语音转文字的软件了,然后我找了半天找到了这款神级软件,作者简直无敌!!!

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图

打开软件逼格就非常高,然后功能多到也是眼花缭乱的

1、提取字幕翻译

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图1

2、视频提取字幕

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图2

3、视频字幕合并

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图3

4、字幕创建配音

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图4

5、语音转文字

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图5

6、文字转语音

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图6

7、音频格式转换

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图7

8、字幕翻译

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图8

是不是非常的牛掰

下载地址:

使用方法:

解压缩文件夹后双击打开

电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图9

无需安装,全程本地化操作,无须担心失效问题,计算全部由显卡完成!

使用方法

  1. 原始视频:选择mp4/avi/mov/mkv/mpeg视频,可选择多个视频;

  2. 输出视频目录:如果不选择,则默认生成在同目录下的_video_out,同时在该目录下的srt文件夹中将创建原语言和目标语言的两个字幕文件

  3. 选择翻译:任选 google|baidu|腾讯|chatGPT|Azure|Gemini|DeepL|DeepLX 翻译渠道

  4. 网络代理地址:如果您所在地区无法直接访问google/chatGPT,需要在软件界面比如网络代理中设置代理,若使用v2ray,则填写http://127.0.0.1:10809,若冲突,则填写http://127.0.0.1:7890。如果您修改了默认端口或使用的其他代理软件,则继续填写

  5. 视频原始语言:选择待翻译视频里的语言种类

  6. 翻译目标语言:选择希望翻译到的语言种类

  7. 选择配音:选择翻译目标语言后,可从配音选项中,选择配音角色;

    硬字幕: 是指全部显示字幕,不可,如果希望网页中播放时也有字幕,请选择硬字幕嵌入

    软字幕:播放器支持隐藏字幕管理,可显示或者字幕,该方式网页中播放时不会显示字幕,某些国产播放器可能不支持,需要将生成的视频同名srt文件和视频放在一个目录中下才会显示

  8. 语音识别模型:选择base/small/medium/large-v3,识别效果越来越好,但识别速度越来越慢,所需内存越来越大,内置base模型,其他模型请单独下载后,解压放到当前软件目录/models目录下。如果GPU显存低于4G,不要使用large-v3

    整体识别/预先分割:整体识别是指直接发送整个语音文件给模型,由模型进行处理,分割可能更准确,但也可以制作出30秒长的单字幕,适合有明显静音的音频;预先分割时指先将音频按10s左右长度切割之后分别发送给模型处理。

    配音速度:填写-90到+90之间的数字,同样的话在不同语言语音下,所需时间是不同的,因此配音后可能声画字幕不同步,可以调整此处语速,负数代表降速,正数代表加速播放。

  9. 音视频对齐:分别是“配音自动加速”和“视频自动降速”

翻译后不同语言下发音时长不同,比如说中文3秒,翻译为英文可能5秒,导致时长和视频不一致。

2种解决方式:

1. 强制配音加速播放,以便缩短配音时长和视频对齐

2. 强制视频慢速播放,以便延长视频时长和配音对齐。

两者只任选其一

  1. 静音分割: 填写100到2000的数字,代表毫秒,默认500,即以大于等于500ms 的静音分割为区间分割语音

  2. CUDA加速:确认你的电脑显卡为N卡,并且已配置好CUDA环境和驱动,则开启选择该项目,速度能大幅提升,具体配置方法见下方CUDA加速支持

  3. TTS:可用edgeTTS和openai TTS模型中选择要合成语音的角色,openai需要使用官方接口或者开通了tts-1模型的三方接口

  4. 点击开始按钮底部会显示当前进度和日志,右侧文本框内显示字幕

  5. 字幕解析完成后,将暂停等待字幕修改,如果不做任何操作,60秒后将自动继续下一步。也可以在右侧字幕区编辑字幕,然后手动点击继续合成

  6. 将在目标文件夹中视频同名的子目录内,分别生成两种语言的字幕srt文件、原始语音和配音后的wav文件,以方便进一步处理

  7. 设置行角色:可对字幕中的每行设定发音角色,首先左侧选好TTS类型和角色,然后点击字幕区右下方“设置行角色”,在每个角色名后面文本中中,填写要内容使用该角色配音的行号,如下图: 电脑工具丨神级工具,语音转文字,文字转语音,音轨分离等全本地化,无须担心破解失效插图10

常见问题

  1. 使用google翻译,提示错误

    使用国内google或chatGPT官方接口,都需要挂梯子

  2. 使用了全局代理,但看起来并没有走代理

    需要在软件界面“网络代理”中设置具体的代理地址,比如http://127.0.0.1:7890

  3. 提示 FFmepg 不存在

    首先查看确定软件根目录下是否存在ffmpeg.exe、ffprobe.exe文件,如果不存在,解压ffmpeg.7z,将这2个文件放到软件根目录下

  4. windows上开启了CUDA,但是提示错误

    A:首先查看详细安装方法,确定你已经正确安装了cuda相关工具,如果仍然存在错误,点击下载 cuBLAS,解压后将里面的dll文件复制到C:/Windows/System32下

    B:如果确定和A无关,那么请检查视频是否是H264编码的mp4,有些高清视频是H265编码的,这种不支持,可尝试在“视频工具箱”中转为H264视频

    C:GPU下对视频进行硬件解码编码对数据正确性要求严格,容错率几乎为0,任何一点错误都会导致失败,加上显卡型号、驱动版本、CUDA版本、ffmpeg版本不同版本之间的差异等,导致很容易出现兼容性错误。目前加了回退,GPU上失败后自动使用CPU软件编解码。失败时logs目录下日志里会记录错误信息。

  5. 提示模型不存在

    在0.985版本之后,模型需要重新安装,models目录下是各个模型的文件夹,而不是pt文件。要使用base模型,要保证models/models–Systran–faster-whisper-base文件夹存在,如果要使用small模型,要保证 models/models–Systran–faster-whisper-small 文件夹,如果不存在,需要下载后格式文件夹复制到models下。要使用medium模型,要保证models/models–Systran–faster-whisper-medium文件夹存在,如果不存在,需要下载后格式文件夹复制到models下。要使用large-v3模型,要保证 models/models–Systran–faster-whisper-large-v3 文件夹存在,如果不存在,需要下载后将文件夹复制到 models 下。

    全部模型下载地址

  6. 提示目录不存在或权限错误

    在sp.exe上右键使用管理员权限打开

  7. 提示错误,但没有详细错误信息

    打开logs目录,找到最新的log日志文件,拉到最底部,即可看到报错信息。

  8. Large-v3模型非常慢

    如果你没有N卡GPU,或者没有配置好CUDA环境,或者显存低于4G,请不要使用这个模型,否则会非常慢和卡顿

  9. 提示缺少cublasxx.dll文件

    有时会遇到“cublasxx.dll不存在”的错误,此时需要下载cuBLAS,然后将dll文件复制到系统目录下

    点击下载cuBLAS,解压后将里面的dll文件复制到C:/Windows/System32下

  10. 背景音乐丢失

只识别人声并保存人声,即配音后音频中不存在原背景音乐,如果需要保留,请使用人声背景音乐分离项目,将背景音提取出来,然后再和配音文件合并。

  1. 怎样使用自定义音色

目前暂时不支持该功能,如果有需要,您可以先识别出字幕,然后使用另一个声音克隆项目,输入字幕srt文件,选择自定义的音色合成为音频文件,然后再生成新视频。

  1. 字幕语音无法液晶

翻译后不同语言下发音时长不同,比如说中文3秒,翻译为英文可能5秒,导致时长和视频不一致。

2种解决方式:

1. 强制配音加速播放,以便缩短配音时长和视频对齐

2. 强制视频慢速播放,以便延长视频时长和配音对齐。

两者只任选其一

  1. 字幕不显示或显示乱码

采用软合成字幕:字幕作为单独文件嵌入视频,可再次提取出来,如果播放器支持,可在播放器字幕管理中启用或取消字幕;

注意很多国内播放器必须将srt字幕文件和视频放在相同目录下且名称相同,才能加载软字幕,并且可能需要将srt文件转为GBK编码,否则显示乱码,

  1. 如何切换软件界面语言/中文或英文

软件目录下如果不存在set.ini文件则先创建,然后将以下代码粘贴到里面,lang=后填写语言代码,zh代表中文,en代表中文,然后重启软件


[GUI]
;GUI show language ,set en or zh  eg.  lang=en
lang =
欢迎加入初见杂货铺大家庭,扫码加站长微信,回复加群自动拉你进群。 任何软件破解版均有时效性,如有失效请理性对待,谢谢理解。本站资源均为学习交流为主,请于下载后24小时内删除,如有侵权请联系站长删除。
© 版权声明
THE END
喜欢就支持一下吧,您的支持是我坚持的最大动力
点赞12 分享
评论 共2条

请登录后发表评论