前几天有很多小伙伴问我，如何语音转文字，我下意识的想到了讯飞语记，之前我经常使用的，但是现在好像没有免费的语音转文字的软件了，然后我找了半天找到了这款神级软件，作者简直无敌！！！

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图

打开软件逼格就非常高，然后功能多到也是眼花缭乱的

1、提取字幕翻译

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图1

2、视频提取字幕

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图2

3、视频字幕合并

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图3

4、字幕创建配音

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图4

5、语音转文字

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图5

6、文字转语音

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图6

7、音频格式转换

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图7

8、字幕翻译

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图8

是不是非常的牛掰

下载地址：

使用方法：

解压缩文件夹后双击打开

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效插图9

无需安装，全程本地化操作，无须担心失效问题，计算全部由显卡完成！

使用方法

原始视频：选择mp4/avi/mov/mkv/mpeg视频，可选择多个视频；
输出视频目录：如果不选择，则默认生成在同目录下的_video_out，同时在该目录下的srt文件夹中将创建原语言和目标语言的两个字幕文件
选择翻译：任选 google|baidu|腾讯|chatGPT|Azure|Gemini|DeepL|DeepLX 翻译渠道
网络代理地址：如果您所在地区无法直接访问google/chatGPT，需要在软件界面比如网络代理中设置代理，若使用v2ray，则填写http://127.0.0.1:10809，若冲突，则填写http://127.0.0.1:7890。如果您修改了默认端口或使用的其他代理软件，则继续填写
视频原始语言：选择待翻译视频里的语言种类
翻译目标语言：选择希望翻译到的语言种类
选择配音：选择翻译目标语言后，可从配音选项中，选择配音角色；

硬字幕: 是指全部显示字幕，不可，如果希望网页中播放时也有字幕，请选择硬字幕嵌入

软字幕：播放器支持隐藏字幕管理，可显示或者字幕，该方式网页中播放时不会显示字幕，某些国产播放器可能不支持，需要将生成的视频同名srt文件和视频放在一个目录中下才会显示
语音识别模型：选择base/small/medium/large-v3，识别效果越来越好，但识别速度越来越慢，所需内存越来越大，内置base模型，其他模型请单独下载后，解压放到当前软件目录/models目录下。如果GPU显存低于4G，不要使用large-v3

整体识别/预先分割：整体识别是指直接发送整个语音文件给模型，由模型进行处理，分割可能更准确，但也可以制作出30秒长的单字幕，适合有明显静音的音频；预先分割时指先将音频按10s左右长度切割之后分别发送给模型处理。

配音速度：填写-90到+90之间的数字，同样的话在不同语言语音下，所需时间是不同的，因此配音后可能声画字幕不同步，可以调整此处语速，负数代表降速，正数代表加速播放。
音视频对齐：分别是“配音自动加速”和“视频自动降速”

翻译后不同语言下发音时长不同，比如说中文3秒，翻译为英文可能5秒，导致时长和视频不一致。

2种解决方式：
1. 强制配音加速播放，以便缩短配音时长和视频对齐

2. 强制视频慢速播放，以便延长视频时长和配音对齐。
两者只任选其一

静音分割: 填写100到2000的数字，代表毫秒，默认500，即以大于等于500ms 的静音分割为区间分割语音
CUDA加速：确认你的电脑显卡为N卡，并且已配置好CUDA环境和驱动，则开启选择该项目，速度能大幅提升，具体配置方法见下方CUDA加速支持
TTS：可用edgeTTS和openai TTS模型中选择要合成语音的角色，openai需要使用官方接口或者开通了tts-1模型的三方接口
点击开始按钮底部会显示当前进度和日志，右侧文本框内显示字幕
字幕解析完成后，将暂停等待字幕修改，如果不做任何操作，60秒后将自动继续下一步。也可以在右侧字幕区编辑字幕，然后手动点击继续合成
将在目标文件夹中视频同名的子目录内，分别生成两种语言的字幕srt文件、原始语音和配音后的wav文件，以方便进一步处理
设置行角色：可对字幕中的每行设定发音角色，首先左侧选好TTS类型和角色，然后点击字幕区右下方“设置行角色”，在每个角色名后面文本中中，填写要内容使用该角色配音的行号，如下图：

常见问题

使用google翻译，提示错误

使用国内google或chatGPT官方接口，都需要挂梯子
使用了全局代理，但看起来并没有走代理

需要在软件界面“网络代理”中设置具体的代理地址，比如http://127.0.0.1:7890
提示 FFmepg 不存在

首先查看确定软件根目录下是否存在ffmpeg.exe、ffprobe.exe文件，如果不存在，解压ffmpeg.7z，将这2个文件放到软件根目录下
windows上开启了CUDA，但是提示错误

A：首先查看详细安装方法，确定你已经正确安装了cuda相关工具，如果仍然存在错误，点击下载 cuBLAS，解压后将里面的dll文件复制到C:/Windows/System32下

B：如果确定和A无关，那么请检查视频是否是H264编码的mp4，有些高清视频是H265编码的，这种不支持，可尝试在“视频工具箱”中转为H264视频

C：GPU下对视频进行硬件解码编码对数据正确性要求严格，容错率几乎为0，任何一点错误都会导致失败，加上显卡型号、驱动版本、CUDA版本、ffmpeg版本不同版本之间的差异等，导致很容易出现兼容性错误。目前加了回退，GPU上失败后自动使用CPU软件编解码。失败时logs目录下日志里会记录错误信息。
提示模型不存在

在0.985版本之后，模型需要重新安装，models目录下是各个模型的文件夹，而不是pt文件。要使用base模型，要保证models/models–Systran–faster-whisper-base文件夹存在，如果要使用small模型，要保证 models/models–Systran–faster-whisper-small 文件夹，如果不存在，需要下载后格式文件夹复制到models下。要使用medium模型，要保证models/models–Systran–faster-whisper-medium文件夹存在，如果不存在，需要下载后格式文件夹复制到models下。要使用large-v3模型，要保证 models/models–Systran–faster-whisper-large-v3 文件夹存在，如果不存在，需要下载后将文件夹复制到 models 下。

全部模型下载地址
提示目录不存在或权限错误

在sp.exe上右键使用管理员权限打开
提示错误，但没有详细错误信息

打开logs目录，找到最新的log日志文件，拉到最底部，即可看到报错信息。
Large-v3模型非常慢

如果你没有N卡GPU，或者没有配置好CUDA环境，或者显存低于4G，请不要使用这个模型，否则会非常慢和卡顿
提示缺少cublasxx.dll文件

有时会遇到“cublasxx.dll不存在”的错误，此时需要下载cuBLAS，然后将dll文件复制到系统目录下

点击下载cuBLAS，解压后将里面的dll文件复制到C:/Windows/System32下
背景音乐丢失

只识别人声并保存人声，即配音后音频中不存在原背景音乐，如果需要保留，请使用人声背景音乐分离项目，将背景音提取出来，然后再和配音文件合并。

怎样使用自定义音色

目前暂时不支持该功能，如果有需要，您可以先识别出字幕，然后使用另一个声音克隆项目，输入字幕srt文件，选择自定义的音色合成为音频文件，然后再生成新视频。

字幕语音无法液晶

翻译后不同语言下发音时长不同，比如说中文3秒，翻译为英文可能5秒，导致时长和视频不一致。

2种解决方式：
1. 强制配音加速播放，以便缩短配音时长和视频对齐

2. 强制视频慢速播放，以便延长视频时长和配音对齐。
两者只任选其一

字幕不显示或显示乱码

采用软合成字幕：字幕作为单独文件嵌入视频，可再次提取出来，如果播放器支持，可在播放器字幕管理中启用或取消字幕；

注意很多国内播放器必须将srt字幕文件和视频放在相同目录下且名称相同，才能加载软字幕，并且可能需要将srt文件转为GBK编码，否则显示乱码，

如何切换软件界面语言/中文或英文

软件目录下如果不存在set.ini文件则先创建，然后将以下代码粘贴到里面，lang=后填写语言代码，zh代表中文，en代表中文，然后重启软件


[GUI]
;GUI show language ,set en or zh  eg.  lang=en
lang =

欢迎加入初见杂货铺大家庭，扫码加站长微信，回复加群自动拉你进群。任何软件破解版均有时效性，如有失效请理性对待，谢谢理解。本站资源均为学习交流为主，请于下载后24小时内删除，如有侵权请联系站长删除。

文章版权归作者所有，未经允许请勿转载。如有侵权请联系站长删除相关文章

THE END

电脑软件
# 语音转文字

电脑工具丨神级工具，语音转文字，文字转语音，音轨分离等全本地化，无须担心破解失效

使用方法

常见问题

请登录后发表评论