手动模型下载
VocoType 离线语音输入模型手动安装指南,解决网络问题导致的模型下载失败,包含ASR、VAD及标点恢复模型的详细下载与配置步骤。
VocoType 离线语音输入模型手动安装指南
VocoType 是一款专注于极致效率与隐私安全的语音输入软件。它采用先进的本地 AI 模型,为您提供快速、准确的语音转文字体验,无需联网即可实现高精度的语音识别与自动标点添加。
如果您的网络环境无法自动下载 VocoType 所需的离线模型,请按照以下步骤手动下载并安装。
1. 打开模型目录
我们为您提供了快捷入口,无需手动查找路径:
- 打开 VocoType 软件。
- 在报错提示界面或设置中,点击右侧的 文件夹图标 按钮 。
- 系统会自动打开存放模型的文件夹(通常是
iic目录)。
注意:如果文件夹是空的,请继续按照下方步骤下载文件。
2. 下载并放置模型文件
请在刚刚打开的文件夹中,分别创建以下三个文件夹,并将对应的文件放入其中。
步骤 A:配置语音识别模型 (ASR)
这是核心的语音转文字模型。
- 创建文件夹:请复制下方名称,在
iic目录下创建一个新文件夹。
speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx- 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中。
步骤 B:配置标点恢复模型 (Punctuation)
该模型用于自动添加标点符号。
- 创建文件夹:请复制下方名称,在
iic目录下创建一个新文件夹。
punc_ct-transformer_zh-cn-common-vocab272727-onnx- 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中。
步骤 C:配置语音活动检测模型 (VAD)
该模型用于精准识别说话的开始和结束。
- 创建文件夹:请复制下方名称,在
iic目录下创建一个新文件夹。
speech_fsmn_vad_zh-cn-16k-common-onnx- 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中。
| 文件名 | 下载链接 | 说明 |
|---|---|---|
config.yaml | 点击下载 | 配置文件 |
am.mvn | 点击下载 | 均值方差文件 |
configuration.json | 点击下载 | 额外配置 |
model_quant.onnx | 点击下载 | 模型主体 (约0.5MB) |
3. 验证安装
完成上述步骤后,重启 VocoType 软件。系统将自动检测并加载这些本地模型,您即可开始体验离线语音输入功能。
目录结构参考:
.cache/modelscope/hub/models/iic/
├── speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx/
├── punc_ct-transformer_zh-cn-common-vocab272727-onnx/
└── speech_fsmn_vad_zh-cn-16k-common-onnx/