手动模型下载
当网络环境受限导致 VocoType 自动下载模型失败时,请参考本指南。我们提供详细的步骤,教您手动下载并配置 ASR 语音识别、VAD 语音活动检测及标点恢复模型,确保软件正常运行。
VocoType 离线语音输入模型手动安装指南
VocoType 是一款专注于极致效率与隐私安全的语音输入软件。它采用先进的本地 AI 模型,为您提供快速、准确的语音转文字体验,无需联网即可实现高精度的语音识别与自动标点添加。
如果您的网络环境无法自动下载 VocoType 所需的离线模型,请按照以下步骤手动下载并安装。
1. 打开模型目录
我们为您提供了快捷入口,无需手动查找路径:
- 打开 VocoType 软件。
- 在报错提示界面或设置中,点击右侧的 文件夹图标 按钮。
- 系统会自动打开存放模型的文件夹(通常是
iic目录)。
注意:如果无法打开请手动创建文件 C:\Users<你的电脑登录用户名>.cache\modelscope\hub\models\iic
2. 下载并放置模型文件
请在刚刚打开的文件夹中,分别创建以下三个文件夹,并将对应的文件放入其中。
步骤 A:配置语音识别模型 (ASR)
这是核心的语音转文字模型。
- 创建文件夹:请复制下方名称,在
iic目录下创建一个新文件夹。
speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx- 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中。
步骤 B:配置标点恢复模型 (Punctuation)
该模型用于自动添加标点符号。
- 创建文件夹:请复制下方名称,在
iic目录下创建一个新文件夹。
punc_ct-transformer_zh-cn-common-vocab272727-onnx- 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中。
步骤 C:配置语音活动检测模型 (VAD)
该模型用于精准识别说话的开始和结束。
- 创建文件夹:请复制下方名称,在
iic目录下创建一个新文件夹。
speech_fsmn_vad_zh-cn-16k-common-onnx- 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中。
| 文件名 | 下载链接 | 说明 |
|---|---|---|
config.yaml | 点击下载 | 配置文件(点击“下载”进入页面后右击另存为保存,命名为config.yaml) |
am.mvn | 点击下载 | 均值方差文件 |
configuration.json | 点击下载 | 额外配置 |
model_quant.onnx | 点击下载 | 模型主体 (约0.5MB) |
3. 验证安装
完成上述步骤后,重启 VocoType 软件。系统将自动检测并加载这些本地模型,您即可开始体验离线语音输入功能。
目录结构参考:
.cache/modelscope/hub/models/iic/
├── speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx/
├── punc_ct-transformer_zh-cn-common-vocab272727-onnx/
└── speech_fsmn_vad_zh-cn-16k-common-onnx/