VocoType

手动模型下载

VocoType 离线语音输入模型手动安装指南,解决网络问题导致的模型下载失败,包含ASR、VAD及标点恢复模型的详细下载与配置步骤。

VocoType 离线语音输入模型手动安装指南

VocoType 是一款专注于极致效率与隐私安全的语音输入软件。它采用先进的本地 AI 模型,为您提供快速、准确的语音转文字体验,无需联网即可实现高精度的语音识别与自动标点添加。

如果您的网络环境无法自动下载 VocoType 所需的离线模型,请按照以下步骤手动下载并安装。


1. 打开模型目录

我们为您提供了快捷入口,无需手动查找路径:

  1. 打开 VocoType 软件。
  2. 在报错提示界面或设置中,点击右侧的 文件夹图标 按钮
  3. 系统会自动打开存放模型的文件夹(通常是 iic 目录)。

注意:如果文件夹是空的,请继续按照下方步骤下载文件。


2. 下载并放置模型文件

请在刚刚打开的文件夹中,分别创建以下三个文件夹,并将对应的文件放入其中。

步骤 A:配置语音识别模型 (ASR)

这是核心的语音转文字模型。

  1. 创建文件夹:请复制下方名称,在 iic 目录下创建一个新文件夹。
speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx
  1. 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中
文件名下载链接说明
config.yaml点击下载配置文件
tokens.json点击下载词表文件
am.mvn点击下载均值方差文件
model_quant.onnx点击下载模型主体 (约227MB)

步骤 B:配置标点恢复模型 (Punctuation)

该模型用于自动添加标点符号。

  1. 创建文件夹:请复制下方名称,在 iic 目录下创建一个新文件夹。
punc_ct-transformer_zh-cn-common-vocab272727-onnx
  1. 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中
文件名下载链接说明
config.yaml点击下载配置文件
tokens.json点击下载词表文件
model_quant.onnx点击下载模型主体 (约270MB)

步骤 C:配置语音活动检测模型 (VAD)

该模型用于精准识别说话的开始和结束。

  1. 创建文件夹:请复制下方名称,在 iic 目录下创建一个新文件夹。
speech_fsmn_vad_zh-cn-16k-common-onnx
  1. 下载文件:点击下方链接下载文件,并放入刚刚创建的文件夹中
文件名下载链接说明
config.yaml点击下载配置文件
am.mvn点击下载均值方差文件
configuration.json点击下载额外配置
model_quant.onnx点击下载模型主体 (约0.5MB)

3. 验证安装

完成上述步骤后,重启 VocoType 软件。系统将自动检测并加载这些本地模型,您即可开始体验离线语音输入功能。

目录结构参考

.cache/modelscope/hub/models/iic/
                            ├── speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx/
                            ├── punc_ct-transformer_zh-cn-common-vocab272727-onnx/
                            └── speech_fsmn_vad_zh-cn-16k-common-onnx/