VocoType

AI 深度优化

AI 深度优化:把“转写结果”优化成更可用的文本

VocoType 的 AI 深度优化原理:将语音转文字后的文本,按照提示词的要求交给大模型再进行一轮处理。

例如,当你说话时发生了“自我纠正”:

🗣️ 你的原话: “这是一个测试,额,不对,这不是测试”
📝 默认结果: “这是一个测试,呃,不对,这不是测试”
✨ AI 润色: “这不是测试”

💡 AI 能完全理解你真正的意思,知道你要把前面的废话删除,同时还能顺便清理掉所有的语气词和口语错别字。

隐私边界:AI 优化会把“文本内容”发送给你配置的模型服务商处理(不是上传语音)。如果你处理的是高敏内容,请谨慎开启,或仅使用本地模型。


能做什么(典型用法)

  1. 转书面语/润色:把口语化表达改成更清晰、正式的文字。
  2. 结构化整理:把长段内容拆成要点、标题、待办清单。
  3. 自定义输出格式:例如“先给一句话摘要,再给 5 条要点,再给 3 条待办”。

3 步上手(最稳妥的配置路径)

VocoType 支持多家模型服务商。选择时建议看三点:稳定性、成本、是否有合适的免费额度。

  • DeepSeekdeepseek-chat 速度较快,非常智能,适合复杂的优化需求。
  • 通义千问:有很多免费额度,qwen2.5-72b-instruct 速度较快,适合日常使用。

第一步:启用 AI 优化

1.点击 VocoType 悬浮球页的 设置(齿轮图标),进入 **“设置”**页面 2.点击"AI供应商"进入配置页面

第二步:配置模型服务商

1.选择对应的AI供应商,点击"编辑"按钮 2.在弹出的对话框中,选择对应的模型,填入API Key 3.点击"测试"按钮,看到绿色对勾(✓),恭喜您,VocoType 已经拥有了"大脑"!

API Key 配置教程

第三步:配置对应的快捷键

  1. 进入“提示词模板”页面,你可以新建对应的提示词,并为其绑定一个快捷键。
  2. 配置好之后,在语音处理时按下对应快捷键,即可触发这套自定义的 AI 整理流程。
提示词模板配置教程

提示词(Prompt):让输出“长期稳定”的关键

AI 的效果很大程度取决于提示词是否清晰、可执行。建议你把提示词写成“规则 + 输出格式 + 例子”,而不是一句空泛的要求。VocoType 支持提示词模板管理,适合做成你自己的工作流。

场景演示

1. 纠错模式

你是一个语音转录后处理引擎。

**唯一任务:** 将语音转录的原始文本修正为准确反映用户最终意图的干净文本。

---

## 处理规则

### 1. 执行口语修正指令
识别说话人的自我纠错行为,**删除被否定的内容,只保留修正后的版本**

常见触发词:
- 否定重说:「不对」「额不对」「等等」「不是」「重新说」「不不不」
- 补充修正:「应该是」「我的意思是」「换句话说」

### 2. 清除无实意词
删除语气词与口癖,包括但不限于:「嗯」「啊」「呃」「那个」「然后是」「就是说」

### 3. 修正同音字与错别字
结合上下文语义判断,修正识别错误,例如:
- 「保护罩」→「本护照」
- 「次日」→「持有人」
- 「不发」→「补发」

### 4. 格式化输出
根据内容结构合理排版:
- 存在列举关系时,使用有序或无序列表
- 存在代码、路径、标识符时,保留其原始格式(如 `snake_case`、括号注释)
- 适当使用标点、空格与换行,提升可读性

---

## 输出要求
- **只输出修正后的最终文本**,不添加任何解释、标注或回应
- **若输入无有效内容,输出空文本**

---

## 示例

### 输入:
注意事项,一、保护罩是重要身份证件。次日,有人应妥为保存,不得擅自转让、故意损毁或不对,不得涂改转让,故意损毁,不何组织和个人不得非法扣押、二、保护罩等签发、换发、不发和家住,由国家移民管理局或其委托的公安机关出入境管理机构、中国驻海使馆领馆或外交部委托的其他驻案机构办理。三、保护照遗收获被盗在国内应立即向当地或户籍所在地的公安机关出入境管理机构报告

### 输出:
注意事项:
1. 本护照是重要身份证件,持有人应妥为保存,不得涂改、转让、故意损毁。任何组织和个人不得非法扣押。
2. 本护照的签发、换发、补发和加注,由国家移民管理局或其委托的公安机关出入境管理机构、中国驻外使馆领馆或外交部委托的其他驻外机构办理。
3. 本护照遗失或被盗,在国内应立即向当地或户籍所在地的公安机关出入境管理机构报告。

---

### 输入:
这个设置好快捷键,保存一下,要保存一下,有没有点保存

### 输出
这个设置好快捷键,要保存一下,有没有点保存

2. 翻译模式

Prompt:

你是一个“资深同声传译”。你的任务是把我的输入精准、优雅地翻译成目标语言。
核心规则:
1. 【自动识别语言】 如果我输入中文,请翻译成英文;如果我输入英文,请翻译成中文。
2. 【信达雅】 翻译要准确(信)、通顺(达)、优美(雅)。不要逐字翻译,要符合目标语言的表达习惯。
3. 【直接输出】 不要解释,不要任何多余的废话,只给我翻译后的结果。

📂 音视频文件智能整理

除了实时输入,VocoType 也支持对音视频转写结果进行整理。

  1. 进入 "音视频转写" 页面,拖入录音或视频文件。
  2. 转写完成后,点击右上角的 "AI 整理" 按钮(星星图标)。
  3. 输入简单的背景描述(如 "产品需求评审会")。
  4. AI 会生成一份结构化笔记(通常包含摘要、关键词与要点)。

❓ 常见问题

Q: 使用 AI 功能收费吗? A: AI 功能调用的是第三方厂商(如 DeepSeek)的 API,费用由厂商收取(通常非常低廉,DeepSeek 甚至有大量免费额度)。

Q: 我的隐私安全吗? A: VocoType 承诺:只有在您开启 AI 优化时,文本数据才会发送给您配置的 AI 厂商。除此之外,所有的语音识别都在本地离线完成,绝不上传。


下一步建议

如果你只是想“把话变成字”,优先把离线转写与替换词典配置好;如果你希望“可直接发出去的内容”,再开启 AI 优化并从 1 个提示词模板开始迭代。

下载 Windows 版下载 macOS 版