VocoType

AI 深度优化

本文介绍 VocoType 的 AI 深度优化功能:如何接入 DeepSeek、智谱等模型,并通过提示词把转写结果整理成邮件、会议纪要或待办清单。包含隐私边界说明与常见问题。

AI 深度优化:把“转写结果”整理成更可用的文本

语音转写解决的是“把声音变成文字”,但很多时候我们真正需要的是“把文字整理成能直接使用的内容”,例如:

  • 会议纪要(摘要 + 结论 + 待办)
  • 商务邮件(更正式、更清晰)
  • 结构化笔记(要点、标题、关键词)

VocoType 的 AI 深度优化用于上述“整理”环节:你可以按自己的工作流设置提示词模板,让输出更稳定、更一致。

隐私边界:AI 优化会把“文本内容”发送给你配置的模型服务商处理(不是上传语音)。如果你处理的是高敏内容,请谨慎开启,或仅使用离线转写与本地词典。


能做什么(典型用法)

  1. 转书面语/润色:把口语化表达改成更清晰、正式的文字。
  2. 结构化整理:把长段内容拆成要点、标题、待办清单。
  3. 自定义输出格式:例如“先给一句话摘要,再给 5 条要点,再给 3 条待办”。

3 步上手(最稳妥的配置路径)

第一步:启用 AI 优化

点击 VocoType 主界面或悬浮球上的 设置(齿轮图标),进入 “AI 优化”,打开 “启用 AI 优化” 开关。

第二步:选择模型服务商

VocoType 支持多家模型服务商。选择时建议看三点:稳定性、成本、是否有合适的免费额度。

  • DeepSeekdeepseek-chat 适合日常整理,deepseek-reasoner 更偏复杂推理任务。
  • 智谱 AIglm-4-flash 速度快,通常也有一定免费额度。
  • 豆包 / 通义千问:也可用,根据你手头账号与额度选择即可。

第三步:测试连通性

  1. "API Key" 输入框中粘贴您从对应厂商获取的密钥(通常在厂商的开发者平台获取)。
  2. 点击 "点此测试服务"
  3. 看到绿色对勾(✓),恭喜您,VocoType 已经拥有了"大脑"!

提示词(Prompt):让输出“长期稳定”的关键

AI 的效果很大程度取决于提示词是否清晰、可执行。建议你把提示词写成“规则 + 输出格式”,而不是一句空泛的要求。VocoType 支持提示词模板管理,适合做成你自己的工作流。

场景演示

1. 程序员模式

  • Prompt: 你是一个资深程序员。请将我输入的语音内容整理为清晰、规范的代码注释,去除口语废话,保持简洁。
  • 🗣️ 输入: "这个函数主要是用来处理用户登录的检查一下密码对不对然后返回 token"
  • ✨ 输出: // 校验用户密码并生成登录 Token

2. 商务邮件模式

  • Prompt: 你是一个专业的商务秘书。请将我的口语内容改写为正式、得体的商务邮件回复,语气要委婉但坚定。
  • 🗣️ 输入: "告诉他价格不能再低了我们已经很亏了"
  • ✨ 输出: 关于价格方面,鉴于目前的成本压力,这已经是我们可以提供的最优方案,希望能得到您的理解。

3. 翻译模式

  • Prompt: 请将以下中文内容翻译成地道的英文。
  • 🗣️ 输入: "VocoType 是最好的离线语音输入法"
  • ✨ 输出: VocoType is the best offline voice input method.

📂 音视频文件智能整理

除了实时输入,VocoType 也支持对音视频转写结果进行整理。

  1. 进入 "音视频转写" 页面,拖入录音或视频文件。
  2. 转写完成后,点击右上角的 "AI 整理" 按钮(星星图标)。
  3. 输入简单的背景描述(如 "产品需求评审会")。
  4. AI 会生成一份结构化笔记(通常包含摘要、关键词与要点)。

❓ 常见问题

Q: 使用 AI 功能收费吗? A: AI 功能调用的是第三方厂商(如 DeepSeek)的 API,费用由厂商收取(通常非常低廉,DeepSeek 甚至有大量免费额度)。

Q: 我的隐私安全吗? A: VocoType 承诺:只有在您开启 AI 优化时,文本数据才会发送给您配置的 AI 厂商。除此之外,所有的语音识别都在本地离线完成,绝不上传。


下一步建议

如果你只是想“把话变成字”,优先把离线转写与替换词典配置好;如果你希望“可直接发出去的内容”,再开启 AI 优化并从 1 个提示词模板开始迭代。

下载 Windows 版

下载 macOS 版