AI 深度优化
本文介绍 VocoType 的 AI 深度优化功能:如何接入 DeepSeek、智谱等模型,并通过提示词把转写结果整理成邮件、会议纪要或待办清单。包含隐私边界说明与常见问题。
AI 深度优化:把“转写结果”整理成更可用的文本
语音转写解决的是“把声音变成文字”,但很多时候我们真正需要的是“把文字整理成能直接使用的内容”,例如:
- 会议纪要(摘要 + 结论 + 待办)
- 商务邮件(更正式、更清晰)
- 结构化笔记(要点、标题、关键词)
VocoType 的 AI 深度优化用于上述“整理”环节:你可以按自己的工作流设置提示词模板,让输出更稳定、更一致。
隐私边界:AI 优化会把“文本内容”发送给你配置的模型服务商处理(不是上传语音)。如果你处理的是高敏内容,请谨慎开启,或仅使用离线转写与本地词典。
能做什么(典型用法)
- 转书面语/润色:把口语化表达改成更清晰、正式的文字。
- 结构化整理:把长段内容拆成要点、标题、待办清单。
- 自定义输出格式:例如“先给一句话摘要,再给 5 条要点,再给 3 条待办”。
3 步上手(最稳妥的配置路径)
第一步:启用 AI 优化
点击 VocoType 主界面或悬浮球上的 设置(齿轮图标),进入 “AI 优化”,打开 “启用 AI 优化” 开关。
第二步:选择模型服务商
VocoType 支持多家模型服务商。选择时建议看三点:稳定性、成本、是否有合适的免费额度。
- DeepSeek:
deepseek-chat适合日常整理,deepseek-reasoner更偏复杂推理任务。 - 智谱 AI:
glm-4-flash速度快,通常也有一定免费额度。 - 豆包 / 通义千问:也可用,根据你手头账号与额度选择即可。
第三步:测试连通性
- 在 "API Key" 输入框中粘贴您从对应厂商获取的密钥(通常在厂商的开发者平台获取)。
- 点击 "点此测试服务"。
- 看到绿色对勾(✓),恭喜您,VocoType 已经拥有了"大脑"!
提示词(Prompt):让输出“长期稳定”的关键
AI 的效果很大程度取决于提示词是否清晰、可执行。建议你把提示词写成“规则 + 输出格式”,而不是一句空泛的要求。VocoType 支持提示词模板管理,适合做成你自己的工作流。
场景演示
1. 程序员模式
- Prompt:
你是一个资深程序员。请将我输入的语音内容整理为清晰、规范的代码注释,去除口语废话,保持简洁。 - 🗣️ 输入: "这个函数主要是用来处理用户登录的检查一下密码对不对然后返回 token"
- ✨ 输出:
// 校验用户密码并生成登录 Token
2. 商务邮件模式
- Prompt:
你是一个专业的商务秘书。请将我的口语内容改写为正式、得体的商务邮件回复,语气要委婉但坚定。 - 🗣️ 输入: "告诉他价格不能再低了我们已经很亏了"
- ✨ 输出:
关于价格方面,鉴于目前的成本压力,这已经是我们可以提供的最优方案,希望能得到您的理解。
3. 翻译模式
- Prompt:
请将以下中文内容翻译成地道的英文。 - 🗣️ 输入: "VocoType 是最好的离线语音输入法"
- ✨ 输出:
VocoType is the best offline voice input method.
📂 音视频文件智能整理
除了实时输入,VocoType 也支持对音视频转写结果进行整理。
- 进入 "音视频转写" 页面,拖入录音或视频文件。
- 转写完成后,点击右上角的 "AI 整理" 按钮(星星图标)。
- 输入简单的背景描述(如 "产品需求评审会")。
- AI 会生成一份结构化笔记(通常包含摘要、关键词与要点)。
❓ 常见问题
Q: 使用 AI 功能收费吗? A: AI 功能调用的是第三方厂商(如 DeepSeek)的 API,费用由厂商收取(通常非常低廉,DeepSeek 甚至有大量免费额度)。
Q: 我的隐私安全吗? A: VocoType 承诺:只有在您开启 AI 优化时,文本数据才会发送给您配置的 AI 厂商。除此之外,所有的语音识别都在本地离线完成,绝不上传。
下一步建议
如果你只是想“把话变成字”,优先把离线转写与替换词典配置好;如果你希望“可直接发出去的内容”,再开启 AI 优化并从 1 个提示词模板开始迭代。