3 分钟快速开始(推荐)
- 下载并安装 ChordVox。
- 首次启动后,授予麦克风权限。
- 在设置中选择默认语音引擎(建议先用内置引擎)。
- 设置一个顺手的热键(如 Fn / Globe 或自定义组合键)。
- 按住热键说话,松开后检查是否自动粘贴到目标应用。
你应该能在光标处看到文字
按住热键,说话,松开后,当前输入框应该直接收到文字,不需要复制粘贴。
如果失败,先减少变量
不要一上来同时折腾所有 Provider,先检查麦克风权限和默认引擎。
安装与首次启动
macOS
下载 `.dmg` 后拖拽到 Applications。若提示“无法验证开发者”,为非 App Store 下载软件正常提示。打开「终端」应用,粘贴以下命令并回车即可解除限制(该命令仅移除系统的下载标记,不会修改任何文件):
xattr -dr com.apple.quarantine /Applications/ChordVox.app
open /Applications/ChordVox.app
Windows / Linux
Windows 使用安装包 `.exe`;Linux 使用 `.AppImage` 或 `.deb`。 首次启动建议先确认系统输入设备与默认麦克风。
系统权限与环境检查
| 平台 | 你要检查什么 | 常见问题 |
|---|---|---|
| macOS | 系统设置 → 隐私与安全性 → 麦克风 | 未授权导致无录音 |
| Windows | 设置 → 隐私 → 麦克风(允许应用访问) | 系统总开关关闭 |
| Linux | 检查输入设备(如 `pavucontrol`)与剪贴板工具 | Wayland 剪贴板不可用 |
AI 配置(模型 / API / 本地方案)
ChordVox 支持 OpenAI / Claude / Gemini / Groq 等云端 API,也支持本地 GGUF 模型。 建议先用一个云端模型跑通,再逐步切换到你想要的质量与成本组合。
先走这两条推荐路径
路径 A:最快跑通
先用内置或低延迟引擎,把整条链路跑通,后面再加 AI 润色。
路径 B:正式写作优先
本地工作流稳定后,再接 OpenAI 或 Claude,并单独留一套高质量配置。
| 方案 | 特点 | 适合场景 |
|---|---|---|
| Groq(云端) | 响应快,延迟低 | 快速草稿、实时聊天输入 |
| GPT / Claude(云端) | 文本质量高 | 正式写作、邮件、长文本润色 |
| 本地 GGUF | 隐私强,可离线 | 内网、敏感信息场景 |
推荐配置顺序
- 先固定一个可用模型,避免多变量排错。
- 确认“转写成功 + 润色成功 + 自动粘贴成功”。
- 再创建第二套配置(用于速度/质量切换)。
API Key 申请速查
大多数云端 AI 都是同一套流程:注册账号 → 开通额度或余额 → 创建 API Key → 回到 ChordVox 填入 Key → 刷新模型并测试。
OpenAI
适合高质量润色。进入 API Keys 页面创建 key;如模型不可用,先检查项目额度和 Billing。
申请 / 管理 Key →OpenRouter
一个 Key 统一接入多家模型。创建 key 时建议设置消费上限;如果调用失败,先确认账户余额。
申请 / 管理 Key →Anthropic Claude
适合长文本组织和正式改写。到 Console 创建 API key;如请求失败,检查 Workspace 与额度。
申请 / 管理 Key →Google Gemini
通过 Google AI Studio 创建 Gemini API Key;新用户通常会绑定或创建 Google Cloud 项目。
申请 / 管理 Key →Groq
主打低延迟,适合快速草稿。创建 Groq key 后填入 ChordVox;遇到失败先看模型是否仍可用和速率限制。
申请 / 管理 Key →Mistral
适合 Mistral 模型和云端转录。先激活计划,再到 API Keys 创建 key;key 只显示一次。
申请 / 管理 Key →AWS Bedrock
不是普通 API Key。需要 Access Key ID、Secret Access Key、Region,并确认账号已开通 Bedrock 模型权限。
查看 AWS 官方步骤 →Custom Provider
适合 Ollama、LocalAI 或自建 OpenAI 兼容服务。你需要 Endpoint URL、可选 API Key 和模型名。
按你的自建服务文档准备展开全部提供商配置
按供应商快速配置
如果你不知道该去哪里获取 Key / Access Key,或者不知道回到 ChordVox 后该填哪里,就按下面对应供应商的步骤做。
OpenAI
用于 GPT 系列模型,适合正式写作和高质量润色。
- 打开 OpenAI 的 API Keys 页面并创建新的 secret key。
- 回到 ChordVox,把 key 粘贴到 OpenAI 的 API Key 字段。
- 点击刷新并选择你想用的模型。
OpenRouter
一个 Key 接入多家模型,适合想灵活切换提供商的用户。
- 打开 OpenRouter 的 Keys 页面并创建新 key。
- 回到 ChordVox,把 key 粘贴到 OpenRouter 的 API Key 字段。
- 点击刷新并从返回列表中选择模型。
Anthropic
用于 Claude 系列模型,适合更稳的长文本组织和改写。
- 打开 Anthropic Console 的 API Keys 页面并创建 key。
- 回到 ChordVox,把 key 粘贴到 Anthropic 的 API Key 字段。
- 点击刷新并选择你想用的 Claude 模型。
Google Gemini
通过 Google AI Studio 获取 key,适合 Gemini 模型接入。
- 打开 Google AI Studio 的 API Keys 页面并创建 key。
- 回到 ChordVox,把 key 粘贴到 Gemini 的 API Key 字段。
- 点击刷新并选择需要的 Gemini 模型。
Groq
低延迟、响应快,适合快速草稿和轻量润色。
- 打开 Groq Console 的 Keys 页面并创建 key。
- 回到 ChordVox,把 key 粘贴到 Groq 的 API Key 字段。
- 点击刷新并选择可用模型。
Mistral
主要用于云端文件转录,适合想快速接入外部转录 API 的场景。
- 打开 Mistral Console 的 API Keys 页面并创建 key。
- 回到 ChordVox,在云端转录提供商里填入该 key。
- 选择可用模型后先跑一条短音频确认成功。
AWS Bedrock
不是单个 API Key,需要 Access Key ID、Secret Access Key 和 Region。
- 在 AWS IAM 中创建 Access Key,并确认账号已开通 Bedrock 模型权限。
- 回到 ChordVox,填写 Access Key ID、Secret Access Key 和 Region。
- 点击刷新并选择可用模型;如有私有网络,再补 Endpoint。
Custom Provider
适用于 Ollama、LocalAI 或其它兼容 OpenAI 接口的自建服务。
- 准备好兼容 OpenAI 的 Endpoint URL,以及服务商要求的凭据。
- 在 ChordVox 填入 Endpoint URL、可选 API Key 和协议。
- 点击刷新并从返回列表中选择模型。
自定义提供商没有统一官方 Key 页面,请以你的兼容服务商文档为准。
热键与自动粘贴工作流
配置 A:高速草稿
用于会议、即时聊天、快速记录。目标是“快且可读”。
配置 B:正式输出
用于邮件、文档、对外沟通。目标是“语气稳、格式好”。
最佳实践:把口述变成可直接发送的文本
ChordVox 不只是“把声音变成字”。真正省时间的用法,是先让本地转写稳定,再用 AI 润色、词典和口头指令把口语整理成会议通知、邮件、待办或翻译稿。
先说输出目标
按住热键前,先决定这段话要变成什么:会议通知、邮件、待办、翻译,还是普通聊天回复。
用口头指令带格式
直接在开头说“帮我整理成会议通知”“帮我写成邮件”“翻译成英文”,让 AI 润色知道目标格式。
让词典接管专有名词
把同事名、产品名、项目代号、英文缩写放进词典,减少“听对了但写错字”的情况。
按场景拆两套配置
聊天和会议记录用高速配置;正式邮件、客户回复和长文本用高质量模型或 Pro 高级工作流。
推荐口述模板
先说“我要什么格式”,再说内容。下面这些句式可以直接照着试。
帮我整理成会议通知:今天下午四点开会,叫上老张,主题是 UI 改版验收。
帮我写成邮件:告诉客户我们已经修复 iOS 首屏遮挡问题,请他刷新后再确认。
帮我整理成待办:今天要检查官网语言识别、修 Telegram 链接、更新教程。
翻译成英文:这段话保持专业、简洁,适合发给客户。
每次效果不好时,按这个顺序检查
- 先确认本地转写是否完整,录音太短或麦克风太远会直接影响后续润色。
- 再确认这段话是否需要 AI 润色;短聊天可以只用本地转写,正式输出再打开高质量配置。
- 如果专有名词错了,优先补词典;如果语气或格式不对,再调整口头指令或 Prompt Studio。
自定义词典:准确率提升关键
建议按“人名 / 产品名 / 缩写 / 专业术语”四类维护,并每周迭代一次。
示例(技术团队)
ChordVox
whisper.cpp
Parakeet
SenseVoice
GGUF
Creem
常见问题排错
有录音但没文字
优先检查麦克风权限、输入设备和模型可用性;然后再检查 API 与网络。
识别结果为空或异常短
检查是否误触热键、音量过低、缓存异常;必要时清理本地缓存后重试。
Linux 粘贴失败
Wayland 下优先安装 `wl-clipboard`,并确认系统粘贴工具已正确安装。
Windows 无窗口或无响应
先查看系统托盘,再尝试关闭 GPU 启动参数与安全软件拦截排查。
给新用户的使用建议
- 先追求稳定可用,再追求模型最优。
- 把“快捷键 + 模型 + 提示词”按场景拆成两套配置。
- 每周更新一次词典,准确率会持续提升。
- 如果你面向客户交付,建议把本页教程链接直接放进产品首页。