voice-transcribe：利用 OpenAI 接口高效转录音频文件

edit · 2026-02-06 02:51:10 · 50 次点击 · 0 条评论

名称： voice-transcribe
描述： 使用 OpenAI 的 gpt-4o-mini-transcribe 模型转录音频文件，支持词汇提示和文本替换。需要 uv (https://docs.astral.sh/uv/)。

voice-transcribe

使用 OpenAI 的 gpt-4o-mini-transcribe 模型转录音频文件。

当收到语音备忘录（尤其是通过 WhatsApp）时，只需运行：

uv run /Users/darin/clawd/skills/voice-transcribe/transcribe <音频文件>

然后根据转录内容进行回复。

如果 Darin 指出某个单词转录错误，请将其添加到 vocab.txt（用于提示）或 replacements.txt（用于强制修正）。详见下文。

# 转录语音备忘录
transcribe /tmp/voice-memo.ogg

# 通过管道传递给其他工具
transcribe /tmp/memo.ogg | pbcopy

将你的 OpenAI API 密钥添加到 /Users/darin/clawd/skills/voice-transcribe/.env：
OPENAI_API_KEY=sk-...

将单词添加到 vocab.txt（每行一个），以帮助模型识别专有名词或术语：

Clawdis
Clawdbot

如果模型仍然出现错误，请在 replacements.txt 中添加替换规则：

错误拼写 -> 正确拼写

50 次点击 ∙ 0 人收藏

登录后收藏

0 条回复