名称: voice-transcribe
描述: 使用 OpenAI 的 gpt-4o-mini-transcribe 模型转录音频文件,支持词汇提示和文本替换。需要 uv (https://docs.astral.sh/uv/)。
使用 OpenAI 的 gpt-4o-mini-transcribe 模型转录音频文件。
当收到语音备忘录(尤其是通过 WhatsApp)时,只需运行:
uv run /Users/darin/clawd/skills/voice-transcribe/transcribe <音频文件>
然后根据转录内容进行回复。
如果 Darin 指出某个单词转录错误,请将其添加到 vocab.txt(用于提示)或 replacements.txt(用于强制修正)。详见下文。
# 转录语音备忘录
transcribe /tmp/voice-memo.ogg
# 通过管道传递给其他工具
transcribe /tmp/memo.ogg | pbcopy
/Users/darin/clawd/skills/voice-transcribe/.env:OPENAI_API_KEY=sk-...将单词添加到 vocab.txt(每行一个),以帮助模型识别专有名词或术语:
Clawdis
Clawdbot
如果模型仍然出现错误,请在 replacements.txt 中添加替换规则:
错误拼写 -> 正确拼写