OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  voice-transcribe:利用 OpenAI 接口高效转录音频文件

voice-transcribe:利用 OpenAI 接口高效转录音频文件

 
  network ·  2026-02-06 02:51:10 · 3 次点击  · 0 条评论  

名称: voice-transcribe
描述: 使用 OpenAI 的 gpt-4o-mini-transcribe 模型转录音频文件,支持词汇提示和文本替换。需要 uv (https://docs.astral.sh/uv/)。


voice-transcribe

使用 OpenAI 的 gpt-4o-mini-transcribe 模型转录音频文件。

使用场景

当收到语音备忘录(尤其是通过 WhatsApp)时,只需运行:

uv run /Users/darin/clawd/skills/voice-transcribe/transcribe <音频文件>

然后根据转录内容进行回复。

修正转录错误

如果 Darin 指出某个单词转录错误,请将其添加到 vocab.txt(用于提示)或 replacements.txt(用于强制修正)。详见下文。

支持格式

  • mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus

示例

# 转录语音备忘录
transcribe /tmp/voice-memo.ogg

# 通过管道传递给其他工具
transcribe /tmp/memo.ogg | pbcopy

设置

  1. 将你的 OpenAI API 密钥添加到 /Users/darin/clawd/skills/voice-transcribe/.env
    OPENAI_API_KEY=sk-...

自定义词汇

将单词添加到 vocab.txt(每行一个),以帮助模型识别专有名词或术语:

Clawdis
Clawdbot

文本替换

如果模型仍然出现错误,请在 replacements.txt 中添加替换规则:

错误拼写 -> 正确拼写

注意事项

  • 假设为英语(无语言检测)
  • 专门使用 gpt-4o-mini-transcribe 模型
  • 根据音频文件的 SHA256 哈希值进行缓存
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor