名称: openai-whisper-api
描述: 通过 OpenAI 音频转录 API (Whisper) 将音频转换为文字。
主页: https://platform.openai.com/docs/guides/speech-to-text
元数据: {"clawdbot":{"emoji":"☁️","requires":{"bins":["curl"],"env":["OPENAI_API_KEY"]},"primaryEnv":"OPENAI_API_KEY"}}
通过 OpenAI 的 /v1/audio/transcriptions 端点转录音频文件。
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a
默认设置:
- 模型:whisper-1
- 输出:<输入文件名>.txt
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --model whisper-1 --out /tmp/transcript.txt
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --language en
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --prompt "发言人:Peter, Daniel"
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --json --out /tmp/transcript.json
设置 OPENAI_API_KEY 环境变量,或在 ~/.clawdbot/clawdbot.json 中配置:
{
skills: {
"openai-whisper-api": {
apiKey: "OPENAI_KEY_HERE"
}
}
}