名称: sound-fx
描述: 通过 ElevenLabs SFX(文本转声音)生成短音效。适用于需要音效片段(如掌声、罐头笑声、嗖嗖声、环境音或短促提示音)的场景,并可选择转换为 WhatsApp 友好的 .ogg/opus 格式。
使用 ElevenLabs SFX API,根据文本提示生成音效。默认输出为 MP3 格式;如需在 WhatsApp 移动端播放,可转换为 .ogg/opus 格式。
1) 设置 API 密钥:
- 使用环境变量 ELEVENLABS_API_KEY(推荐)或 XI_API_KEY
- 或在 ~/.clawdbot/clawdbot.json 中设置 skills."sound-fx".env.ELEVENLABS_API_KEY
2) 生成音效(MP3):
scripts/generate_sfx.sh --text "短促观众掌声" --out "/tmp/applause.mp3" --duration 1.2
3) 转换为 WhatsApp 友好的 .ogg/opus 格式(如需):
ffmpeg -y -i /tmp/applause.mp3 -c:a libopus -b:a 48k /tmp/applause.ogg
用法
scripts/generate_sfx.sh --text "罐头笑声" --out "/tmp/laugh.mp3" --duration 1.5
说明
- 调用接口:POST https://api.elevenlabs.io/v1/sound-generation
- 支持可选参数 --duration(范围 0.5–30 秒)。若省略,时长将自动确定。
- 成功时输出 MEDIA: <路径>,便于自动附件处理。
"短促观众掌声""罐头观众笑声""快速嗖嗖声""轻柔雨声环境音"