名称: sag
描述: 基于 ElevenLabs 文本转语音,提供类似 macOS say 命令的本地播放体验。
主页: https://sag.sh
元数据: {"clawdbot":{"emoji":"🗣️","requires":{"bins":["sag"],"env":["ELEVENLABS_API_KEY"]},"primaryEnv":"ELEVENLABS_API_KEY","install":[{"id":"brew","kind":"brew","formula":"steipete/tap/sag","bins":["sag"],"label":"安装 sag (brew)"}]}}
使用 sag 通过 ElevenLabs 进行文本转语音并本地播放。
API 密钥(必需)
- 首选:ELEVENLABS_API_KEY
- CLI 也支持:SAG_API_KEY
快速开始
- sag "Hello there"
- sag speak -v "Roger" "Hello"
- sag voices
- sag prompting(获取特定模型的提示技巧)
模型说明
- 默认:eleven_v3(富有表现力)
- 稳定:eleven_multilingual_v2
- 快速:eleven_flash_v2_5
发音与表达规则
- 首要调整方法:重新拼写(例如 "key-note")、添加连字符、调整大小写。
- 数字/单位/URL:使用 --normalize auto(如果对名称有负面影响,则用 off)。
- 语言偏好:使用 --lang en|de|fr|... 引导标准化处理。
- v3 模型:不支持 SSML <break>;请使用 [pause]、[short pause]、[long pause]。
- v2/v2.5 模型:支持 SSML <break time="1.5s" />;<phoneme> 标签在 sag 中未开放。
v3 音频标签(置于行首)
- [whispers]、[shouts]、[sings]
- [laughs]、[starts laughing]、[sighs]、[exhales]
- [sarcastic]、[curious]、[excited]、[crying]、[mischievously]
- 示例:sag "[whispers] keep this quiet. [short pause] ok?"
语音默认设置
- 通过 ELEVENLABS_VOICE_ID 或 SAG_VOICE_ID 环境变量设置。
重要提示:在输出长内容前,请确认语音和说话人设置。
当 Peter 请求“语音”回复时(例如,“疯狂科学家语音”、“用语音解释”),生成音频并发送:
# 生成音频文件
sag -v Clawd -o /tmp/voice-reply.mp3 "您的消息内容"
# 然后在回复中包含:
# MEDIA:/tmp/voice-reply.mp3
语音角色技巧:
- 疯狂科学家:使用 [excited] 标签,加入戏剧性停顿 [short pause],变化语调强度。
- 平静:使用 [whispers] 或较慢的语速。
- 戏剧性:谨慎使用 [sings] 或 [shouts]。
Clawd 默认语音:lj2rcrvANS3gaWWnczSX(或直接使用 -v Clawd)。