OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  sag:集成 ElevenLabs 文本转语音,具备 Mac 风格的朗读能力

sag:集成 ElevenLabs 文本转语音,具备 Mac 风格的朗读能力

 
  infrastructure ·  2026-02-20 21:47:55 · 3 次点击  · 0 条评论  

名称: sag
描述: 基于 ElevenLabs 文本转语音,提供类似 macOS say 命令的本地播放体验。
主页: https://sag.sh
元数据: {"clawdbot":{"emoji":"🗣️","requires":{"bins":["sag"],"env":["ELEVENLABS_API_KEY"]},"primaryEnv":"ELEVENLABS_API_KEY","install":[{"id":"brew","kind":"brew","formula":"steipete/tap/sag","bins":["sag"],"label":"安装 sag (brew)"}]}}


sag

使用 sag 通过 ElevenLabs 进行文本转语音并本地播放。

API 密钥(必需)
- 首选:ELEVENLABS_API_KEY
- CLI 也支持:SAG_API_KEY

快速开始
- sag "Hello there"
- sag speak -v "Roger" "Hello"
- sag voices
- sag prompting(获取特定模型的提示技巧)

模型说明
- 默认:eleven_v3(富有表现力)
- 稳定:eleven_multilingual_v2
- 快速:eleven_flash_v2_5

发音与表达规则
- 首要调整方法:重新拼写(例如 "key-note")、添加连字符、调整大小写。
- 数字/单位/URL:使用 --normalize auto(如果对名称有负面影响,则用 off)。
- 语言偏好:使用 --lang en|de|fr|... 引导标准化处理。
- v3 模型:不支持 SSML <break>;请使用 [pause][short pause][long pause]
- v2/v2.5 模型:支持 SSML <break time="1.5s" /><phoneme> 标签在 sag 中未开放。

v3 音频标签(置于行首)
- [whispers][shouts][sings]
- [laughs][starts laughing][sighs][exhales]
- [sarcastic][curious][excited][crying][mischievously]
- 示例:sag "[whispers] keep this quiet. [short pause] ok?"

语音默认设置
- 通过 ELEVENLABS_VOICE_IDSAG_VOICE_ID 环境变量设置。

重要提示:在输出长内容前,请确认语音和说话人设置。

聊天语音回复

当 Peter 请求“语音”回复时(例如,“疯狂科学家语音”、“用语音解释”),生成音频并发送:

# 生成音频文件
sag -v Clawd -o /tmp/voice-reply.mp3 "您的消息内容"

# 然后在回复中包含:
# MEDIA:/tmp/voice-reply.mp3

语音角色技巧
- 疯狂科学家:使用 [excited] 标签,加入戏剧性停顿 [short pause],变化语调强度。
- 平静:使用 [whispers] 或较慢的语速。
- 戏剧性:谨慎使用 [sings][shouts]

Clawd 默认语音lj2rcrvANS3gaWWnczSX(或直接使用 -v Clawd)。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor