OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  narrator:具备 7 种风格的屏幕活动实时语音旁白解说

narrator:具备 7 种风格的屏幕活动实时语音旁白解说

 
  chatgp ·  2026-02-16 22:52:29 · 3 次点击  · 0 条评论  

名称: screen-narrator
描述: 使用 Gemini 视觉 + ElevenLabs 语音,实时播报您的 macOS 屏幕活动。
主页: https://github.com/buddyh/narrator
元数据:
{
"openclaw":
{
"emoji": "🎙️",
"requires": {
"bins": ["python3", "tmux", "peekaboo"],
"env": ["GEMINI_API_KEY", "ELEVENLABS_API_KEY"]
},
},
}


屏幕播报器

此技能对应上游 narrator 仓库的实现。

它运行 Gemini 视觉播报风格(体育、自然、恐怖、黑色电影、真人秀、ASMR、摔角)和 ElevenLabs 文本转语音,支持可选的双通道播报,并可通过 JSON 文件进行实时控制。

权威来源

请使用仓库安装方式:

cd /Users/buddy/narrator
/Users/buddy/narrator/.venv/bin/python -m narrator sports --help

环境设置

cd /Users/buddy/narrator
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

所需环境变量:

  • GEMINI_API_KEY
  • ELEVENLABS_API_KEY
  • 可选:ELEVENLABS_VOICE_ID

运行时控制命令

在 tmux 会话中启动实时播报(推荐):

tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator sports --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"

带定时器启动:

tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator wrestling --time 5m --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"

运行时动态切换风格:

echo '{"command": "style", "value": "horror"}' > /tmp/narrator-ctl.json

设置脏话过滤级别:

echo '{"command": "profanity", "value": "low"}' > /tmp/narrator-ctl.json

暂停 / 恢复:

echo '{"command": "pause"}' > /tmp/narrator-ctl.json
echo '{"command": "resume"}' > /tmp/narrator-ctl.json

停止:

tmux kill-session -t narrator

检查状态:

cat /tmp/narrator-status.json

注意事项

  • 仅限 macOS 系统(依赖屏幕捕获和 TTS/音频功能)。
  • 此 OpenClaw 技能包装器与 /Users/buddy/narrator 路径下的实现保持一致,以避免文档与运行时环境产生偏差。
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor