名称: screen-narrator
描述: 使用 Gemini 视觉 + ElevenLabs 语音,实时播报您的 macOS 屏幕活动。
主页: https://github.com/buddyh/narrator
元数据:
{
"openclaw":
{
"emoji": "🎙️",
"requires": {
"bins": ["python3", "tmux", "peekaboo"],
"env": ["GEMINI_API_KEY", "ELEVENLABS_API_KEY"]
},
},
}
此技能对应上游 narrator 仓库的实现。
它运行 Gemini 视觉播报风格(体育、自然、恐怖、黑色电影、真人秀、ASMR、摔角)和 ElevenLabs 文本转语音,支持可选的双通道播报,并可通过 JSON 文件进行实时控制。
请使用仓库安装方式:
cd /Users/buddy/narrator
/Users/buddy/narrator/.venv/bin/python -m narrator sports --help
cd /Users/buddy/narrator
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
所需环境变量:
GEMINI_API_KEYELEVENLABS_API_KEYELEVENLABS_VOICE_ID在 tmux 会话中启动实时播报(推荐):
tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator sports --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"
带定时器启动:
tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator wrestling --time 5m --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"
运行时动态切换风格:
echo '{"command": "style", "value": "horror"}' > /tmp/narrator-ctl.json
设置脏话过滤级别:
echo '{"command": "profanity", "value": "low"}' > /tmp/narrator-ctl.json
暂停 / 恢复:
echo '{"command": "pause"}' > /tmp/narrator-ctl.json
echo '{"command": "resume"}' > /tmp/narrator-ctl.json
停止:
tmux kill-session -t narrator
检查状态:
cat /tmp/narrator-status.json
/Users/buddy/narrator 路径下的实现保持一致,以避免文档与运行时环境产生偏差。