narrator：具备 7 种风格的屏幕活动实时语音旁白解说

meteor · 2026-02-09 06:42:41 · 47 次点击 · 0 条评论

名称： screen-narrator
描述： 使用 Gemini 视觉 + ElevenLabs 语音，实时播报您的 macOS 屏幕活动。
主页： https://github.com/buddyh/narrator
元数据：
{
"openclaw":
{
"emoji": "🎙️",
"requires": {
"bins": ["python3", "tmux", "peekaboo"],
"env": ["GEMINI_API_KEY", "ELEVENLABS_API_KEY"]
},
},
}

屏幕播报器

此技能对应上游 narrator 仓库的实现。

它运行 Gemini 视觉播报风格（体育、自然、恐怖、黑色电影、真人秀、ASMR、摔角）和 ElevenLabs 文本转语音，支持可选的双通道播报，并可通过 JSON 文件进行实时控制。

权威来源

请使用仓库安装方式：

cd /Users/buddy/narrator
/Users/buddy/narrator/.venv/bin/python -m narrator sports --help

环境设置

cd /Users/buddy/narrator
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

所需环境变量：

GEMINI_API_KEY
ELEVENLABS_API_KEY
可选：ELEVENLABS_VOICE_ID

运行时控制命令

在 tmux 会话中启动实时播报（推荐）：

tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator sports --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"

带定时器启动：

tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator wrestling --time 5m --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"

运行时动态切换风格：

echo '{"command": "style", "value": "horror"}' > /tmp/narrator-ctl.json

设置脏话过滤级别：

echo '{"command": "profanity", "value": "low"}' > /tmp/narrator-ctl.json

暂停 / 恢复：

echo '{"command": "pause"}' > /tmp/narrator-ctl.json
echo '{"command": "resume"}' > /tmp/narrator-ctl.json

停止：

tmux kill-session -t narrator

检查状态：

cat /tmp/narrator-status.json

注意事项

仅限 macOS 系统（依赖屏幕捕获和 TTS/音频功能）。
此 OpenClaw 技能包装器与 /Users/buddy/narrator 路径下的实现保持一致，以避免文档与运行时环境产生偏差。

技能包地址：https://github.com/openclaw/skills/tree/main/skills/buddyh/narrator/SKILL.md

47 次点击 ∙ 0 人收藏

登录后收藏

0 条回复