名称: local-whisper
描述: 使用 OpenAI Whisper 进行本地语音转文字。模型下载后完全离线运行。提供多种模型尺寸的高质量转录。
元数据: {"clawdbot":{"emoji":"🎙️","requires":{"bins":["ffmpeg"]}}}
使用 OpenAI 的 Whisper 进行本地语音转文字。模型下载后完全离线运行。
# 基础用法
~/.clawdbot/skills/local-whisper/scripts/local-whisper audio.wav
# 使用更好的模型
~/.clawdbot/skills/local-whisper/scripts/local-whisper audio.wav --model turbo
# 包含时间戳
~/.clawdbot/skills/local-whisper/scripts/local-whisper audio.wav --timestamps --json
| 模型 | 大小 | 说明 |
|---|---|---|
tiny |
39M | 速度最快 |
base |
74M | 默认模型 |
small |
244M | 良好的平衡性 |
turbo |
809M | 最佳速度/质量比 |
large-v3 |
1.5GB | 最高准确度 |
--model/-m — 模型尺寸 (默认: base)--language/-l — 语言代码 (省略则自动检测)--timestamps/-t — 包含词级时间戳--json/-j — 输出 JSON 格式--quiet/-q — 静默模式,不显示进度使用 uv 管理的虚拟环境,位于 .venv/。如需重新安装:
cd ~/.clawdbot/skills/local-whisper
uv venv .venv --python 3.12
uv pip install --python .venv/bin/python click openai-whisper torch --index-url https://download.pytorch.org/whl/cpu