名称: whisper-mlx-local
描述: "基于 MLX Whisper 在 Apple Silicon 上为 Telegram 和 WhatsApp 提供免费的本地语音转文字服务。私密、无 API 成本。"
元数据:
openclaw:
emoji: "🎤"
version: "1.5.0"
author: "社区"
repo: "https://github.com/ImpKind/local-whisper"
requires:
os: ["darwin"]
arch: ["arm64"]
bins: ["python3"]
install:
- id: "deps"
kind: "manual"
label: "安装依赖"
instructions: "pip3 install -r requirements.txt"
为 Telegram 和 WhatsApp 的语音消息免费转文字。 无需 API 密钥,无需费用。在您的 Mac 上运行。
语音转文字 API 需要付费:
- OpenAI Whisper: $0.006/分钟
- Groq: $0.001/分钟
- AssemblyAI: $0.01/分钟
如果您需要转录大量 Telegram 语音消息,费用会累积起来。
此技能在您的 Mac 本地运行 Whisper。质量相同,零成本。
tools.media.audio 配置pip3 install -r requirements.txt
python3 scripts/daemon.py
首次运行将下载 Whisper 模型(约 1.5GB)。请等待出现 "Ready" 消息。
将以下内容添加到您的 ~/.openclaw/openclaw.json 文件中:
{
"tools": {
"media": {
"audio": {
"enabled": true,
"models": [
{
"type": "cli",
"command": "~/.openclaw/workspace/skills/local-whisper/scripts/transcribe.sh",
"args": ["{{MediaPath}}"],
"timeoutSeconds": 60
}
]
}
}
}
}
openclaw gateway restart
现在,来自 Telegram、WhatsApp 等的语音消息将免费在本地进行转录!
./scripts/transcribe.sh voice_message.ogg
无需付费使用 OpenAI API 来转录收到的语音消息,只需将 OpenClaw 指向此本地守护进程。即可获得永久免费的转录服务。
cp com.local-whisper.plist ~/Library/LaunchAgents/
launchctl load ~/Library/LaunchAgents/com.local-whisper.plist
守护进程运行在 localhost:8787:
curl -X POST http://localhost:8787/transcribe -F "file=@audio.ogg"
# {"text": "Hello world", "language": "en"}
支持任何语言 → 英语:
./scripts/transcribe.sh spanish_audio.ogg --translate
MIT