OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  whisper-mlx-local:适用于 Telegram 和 WhatsApp 的免费本地语音转文本

whisper-mlx-local:适用于 Telegram 和 WhatsApp 的免费本地语音转文本

 
  kernel ·  2026-02-06 03:31:23 · 3 次点击  · 0 条评论  

名称: whisper-mlx-local
描述: "基于 MLX Whisper 在 Apple Silicon 上为 Telegram 和 WhatsApp 提供免费的本地语音转文字服务。私密、无 API 成本。"
元数据:
openclaw:
emoji: "🎤"
version: "1.5.0"
author: "社区"
repo: "https://github.com/ImpKind/local-whisper"
requires:
os: ["darwin"]
arch: ["arm64"]
bins: ["python3"]
install:
- id: "deps"
kind: "manual"
label: "安装依赖"
instructions: "pip3 install -r requirements.txt"


本地 Whisper

为 Telegram 和 WhatsApp 的语音消息免费转文字。 无需 API 密钥,无需费用。在您的 Mac 上运行。

问题所在

语音转文字 API 需要付费:
- OpenAI Whisper: $0.006/分钟
- Groq: $0.001/分钟
- AssemblyAI: $0.01/分钟

如果您需要转录大量 Telegram 语音消息,费用会累积起来。

解决方案

此技能在您的 Mac 本地运行 Whisper。质量相同,零成本

  • ✅ 永久免费
  • ✅ 私密(音频永不离开您的 Mac)
  • ✅ 快速(每条消息约 1 秒)
  • ✅ 可离线工作

⚠️ 重要提示

  • 首次运行会下载约 1.5GB 的模型 — 请耐心等待,此操作仅需一次
  • 首次转录速度较慢 — 模型需加载到内存(约 10-30 秒),之后即为瞬时完成
  • 已经在使用 OpenAI API 进行转录? 请用下方的配置替换您现有的 tools.media.audio 配置

快速开始

1. 安装依赖

pip3 install -r requirements.txt

2. 启动守护进程

python3 scripts/daemon.py

首次运行将下载 Whisper 模型(约 1.5GB)。请等待出现 "Ready" 消息。

3. 添加到 OpenClaw 配置

将以下内容添加到您的 ~/.openclaw/openclaw.json 文件中:

{
  "tools": {
    "media": {
      "audio": {
        "enabled": true,
        "models": [
          {
            "type": "cli",
            "command": "~/.openclaw/workspace/skills/local-whisper/scripts/transcribe.sh",
            "args": ["{{MediaPath}}"],
            "timeoutSeconds": 60
          }
        ]
      }
    }
  }
}

4. 重启网关

openclaw gateway restart

现在,来自 Telegram、WhatsApp 等的语音消息将免费在本地进行转录!

手动测试

./scripts/transcribe.sh voice_message.ogg

使用场景:Telegram 语音消息

无需付费使用 OpenAI API 来转录收到的语音消息,只需将 OpenClaw 指向此本地守护进程。即可获得永久免费的转录服务。

登录时自动启动

cp com.local-whisper.plist ~/Library/LaunchAgents/
launchctl load ~/Library/LaunchAgents/com.local-whisper.plist

API

守护进程运行在 localhost:8787

curl -X POST http://localhost:8787/transcribe -F "file=@audio.ogg"
# {"text": "Hello world", "language": "en"}

翻译功能

支持任何语言 → 英语:

./scripts/transcribe.sh spanish_audio.ogg --translate

系统要求

  • 搭载 Apple Silicon(M1/M2/M3/M4)的 macOS
  • Python 3.9+

许可证

MIT

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor