名称: mlx-stt
描述: 使用 MLX(Apple Silicon)和开源模型(默认为 GLM-ASR-Nano-2512)在本地进行语音转文本。
版本: 1.0.7
作者: guoqiao
元数据: {"openclaw":{"always":true,"emoji":"🦞","homepage":"https://github.com/guoqiao/skills/blob/main/mlx-stt/mlx-stt/SKILL.md","os":["darwin"],"requires":{"bins":["brew"]}}}
触发器:
- "/mlx-stt
使用 MLX(Apple Silicon)和开源模型(默认为 GLM-ASR-Nano-2512)在本地进行语音转文本/自动语音识别/转录。
免费且准确。无需 API 密钥,也无需服务器。
mlx:配备 Apple Silicon 芯片的 macOS 系统brew:用于在依赖项缺失时进行安装bash ${baseDir}/install.sh
此脚本将使用 brew 安装以下命令行工具(如果尚未安装):
- ffmpeg:在需要时转换音频格式
- uv:安装 Python 包并运行 Python 脚本
- mlx_audio:执行核心的语音转文本任务
要转录一个音频文件,请运行此脚本:
bash ${baseDir}/mlx-stt.sh <音频文件路径>