OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  transcribe:使用本地 Docker 版 Whisper 将音频文件转录为文本

transcribe:使用本地 Docker 版 Whisper 将音频文件转录为文本

 
  backend ·  2026-02-06 02:14:42 · 3 次点击  · 0 条评论  

名称: transcribe
描述: 使用本地 Whisper(Docker)将音频文件转录为文本。适用于接收语音消息、音频文件(.mp3、.m4a、.ogg、.wav、.webm)或被要求转录音频内容时。


音频转录

使用 Docker 中的 faster-whisper 进行本地音频转录。

安装

cd /path/to/skills/transcribe/scripts
chmod +x install.sh
./install.sh

此命令将构建 Docker 镜像 whisper:local 并安装 transcribe 命令行工具。

使用方法

transcribe /path/to/audio.mp3 [language]
  • 默认语言:es(西班牙语)
  • 使用 auto 进行自动语言检测
  • 将纯文本结果输出到标准输出

示例

transcribe /tmp/voice.ogg          # 西班牙语(默认)
transcribe /tmp/meeting.mp3 en     # 英语
transcribe /tmp/audio.m4a auto     # 自动检测语言

支持的格式

mp3、m4a、ogg、wav、webm、flac、aac

接收语音消息时的处理流程

  1. 将音频附件保存为临时文件
  2. 运行 transcribe <文件路径>
  3. 在回复中包含转录文本
  4. 清理临时文件

文件说明

  • scripts/transcribe - 命令行封装脚本(bash)
  • scripts/install.sh - 安装脚本(内含 Dockerfile)

注意事项

  • 默认模型:small(速度快)— 如需使用 large-v3(更准确),请编辑 install.sh 脚本
  • 完全本地运行,无需 API 密钥
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor