OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  assemblyai-transcribe:使用 AssemblyAI 转录音频和视频

assemblyai-transcribe:使用 AssemblyAI 转录音频和视频

 
  protocol ·  2026-02-05 20:18:04 · 3 次点击  · 0 条评论  

名称: assemblyai-transcribe
描述: 使用 AssemblyAI 转录音频/视频(支持本地上传或 URL),并可导出字幕、段落和句子。
主页: https://www.assemblyai.com/docs
user-invocable: true
元数据: {"clawdbot":{"skillKey":"assemblyai","emoji":"🎙️","requires":{"bins":["node"],"env":["ASSEMBLYAI_API_KEY"]},"primaryEnv":"ASSEMBLYAI_API_KEY"}}


AssemblyAI 转录与导出工具

当你需要使用 AssemblyAI 转录音频/视频,或导出可读格式(如字幕、段落、句子)时,可使用此技能。

此技能中的辅助脚本实现了基本的 REST 流程:

  1. (本地文件)通过 POST /v2/upload 上传。
  2. 通过 POST /v2/transcript 创建转录任务。
  3. 轮询 GET /v2/transcript/:id 直到转录状态变为 completed(或 error)。

环境配置

此技能需要:

  • 在 PATH 中安装 node(推荐 Node.js 18+;脚本使用内置 fetch)
  • 在环境中设置 ASSEMBLYAI_API_KEY

推荐的 Clawdbot 配置(~/.clawdbot/clawdbot.json):

{
  skills: {
    entries: {
      // 此技能声明了 metadata.clawdbot.skillKey = "assemblyai"
      assemblyai: {
        enabled: true,
        // 由于此技能声明了 primaryEnv = ASSEMBLYAI_API_KEY,
        // 你可以使用 apiKey 作为便捷设置:
        apiKey: "YOUR_ASSEMBLYAI_KEY",
        env: {
          ASSEMBLYAI_API_KEY: "YOUR_ASSEMBLYAI_KEY",

          // 可选:使用欧盟异步端点
          // ASSEMBLYAI_BASE_URL: "https://api.eu.assemblyai.com"
        }
      }
    }
  }
}

使用方法

通过 Exec 工具运行以下命令。

转录(本地文件或公开 URL)

将转录文本输出到 stdout:

node {baseDir}/assemblyai.mjs transcribe "./path/to/audio.mp3"
node {baseDir}/assemblyai.mjs transcribe "https://example.com/audio.mp3"

将转录内容写入文件(推荐用于长音频):

node {baseDir}/assemblyai.mjs transcribe "./path/to/audio.mp3" --out ./transcript.txt

传递高级转录选项

可通过 --config 传递 POST /v2/transcript 支持的任何字段:

node {baseDir}/assemblyai.mjs transcribe "./path/to/audio.mp3" \
  --config '{"speaker_labels":true,"summarization":true,"summary_model":"informative","summary_type":"bullets"}' \
  --export json \
  --out ./transcript.json

导出字幕(SRT/VTT)

转录并立即导出字幕:

node {baseDir}/assemblyai.mjs transcribe "./path/to/video.mp4" --export srt --out ./subtitles.srt
node {baseDir}/assemblyai.mjs transcribe "./path/to/video.mp4" --export vtt --out ./subtitles.vtt

或从现有转录 ID 导出字幕:

node {baseDir}/assemblyai.mjs subtitles <transcript_id> srt --out ./subtitles.srt

导出段落 / 句子

node {baseDir}/assemblyai.mjs paragraphs <transcript_id> --out ./paragraphs.txt
node {baseDir}/assemblyai.mjs sentences <transcript_id> --out ./sentences.txt

获取现有转录

node {baseDir}/assemblyai.mjs get <transcript_id> --format json
node {baseDir}/assemblyai.mjs get <transcript_id> --wait --format text

使用建议

  • 当输出内容可能较大时,推荐使用 --out <file> 参数。
  • 避免在日志和聊天中暴露 API 密钥;请依赖环境变量注入。
  • 如果用户要求欧盟数据处理/数据驻留,请将 ASSEMBLYAI_BASE_URL 设置为欧盟主机。
  • AssemblyAI 要求上传和后续的转录请求使用同一 AssemblyAI 项目的 API 密钥(否则可能遇到 403 错误 / 'Cannot access uploaded file')。
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor