OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  asr: 极速且超低成本的自动语音转文字 (ASR) 技能

asr: 极速且超低成本的自动语音转文字 (ASR) 技能

 
  ocmuuu ·  2026-02-02 14:07:40 · 3 次点击  · 0 条评论  

Speech is Cheap (IC) 技能

快速、准确且极其经济的自动语音转文字转录服务。

🚀 为何选择此技能?

  • 颠覆性定价: 每小时 0.06 - 0.12 美元(比 Deepgram 或 OpenAI 便宜 2-15 倍)。
  • 极速处理: 约 1 分钟即可转录 100 分钟的音频。
  • 多语言支持: 支持 100 种语言,并自动检测。
  • 为智能体而生: 专为高容量、自动化流程设计。

🛠 设置

1. 获取 API 密钥

speechischeap.com 注册。使用优惠码 CH5 可减免 5 美元。

2. 配置认证

此技能会从 SIC_API_KEY 环境变量中读取您的 API 密钥。

将其添加到您的 .env 文件或智能体配置中:

SIC_API_KEY=你的密钥在此

📖 使用方法

🤖 智能体快速指南

安装此技能后,您可以在 OpenClaw 会话中转录任何 URL,并通过运行以下命令立即获取 JSON 结果:
./skills/asr/scripts/asr.sh transcribe --url "https://example.com/audio.mp3"

转录 URL 音频

# 基础转录
./skills/asr/scripts/asr.sh transcribe --url "https://example.com/audio.mp3"

# 带选项的高级转录
./skills/asr/scripts/asr.sh transcribe --url "https://example.com/audio.mp3" \
  --speakers --words --labels \
  --language "en" \
  --format "srt" \
  --private

转录本地文件

非常适合处理已存储在磁盘上的音频文件。此功能会自动处理上传。

# 上传并转录本地媒体文件
./skills/asr/scripts/asr.sh transcribe --file "./local-audio.wav"

# 上传并设置 Webhook 回调
./skills/asr/scripts/asr.sh transcribe --file "./local-audio.wav" --webhook "https://mysite.com/callback"

# 注意:对于本地文件,技能会先将其多部分上传至
# https://upload.speechischeap.com,然后再开始转录。

支持的选项

  • --speakers: 启用说话人分离
  • --words: 启用词级时间戳
  • --labels: 启用音频标签(音乐、噪音等)
  • --stream: 启用流式输出
  • --private: 不存储音频/转录文本(隐私模式)
  • --language <code>: ISO 语言代码(例如 'en', 'es')
  • --confidence <float>: 最小置信度阈值(默认 0.5)
  • --format <fmt>: 输出格式(json, srt, vtt, webvtt)
  • --webhook <url>: 接收任务完成通知的 URL
  • --segment-duration <n>: 分段时长(秒),默认 30

检查任务状态

./skills/asr/scripts/asr.sh status "此处填写任务ID"

🤖 面向智能体

asr.sh 命令行工具在成功时默认返回 JSON 格式,便于直接解析或传递给其他工具。

如果缺少 SIC_API_KEY,工具会提供清晰的错误信息并直接链接到注册页面。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor