名称: transcribee
描述: 通过说话人分离技术转录 YouTube 视频及本地音视频文件。当用户要求转录 YouTube 链接、播客、视频或音频文件时使用。输出清晰、带说话人标签的转录文本,便于 LLM 分析。
通过 ElevenLabs 实现说话人分离,转录 YouTube 视频及本地媒体文件。
# YouTube 视频
transcribee "https://www.youtube.com/watch?v=..."
# 本地视频
transcribee ~/path/to/video.mp4
# 本地音频
transcribee ~/path/to/podcast.mp3
如果 URL 包含 & 或其他特殊字符,请务必使用引号。
转录文件将保存至:~/Documents/transcripts/{category}/{title}-{date}/
| 文件 | 用途 |
|---|---|
transcription.txt |
带说话人标签的转录文本 |
transcription-raw.txt |
纯文本,无说话人标签 |
transcription-raw.json |
包含逐词时间戳的 JSON 数据 |
metadata.json |
视频信息、语言、分类等元数据 |
brew install yt-dlp ffmpeg
| 错误 | 解决方法 |
|---|---|
yt-dlp not found |
执行 brew install yt-dlp |
ffmpeg not found |
执行 brew install ffmpeg |
| API 错误 | 检查 transcribee 目录下的 .env 配置文件 |