OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  pocket-tts:便携、轻量级的文本转语音工具

pocket-tts:便携、轻量级的文本转语音工具

 
  commit ·  2026-02-06 01:11:25 · 3 次点击  · 0 条评论  

Pocket TTS 技能

基于 Kyutai Pocket TTS 模型的完全本地、离线文本转语音工具。无需任何 API 调用或网络连接即可从文本生成高质量音频。内置 8 种语音,支持语音克隆,完全在 CPU 上运行。

特性

  • 🎯 完全本地化 - 无需 API 调用,完全离线运行
  • 🚀 仅需 CPU - 无需 GPU,可在任何计算机上运行
  • 快速生成 - 在 CPU 上约为实时速度的 2-6 倍
  • 🎤 8 种内置语音 - alba、marius、javert、jean、fantine、cosette、eponine、azelma
  • 🎭 语音克隆 - 从 WAV 样本克隆任意语音
  • 🔊 低延迟 - 首个音频块约 200 毫秒
  • 📚 简洁的 Python API - 易于集成到任何项目中

安装

# 1. 在 Hugging Face 上接受模型许可协议
# https://huggingface.co/kyutai/pocket-tts

# 2. 安装包
pip install pocket-tts

# 或使用 uv 进行自动依赖管理
uvx pocket-tts generate "Hello world"

使用

命令行界面

# 基础用法
pocket-tts "你好,我是你的 AI 助手"

# 指定语音
pocket-tts "你好" --voice alba --output hello.wav

# 使用自定义语音文件(语音克隆)
pocket-tts "你好" --voice-file myvoice.wav --output output.wav

# 调整语速
pocket-tts "你好" --speed 1.2

# 启动本地服务器
pocket-tts --serve

# 列出可用语音
pocket-tts --list-voices

Python API

from pocket_tts import TTSModel
import scipy.io.wavfile

# 加载模型
tts_model = TTSModel.load_model()

# 获取语音状态
voice_state = tts_model.get_state_for_audio_prompt(
    "hf://kyutai/tts-voices/alba-mackenna/casual.wav"
)

# 生成音频
audio = tts_model.generate_audio(voice_state, "你好,世界!")

# 保存为 WAV 文件
scipy.io.wavfile.write("output.wav", tts_model.sample_rate, audio.numpy())

# 检查采样率
print(f"采样率: {tts_model.sample_rate} Hz")

可用语音

语音 描述
alba 随意的女性语音
marius 男性语音
javert 清晰的男性语音
jean 自然的男性语音
fantine 女性语音
cosette 女性语音
eponine 女性语音
azelma 女性语音

或使用 --voice-file /path/to/wav.wav 进行自定义语音克隆。

选项

选项 描述 默认值
text 要转换的文本 必填
-o, --output 输出 WAV 文件 output.wav
-v, --voice 预设语音 alba
-s, --speed 语速 (0.5-2.0) 1.0
--voice-file 用于克隆的自定义 WAV 文件
--serve 启动 HTTP 服务器
--list-voices 列出所有语音

要求

  • Python 3.10-3.14
  • PyTorch 2.5+(CPU 版本可用)
  • 至少 2 个 CPU 核心

注意事项

  • ⚠️ 模型需授权 - 请先在 Hugging Face 上接受许可协议
  • 🌍 仅支持英语(v1 版本)
  • 💾 首次运行会下载模型(约 1 亿参数)
  • 🔊 音频以 1D torch 张量(PCM 数据)形式返回

相关链接

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor