
🎙️ Pipecat:实时语音与多模态 AI 智能体框架
Pipecat 是一个用于构建实时语音和多模态对话智能体的开源 Python 框架。它可以轻松编排音频、视频、AI 服务、不同传输协议和对话流程,让你专注于打造智能体的独特之处。
想立即上手?请尝试 快速入门。
🚀 你可以构建什么
- 语音助手 – 与 AI 进行自然、流式的对话
- AI 伙伴 – 教练、会议助手、角色扮演
- 多模态界面 – 语音、视频、图像等
- 互动叙事 – 结合生成媒体的创意工具
- 商业智能体 – 客户接待、支持机器人、引导流程
- 复杂对话系统 – 使用结构化对话设计逻辑
🧠 为什么选择 Pipecat?
- 语音优先:集成语音识别、文本转语音和对话处理
- 可插拔:支持多种 AI 服务和工具
- 可组合的流水线:通过模块化组件构建复杂行为
- 实时性:通过不同传输协议(如 WebSocket 或 WebRTC)实现超低延迟交互
🌐 Pipecat 生态系统
📱 客户端 SDK
正在构建客户端应用程序?你可以使用我们的官方 SDK 从任何平台连接到 Pipecat:
JavaScript | React | React Native |
Swift | Kotlin | C++ | ESP32
🧭 结构化对话
想要构建结构化对话?请查看 Pipecat Flows,它用于管理复杂的对话状态和转换。
🪄 精美的用户界面
想要构建美观且引人入胜的体验?请查看 Voice UI Kit,这是一个用于快速构建语音 AI 应用程序的组件、钩子和模板集合。
🛠️ 创建和部署项目
使用 Pipecat CLI 在一分钟内创建一个新项目。然后使用 CLI 监控并将你的智能体部署到生产环境。
🔍 调试
需要帮助调试流水线和处理器?请查看 Whisker,这是一个实时的 Pipecat 调试器。
🖥️ 终端
喜欢终端应用程序?请查看 Tail,这是一个 Pipecat 的终端仪表板。
🤖 Claude Code 技能
在 Claude Code 中使用 Pipecat Skills 来搭建项目、部署到 Pipecat Cloud 等。通过以下命令安装市场:
claude plugin marketplace add pipecat-ai/skills
并安装任何可用的插件。
📺️ Pipecat TV 频道
在我们的 Pipecat TV 频道上观看新功能、访谈和教程。
🎬 实际效果展示
🧩 支持的服务
| 类别 |
服务 |
| 语音转文本 (STT) |
AssemblyAI, AWS, Azure, Cartesia, Deepgram, ElevenLabs, Fal Wizper, Gladia, Google, Gradium, Groq (Whisper), Hathora, NVIDIA Riva, OpenAI (Whisper), SambaNova (Whisper), Sarvam, Soniox, Speechmatics, Whisper |
| 大语言模型 (LLM) |
Anthropic, AWS, Azure, Cerebras, DeepSeek, Fireworks AI, Gemini, Grok, Groq, Mistral, NVIDIA NIM, Ollama, OpenAI, OpenRouter, Perplexity, Qwen, SambaNova Together AI |
| 文本转语音 (TTS) |
Async, AWS, Azure, Camb AI, Cartesia, Deepgram, ElevenLabs, Fish, Google, Gradium, Groq, Hathora, Hume, Inworld, LMNT, MiniMax, Neuphonic, NVIDIA Riva, OpenAI, Piper, Resemble, Rime, Sarvam, Speechmatics, XTTS |
| 语音转语音 (S2S) |
AWS Nova Sonic, Gemini Multimodal Live, Grok Voice Agent, OpenAI Realtime, Ultravox, |
| 传输协议 |
Daily (WebRTC), FastAPI Websocket, SmallWebRTCTransport, WebSocket Server, Local |
| 序列化器 |
Exotel, Plivo, Twilio, Telnyx, Vonage |
| 视频 |
HeyGen, LemonSlice, Tavus, Simli |
| 记忆 |
mem0 |
| 视觉与图像 |
fal, Google Imagen, Moondream |
| 音频处理 |
Silero VAD, Krisp, Koala, ai-coustics |
| 分析与指标 |
OpenTelemetry, Sentry |
📚 查看完整服务文档 →
⚡ 快速开始
你可以先在本地机器上运行 Pipecat 开始体验,待准备就绪后再将智能体进程迁移到云端。
-
安装 uv
bash
curl -LsSf https://astral.sh/uv/install.sh | sh
需要帮助? 请参考 uv 安装文档。
-
安装模块
```bash
对于新项目
uv init my-pipecat-app
cd my-pipecat-app
uv add pipecat-ai
或者对于已有项目
uv add pipecat-ai
```
-
设置环境变量
bash
cp env.example .env
-
为了保持轻量,默认只包含核心框架。如果你需要第三方 AI 服务的支持,可以通过以下命令添加必要的依赖:
bash
uv add "pipecat-ai[option,...]"
使用 pip? 你仍然可以使用 pip install pipecat-ai 和 pip install "pipecat-ai[option,...]" 来设置。
🧪 代码示例
- 基础示例 – 相互构建的小片段,每次介绍一两个概念
- 应用示例 – 完整的应用程序,可作为开发的起点
🛠️ 为框架做贡献
先决条件
最低 Python 版本: 3.10
推荐 Python 版本: 3.12
设置步骤
-
克隆仓库并进入目录:
bash
git clone https://github.com/pipecat-ai/pipecat.git
cd pipecat
-
安装开发和测试依赖:
bash
uv sync --group dev --all-extras \
--no-extra gstreamer \
--no-extra krisp \
--no-extra local \
-
安装 git pre-commit 钩子:
bash
uv run pre-commit install
注意:某些额外功能(local, gstreamer)需要系统依赖。如果遇到构建错误,请参阅文档。
Claude Code 技能