OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  代码  ›  Pipecat — 实时语音及多模态对话智能体框架

Pipecat — 实时语音及多模态对话智能体框架

 
  laser ·  2026-01-07 02:20:39 · 11 次点击  · 0 条评论  

pipecat

PyPI Tests codecov Docs Discord Ask DeepWiki

🎙️ Pipecat:实时语音与多模态 AI 智能体框架

Pipecat 是一个用于构建实时语音和多模态对话智能体的开源 Python 框架。它可以轻松编排音频、视频、AI 服务、不同传输协议和对话流程,让你专注于打造智能体的独特之处。

想立即上手?请尝试 快速入门

🚀 你可以构建什么

  • 语音助手 – 与 AI 进行自然、流式的对话
  • AI 伙伴 – 教练、会议助手、角色扮演
  • 多模态界面 – 语音、视频、图像等
  • 互动叙事 – 结合生成媒体的创意工具
  • 商业智能体 – 客户接待、支持机器人、引导流程
  • 复杂对话系统 – 使用结构化对话设计逻辑

🧠 为什么选择 Pipecat?

  • 语音优先:集成语音识别、文本转语音和对话处理
  • 可插拔:支持多种 AI 服务和工具
  • 可组合的流水线:通过模块化组件构建复杂行为
  • 实时性:通过不同传输协议(如 WebSocket 或 WebRTC)实现超低延迟交互

🌐 Pipecat 生态系统

📱 客户端 SDK

正在构建客户端应用程序?你可以使用我们的官方 SDK 从任何平台连接到 Pipecat:

JavaScript | React | React Native |
Swift | Kotlin | C++ | ESP32

🧭 结构化对话

想要构建结构化对话?请查看 Pipecat Flows,它用于管理复杂的对话状态和转换。

🪄 精美的用户界面

想要构建美观且引人入胜的体验?请查看 Voice UI Kit,这是一个用于快速构建语音 AI 应用程序的组件、钩子和模板集合。

🛠️ 创建和部署项目

使用 Pipecat CLI 在一分钟内创建一个新项目。然后使用 CLI 监控并将你的智能体部署到生产环境。

🔍 调试

需要帮助调试流水线和处理器?请查看 Whisker,这是一个实时的 Pipecat 调试器。

🖥️ 终端

喜欢终端应用程序?请查看 Tail,这是一个 Pipecat 的终端仪表板。

🤖 Claude Code 技能

Claude Code 中使用 Pipecat Skills 来搭建项目、部署到 Pipecat Cloud 等。通过以下命令安装市场:

claude plugin marketplace add pipecat-ai/skills

并安装任何可用的插件。

📺️ Pipecat TV 频道

在我们的 Pipecat TV 频道上观看新功能、访谈和教程。

🎬 实际效果展示

 
 

🧩 支持的服务

类别 服务
语音转文本 (STT) AssemblyAI, AWS, Azure, Cartesia, Deepgram, ElevenLabs, Fal Wizper, Gladia, Google, Gradium, Groq (Whisper), Hathora, NVIDIA Riva, OpenAI (Whisper), SambaNova (Whisper), Sarvam, Soniox, Speechmatics, Whisper
大语言模型 (LLM) Anthropic, AWS, Azure, Cerebras, DeepSeek, Fireworks AI, Gemini, Grok, Groq, Mistral, NVIDIA NIM, Ollama, OpenAI, OpenRouter, Perplexity, Qwen, SambaNova Together AI
文本转语音 (TTS) Async, AWS, Azure, Camb AI, Cartesia, Deepgram, ElevenLabs, Fish, Google, Gradium, Groq, Hathora, Hume, Inworld, LMNT, MiniMax, Neuphonic, NVIDIA Riva, OpenAI, Piper, Resemble, Rime, Sarvam, Speechmatics, XTTS
语音转语音 (S2S) AWS Nova Sonic, Gemini Multimodal Live, Grok Voice Agent, OpenAI Realtime, Ultravox,
传输协议 Daily (WebRTC), FastAPI Websocket, SmallWebRTCTransport, WebSocket Server, Local
序列化器 Exotel, Plivo, Twilio, Telnyx, Vonage
视频 HeyGen, LemonSlice, Tavus, Simli
记忆 mem0
视觉与图像 fal, Google Imagen, Moondream
音频处理 Silero VAD, Krisp, Koala, ai-coustics
分析与指标 OpenTelemetry, Sentry

📚 查看完整服务文档 →

⚡ 快速开始

你可以先在本地机器上运行 Pipecat 开始体验,待准备就绪后再将智能体进程迁移到云端。

  1. 安装 uv

    bash curl -LsSf https://astral.sh/uv/install.sh | sh

    需要帮助? 请参考 uv 安装文档

  2. 安装模块

    ```bash

    对于新项目

    uv init my-pipecat-app
    cd my-pipecat-app
    uv add pipecat-ai

    或者对于已有项目

    uv add pipecat-ai
    ```

  3. 设置环境变量

    bash cp env.example .env

  4. 为了保持轻量,默认只包含核心框架。如果你需要第三方 AI 服务的支持,可以通过以下命令添加必要的依赖:

    bash uv add "pipecat-ai[option,...]"

使用 pip? 你仍然可以使用 pip install pipecat-aipip install "pipecat-ai[option,...]" 来设置。

🧪 代码示例

  • 基础示例 – 相互构建的小片段,每次介绍一两个概念
  • 应用示例 – 完整的应用程序,可作为开发的起点

🛠️ 为框架做贡献

先决条件

最低 Python 版本: 3.10
推荐 Python 版本: 3.12

设置步骤

  1. 克隆仓库并进入目录:

    bash git clone https://github.com/pipecat-ai/pipecat.git cd pipecat

  2. 安装开发和测试依赖:

    bash uv sync --group dev --all-extras \ --no-extra gstreamer \ --no-extra krisp \ --no-extra local \

  3. 安装 git pre-commit 钩子:

    bash uv run pre-commit install

注意:某些额外功能(local, gstreamer)需要系统依赖。如果遇到构建错误,请参阅文档。

Claude Code 技能

11 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 24 ms
Developed with Cursor