一体化 AI 框架
txtai 是一个用于语义搜索、LLM 编排和语言模型工作流的一体化 AI 框架。


txtai 的核心组件是一个嵌入数据库,它融合了向量索引(稀疏和稠密)、图网络和关系型数据库。
这一基础架构支持向量搜索,并可作为大型语言模型(LLM)应用的强大知识源。
你可以用它构建自主智能体、检索增强生成(RAG)流程、多模型工作流等。
txtai 功能摘要:
txtai 基于 Python 3.10+、Hugging Face Transformers、Sentence Transformers 和 FastAPI 构建。txtai 采用 Apache 2.0 许可证开源。
[!NOTE]
NeuML 是 txtai 背后的公司,我们围绕该技术栈提供 AI 咨询服务。预约会议 或 发送邮件 了解更多信息。
我们还在构建一个简单、安全的方式来运行托管的 txtai 应用:txtai.cloud。


新的向量数据库、LLM 框架以及各种中间件如雨后春笋般涌现。为什么要选择 txtai 进行构建?
# 几行代码即可开始
import txtai
embeddings = txtai.Embeddings()
embeddings.index(["正确", "非我们所愿"])
embeddings.search("积极", 1)
#[(0, 0.29862046241760254)]
# app.yml
embeddings:
path: sentence-transformers/all-MiniLM-L6-v2
CONFIG=app.yml uvicorn "txtai.api:app"
curl -X GET "http://localhost:8000/search?query=positive"
以下部分介绍常见的 txtai 应用场景。我们还提供了涵盖 70 多个 示例笔记本和应用程序 的完整集合。
构建语义/相似性/向量/神经搜索应用。

传统搜索系统使用关键词查找数据。语义搜索能够理解自然语言,并找出具有相同含义(而非相同关键词)的结果。


从以下示例开始学习。
| 笔记本 | 描述 | |
|---|---|---|
| txtai 介绍 ▶️ | txtai 功能概述 | |
| 图像相似性搜索 | 将图像和文本嵌入到同一空间进行搜索 | |
| 构建问答数据库 | 使用语义搜索进行问题匹配 | |
| 语义图 | 探索主题、数据连接性并进行网络分析 |
自主智能体、检索增强生成(RAG)、与数据对话、以及与大型语言模型(LLM)交互的管道和工作流。

通过以下内容了解更多。
| 笔记本 | 描述 | |
|---|---|---|
| 提示模板和任务链 | 构建模型提示并通过工作流连接任务 | |
| 集成 LLM 框架 | 集成 llama.cpp、LiteLLM 和自定义生成框架 | |
| 使用 LLM 构建知识图谱 | 通过 LLM 驱动的实体抽取构建知识图谱 | |
| 用 txtai 解析星空 | 探索已知恒星、行星、星系的天文知识图谱 |
智能体将嵌入、管道、工作流和其他智能体连接起来,以自主解决复杂问题。

txtai 智能体基于 smolagents 框架构建。它支持 txtai 支持的所有 LLM(Hugging Face、llama.cpp、通过 LiteLLM 的 OpenAI / Claude / AWS Bedrock)。同时支持使用 agents.md 和 skill.md 进行智能体提示。
查看这个 智能体快速入门示例。更多示例如下。
| 笔记本 | 描述 | |
|---|---|---|
| 使用图和智能体分析 Hugging Face 帖子 | 使用图分析和智能体探索丰富的数据集 | |
| 授予智能体自主权 | 智能体可根据需要迭代地解决问题 | |
| 使用图和智能体分析 LinkedIn 公司帖子 | 探索如何利用 AI 提升社交媒体参与度 |
检索增强生成(RAG)通过使用知识库作为上下文来约束输出,从而降低 LLM 产生幻觉的风险。RAG 通常用于“与你的数据对话”。


查看这个 RAG 快速入门示例。更多示例如下。
| 笔记本 | 描述 | |
|---|---|---|
| 使用 txtai 构建 RAG 管道 ▶️ | 检索增强生成指南,包括如何创建引用 | |
| RAG 不仅仅是向量搜索 | 通过 Web、SQL 和其他来源进行上下文检索 | |
| 使用 Wikipedia 和 GPT OSS 进行 GraphRAG | 深度图搜索驱动的 RAG | |
| 语音到语音 RAG ▶️ | 包含 RAG 的完整语音到语音工作流 |
语言模型工作流,也称为语义工作流,将语言模型连接起来以构建智能应用。


虽然 LLM 功能强大,但对于特定任务,有许多更小、更专业的模型表现更好、更快。这包括用于抽取式问答、自动摘要、文本转语音、转录和翻译的模型。
查看这个 工作流快速入门示例。更多示例如下。
| 笔记本 | 描述 | |
|---|---|---|
| 运行管道工作流 ▶️ | 高效处理数据的简单而强大的结构 | |
| 构建抽象文本摘要 | 运行抽象文本摘要 | [![在 Colab |