OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  代码  ›  txtai — 集成语义搜索、RAG 与工作流的轻量框架

txtai — 集成语义搜索、RAG 与工作流的轻量框架

 
  nine ·  2026-02-11 23:30:54 · 6 次点击  · 0 条评论  

一体化 AI 框架

版本 GitHub 最后提交 GitHub 问题 加入 Slack 构建状态 覆盖率状态

txtai 是一个用于语义搜索、LLM 编排和语言模型工作流的一体化 AI 框架。

架构
架构

txtai 的核心组件是一个嵌入数据库,它融合了向量索引(稀疏和稠密)、图网络和关系型数据库。

这一基础架构支持向量搜索,并可作为大型语言模型(LLM)应用的强大知识源。

你可以用它构建自主智能体、检索增强生成(RAG)流程、多模型工作流等。

txtai 功能摘要:

  • 🔎 支持 SQL、对象存储、主题建模、图分析和多模态索引的向量搜索
  • 📄 为文本、文档、音频、图像和视频创建嵌入向量
  • 💡 由语言模型驱动的管道,可运行 LLM 提示、问答、标注、转录、翻译、摘要等任务
  • ↪️️ 将多个管道连接并聚合业务逻辑的工作流。txtai 进程可以是简单的微服务,也可以是复杂的多模型工作流。
  • 🤖 智能连接嵌入、管道、工作流和其他智能体以自主解决复杂问题的智能体
  • ⚙️ Web 和模型上下文协议(MCP)API。提供 JavaScriptJavaRustGo 的绑定库。
  • 🔋 开箱即用,提供默认配置以便快速上手
  • ☁️ 可在本地运行,也可通过容器编排进行扩展

txtai 基于 Python 3.10+、Hugging Face TransformersSentence TransformersFastAPI 构建。txtai 采用 Apache 2.0 许可证开源。

[!NOTE]

NeuML 是 txtai 背后的公司,我们围绕该技术栈提供 AI 咨询服务。预约会议发送邮件 了解更多信息。

我们还在构建一个简单、安全的方式来运行托管的 txtai 应用:txtai.cloud

为什么选择 txtai?

原因
原因

新的向量数据库、LLM 框架以及各种中间件如雨后春笋般涌现。为什么要选择 txtai 进行构建?

  • 快速上手:通过 pipDocker 几分钟内即可运行
# 几行代码即可开始
import txtai

embeddings = txtai.Embeddings()
embeddings.index(["正确", "非我们所愿"])
embeddings.search("积极", 1)
#[(0, 0.29862046241760254)]
  • 内置 API:便于使用你选择的编程语言开发应用
# app.yml
embeddings:
    path: sentence-transformers/all-MiniLM-L6-v2
CONFIG=app.yml uvicorn "txtai.api:app"
curl -X GET "http://localhost:8000/search?query=positive"
  • 本地运行:无需将数据发送到分散的远程服务
  • 模型灵活:从微型模型到大型语言模型(LLM)均可使用
  • 低资源占用:按需安装额外依赖并进行扩展
  • 示例学习:涵盖所有功能的 示例笔记本

应用场景

以下部分介绍常见的 txtai 应用场景。我们还提供了涵盖 70 多个 示例笔记本和应用程序 的完整集合。

语义搜索

构建语义/相似性/向量/神经搜索应用。

演示

传统搜索系统使用关键词查找数据。语义搜索能够理解自然语言,并找出具有相同含义(而非相同关键词)的结果。

搜索
搜索

从以下示例开始学习。

笔记本 描述
txtai 介绍 ▶️ txtai 功能概述 在 Colab 中打开
图像相似性搜索 将图像和文本嵌入到同一空间进行搜索 在 Colab 中打开
构建问答数据库 使用语义搜索进行问题匹配 在 Colab 中打开
语义图 探索主题、数据连接性并进行网络分析 在 Colab 中打开

LLM 编排

自主智能体、检索增强生成(RAG)、与数据对话、以及与大型语言模型(LLM)交互的管道和工作流。

llm

通过以下内容了解更多。

笔记本 描述
提示模板和任务链 构建模型提示并通过工作流连接任务 在 Colab 中打开
集成 LLM 框架 集成 llama.cpp、LiteLLM 和自定义生成框架 在 Colab 中打开
使用 LLM 构建知识图谱 通过 LLM 驱动的实体抽取构建知识图谱 在 Colab 中打开
用 txtai 解析星空 探索已知恒星、行星、星系的天文知识图谱 在 Colab 中打开

智能体

智能体将嵌入、管道、工作流和其他智能体连接起来,以自主解决复杂问题。

智能体

txtai 智能体基于 smolagents 框架构建。它支持 txtai 支持的所有 LLM(Hugging Face、llama.cpp、通过 LiteLLM 的 OpenAI / Claude / AWS Bedrock)。同时支持使用 agents.mdskill.md 进行智能体提示。

查看这个 智能体快速入门示例。更多示例如下。

笔记本 描述
使用图和智能体分析 Hugging Face 帖子 使用图分析和智能体探索丰富的数据集 在 Colab 中打开
授予智能体自主权 智能体可根据需要迭代地解决问题 在 Colab 中打开
使用图和智能体分析 LinkedIn 公司帖子 探索如何利用 AI 提升社交媒体参与度 在 Colab 中打开

检索增强生成

检索增强生成(RAG)通过使用知识库作为上下文来约束输出,从而降低 LLM 产生幻觉的风险。RAG 通常用于“与你的数据对话”。

rag
rag

查看这个 RAG 快速入门示例。更多示例如下。

笔记本 描述
使用 txtai 构建 RAG 管道 ▶️ 检索增强生成指南,包括如何创建引用 在 Colab 中打开
RAG 不仅仅是向量搜索 通过 Web、SQL 和其他来源进行上下文检索 在 Colab 中打开
使用 Wikipedia 和 GPT OSS 进行 GraphRAG 深度图搜索驱动的 RAG 在 Colab 中打开
语音到语音 RAG ▶️ 包含 RAG 的完整语音到语音工作流 在 Colab 中打开

语言模型工作流

语言模型工作流,也称为语义工作流,将语言模型连接起来以构建智能应用。

工作流
工作流

虽然 LLM 功能强大,但对于特定任务,有许多更小、更专业的模型表现更好、更快。这包括用于抽取式问答、自动摘要、文本转语音、转录和翻译的模型。

查看这个 工作流快速入门示例。更多示例如下。

笔记本 描述
运行管道工作流 ▶️ 高效处理数据的简单而强大的结构 在 Colab 中打开
构建抽象文本摘要 运行抽象文本摘要 [![在 Colab
6 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 31 ms
Developed with Cursor