DB-GPT:基于 AWEL 与 Agents 的 AI 原生数据应用开发框架
🤖 DB-GPT 是一个开源的 AI 原生数据应用开发框架,集成了 AWEL(Agentic Workflow Expression Language)和智能体(Agents)。
其目标是在大模型领域构建基础设施,通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架与优化、多智能体框架协作、AWEL(智能体工作流编排)等多种技术能力,让基于数据的大模型应用开发变得更简单、更便捷。
🚀 在 Data 3.0 时代,基于模型和数据库,企业和开发者可以用更少的代码构建自己的定制化应用。
DB-GPT 的架构如下图所示:
其核心能力包括以下几个部分:
RAG(检索增强生成):RAG 是目前最具实践性和迫切需求的领域。DB-GPT 已经实现了一个基于 RAG 的框架,允许用户利用 DB-GPT 的 RAG 能力构建基于知识的应用。
GBI(生成式商业智能):生成式 BI 是 DB-GPT 项目的核心能力之一,为构建企业报表分析和业务洞察提供了基础的数据智能技术。
微调框架:模型微调是任何企业在垂直和细分领域落地不可或缺的能力。DB-GPT 提供了一个完整的微调框架,可与 DB-GPT 项目无缝集成。在最近的微调工作中,基于 Spider 数据集的准确率达到了 82.5%。
数据驱动的多智能体框架:DB-GPT 提供了一个数据驱动的自进化多智能体框架,旨在基于数据持续进行决策和执行。
数据工厂:数据工厂主要关注大模型时代可信知识和数据的清洗与处理。
数据源:集成各种数据源,将生产业务数据无缝连接到 DB-GPT 的核心能力。
| LLM | 是否支持 |
|---|---|
| LLaMA | ✅ |
| LLaMA-2 | ✅ |
| BLOOM | ✅ |
| BLOOMZ | ✅ |
| Falcon | ✅ |
| Baichuan | ✅ |
| Baichuan2 | ✅ |
| InternLM | ✅ |
| Qwen | ✅ |
| XVERSE | ✅ |
| ChatGLM2 | ✅ |
使用教程
- 安装
- Docker
- 源码
- 快速开始
- 应用
- 开发指南
- 应用使用
- AWEL 流程使用
- 调试
- 高级用法
- SMMF
- 微调
- AWEL
目前,我们引入了几个关键特性来展示当前的能力:
- 私有领域问答与数据处理
DB-GPT 项目提供了一系列功能,旨在改进知识库构建,并实现对结构化和非结构化数据的高效存储和检索。这些功能包括内置支持上传多种文件格式、集成自定义数据提取插件的能力,以及用于有效管理海量信息的统一向量存储和检索能力。
DB-GPT 项目促进了与多种数据源(包括 Excel、数据库和数据仓库)的无缝自然语言交互。它简化了从这些数据源查询和检索信息的过程,使用户能够进行直观的对话并获得洞察。此外,DB-GPT 支持生成分析报告,为用户提供有价值的数据摘要和解读。
它支持自定义插件来执行各种任务,并原生集成了 Auto-GPT 插件模型。智能体协议遵循 Agent Protocol 标准。
我们还开发了一个以大型语言模型(LLMs)、Text2SQL 数据集、LoRA/QLoRA/Pturning 等微调方法为中心的自动化微调轻量级框架。该框架简化了 Text-to-SQL 微调,使其像流水线过程一样简单。DB-GPT-Hub
SMMF(面向服务的多模型管理框架)
我们提供了广泛的模型支持,包括来自开源和 API 代理的数十种大型语言模型(LLMs),例如 LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通义、智谱等等。
新闻
| 提供商 | 是否支持 | 模型 |
|---|---|---|
| DeepSeek | ✅ | 🔥🔥🔥 DeepSeek-R1-0528 🔥🔥🔥 DeepSeek-V3-0324 🔥🔥🔥 DeepSeek-R1 🔥🔥🔥 DeepSeek-V3 🔥🔥🔥 DeepSeek-R1-Distill-Llama-70B 🔥🔥🔥 DeepSeek-R1-Distill-Qwen-32B 🔥🔥🔥 DeepSeek-Coder-V2-Instruct |
| Qwen | ✅ | 🔥🔥🔥 Qwen3-235B-A22B 🔥🔥🔥 Qwen3-30B-A3B 🔥🔥🔥 Qwen3-32B 🔥🔥🔥 QwQ-32B 🔥🔥🔥 Qwen2.5-Coder-32B-Instruct 🔥🔥🔥 Qwen2.5-Coder-14B-Instruct 🔥🔥🔥 Qwen2.5-72B-Instruct 🔥🔥🔥 Qwen2.5-32B-Instruct |
| GLM | ✅ | 🔥🔥🔥 GLM-Z1-32B-0414 🔥🔥🔥 |