eosphoros-ai/DB-GPTPlease refer to the latest official releases for information GitHub Homepage

AI原生数据应用开发框架，基于AWEL和多Agent构建数据智能应用

MITPython 16.8keosphoros-ai Last Updated: 2025-06-20

DB-GPT：AI原生数据应用开发框架

项目概述

DB-GPT是一个开源的AI原生数据应用开发框架，集成了AWEL（Agentic Workflow Expression Language）和多Agent系统。该项目旨在通过开发多种技术能力，如多模型管理(SMMF)、Text2SQL效果优化、RAG框架和优化、多Agent框架协作、AWEL(agent工作流编排)等，在大模型领域构建基础设施，使得基于数据的大模型应用变得更加简单和便捷。

在Data 3.0时代，基于模型和数据库，企业和开发者可以用更少的代码构建自己的定制应用。

核心架构与能力

主要功能模块

1. RAG（检索增强生成）

RAG是目前最实用且迫切需要的领域。DB-GPT已经实现了基于RAG的框架，允许用户使用DB-GPT的RAG功能构建知识库应用。

2. GBI（生成式商业智能）

生成式BI是DB-GPT项目的核心能力之一，为构建企业报表分析和业务洞察提供基础数据智能技术。

3. 微调框架

模型微调是任何企业在垂直和细分领域实施的不可或缺的能力。DB-GPT提供了一个完整的微调框架，与DB-GPT项目无缝集成。在最近的微调工作中，基于Spider数据集实现了82.5%的准确率。

4. 数据驱动多Agent框架

DB-GPT提供了一个数据驱动的自进化多Agent框架，旨在基于数据持续做出决策和执行。

5. 数据工厂

数据工厂主要负责在大模型时代清理和处理可信的知识和数据。

6. 数据源集成

集成各种数据源，将生产业务数据无缝连接到DB-GPT的核心功能。

关联项目

DB-GPT-Hub

DB-GPT-Hub专注于通过在大语言模型(LLMs)上应用监督微调(SFT)来实现高性能的Text-to-SQL工作流。

dbgpts

dbgpts是官方仓库，包含一些基于DB-GPT构建的数据应用、AWEL操作符、AWEL工作流模板和智能体。

DB-GPT-Plugins

DB-GPT插件，可以直接运行Auto-GPT插件。

支持的语言模型

DB-GPT支持广泛的大语言模型，包括：

开源模型：
- LLaMA / LLaMA-2 / LLaMA-3 / LLaMA-3.1
- BLOOM / BLOOMZ
- Falcon
- Baichuan / Baichuan2
- InternLM
- Qwen系列 (Qwen2.5, Qwen3等)
- XVERSE
- ChatGLM2 / GLM-4
- DeepSeek系列
- Yi系列
- Gemma系列
- Phi-3
- CodeQwen
- Mixtral
- SOLAR
API模型：
- 文心一言
- 通义千问
- 智谱AI
- 等其他API服务

主要特性

1. 私域问答与数据处理

DB-GPT项目提供了一系列功能，旨在改进知识库构建，实现结构化和非结构化数据的高效存储和检索。这些功能包括：

内置多种文件格式上传支持
集成自定义数据提取插件的能力
统一的向量存储和检索功能

2. 多数据源与GBI

该项目促进与多样化数据源的无缝自然语言交互，包括Excel、数据库和数据仓库。它简化了从这些源查询和检索信息的过程，使用户能够进行直观的对话并获得洞察。此外，DB-GPT支持生成分析报告。

3. 多Agent和插件

它提供对自定义插件的支持以执行各种任务，并原生集成Auto-GPT插件模型。Agent协议遵循Agent Protocol标准。

4. 自动化Text2SQL微调

我们还开发了一个以大语言模型(LLMs)、Text2SQL数据集、LoRA/QLoRA/Pturning和其他微调方法为中心的自动化微调轻量级框架。该框架简化了Text-to-SQL微调，使其像装配线流程一样简单。

5. SMMF（面向服务的多模型管理框架）

我们提供广泛的模型支持，包括来自开源和API代理的数十个大语言模型(LLMs)，如LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通义、智谱等。

隐私与安全

我们通过实施各种技术，包括私有化大模型和代理脱敏，确保数据的隐私和安全。

支持的数据源

在.env配置文件中，修改LANGUAGE参数以切换到不同语言。默认为英文（中文：zh，英文：en，其他语言稍后添加）。

技术架构

DB-GPT采用模块化架构设计，主要包括：

AWEL工作流编排层：提供智能体工作流的表达和编排能力
多模型管理层：统一管理和调度不同的大语言模型
数据接入层：支持多种数据源的接入和处理
智能体协作层：实现多个AI智能体之间的协作
应用服务层：提供面向最终用户的应用服务