Home
Login

AI原生数据应用开发框架,基于AWEL和多Agent构建数据智能应用

MITPython 16.8keosphoros-ai Last Updated: 2025-06-20

DB-GPT:AI原生数据应用开发框架

项目概述

DB-GPT是一个开源的AI原生数据应用开发框架,集成了AWEL(Agentic Workflow Expression Language)和多Agent系统。该项目旨在通过开发多种技术能力,如多模型管理(SMMF)、Text2SQL效果优化、RAG框架和优化、多Agent框架协作、AWEL(agent工作流编排)等,在大模型领域构建基础设施,使得基于数据的大模型应用变得更加简单和便捷。

在Data 3.0时代,基于模型和数据库,企业和开发者可以用更少的代码构建自己的定制应用。

核心架构与能力

主要功能模块

1. RAG(检索增强生成)

RAG是目前最实用且迫切需要的领域。DB-GPT已经实现了基于RAG的框架,允许用户使用DB-GPT的RAG功能构建知识库应用。

2. GBI(生成式商业智能)

生成式BI是DB-GPT项目的核心能力之一,为构建企业报表分析和业务洞察提供基础数据智能技术。

3. 微调框架

模型微调是任何企业在垂直和细分领域实施的不可或缺的能力。DB-GPT提供了一个完整的微调框架,与DB-GPT项目无缝集成。在最近的微调工作中,基于Spider数据集实现了82.5%的准确率。

4. 数据驱动多Agent框架

DB-GPT提供了一个数据驱动的自进化多Agent框架,旨在基于数据持续做出决策和执行。

5. 数据工厂

数据工厂主要负责在大模型时代清理和处理可信的知识和数据。

6. 数据源集成

集成各种数据源,将生产业务数据无缝连接到DB-GPT的核心功能。

关联项目

DB-GPT-Hub

DB-GPT-Hub专注于通过在大语言模型(LLMs)上应用监督微调(SFT)来实现高性能的Text-to-SQL工作流。

dbgpts

dbgpts是官方仓库,包含一些基于DB-GPT构建的数据应用、AWEL操作符、AWEL工作流模板和智能体。

DB-GPT-Plugins

DB-GPT插件,可以直接运行Auto-GPT插件。

支持的语言模型

DB-GPT支持广泛的大语言模型,包括:

  • 开源模型

    • LLaMA / LLaMA-2 / LLaMA-3 / LLaMA-3.1
    • BLOOM / BLOOMZ
    • Falcon
    • Baichuan / Baichuan2
    • InternLM
    • Qwen系列 (Qwen2.5, Qwen3等)
    • XVERSE
    • ChatGLM2 / GLM-4
    • DeepSeek系列
    • Yi系列
    • Gemma系列
    • Phi-3
    • CodeQwen
    • Mixtral
    • SOLAR
  • API模型

    • 文心一言
    • 通义千问
    • 智谱AI
    • 等其他API服务

主要特性

1. 私域问答与数据处理

DB-GPT项目提供了一系列功能,旨在改进知识库构建,实现结构化和非结构化数据的高效存储和检索。这些功能包括:

  • 内置多种文件格式上传支持
  • 集成自定义数据提取插件的能力
  • 统一的向量存储和检索功能

2. 多数据源与GBI

该项目促进与多样化数据源的无缝自然语言交互,包括Excel、数据库和数据仓库。它简化了从这些源查询和检索信息的过程,使用户能够进行直观的对话并获得洞察。此外,DB-GPT支持生成分析报告。

3. 多Agent和插件

它提供对自定义插件的支持以执行各种任务,并原生集成Auto-GPT插件模型。Agent协议遵循Agent Protocol标准。

4. 自动化Text2SQL微调

我们还开发了一个以大语言模型(LLMs)、Text2SQL数据集、LoRA/QLoRA/Pturning和其他微调方法为中心的自动化微调轻量级框架。该框架简化了Text-to-SQL微调,使其像装配线流程一样简单。

5. SMMF(面向服务的多模型管理框架)

我们提供广泛的模型支持,包括来自开源和API代理的数十个大语言模型(LLMs),如LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通义、智谱等。

隐私与安全

我们通过实施各种技术,包括私有化大模型和代理脱敏,确保数据的隐私和安全。

支持的数据源

在.env配置文件中,修改LANGUAGE参数以切换到不同语言。默认为英文(中文:zh,英文:en,其他语言稍后添加)。

技术架构

DB-GPT采用模块化架构设计,主要包括:

  • AWEL工作流编排层:提供智能体工作流的表达和编排能力
  • 多模型管理层:统一管理和调度不同的大语言模型
  • 数据接入层:支持多种数据源的接入和处理
  • 智能体协作层:实现多个AI智能体之间的协作
  • 应用服务层:提供面向最终用户的应用服务