Home
Login

AI 原生資料應用開發框架,基於 AWEL 和多 Agent 建構資料智慧應用

MITPython 16.8keosphoros-ai Last Updated: 2025-06-20

DB-GPT:AI 原生資料應用開發框架

項目概述

DB-GPT 是一個開源的 AI 原生資料應用開發框架,集成了 AWEL(Agentic Workflow Expression Language)和多 Agent 系統。該項目旨在通過開發多種技術能力,如多模型管理 (SMMF)、Text2SQL 效果優化、RAG 框架和優化、多 Agent 框架協作、AWEL (agent 工作流編排) 等,在大模型領域構建基礎設施,使得基於資料的大模型應用變得更加簡單和便捷。

在 Data 3.0 時代,基於模型和資料庫,企業和開發者可以用更少的代碼構建自己的定制應用。

核心架構與能力

主要功能模組

1. RAG(檢索增強生成)

RAG 是目前最實用且迫切需要的領域。DB-GPT 已經實現了基於 RAG 的框架,允許用戶使用 DB-GPT 的 RAG 功能構建知識庫應用。

2. GBI(生成式商業智能)

生成式 BI 是 DB-GPT 專案的核心能力之一,為構建企業報表分析和業務洞察提供基礎資料智能技術。

3. 微調框架

模型微調是任何企業在垂直和細分領域實施的不可或缺的能力。DB-GPT 提供了一個完整的微調框架,與 DB-GPT 專案無縫集成。在最近的微調工作中,基於 Spider 資料集實現了 82.5% 的準確率。

4. 資料驅動多 Agent 框架

DB-GPT 提供了一個資料驅動的自進化多 Agent 框架,旨在基於資料持續做出決策和執行。

5. 資料工廠

資料工廠主要負責在大模型時代清理和處理可信的知識和資料。

6. 資料來源集成

集成各種資料來源,將生產業務資料無縫連接到 DB-GPT 的核心功能。

關聯項目

DB-GPT-Hub

DB-GPT-Hub 專注於通過在大語言模型 (LLMs) 上應用監督微調 (SFT) 來實現高性能的 Text-to-SQL 工作流。

dbgpts

dbgpts 是官方倉庫,包含一些基於 DB-GPT 構建的資料應用、AWEL 操作符、AWEL 工作流模板和智能體。

DB-GPT-Plugins

DB-GPT 插件,可以直接運行 Auto-GPT 插件。

支持的語言模型

DB-GPT 支持廣泛的大語言模型,包括:

  • 開源模型

    • LLaMA / LLaMA-2 / LLaMA-3 / LLaMA-3.1
    • BLOOM / BLOOMZ
    • Falcon
    • Baichuan / Baichuan2
    • InternLM
    • Qwen 系列 (Qwen2.5, Qwen3 等)
    • XVERSE
    • ChatGLM2 / GLM-4
    • DeepSeek 系列
    • Yi 系列
    • Gemma 系列
    • Phi-3
    • CodeQwen
    • Mixtral
    • SOLAR
  • API 模型

    • 文心一言
    • 通義千問
    • 智譜 AI
    • 等其他 API 服務

主要特性

1. 私域問答與資料處理

DB-GPT 專案提供了一系列功能,旨在改進知識庫構建,實現結構化和非結構化資料的高效儲存和檢索。這些功能包括:

  • 內置多種檔案格式上傳支持
  • 集成自定義資料提取插件的能力
  • 統一的向量儲存和檢索功能

2. 多資料來源與 GBI

該專案促進與多樣化資料來源的無縫自然語言交互,包括 Excel、資料庫和資料倉庫。它簡化了從這些來源查詢和檢索信息的過程,使用戶能夠進行直觀的對話並獲得洞察。此外,DB-GPT 支持生成分析報告。

3. 多 Agent 和插件

它提供對自定義插件的支持以執行各種任務,並原生集成 Auto-GPT 插件模型。Agent 協議遵循 Agent Protocol 標準。

4. 自動化 Text2SQL 微調

我們還開發了一個以大語言模型 (LLMs)、Text2SQL 資料集、LoRA/QLoRA/Pturning 和其他微調方法為中心的自動化微調輕量級框架。該框架簡化了 Text-to-SQL 微調,使其像裝配線流程一樣簡單。

5. SMMF(面向服務的多模型管理框架)

我們提供廣泛的模型支持,包括來自開源和 API 代理的數十個大語言模型 (LLMs),如 LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通義、智譜等。

隱私與安全

我們通過實施各種技術,包括私有化大模型和代理脫敏,確保資料的隱私和安全。

支持的資料來源

在 .env 配置文件中,修改 LANGUAGE 參數以切換到不同語言。默認為英文(中文:zh,英文:en,其他語言稍後添加)。

技術架構

DB-GPT 採用模組化架構設計,主要包括:

  • AWEL 工作流編排層:提供智能體工作流的表達和編排能力
  • 多模型管理層:統一管理和調度不同的大語言模型
  • 資料接入層:支持多種資料來源的接入和處理
  • 智能體協作層:實現多個 AI 智能體之間的協作
  • 應用服務層:提供面向最終用戶的應用服務