DB-GPT 是一個開源的 AI 原生資料應用開發框架,集成了 AWEL(Agentic Workflow Expression Language)和多 Agent 系統。該項目旨在通過開發多種技術能力,如多模型管理 (SMMF)、Text2SQL 效果優化、RAG 框架和優化、多 Agent 框架協作、AWEL (agent 工作流編排) 等,在大模型領域構建基礎設施,使得基於資料的大模型應用變得更加簡單和便捷。
在 Data 3.0 時代,基於模型和資料庫,企業和開發者可以用更少的代碼構建自己的定制應用。
RAG 是目前最實用且迫切需要的領域。DB-GPT 已經實現了基於 RAG 的框架,允許用戶使用 DB-GPT 的 RAG 功能構建知識庫應用。
生成式 BI 是 DB-GPT 專案的核心能力之一,為構建企業報表分析和業務洞察提供基礎資料智能技術。
模型微調是任何企業在垂直和細分領域實施的不可或缺的能力。DB-GPT 提供了一個完整的微調框架,與 DB-GPT 專案無縫集成。在最近的微調工作中,基於 Spider 資料集實現了 82.5% 的準確率。
DB-GPT 提供了一個資料驅動的自進化多 Agent 框架,旨在基於資料持續做出決策和執行。
資料工廠主要負責在大模型時代清理和處理可信的知識和資料。
集成各種資料來源,將生產業務資料無縫連接到 DB-GPT 的核心功能。
DB-GPT-Hub 專注於通過在大語言模型 (LLMs) 上應用監督微調 (SFT) 來實現高性能的 Text-to-SQL 工作流。
dbgpts 是官方倉庫,包含一些基於 DB-GPT 構建的資料應用、AWEL 操作符、AWEL 工作流模板和智能體。
DB-GPT 插件,可以直接運行 Auto-GPT 插件。
DB-GPT 支持廣泛的大語言模型,包括:
開源模型:
API 模型:
DB-GPT 專案提供了一系列功能,旨在改進知識庫構建,實現結構化和非結構化資料的高效儲存和檢索。這些功能包括:
該專案促進與多樣化資料來源的無縫自然語言交互,包括 Excel、資料庫和資料倉庫。它簡化了從這些來源查詢和檢索信息的過程,使用戶能夠進行直觀的對話並獲得洞察。此外,DB-GPT 支持生成分析報告。
它提供對自定義插件的支持以執行各種任務,並原生集成 Auto-GPT 插件模型。Agent 協議遵循 Agent Protocol 標準。
我們還開發了一個以大語言模型 (LLMs)、Text2SQL 資料集、LoRA/QLoRA/Pturning 和其他微調方法為中心的自動化微調輕量級框架。該框架簡化了 Text-to-SQL 微調,使其像裝配線流程一樣簡單。
我們提供廣泛的模型支持,包括來自開源和 API 代理的數十個大語言模型 (LLMs),如 LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通義、智譜等。
我們通過實施各種技術,包括私有化大模型和代理脫敏,確保資料的隱私和安全。
在 .env 配置文件中,修改 LANGUAGE 參數以切換到不同語言。默認為英文(中文:zh,英文:en,其他語言稍後添加)。
DB-GPT 採用模組化架構設計,主要包括: