Home
Login

AI 네이티브 데이터 애플리케이션 개발 프레임워크, AWEL 및 멀티 에이전트 기반 데이터 지능형 애플리케이션 구축

MITPython 16.8keosphoros-ai Last Updated: 2025-06-20

DB-GPT: AI 네이티브 데이터 애플리케이션 개발 프레임워크

프로젝트 개요

DB-GPT는 오픈 소스 AI 네이티브 데이터 애플리케이션 개발 프레임워크로, AWEL(Agentic Workflow Expression Language)과 멀티 에이전트 시스템을 통합했습니다. 이 프로젝트는 멀티 모델 관리(SMMF), Text2SQL 효과 최적화, RAG 프레임워크 및 최적화, 멀티 에이전트 프레임워크 협업, AWEL(에이전트 워크플로우 오케스트레이션) 등 다양한 기술 능력을 개발하여 대규모 모델 영역에서 인프라를 구축하고 데이터 기반 대규모 모델 애플리케이션을 더욱 간단하고 편리하게 만드는 것을 목표로 합니다.

Data 3.0 시대에는 모델과 데이터베이스를 기반으로 기업과 개발자가 더 적은 코드로 자신만의 맞춤형 애플리케이션을 구축할 수 있습니다.

핵심 아키텍처 및 기능

주요 기능 모듈

1. RAG (검색 증강 생성)

RAG는 현재 가장 실용적이고 시급한 분야입니다. DB-GPT는 이미 RAG 기반 프레임워크를 구현하여 사용자가 DB-GPT의 RAG 기능을 사용하여 지식 베이스 애플리케이션을 구축할 수 있도록 합니다.

2. GBI (생성형 비즈니스 인텔리전스)

생성형 BI는 DB-GPT 프로젝트의 핵심 기능 중 하나이며, 기업 보고서 분석 및 비즈니스 통찰력을 구축하기 위한 기본 데이터 인텔리전스 기술을 제공합니다.

3. 미세 조정 프레임워크

모델 미세 조정은 모든 기업이 수직 및 세분화된 영역에서 구현해야 하는 필수적인 기능입니다. DB-GPT는 DB-GPT 프로젝트와 완벽하게 통합되는 완전한 미세 조정 프레임워크를 제공합니다. 최근 미세 조정 작업에서 Spider 데이터 세트를 기반으로 82.5%의 정확도를 달성했습니다.

4. 데이터 기반 멀티 에이전트 프레임워크

DB-GPT는 데이터 기반의 자체 진화 멀티 에이전트 프레임워크를 제공하여 데이터를 기반으로 지속적으로 의사 결정을 내리고 실행하도록 설계되었습니다.

5. 데이터 팩토리

데이터 팩토리는 주로 대규모 모델 시대에 신뢰할 수 있는 지식과 데이터를 정리하고 처리하는 역할을 합니다.

6. 데이터 소스 통합

다양한 데이터 소스를 통합하여 생산 비즈니스 데이터를 DB-GPT의 핵심 기능에 원활하게 연결합니다.

관련 프로젝트

DB-GPT-Hub

DB-GPT-Hub는 대규모 언어 모델(LLM)에 SFT(Supervised Fine-Tuning)를 적용하여 고성능 Text-to-SQL 워크플로우를 구현하는 데 중점을 둡니다.

dbgpts

dbgpts는 공식 저장소이며, DB-GPT를 기반으로 구축된 데이터 애플리케이션, AWEL 연산자, AWEL 워크플로우 템플릿 및 에이전트를 포함합니다.

DB-GPT-Plugins

DB-GPT 플러그인으로, Auto-GPT 플러그인을 직접 실행할 수 있습니다.

지원되는 언어 모델

DB-GPT는 다음과 같은 광범위한 대규모 언어 모델을 지원합니다.

  • 오픈 소스 모델:
    • LLaMA / LLaMA-2 / LLaMA-3 / LLaMA-3.1
    • BLOOM / BLOOMZ
    • Falcon
    • Baichuan / Baichuan2
    • InternLM
    • Qwen 시리즈 (Qwen2.5, Qwen3 등)
    • XVERSE
    • ChatGLM2 / GLM-4
    • DeepSeek 시리즈
    • Yi 시리즈
    • Gemma 시리즈
    • Phi-3
    • CodeQwen
    • Mixtral
    • SOLAR
  • API 모델:
    • 文心一言 (Wenxin Yiyan)
    • 通义千问 (Tongyi Qianwen)
    • 智谱AI (Zhipu AI)
    • 기타 API 서비스

주요 특징

1. 프라이빗 도메인 질의응답 및 데이터 처리

DB-GPT 프로젝트는 지식 베이스 구축을 개선하고 구조화 및 비구조화 데이터의 효율적인 저장 및 검색을 구현하기 위한 일련의 기능을 제공합니다. 이러한 기능에는 다음이 포함됩니다.

  • 다양한 파일 형식 업로드 지원 내장
  • 사용자 정의 데이터 추출 플러그인 통합 기능
  • 통합된 벡터 저장 및 검색 기능

2. 멀티 데이터 소스 및 GBI

이 프로젝트는 Excel, 데이터베이스 및 데이터 웨어하우스를 포함한 다양한 데이터 소스와의 원활한 자연어 상호 작용을 촉진합니다. 이러한 소스에서 정보를 쿼리하고 검색하는 프로세스를 간소화하여 사용자가 직관적인 대화를 수행하고 통찰력을 얻을 수 있도록 합니다. 또한 DB-GPT는 분석 보고서 생성을 지원합니다.

3. 멀티 에이전트 및 플러그인

다양한 작업을 수행하기 위한 사용자 정의 플러그인 지원을 제공하고 Auto-GPT 플러그인 모델을 기본적으로 통합합니다. 에이전트 프로토콜은 Agent Protocol 표준을 따릅니다.

4. 자동화된 Text2SQL 미세 조정

또한 대규모 언어 모델(LLM), Text2SQL 데이터 세트, LoRA/QLoRA/Pturning 및 기타 미세 조정 방법을 중심으로 하는 자동화된 미세 조정 경량 프레임워크를 개발했습니다. 이 프레임워크는 Text-to-SQL 미세 조정을 조립 라인 프로세스처럼 간단하게 만듭니다.

5. SMMF (서비스 지향 멀티 모델 관리 프레임워크)

LLaMA/LLaMA2, Baichuan, ChatGLM, 文心 (Wenxin), 通义 (Tongyi), 智谱 (Zhipu) 등과 같은 오픈 소스 및 API 에이전트의 수십 개의 대규모 언어 모델(LLM)을 포함하여 광범위한 모델 지원을 제공합니다.

개인 정보 보호 및 보안

프라이빗 대규모 모델 및 에이전트 비식별화를 포함한 다양한 기술을 구현하여 데이터의 개인 정보 보호 및 보안을 보장합니다.

지원되는 데이터 소스

.env 구성 파일에서 LANGUAGE 매개변수를 수정하여 다른 언어로 전환합니다. 기본값은 영어입니다 (중국어: zh, 영어: en, 기타 언어는 나중에 추가).

기술 아키텍처

DB-GPT는 모듈식 아키텍처 설계를 채택하며, 주로 다음을 포함합니다.

  • AWEL 워크플로우 오케스트레이션 계층: 에이전트 워크플로우의 표현 및 오케스트레이션 기능 제공
  • 멀티 모델 관리 계층: 다양한 대규모 언어 모델을 통합 관리 및 스케줄링
  • 데이터 액세스 계층: 다양한 데이터 소스의 액세스 및 처리 지원
  • 에이전트 협업 계층: 여러 AI 에이전트 간의 협업 구현
  • 애플리케이션 서비스 계층: 최종 사용자를 위한 애플리케이션 서비스 제공