Home
Login

Framework de desenvolvimento de aplicações de dados nativas de IA, baseado em AWEL e multi-agentes para construir aplicações de inteligência de dados.

MITPython 16.8keosphoros-ai Last Updated: 2025-06-20

DB-GPT: Framework de Desenvolvimento de Aplicações de Dados Nativas de IA

Visão Geral do Projeto

DB-GPT é um framework de código aberto para o desenvolvimento de aplicações de dados nativas de IA, que integra AWEL (Agentic Workflow Expression Language) e um sistema multi-agente. O projeto visa construir infraestrutura no domínio de grandes modelos, através do desenvolvimento de diversas capacidades técnicas, como gestão multi-modelo (SMMF), otimização do efeito Text2SQL, framework RAG e otimização, colaboração de framework multi-agente, AWEL (orquestração de fluxo de trabalho de agente), etc., tornando as aplicações de grandes modelos baseadas em dados mais simples e convenientes.

Na era Data 3.0, com base em modelos e bancos de dados, empresas e desenvolvedores podem construir suas próprias aplicações personalizadas com menos código.

Arquitetura e Capacidades Centrais

Principais Módulos Funcionais

1. RAG (Geração Aumentada por Recuperação)

RAG é a área mais prática e urgentemente necessária atualmente. DB-GPT já implementou um framework baseado em RAG, permitindo que os usuários construam aplicações de base de conhecimento usando a funcionalidade RAG do DB-GPT.

2. GBI (Inteligência de Negócios Generativa)

GBI generativa é uma das capacidades centrais do projeto DB-GPT, fornecendo tecnologia básica de inteligência de dados para construir análise de relatórios empresariais e insights de negócios.

3. Framework de Ajuste Fino

O ajuste fino de modelos é uma capacidade indispensável para qualquer empresa implementar em domínios verticais e segmentados. DB-GPT fornece um framework de ajuste fino completo, integrado perfeitamente com o projeto DB-GPT. Em trabalhos recentes de ajuste fino, uma precisão de 82,5% foi alcançada com base no conjunto de dados Spider.

4. Framework Multi-Agente Orientado a Dados

DB-GPT fornece um framework multi-agente auto-evolutivo orientado a dados, projetado para tomar decisões e executar continuamente com base em dados.

5. Fábrica de Dados

A fábrica de dados é principalmente responsável por limpar e processar conhecimento e dados confiáveis na era dos grandes modelos.

6. Integração de Fontes de Dados

Integra várias fontes de dados, conectando dados de negócios de produção perfeitamente às funcionalidades centrais do DB-GPT.

Projetos Associados

DB-GPT-Hub

DB-GPT-Hub se concentra em alcançar fluxos de trabalho Text-to-SQL de alto desempenho, aplicando ajuste fino supervisionado (SFT) em grandes modelos de linguagem (LLMs).

dbgpts

dbgpts é o repositório oficial, contendo algumas aplicações de dados, operadores AWEL, modelos de fluxo de trabalho AWEL e agentes construídos com base no DB-GPT.

DB-GPT-Plugins

Plugins DB-GPT, que podem executar diretamente plugins Auto-GPT.

Modelos de Linguagem Suportados

DB-GPT suporta uma ampla gama de grandes modelos de linguagem, incluindo:

  • Modelos de Código Aberto:

    • LLaMA / LLaMA-2 / LLaMA-3 / LLaMA-3.1
    • BLOOM / BLOOMZ
    • Falcon
    • Baichuan / Baichuan2
    • InternLM
    • Qwen系列 (Qwen2.5, Qwen3等)
    • XVERSE
    • ChatGLM2 / GLM-4
    • DeepSeek系列
    • Yi系列
    • Gemma系列
    • Phi-3
    • CodeQwen
    • Mixtral
    • SOLAR
  • Modelos de API:

    • 文心一言
    • 通义千问
    • 智谱AI
    • 等其他API服务

Principais Características

1. Perguntas e Respostas Privadas e Processamento de Dados

O projeto DB-GPT fornece uma série de funcionalidades destinadas a melhorar a construção de bases de conhecimento, permitindo o armazenamento e recuperação eficientes de dados estruturados e não estruturados. Essas funcionalidades incluem:

  • Suporte integrado para upload de vários formatos de arquivo
  • Capacidade de integrar plugins de extração de dados personalizados
  • Funcionalidade unificada de armazenamento e recuperação de vetores

2. Multi-Fonte de Dados e GBI

O projeto facilita a interação perfeita em linguagem natural com diversas fontes de dados, incluindo Excel, bancos de dados e data warehouses. Ele simplifica o processo de consulta e recuperação de informações dessas fontes, permitindo que os usuários conduzam conversas intuitivas e obtenham insights. Além disso, o DB-GPT suporta a geração de relatórios analíticos.

3. Multi-Agente e Plugins

Ele oferece suporte para plugins personalizados para executar várias tarefas e integra nativamente o modelo de plugin Auto-GPT. O protocolo do agente segue o padrão Agent Protocol.

4. Ajuste Fino Automatizado de Text2SQL

Também desenvolvemos um framework leve de ajuste fino automatizado centrado em grandes modelos de linguagem (LLMs), conjuntos de dados Text2SQL, LoRA/QLoRA/Pturning e outros métodos de ajuste fino. O framework simplifica o ajuste fino de Text-to-SQL, tornando-o tão simples quanto um processo de linha de montagem.

5. SMMF (Framework de Gestão Multi-Modelo Orientado a Serviços)

Oferecemos amplo suporte a modelos, incluindo dezenas de grandes modelos de linguagem (LLMs) de código aberto e agentes de API, como LLaMA/LLaMA2, Baichuan, ChatGLM, 文心, 通义, 智谱, etc.

Privacidade e Segurança

Garantimos a privacidade e segurança dos dados implementando várias tecnologias, incluindo a privatização de grandes modelos e a dessensibilização de agentes.

Fontes de Dados Suportadas

No arquivo de configuração .env, modifique o parâmetro LANGUAGE para alternar para um idioma diferente. O padrão é inglês (Chinês: zh, Inglês: en, outros idiomas serão adicionados posteriormente).

Arquitetura Técnica

DB-GPT adota um design de arquitetura modular, que inclui principalmente:

  • Camada de Orquestração de Fluxo de Trabalho AWEL: Fornece a capacidade de expressão e orquestração de fluxos de trabalho de agentes
  • Camada de Gestão Multi-Modelo: Gerencia e agenda uniformemente diferentes grandes modelos de linguagem
  • Camada de Acesso a Dados: Suporta o acesso e processamento de várias fontes de dados
  • Camada de Colaboração de Agentes Inteligentes: Implementa a colaboração entre vários agentes inteligentes de IA
  • Camada de Serviço de Aplicação: Fornece serviços de aplicação voltados para o usuário final