Home
Login

Framework de desarrollo de aplicaciones de datos nativas de IA, basado en AWEL y múltiples Agentes para construir aplicaciones de inteligencia de datos.

MITPython 16.8keosphoros-ai Last Updated: 2025-06-20

DB-GPT: Marco de Desarrollo de Aplicaciones de Datos Nativas de IA

Resumen del Proyecto

DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto que integra AWEL (Agentic Workflow Expression Language) y un sistema multi-agente. El proyecto tiene como objetivo construir infraestructura en el dominio de los grandes modelos mediante el desarrollo de diversas capacidades técnicas, como la gestión multi-modelo (SMMF), la optimización del efecto Text2SQL, el marco y la optimización RAG, la colaboración del marco multi-agente, AWEL (orquestación del flujo de trabajo del agente), etc., para que las aplicaciones de grandes modelos basadas en datos sean más simples y convenientes.

En la era de Data 3.0, las empresas y los desarrolladores pueden construir sus propias aplicaciones personalizadas con menos código, basándose en modelos y bases de datos.

Arquitectura y Capacidades Centrales

Módulos Funcionales Principales

1. RAG (Generación Aumentada por Recuperación)

RAG es el área más práctica y necesaria en la actualidad. DB-GPT ya ha implementado un marco basado en RAG, que permite a los usuarios utilizar la función RAG de DB-GPT para construir aplicaciones de base de conocimiento.

2. GBI (Inteligencia de Negocios Generativa)

La BI generativa es una de las capacidades centrales del proyecto DB-GPT, que proporciona tecnología de inteligencia de datos básica para la construcción de análisis de informes empresariales y conocimiento empresarial.

3. Marco de Ajuste Fino

El ajuste fino del modelo es una capacidad indispensable para cualquier empresa que implemente en dominios verticales y segmentados. DB-GPT proporciona un marco de ajuste fino completo, integrado a la perfección con el proyecto DB-GPT. En el trabajo de ajuste fino reciente, se logró una precisión del 82.5% basada en el conjunto de datos Spider.

4. Marco Multi-Agente Impulsado por Datos

DB-GPT proporciona un marco multi-agente auto-evolutivo impulsado por datos, diseñado para tomar decisiones y ejecutar continuamente basándose en los datos.

5. Fábrica de Datos

La fábrica de datos es principalmente responsable de limpiar y procesar conocimientos y datos confiables en la era de los grandes modelos.

6. Integración de Fuentes de Datos

Integra varias fuentes de datos, conectando a la perfección los datos comerciales de producción con las funciones centrales de DB-GPT.

Proyectos Asociados

DB-GPT-Hub

DB-GPT-Hub se centra en lograr un flujo de trabajo Text-to-SQL de alto rendimiento mediante la aplicación de ajuste fino supervisado (SFT) en grandes modelos de lenguaje (LLMs).

dbgpts

dbgpts es el repositorio oficial, que contiene algunas aplicaciones de datos, operadores AWEL, plantillas de flujo de trabajo AWEL y agentes construidos sobre DB-GPT.

DB-GPT-Plugins

Plugins de DB-GPT, que pueden ejecutar directamente plugins de Auto-GPT.

Modelos de Lenguaje Soportados

DB-GPT admite una amplia gama de grandes modelos de lenguaje, que incluyen:

  • Modelos de Código Abierto:

    • LLaMA / LLaMA-2 / LLaMA-3 / LLaMA-3.1
    • BLOOM / BLOOMZ
    • Falcon
    • Baichuan / Baichuan2
    • InternLM
    • Serie Qwen (Qwen2.5, Qwen3, etc.)
    • XVERSE
    • ChatGLM2 / GLM-4
    • Serie DeepSeek
    • Serie Yi
    • Serie Gemma
    • Phi-3
    • CodeQwen
    • Mixtral
    • SOLAR
  • Modelos API:

    • Wenxin Yiyan
    • Tongyi Qianwen
    • Zhipu AI
    • Otros servicios API

Características Principales

1. Preguntas y Respuestas Privadas y Procesamiento de Datos

El proyecto DB-GPT proporciona una serie de funciones diseñadas para mejorar la construcción de bases de conocimiento, permitiendo el almacenamiento y la recuperación eficientes de datos estructurados y no estructurados. Estas funciones incluyen:

  • Soporte integrado para la carga de múltiples formatos de archivo
  • Capacidad para integrar plugins de extracción de datos personalizados
  • Funciones unificadas de almacenamiento y recuperación de vectores

2. Múltiples Fuentes de Datos y GBI

El proyecto facilita la interacción fluida en lenguaje natural con diversas fuentes de datos, incluyendo Excel, bases de datos y almacenes de datos. Simplifica el proceso de consulta y recuperación de información de estas fuentes, permitiendo a los usuarios realizar conversaciones intuitivas y obtener información. Además, DB-GPT admite la generación de informes de análisis.

3. Multi-Agente y Plugins

Proporciona soporte para plugins personalizados para ejecutar diversas tareas, e integra de forma nativa el modelo de plugins Auto-GPT. El protocolo de agente sigue el estándar Agent Protocol.

4. Ajuste Fino Automatizado de Text2SQL

También hemos desarrollado un marco ligero de ajuste fino automatizado centrado en grandes modelos de lenguaje (LLMs), conjuntos de datos Text2SQL, LoRA/QLoRA/Pturning y otros métodos de ajuste fino. Este marco simplifica el ajuste fino de Text-to-SQL, haciéndolo tan simple como un proceso de línea de montaje.

5. SMMF (Marco de Gestión Multi-Modelo Orientado a Servicios)

Ofrecemos un amplio soporte de modelos, incluyendo docenas de grandes modelos de lenguaje (LLMs) de código abierto y agentes API, como LLaMA/LLaMA2, Baichuan, ChatGLM, Wenxin, Tongyi, Zhipu, etc.

Privacidad y Seguridad

Garantizamos la privacidad y seguridad de los datos mediante la implementación de diversas tecnologías, incluyendo la privatización de grandes modelos y la desensibilización de agentes.

Fuentes de Datos Soportadas

En el archivo de configuración .env, modifique el parámetro LANGUAGE para cambiar a un idioma diferente. El valor predeterminado es inglés (chino: zh, inglés: en, otros idiomas se agregarán más adelante).

Arquitectura Técnica

DB-GPT adopta un diseño de arquitectura modular, que incluye principalmente:

  • Capa de Orquestación del Flujo de Trabajo AWEL: Proporciona capacidades de expresión y orquestación del flujo de trabajo del agente
  • Capa de Gestión Multi-Modelo: Gestiona y programa de forma unificada diferentes grandes modelos de lenguaje
  • Capa de Acceso a Datos: Admite el acceso y el procesamiento de múltiples fuentes de datos
  • Capa de Colaboración de Agentes Inteligentes: Implementa la colaboración entre múltiples agentes inteligentes de IA
  • Capa de Servicios de Aplicación: Proporciona servicios de aplicación orientados al usuario final