DB-GPT est un cadre de développement d'applications de données natives de l'IA open source, intégrant AWEL (Agentic Workflow Expression Language) et un système multi-agents. Ce projet vise à construire une infrastructure dans le domaine des grands modèles en développant diverses capacités techniques, telles que la gestion multi-modèles (SMMF), l'optimisation des effets Text2SQL, le cadre RAG et son optimisation, la collaboration de cadres multi-agents, AWEL (orchestration du workflow d'agents), etc., afin de rendre les applications de grands modèles basées sur les données plus simples et plus pratiques.
À l'ère de la Data 3.0, en s'appuyant sur les modèles et les bases de données, les entreprises et les développeurs peuvent construire leurs propres applications personnalisées avec moins de code.
RAG est actuellement le domaine le plus pratique et le plus urgent. DB-GPT a déjà implémenté un cadre basé sur RAG, permettant aux utilisateurs de construire des applications de base de connaissances en utilisant la fonctionnalité RAG de DB-GPT.
La BI générative est l'une des capacités fondamentales du projet DB-GPT, fournissant une technologie d'intelligence de données de base pour la construction d'analyses de rapports d'entreprise et d'informations commerciales.
Le fine-tuning de modèles est une capacité indispensable pour toute entreprise mettant en œuvre des domaines verticaux et segmentés. DB-GPT fournit un cadre de fine-tuning complet, intégré de manière transparente au projet DB-GPT. Lors de récents travaux de fine-tuning, une précision de 82,5 % a été atteinte sur la base du jeu de données Spider.
DB-GPT fournit un cadre multi-agents auto-évolutif piloté par les données, conçu pour prendre des décisions et exécuter des actions en continu sur la base des données.
L'usine de données est principalement responsable du nettoyage et du traitement des connaissances et des données fiables à l'ère des grands modèles.
Intégration de diverses sources de données, connectant de manière transparente les données opérationnelles de production aux fonctionnalités de base de DB-GPT.
DB-GPT-Hub se concentre sur la réalisation de workflows Text-to-SQL haute performance en appliquant le fine-tuning supervisé (SFT) sur les grands modèles de langage (LLMs).
dbgpts est le dépôt officiel, contenant des applications de données, des opérateurs AWEL, des modèles de workflow AWEL et des agents construits sur la base de DB-GPT.
Plugins DB-GPT, qui peuvent exécuter directement les plugins Auto-GPT.
DB-GPT prend en charge une large gamme de grands modèles de langage, notamment :
Modèles open source :
Modèles API :
Le projet DB-GPT fournit une série de fonctionnalités visant à améliorer la construction de bases de connaissances, à réaliser un stockage et une récupération efficaces des données structurées et non structurées. Ces fonctionnalités incluent :
Ce projet facilite l'interaction en langage naturel transparente avec des sources de données diversifiées, notamment Excel, les bases de données et les entrepôts de données. Il simplifie le processus d'interrogation et de récupération d'informations à partir de ces sources, permettant aux utilisateurs de mener des conversations intuitives et d'obtenir des informations. De plus, DB-GPT prend en charge la génération de rapports d'analyse.
Il offre une prise en charge des plugins personnalisés pour exécuter diverses tâches et intègre nativement le modèle de plugin Auto-GPT. Le protocole d'agent suit la norme Agent Protocol.
Nous avons également développé un cadre léger de fine-tuning automatisé centré sur les grands modèles de langage (LLMs), les jeux de données Text2SQL, LoRA/QLoRA/Pturning et d'autres méthodes de fine-tuning. Ce cadre simplifie le fine-tuning Text-to-SQL, le rendant aussi simple qu'un processus de chaîne de montage.
Nous offrons une large prise en charge des modèles, y compris des dizaines de grands modèles de langage (LLMs) provenant d'agents open source et API, tels que LLaMA/LLaMA2, Baichuan, ChatGLM, Wenxin, Tongyi, Zhipu, etc.
Nous assurons la confidentialité et la sécurité des données en mettant en œuvre diverses technologies, notamment la privatisation des grands modèles et la désensibilisation des agents.
Dans le fichier de configuration .env, modifiez le paramètre LANGUAGE pour passer à une autre langue. La valeur par défaut est l'anglais (chinois : zh, anglais : en, d'autres langues seront ajoutées ultérieurement).
DB-GPT adopte une conception d'architecture modulaire, comprenant principalement :