Home
Login

Moteur open source de génération augmentée par la récupération basé sur la compréhension approfondie des documents, offrant des capacités de questions-réponses précises et fiables aux entreprises de toutes tailles.

Apache-2.0Python 57.0kinfiniflow Last Updated: 2025-06-19

RAGFlow - Moteur RAG Open Source Basé sur la Compréhension Approfondie des Documents

Aperçu du Projet

RAGFlow est un moteur RAG (Retrieval-Augmented Generation) open source basé sur la compréhension approfondie des documents. Il offre aux entreprises de toutes tailles un flux de travail RAG simplifié, combinant des modèles de langage de grande taille (LLM) pour fournir des capacités de questions-réponses fiables et vérifiables, et fournissant des citations étayées à partir de données de divers formats complexes.

Caractéristiques Principales

🧠 Compréhension Approfondie des Documents

  • Extraction de connaissances basée sur des données non structurées de formats complexes
  • Prise en charge de la recherche précise dans un "océan de données" avec des tokens illimités
  • Résultats de traitement intelligents et interprétables

📄 Prise en Charge de Documents Multi-Formats

  • Formats pris en charge : Documents Word, présentations PPT, feuilles de calcul Excel, fichiers texte, images, documents numérisés, données structurées, pages web, etc.
  • Capacités de traitement : Les modèles multimodaux prennent en charge la compréhension des images dans les fichiers PDF ou DOCX
  • Segmentation visuelle : Visualisation de la segmentation du texte, permettant une optimisation par intervention humaine

🎯 Recherche et Citation Précises

  • Fournit un aperçu rapide des références clés
  • Les sources de citation traçables prennent en charge les réponses basées sur les faits
  • Diverses stratégies de rappel combinées à un réordonnancement de fusion
  • Extraction de mots-clés et génération de questions connexes pour améliorer la précision de la recherche

🔧 Configuration Flexible

  • LLM et modèles d'intégration configurables
  • Options de modèles riches
  • Options de configuration multiples pour l'extraction et l'application de graphes de connaissances
  • Prise en charge de la conversion de texte en instructions SQL

🌐 Application d'Entreprise

  • Orchestration RAG simplifiée pour les particuliers et les grandes entreprises
  • API intuitive pour une intégration transparente aux systèmes d'entreprise
  • Combinaison avec la recherche sur Internet (Tavily) pour une inférence de recherche approfondie pour tout LLM

Architecture du Système

RAGFlow adopte une conception modulaire, comprenant principalement les composants suivants :

  • Interface Frontale : Interface utilisateur basée sur React
  • Services Backend : Moteur de traitement central construit en Python
  • Moteur de Traitement de Documents : Module de compréhension approfondie des documents DeepDoc
  • Stockage Vectoriel : Prise en charge d'Elasticsearch et Infinity
  • Stockage de Données : MySQL, Redis, MinIO, etc.
  • Services de Modèles : Prise en charge de divers LLM et modèles d'intégration

Exigences Techniques

Configuration Système Minimale

  • CPU : ≥ 4 cœurs
  • Mémoire : ≥ 16 Go
  • Espace Disque : ≥ 50 Go
  • Docker : ≥ 24.0.0
  • Docker Compose : ≥ v2.26.1

Plateformes Prises en Charge

  • Principalement la plateforme x86
  • La plateforme ARM64 nécessite la construction de vos propres images Docker

Installation et Déploiement

Déploiement Rapide avec Docker

# Cloner le dépôt
git clone https://github.com/infiniflow/ragflow.git

# Accéder au répertoire docker
cd ragflow/docker

# Démarrer les services (version CPU)
docker compose -f docker-compose.yml up -d

# Démarrer les services (version accélérée par GPU)
docker compose -f docker-compose-gpu.yml up -d

Description des Versions d'Image

Étiquette d'image Taille Inclut les modèles d'intégration Stabilité
v0.18.0 ~9GB ✔️ Version stable
v0.18.0-slim ~2GB Version stable
nightly ~9GB ✔️ Version de développement
nightly-slim ~2GB Version de développement

Déploiement du Développement à partir du Code Source

Prise en charge du démarrage de l'environnement de développement à partir du code source, y compris la configuration de l'environnement Python, le démarrage des services dépendants, le démarrage des services frontend et backend, etc., un processus complet.

Gestion de la Configuration

Le système est géré via les fichiers de configuration suivants :

  • .env : Configuration système de base (port HTTP, mot de passe de la base de données, etc.)
  • service_conf.yaml.template : Configuration des services backend
  • docker-compose.yml : Configuration de l'orchestration des conteneurs Docker

Scénarios d'Application

  • Gestion des Connaissances d'Entreprise : Construction d'un système de questions-réponses de base de connaissances interne
  • Analyse Intelligente de Documents : Analyse et requête intelligentes de documents de formats complexes
  • Service Client : Système de service client intelligent basé sur la documentation d'entreprise
  • Assistance à la Recherche : Recherche intelligente de littérature académique et de documents de recherche
  • Analyse de Données : Requête unifiée de données structurées et non structurées

Grâce à ses puissantes capacités de compréhension des documents et à ses options de configuration flexibles, RAGFlow fournit une solution RAG fiable pour diverses industries, ce qui en fait un choix idéal pour la construction de systèmes de questions-réponses intelligents.