Home
Login

Eine Open-Source-Retrieval-Augmented-Generation-Engine, die auf tiefem Dokumentenverständnis basiert und Unternehmen jeder Größe präzise und zuverlässige Frage-Antwort-Funktionen bietet.

Apache-2.0Python 57.0kinfiniflow Last Updated: 2025-06-19

RAGFlow - Open-Source-RAG-Engine basierend auf tiefgehendem Dokumentenverständnis

Projektübersicht

RAGFlow ist ein Open-Source-RAG-Engine (Retrieval-Augmented Generation) basierend auf tiefgehendem Dokumentenverständnis. Es bietet Unternehmen jeder Größe einen vereinfachten RAG-Workflow, kombiniert große Sprachmodelle (LLM) für zuverlässige und glaubwürdige Frage-Antwort-Fähigkeiten und liefert belegbare Zitate aus verschiedenen komplexen Datenformaten.

Kernfunktionen

🧠 Tiefgehendes Dokumentenverständnis

  • Wissensextraktion basierend auf komplexen, unstrukturierten Daten
  • Präzise Suche in unbegrenzten Token-Mengen ("Nadel im Heuhaufen")
  • Intelligente und nachvollziehbare Verarbeitungsergebnisse

📄 Unterstützung für verschiedene Dokumentformate

  • Unterstützte Formate: Word-Dokumente, PPT-Präsentationen, Excel-Tabellen, Textdateien, Bilder, Scans, strukturierte Daten, Webseiten usw.
  • Verarbeitungsfähigkeiten: Multimodale Modelle unterstützen das Verständnis von Bildern in PDF- oder DOCX-Dateien
  • Visuelle Chunking: Visualisierung der Textsegmentierung, die eine manuelle Optimierung ermöglicht

🎯 Präzise Suche und Zitation

  • Schneller Zugriff auf wichtige Referenzdokumente
  • Nachvollziehbare Quellenangaben unterstützen faktenbasierte Antworten
  • Vielfältige Abrufstrategien in Kombination mit Fusion-Re-Ranking
  • Schlüsselwortextraktion und Generierung verwandter Fragen zur Verbesserung der Suchgenauigkeit

🔧 Flexible Konfiguration

  • Konfigurierbare LLM- und Embedding-Modelle
  • Umfangreiche Vorlagenoptionen
  • Vielfältige Konfigurationsmöglichkeiten für die Extraktion und Anwendung von Wissensgraphen
  • Unterstützung der Konvertierung von Text in SQL-Anweisungen

🌐 Enterprise-Anwendungen

  • Vereinfachte RAG-Orchestrierung für Einzelpersonen und große Unternehmen
  • Intuitive API für die nahtlose Integration in Geschäftssysteme
  • Kombination mit Internetsuche (Tavily) zur Unterstützung von Deep-Research-Reasoning für jedes LLM

Systemarchitektur

RAGFlow verwendet ein modulares Design und umfasst die folgenden Hauptkomponenten:

  • Frontend-Oberfläche: Benutzerinteraktive Oberfläche basierend auf React
  • Backend-Service: Kernverarbeitungs-Engine, erstellt mit Python
  • Dokumentenverarbeitungs-Engine: DeepDoc-Modul für tiefgehendes Dokumentenverständnis
  • Vektorspeicher: Unterstützung für Elasticsearch und Infinity
  • Datenspeicher: MySQL, Redis, MinIO usw.
  • Modelldienst: Unterstützung für verschiedene LLM- und Embedding-Modelle

Technische Anforderungen

Minimale Systemkonfiguration

  • CPU: ≥ 4 Kerne
  • RAM: ≥ 16 GB
  • Festplattenspeicher: ≥ 50 GB
  • Docker: ≥ 24.0.0
  • Docker Compose: ≥ v2.26.1

Unterstützte Plattformen

  • Hauptsächlich Unterstützung für x86-Plattformen
  • ARM64-Plattformen erfordern den Selbstbau von Docker-Images

Installation und Bereitstellung

Docker-Schnellbereitstellung

# Repository klonen
git clone https://github.com/infiniflow/ragflow.git

# In das Docker-Verzeichnis wechseln
cd ragflow/docker

# Dienst starten (CPU-Version)
docker compose -f docker-compose.yml up -d

# Dienst starten (GPU-beschleunigte Version)
docker compose -f docker-compose-gpu.yml up -d

Erläuterung der Image-Versionen

Image-Tag Größe Enthält Embedding-Modelle Stabilität
v0.18.0 ~9GB ✔️ Stabile Version
v0.18.0-slim ~2GB Stabile Version
nightly ~9GB ✔️ Entwicklungsversion
nightly-slim ~2GB Entwicklungsversion

Quellcode-Entwicklungsbereitstellung

Unterstützt das Starten einer Entwicklungsumgebung aus dem Quellcode, einschließlich Python-Umgebungskonfiguration, Starten abhängiger Dienste, Starten von Frontend- und Backend-Diensten usw.

Konfigurationsmanagement

Das System wird über die folgenden Konfigurationsdateien verwaltet:

  • .env: Basissystemkonfiguration (HTTP-Port, Datenbankpasswort usw.)
  • service_conf.yaml.template: Backend-Service-Konfiguration
  • docker-compose.yml: Docker-Container-Orchestrierungskonfiguration

Anwendungsfälle

  • Enterprise-Wissensmanagement: Aufbau eines internen Wissensdatenbank-Frage-Antwort-Systems
  • Intelligente Dokumentenanalyse: Intelligente Analyse und Abfrage komplexer Dokumentformate
  • Kundenservice: Intelligentes Kundenservice-System basierend auf Unternehmensdokumenten
  • Forschungsunterstützung: Intelligente Suche in akademischer Literatur und Forschungsmaterialien
  • Datenanalyse: Einheitliche Abfrage strukturierter und unstrukturierter Daten

RAGFlow bietet mit seinen leistungsstarken Dokumentenverständnisfähigkeiten und flexiblen Konfigurationsoptionen eine zuverlässige RAG-Lösung für verschiedene Branchen und ist die ideale Wahl für den Aufbau intelligenter Frage-Antwort-Systeme.