Um mecanismo de geração aumentada por recuperação de código aberto baseado em compreensão profunda de documentos, fornecendo recursos de perguntas e respostas precisos e confiáveis para empresas de todos os tamanhos.

Apache-2.0TypeScriptragflowinfiniflow 61.9k Last Updated: August 07, 2025

RAGFlow - Motor RAG de Código Aberto Baseado em Compreensão Profunda de Documentos

Visão Geral do Projeto

RAGFlow é um motor RAG (Retrieval-Augmented Generation) de código aberto baseado em compreensão profunda de documentos. Ele fornece fluxos de trabalho RAG simplificados para empresas de todos os tamanhos, combinando grandes modelos de linguagem (LLMs) para fornecer recursos de perguntas e respostas confiáveis e com base em evidências, e fornece citações verificáveis de dados em vários formatos complexos.

Principais Características

🧠 Compreensão Profunda de Documentos

  • Extração de conhecimento baseada em dados não estruturados em formatos complexos
  • Suporte para pesquisa precisa em "palheiros de dados" com tokens ilimitados
  • Resultados de processamento inteligentes e interpretáveis

📄 Suporte a Documentos em Vários Formatos

  • Formatos suportados: Documentos Word, apresentações PPT, planilhas Excel, arquivos de texto, imagens, documentos digitalizados, dados estruturados, páginas da web, etc.
  • Capacidades de processamento: Modelos multimodais suportam compreensão de imagens em arquivos PDF ou DOCX
  • Fragmentação visual: Visualização de fragmentação de texto, permitindo otimização por intervenção humana

🎯 Recuperação e Citação Precisas

  • Fornece visualização rápida de referências-chave
  • Fontes de citação rastreáveis suportam respostas baseadas em fatos
  • Várias estratégias de recall combinadas com reclassificação de fusão
  • Extração de palavras-chave e geração de perguntas relacionadas para melhorar a precisão da recuperação

🔧 Configuração Flexível

  • LLMs e modelos de incorporação configuráveis
  • Ricas opções de modelo
  • Várias opções de configuração para extração e aplicação de grafos de conhecimento
  • Suporte para conversão de texto em instruções SQL

🌐 Aplicação de Nível Empresarial

  • Orquestração RAG simplificada para indivíduos e grandes empresas
  • API intuitiva, integração perfeita com sistemas de negócios
  • Combina pesquisa na Internet (Tavily) para suporte à inferência de pesquisa profunda para qualquer LLM

Arquitetura do Sistema

RAGFlow adota um design modular, incluindo principalmente os seguintes componentes:

  • Interface Front-end: Interface de interação do usuário baseada em React
  • Serviço Back-end: Motor de processamento central construído em Python
  • Motor de Processamento de Documentos: Módulo de compreensão profunda de documentos DeepDoc
  • Armazenamento de Vetores: Suporte para Elasticsearch e Infinity
  • Armazenamento de Dados: MySQL, Redis, MinIO, etc.
  • Serviço de Modelos: Suporte para vários LLMs e modelos de incorporação

Requisitos Técnicos

Configuração Mínima do Sistema

  • CPU: ≥ 4 núcleos
  • Memória: ≥ 16 GB
  • Espaço em Disco: ≥ 50 GB
  • Docker: ≥ 24.0.0
  • Docker Compose: ≥ v2.26.1

Plataformas Suportadas

  • Suporte principal para plataforma x86
  • A plataforma ARM64 requer a construção de imagens Docker por conta própria

Instalação e Implantação

Implantação Rápida com Docker

# Clonar o repositório
git clone https://github.com/infiniflow/ragflow.git

# Entrar no diretório docker
cd ragflow/docker

# Iniciar o serviço (versão CPU)
docker compose -f docker-compose.yml up -d

# Iniciar o serviço (versão acelerada por GPU)
docker compose -f docker-compose-gpu.yml up -d

Descrição da Versão da Imagem

Etiqueta da Imagem Tamanho Inclui Modelo de Incorporação Estabilidade
v0.18.0 ~9GB ✔️ Versão Estável
v0.18.0-slim ~2GB Versão Estável
nightly ~9GB ✔️ Versão de Desenvolvimento
nightly-slim ~2GB Versão de Desenvolvimento

Implantação de Desenvolvimento a partir do Código Fonte

Suporta a inicialização de um ambiente de desenvolvimento a partir do código fonte, incluindo configuração do ambiente Python, inicialização de serviços dependentes, inicialização de serviços front-end e back-end e outros processos completos.

Gerenciamento de Configuração

O sistema é gerenciado através dos seguintes arquivos de configuração:

  • .env: Configuração básica do sistema (porta HTTP, senha do banco de dados, etc.)
  • service_conf.yaml.template: Configuração do serviço back-end
  • docker-compose.yml: Configuração de orquestração de contêineres Docker

Cenários de Aplicação

  • Gerenciamento de Conhecimento Empresarial: Construção de um sistema de perguntas e respostas de base de conhecimento interna
  • Análise Inteligente de Documentos: Análise e consulta inteligente de documentos em formatos complexos
  • Atendimento ao Cliente: Sistema de atendimento ao cliente inteligente baseado em documentos empresariais
  • Auxílio à Pesquisa: Recuperação inteligente de literatura acadêmica e materiais de pesquisa
  • Análise de Dados: Consulta unificada de dados estruturados e não estruturados

Através de seus poderosos recursos de compreensão de documentos e opções de configuração flexíveis, o RAGFlow fornece uma solução RAG confiável para vários setores, sendo uma escolha ideal para construir sistemas de perguntas e respostas inteligentes.

Star History Chart