Um mecanismo de geração aumentada por recuperação de código aberto baseado em compreensão profunda de documentos, fornecendo recursos de perguntas e respostas precisos e confiáveis para empresas de todos os tamanhos.
RAGFlow - Motor RAG de Código Aberto Baseado em Compreensão Profunda de Documentos
Visão Geral do Projeto
RAGFlow é um motor RAG (Retrieval-Augmented Generation) de código aberto baseado em compreensão profunda de documentos. Ele fornece fluxos de trabalho RAG simplificados para empresas de todos os tamanhos, combinando grandes modelos de linguagem (LLMs) para fornecer recursos de perguntas e respostas confiáveis e com base em evidências, e fornece citações verificáveis de dados em vários formatos complexos.
Principais Características
🧠 Compreensão Profunda de Documentos
- Extração de conhecimento baseada em dados não estruturados em formatos complexos
- Suporte para pesquisa precisa em "palheiros de dados" com tokens ilimitados
- Resultados de processamento inteligentes e interpretáveis
📄 Suporte a Documentos em Vários Formatos
- Formatos suportados: Documentos Word, apresentações PPT, planilhas Excel, arquivos de texto, imagens, documentos digitalizados, dados estruturados, páginas da web, etc.
- Capacidades de processamento: Modelos multimodais suportam compreensão de imagens em arquivos PDF ou DOCX
- Fragmentação visual: Visualização de fragmentação de texto, permitindo otimização por intervenção humana
🎯 Recuperação e Citação Precisas
- Fornece visualização rápida de referências-chave
- Fontes de citação rastreáveis suportam respostas baseadas em fatos
- Várias estratégias de recall combinadas com reclassificação de fusão
- Extração de palavras-chave e geração de perguntas relacionadas para melhorar a precisão da recuperação
🔧 Configuração Flexível
- LLMs e modelos de incorporação configuráveis
- Ricas opções de modelo
- Várias opções de configuração para extração e aplicação de grafos de conhecimento
- Suporte para conversão de texto em instruções SQL
🌐 Aplicação de Nível Empresarial
- Orquestração RAG simplificada para indivíduos e grandes empresas
- API intuitiva, integração perfeita com sistemas de negócios
- Combina pesquisa na Internet (Tavily) para suporte à inferência de pesquisa profunda para qualquer LLM
Arquitetura do Sistema
RAGFlow adota um design modular, incluindo principalmente os seguintes componentes:
- Interface Front-end: Interface de interação do usuário baseada em React
- Serviço Back-end: Motor de processamento central construído em Python
- Motor de Processamento de Documentos: Módulo de compreensão profunda de documentos DeepDoc
- Armazenamento de Vetores: Suporte para Elasticsearch e Infinity
- Armazenamento de Dados: MySQL, Redis, MinIO, etc.
- Serviço de Modelos: Suporte para vários LLMs e modelos de incorporação
Requisitos Técnicos
Configuração Mínima do Sistema
- CPU: ≥ 4 núcleos
- Memória: ≥ 16 GB
- Espaço em Disco: ≥ 50 GB
- Docker: ≥ 24.0.0
- Docker Compose: ≥ v2.26.1
Plataformas Suportadas
- Suporte principal para plataforma x86
- A plataforma ARM64 requer a construção de imagens Docker por conta própria
Instalação e Implantação
Implantação Rápida com Docker
# Clonar o repositório
git clone https://github.com/infiniflow/ragflow.git
# Entrar no diretório docker
cd ragflow/docker
# Iniciar o serviço (versão CPU)
docker compose -f docker-compose.yml up -d
# Iniciar o serviço (versão acelerada por GPU)
docker compose -f docker-compose-gpu.yml up -d
Descrição da Versão da Imagem
Etiqueta da Imagem | Tamanho | Inclui Modelo de Incorporação | Estabilidade |
---|---|---|---|
v0.18.0 | ~9GB | ✔️ | Versão Estável |
v0.18.0-slim | ~2GB | ❌ | Versão Estável |
nightly | ~9GB | ✔️ | Versão de Desenvolvimento |
nightly-slim | ~2GB | ❌ | Versão de Desenvolvimento |
Implantação de Desenvolvimento a partir do Código Fonte
Suporta a inicialização de um ambiente de desenvolvimento a partir do código fonte, incluindo configuração do ambiente Python, inicialização de serviços dependentes, inicialização de serviços front-end e back-end e outros processos completos.
Gerenciamento de Configuração
O sistema é gerenciado através dos seguintes arquivos de configuração:
- .env: Configuração básica do sistema (porta HTTP, senha do banco de dados, etc.)
- service_conf.yaml.template: Configuração do serviço back-end
- docker-compose.yml: Configuração de orquestração de contêineres Docker
Cenários de Aplicação
- Gerenciamento de Conhecimento Empresarial: Construção de um sistema de perguntas e respostas de base de conhecimento interna
- Análise Inteligente de Documentos: Análise e consulta inteligente de documentos em formatos complexos
- Atendimento ao Cliente: Sistema de atendimento ao cliente inteligente baseado em documentos empresariais
- Auxílio à Pesquisa: Recuperação inteligente de literatura acadêmica e materiais de pesquisa
- Análise de Dados: Consulta unificada de dados estruturados e não estruturados
Através de seus poderosos recursos de compreensão de documentos e opções de configuração flexíveis, o RAGFlow fornece uma solução RAG confiável para vários setores, sendo uma escolha ideal para construir sistemas de perguntas e respostas inteligentes.