Login

Ferramenta de visualização RAG de código aberto que ajuda os usuários a entender e depurar intuitivamente sistemas de geração aumentada por recuperação.

MITJupyter Notebook 1.1kgabrielchuaRAGxplorer Last Updated: 2025-01-03

RAGxplorer - Ferramenta de Visualização RAG de Código Aberto 🔮

Visão Geral do Projeto

RAGxplorer é uma ferramenta de código aberto, desenvolvida especificamente para visualizar sistemas de Geração Aumentada por Recuperação (RAG). O projeto, desenvolvido por Gabriel Chua, visa ajudar desenvolvedores e pesquisadores a compreender e depurar melhor os processos de recuperação de documentos e correspondência de similaridade semântica em aplicações RAG.

Principais Funcionalidades

1. Processamento e Carregamento de Documentos

  • Suporte a Documentos PDF: Permite carregar e processar diretamente arquivos PDF
  • Fragmentação de Documentos: Divide automaticamente os documentos em blocos de texto adequados para vetorização
  • Suporte a Múltiplos Formatos de Documento: Suporte estendido a vários formatos de documento

2. Visualização de Incorporações Vetoriais

  • Visualização do Espaço de Incorporação: Visualiza a representação dos blocos de documento no espaço vetorial
  • Exploração de Similaridade Semântica: Exibe intuitivamente as relações semânticas entre os blocos de documento
  • Suporte a Múltiplos Modelos de Incorporação: Suporta diferentes modelos de incorporação pré-treinados

3. Visualização de Consultas

  • Visualização de Correspondência de Consulta: Exibe o processo de correspondência entre a consulta e os blocos de documento
  • Exibição de Pontuação de Similaridade: Mostra intuitivamente as pontuações de relevância dos resultados da recuperação
  • Consulta Interativa: Suporta consultas em tempo real e visualização de resultados

Características Técnicas

Pilha Tecnológica Principal

  • Python: Linguagem de desenvolvimento principal
  • Streamlit: Framework para interface web
  • Incorporações Vetoriais: Suporta múltiplos modelos de incorporação
  • Bibliotecas de Visualização: Usadas para visualização e interação de dados

Modelos de Incorporação Suportados

  • thenlper/gte-large: Modelo padrão recomendado
  • Outros modelos Hugging Face: Suporta modelos de incorporação personalizados

Instalação e Uso

Método de Instalação

pip install ragxplorer

Exemplo de Uso Básico

from ragxplorer import RAGxplorer

# Inicializa o cliente
client = RAGxplorer(embedding_model="thenlper/gte-large")

# Carrega documento PDF
client.load_pdf("presentation.pdf", verbose=True)

# Visualiza resultados da consulta
client.visualize_query("What are the top revenue drivers for Microsoft?")

Início Rápido

O projeto oferece tutoriais completos em Jupyter notebook:

Demonstração Online

Cenários de Aplicação

1. Depuração de Sistemas RAG

  • Avaliação da Qualidade de Recuperação: Avalia a precisão e relevância da recuperação de documentos
  • Otimização de Parâmetros: Ajusta os parâmetros do sistema RAG através da visualização dos resultados
  • Análise de Desempenho: Analisa o desempenho do sistema sob diferentes configurações

2. Educação e Pesquisa

  • Ensino de Conceitos RAG: Ajuda os alunos a compreender o funcionamento do RAG
  • Pesquisa Acadêmica: Fornece uma ferramenta de visualização para pesquisas relacionadas a RAG
  • Desenvolvimento de Protótipos: Valida rapidamente o design de sistemas RAG

3. Aplicações Empresariais

  • Otimização de Busca de Documentos: Otimiza sistemas de busca de documentos internos da empresa
  • Gestão do Conhecimento: Visualiza a estrutura organizacional de bases de conhecimento empresariais
  • Atendimento ao Cliente: Otimiza sistemas de atendimento ao cliente baseados em RAG

Vantagens do Projeto

1. Código Aberto e Comunidade

  • Licença MIT: Totalmente de código aberto, livre para uso e modificação
  • Suporte da Comunidade: Comunidade de desenvolvedores e contribuidores ativa
  • Atualizações Contínuas: Atualizações regulares e melhorias de funcionalidades

2. Facilidade de Uso

  • API Simples: Design de API Python intuitivo
  • Interface Web: Interface amigável baseada em Streamlit
  • Documentação Detalhada: Tutoriais e exemplos de uso completos

3. Escalabilidade

  • Design Modular: Fácil de estender e personalizar
  • Suporte a Múltiplos Modelos: Suporta vários modelos de incorporação
  • Mecanismo de Plugins: Permite a integração com outras ferramentas e bibliotecas

Arquitetura Técnica

Componentes Principais

  1. Processador de Documentos: Responsável pelo carregamento e pré-processamento de documentos
  2. Motor de Vetorização: Lida com a vetorização e incorporação de texto
  3. Motor de Visualização: Gera interfaces de visualização interativas
  4. Processador de Consultas: Lida com consultas de usuários e cálculo de similaridade

Fluxo de Dados

  1. Entrada de DocumentosFragmentação de TextoVetorizaçãoArmazenamento
  2. Entrada de ConsultaVetorizaçãoCálculo de SimilaridadeVisualização de Resultados

Resumo

RAGxplorer é uma ferramenta de visualização RAG poderosa e fácil de usar, que oferece aos desenvolvedores um meio eficaz para compreender e otimizar sistemas RAG. Através de uma interface de visualização intuitiva, os usuários podem depurar e aprimorar melhor as aplicações de IA baseadas em Geração Aumentada por Recuperação.

Star History Chart