gabrielchua/RAGxplorerPlease refer to the latest official releases for information GitHub Homepage
Ferramenta de visualização RAG de código aberto que ajuda os usuários a entender e depurar intuitivamente sistemas de geração aumentada por recuperação.
MITJupyter Notebook 1.1kgabrielchuaRAGxplorer Last Updated: 2025-01-03
RAGxplorer - Ferramenta de Visualização RAG de Código Aberto 🔮
Visão Geral do Projeto
RAGxplorer é uma ferramenta de código aberto, desenvolvida especificamente para visualizar sistemas de Geração Aumentada por Recuperação (RAG). O projeto, desenvolvido por Gabriel Chua, visa ajudar desenvolvedores e pesquisadores a compreender e depurar melhor os processos de recuperação de documentos e correspondência de similaridade semântica em aplicações RAG.
Principais Funcionalidades
1. Processamento e Carregamento de Documentos
- Suporte a Documentos PDF: Permite carregar e processar diretamente arquivos PDF
- Fragmentação de Documentos: Divide automaticamente os documentos em blocos de texto adequados para vetorização
- Suporte a Múltiplos Formatos de Documento: Suporte estendido a vários formatos de documento
2. Visualização de Incorporações Vetoriais
- Visualização do Espaço de Incorporação: Visualiza a representação dos blocos de documento no espaço vetorial
- Exploração de Similaridade Semântica: Exibe intuitivamente as relações semânticas entre os blocos de documento
- Suporte a Múltiplos Modelos de Incorporação: Suporta diferentes modelos de incorporação pré-treinados
3. Visualização de Consultas
- Visualização de Correspondência de Consulta: Exibe o processo de correspondência entre a consulta e os blocos de documento
- Exibição de Pontuação de Similaridade: Mostra intuitivamente as pontuações de relevância dos resultados da recuperação
- Consulta Interativa: Suporta consultas em tempo real e visualização de resultados
Características Técnicas
Pilha Tecnológica Principal
- Python: Linguagem de desenvolvimento principal
- Streamlit: Framework para interface web
- Incorporações Vetoriais: Suporta múltiplos modelos de incorporação
- Bibliotecas de Visualização: Usadas para visualização e interação de dados
Modelos de Incorporação Suportados
thenlper/gte-large
: Modelo padrão recomendado- Outros modelos Hugging Face: Suporta modelos de incorporação personalizados
Instalação e Uso
Método de Instalação
pip install ragxplorer
Exemplo de Uso Básico
from ragxplorer import RAGxplorer
# Inicializa o cliente
client = RAGxplorer(embedding_model="thenlper/gte-large")
# Carrega documento PDF
client.load_pdf("presentation.pdf", verbose=True)
# Visualiza resultados da consulta
client.visualize_query("What are the top revenue drivers for Microsoft?")
Início Rápido
O projeto oferece tutoriais completos em Jupyter notebook:
Demonstração Online
Cenários de Aplicação
1. Depuração de Sistemas RAG
- Avaliação da Qualidade de Recuperação: Avalia a precisão e relevância da recuperação de documentos
- Otimização de Parâmetros: Ajusta os parâmetros do sistema RAG através da visualização dos resultados
- Análise de Desempenho: Analisa o desempenho do sistema sob diferentes configurações
2. Educação e Pesquisa
- Ensino de Conceitos RAG: Ajuda os alunos a compreender o funcionamento do RAG
- Pesquisa Acadêmica: Fornece uma ferramenta de visualização para pesquisas relacionadas a RAG
- Desenvolvimento de Protótipos: Valida rapidamente o design de sistemas RAG
3. Aplicações Empresariais
- Otimização de Busca de Documentos: Otimiza sistemas de busca de documentos internos da empresa
- Gestão do Conhecimento: Visualiza a estrutura organizacional de bases de conhecimento empresariais
- Atendimento ao Cliente: Otimiza sistemas de atendimento ao cliente baseados em RAG
Vantagens do Projeto
1. Código Aberto e Comunidade
- Licença MIT: Totalmente de código aberto, livre para uso e modificação
- Suporte da Comunidade: Comunidade de desenvolvedores e contribuidores ativa
- Atualizações Contínuas: Atualizações regulares e melhorias de funcionalidades
2. Facilidade de Uso
- API Simples: Design de API Python intuitivo
- Interface Web: Interface amigável baseada em Streamlit
- Documentação Detalhada: Tutoriais e exemplos de uso completos
3. Escalabilidade
- Design Modular: Fácil de estender e personalizar
- Suporte a Múltiplos Modelos: Suporta vários modelos de incorporação
- Mecanismo de Plugins: Permite a integração com outras ferramentas e bibliotecas
Arquitetura Técnica
Componentes Principais
- Processador de Documentos: Responsável pelo carregamento e pré-processamento de documentos
- Motor de Vetorização: Lida com a vetorização e incorporação de texto
- Motor de Visualização: Gera interfaces de visualização interativas
- Processador de Consultas: Lida com consultas de usuários e cálculo de similaridade
Fluxo de Dados
- Entrada de Documentos → Fragmentação de Texto → Vetorização → Armazenamento
- Entrada de Consulta → Vetorização → Cálculo de Similaridade → Visualização de Resultados
Resumo
RAGxplorer é uma ferramenta de visualização RAG poderosa e fácil de usar, que oferece aos desenvolvedores um meio eficaz para compreender e otimizar sistemas RAG. Através de uma interface de visualização intuitiva, os usuários podem depurar e aprimorar melhor as aplicações de IA baseadas em Geração Aumentada por Recuperação.