gabrielchua/RAGxplorerPlease refer to the latest official releases for information GitHub Homepage
オープンソースのRAG可視化ツール。ユーザーが検索拡張生成システムを直感的に理解し、デバッグするのに役立ちます。
MITJupyter Notebook 1.1kgabrielchuaRAGxplorer Last Updated: 2025-01-03
RAGxplorer - オープンソースRAG可視化ツール 🔮
プロジェクト概要
RAGxplorerは、検索拡張生成(RAG)システムを可視化するために特化して開発されたオープンソースツールです。このプロジェクトはGabriel Chuaによって開発され、開発者や研究者がRAGアプリケーションにおけるドキュメント検索と意味的類似性マッチングのプロセスをより深く理解し、デバッグするのを支援することを目的としています。
主要機能
1. ドキュメント処理と読み込み
- PDFドキュメント対応: PDFファイルを直接読み込んで処理可能
- ドキュメントのチャンク化: ドキュメントをベクトル化に適したテキストブロックに自動分割
- 多様なドキュメント形式に対応: 様々なドキュメント形式への対応を拡張
2. ベクトル埋め込みの可視化
- 埋め込み空間の可視化: ドキュメントブロックのベクトル空間における表現を可視化
- 意味的類似性の探索: ドキュメントブロック間の意味的関係を直感的に表示
- 多様な埋め込みモデルに対応: 異なる事前学習済み埋め込みモデルをサポート
3. クエリの可視化
- クエリマッチングの可視化: クエリとドキュメントブロックのマッチングプロセスを表示
- 類似度スコアの表示: 検索結果の関連性スコアを直感的に表示
- インタラクティブなクエリ: リアルタイムクエリと結果の可視化をサポート
技術的特徴
コア技術スタック
- Python: 主要開発言語
- Streamlit: Webインターフェースフレームワーク
- ベクトル埋め込み: 多様な埋め込みモデルをサポート
- 可視化ライブラリ: データ可視化とインタラクションに使用
サポートされる埋め込みモデル
thenlper/gte-large
: デフォルト推奨モデル- その他のHugging Faceモデル: カスタム埋め込みモデルをサポート
インストールと使用方法
インストール方法
pip install ragxplorer
基本的な使用例
from ragxplorer import RAGxplorer
# クライアントの初期化
client = RAGxplorer(embedding_model="thenlper/gte-large")
# PDFドキュメントの読み込み
client.load_pdf("presentation.pdf", verbose=True)
# クエリ結果の可視化
client.visualize_query("What are the top revenue drivers for Microsoft?")
クイックスタート
プロジェクトは完全なJupyter Notebookチュートリアルを提供しています:
オンラインデモ
アプリケーションシナリオ
1. RAGシステムデバッグ
- 検索品質の評価: ドキュメント検索の正確性と関連性を評価
- パラメータ調整: 可視化結果を通じてRAGシステムパラメータを調整
- パフォーマンス分析: 異なる設定下でのシステムパフォーマンスを分析
2. 教育と研究
- RAG概念の教育: 学習者がRAGの動作原理を理解するのを支援
- 学術研究: RAG関連研究に可視化ツールを提供
- プロトタイプ開発: RAGシステム設計の迅速な検証
3. 企業アプリケーション
- ドキュメント検索の最適化: 企業内ドキュメント検索システムを最適化
- ナレッジマネジメント: 企業ナレッジベースの組織構造を可視化
- 顧客サービス: RAGベースの顧客サービスシステムを最適化
プロジェクトの利点
1. オープンソースとコミュニティ
- MITライセンス: 完全なオープンソースで、自由な使用と変更が可能
- コミュニティサポート: 活発な開発者コミュニティと貢献者
- 継続的な更新: 定期的な更新と機能改善
2. 使いやすさ
- シンプルなAPI: 直感的なPython API設計
- Webインターフェース: Streamlitベースのユーザーフレンドリーなインターフェース
- 詳細なドキュメント: 完全な使用チュートリアルと例
3. 拡張性
- モジュール設計: 拡張とカスタマイズが容易
- マルチモデル対応: 様々な埋め込みモデルをサポート
- プラグインメカニズム: 他のツールやライブラリとの統合が可能
技術アーキテクチャ
コアコンポーネント
- ドキュメントプロセッサ: ドキュメントの読み込みと前処理を担当
- ベクトル化エンジン: テキストのベクトル化と埋め込みを処理
- 可視化エンジン: インタラクティブな可視化インターフェースを生成
- クエリプロセッサ: ユーザークエリと類似度計算を処理
データフロー
- ドキュメント入力 → テキストチャンク化 → ベクトル化 → 保存
- クエリ入力 → ベクトル化 → 類似度計算 → 結果可視化
まとめ
RAGxplorerは、強力で使いやすいRAG可視化ツールであり、開発者がRAGシステムを深く理解し最適化するための効果的な手段を提供します。直感的な可視化インターフェースを通じて、ユーザーは検索拡張生成ベースのAIアプリケーションをより効果的にデバッグし、改善することができます。