Home
Login

深層ドキュメント理解に基づくオープンソースの検索拡張生成エンジンで、あらゆる規模の企業に正確で信頼性の高いQ&A機能を提供します。

Apache-2.0Python 57.0kinfiniflow Last Updated: 2025-06-19

RAGFlow - 深層ドキュメント理解に基づくオープンソースRAGエンジン

プロジェクト概要

RAGFlowは、深層ドキュメント理解に基づくオープンソースのRAG(検索拡張生成)エンジンです。さまざまな規模の企業向けに、簡素化されたRAGワークフローを提供し、大規模言語モデル(LLM)と組み合わせて、信頼性の高い質問応答能力を提供し、さまざまな複雑な形式のデータから証拠に基づいた引用を提供します。

主要な特徴

🧠 深層ドキュメント理解

  • 複雑な形式の非構造化データに基づいて知識を抽出
  • 無制限のトークンによる「データの中から針を探す」ような状況でも正確な検索をサポート
  • インテリジェントで説明可能な処理結果

📄 多様な形式のドキュメントをサポート

  • サポート形式: Wordドキュメント、PPTプレゼンテーション、Excelスプレッドシート、テキストファイル、画像、スキャン、構造化データ、Webページなど
  • 処理能力: マルチモーダルモデルは、PDFまたはDOCXファイル内の画像の理解をサポート
  • 可視化されたチャンク: テキストチャンクの可視化により、手動での最適化が可能

🎯 正確な検索と引用

  • 重要な参考文献をすばやく表示
  • 追跡可能な引用元は、事実に基づいた回答をサポート
  • さまざまなリコール戦略と融合リランキング
  • キーワード抽出と関連する質問の生成により、検索精度を向上

🔧 柔軟な構成

  • 構成可能なLLMと埋め込みモデル
  • 豊富なテンプレートオプション
  • 知識グラフの抽出と適用に関するさまざまな構成オプション
  • テキストからSQLステートメントへの変換をサポート

🌐 エンタープライズレベルのアプリケーション

  • 個人および大企業向けの簡素化されたRAGオーケストレーション
  • 直感的なAPIにより、ビジネスシステムとのシームレスな統合が可能
  • インターネット検索(Tavily)と組み合わせることで、あらゆるLLMの深い研究推論をサポート

システムアーキテクチャ

RAGFlowはモジュール設計を採用しており、主に次のコンポーネントが含まれています。

  • フロントエンドインターフェース: Reactベースのユーザーインタラクションインターフェース
  • バックエンドサービス: Pythonで構築されたコア処理エンジン
  • ドキュメント処理エンジン: DeepDoc深層ドキュメント理解モジュール
  • ベクトルストレージ: ElasticsearchとInfinityをサポート
  • データストレージ: MySQL、Redis、MinIOなど
  • モデルサービス: さまざまなLLMと埋め込みモデルをサポート

技術要件

最小システム構成

  • CPU: ≥ 4コア
  • メモリ: ≥ 16 GB
  • ディスク容量: ≥ 50 GB
  • Docker: ≥ 24.0.0
  • Docker Compose: ≥ v2.26.1

サポートプラットフォーム

  • 主にx86プラットフォームをサポート
  • ARM64プラットフォームは、Dockerイメージを自分で構築する必要があります

インストールとデプロイ

Dockerによるクイックデプロイ

# リポジトリをクローン
git clone https://github.com/infiniflow/ragflow.git

# dockerディレクトリに移動
cd ragflow/docker

# サービスを開始(CPUバージョン)
docker compose -f docker-compose.yml up -d

# サービスを開始(GPUアクセラレーションバージョン)
docker compose -f docker-compose-gpu.yml up -d

イメージバージョンの説明

イメージタグ サイズ 埋め込みモデルを含む 安定性
v0.18.0 ~9GB ✔️ 安定バージョン
v0.18.0-slim ~2GB 安定バージョン
nightly ~9GB ✔️ 開発バージョン
nightly-slim ~2GB 開発バージョン

ソースコードからの開発とデプロイ

Python環境の構成、依存サービスの起動、フロントエンドおよびバックエンドサービスの起動など、ソースコードから開発環境を起動するための完全なプロセスをサポートします。

構成管理

システムは、次の構成ファイルを使用して管理されます。

  • .env: 基本的なシステム構成(HTTPポート、データベースパスワードなど)
  • service_conf.yaml.template: バックエンドサービスの構成
  • docker-compose.yml: Dockerコンテナオーケストレーション構成

応用シーン

  • 企業知識管理: 内部知識ベースの質問応答システムを構築
  • ドキュメントインテリジェント分析: 複雑な形式のドキュメントのインテリジェントな解析とクエリ
  • カスタマーサービス: 企業ドキュメントに基づくインテリジェントなカスタマーサービスシステム
  • 研究支援: 学術文献および研究資料のインテリジェントな検索
  • データ分析: 構造化データと非構造化データの統一されたクエリ

RAGFlowは、その強力なドキュメント理解能力と柔軟な構成オプションを通じて、さまざまな業界に信頼性の高いRAGソリューションを提供し、インテリジェントな質問応答システムを構築するための理想的な選択肢です。