Home
Login

심층 문서 이해 기반의 오픈 소스 검색 증강 생성 엔진으로, 모든 규모의 기업에 정확하고 신뢰할 수 있는 질의응답 능력을 제공합니다.

Apache-2.0Python 57.0kinfiniflow Last Updated: 2025-06-19

RAGFlow - 심층 문서 이해 기반 오픈 소스 RAG 엔진

프로젝트 개요

RAGFlow는 심층 문서 이해를 기반으로 하는 오픈 소스 RAG(검색 증강 생성) 엔진입니다. 다양한 규모의 기업에 간소화된 RAG 워크플로우를 제공하며, 대규모 언어 모델(LLM)과 결합하여 신뢰할 수 있는 질의응답 능력을 제공하고, 다양한 복잡한 형식의 데이터에서 근거 있는 인용을 제공합니다.

핵심 기능

🧠 심층 문서 이해

  • 복잡한 형식의 비정형 데이터 기반 지식 추출
  • 무제한 토큰의 "데이터 속 바늘 찾기"에서 정확한 검색 지원
  • 스마트하고 설명 가능한 처리 결과

📄 다중 형식 문서 지원

  • 지원 형식: Word 문서, PPT 프레젠테이션, Excel 스프레드시트, 텍스트 파일, 이미지, 스캔 문서, 구조화된 데이터, 웹 페이지 등
  • 처리 능력: 다중 모달 모델은 PDF 또는 DOCX 파일의 이미지 이해 지원
  • 시각적 청크: 텍스트 청크 시각화, 수동 개입을 통한 최적화 허용

🎯 정확한 검색 및 인용

  • 주요 참고 문헌의 빠른 보기 제공
  • 추적 가능한 인용 출처는 사실 기반 답변 지원
  • 다양한 회수 전략과 융합 재정렬
  • 키워드 추출 및 관련 질문 생성으로 검색 정확도 향상

🔧 유연한 구성

  • 구성 가능한 LLM 및 임베딩 모델
  • 풍부한 템플릿 옵션
  • 지식 그래프 추출 및 적용을 위한 다양한 구성 옵션
  • 텍스트-SQL 문장 변환 지원

🌐 엔터프라이즈급 애플리케이션

  • 개인 및 대규모 기업에 적합한 간소화된 RAG 오케스트레이션
  • 직관적인 API로 비즈니스 시스템과 원활하게 통합
  • 인터넷 검색(Tavily)과 결합하여 모든 LLM의 심층 연구 추론 지원

시스템 아키텍처

RAGFlow는 모듈식 설계를 채택하고 있으며, 주요 구성 요소는 다음과 같습니다.

  • 프론트엔드 인터페이스: React 기반 사용자 인터페이스
  • 백엔드 서비스: Python으로 구축된 핵심 처리 엔진
  • 문서 처리 엔진: DeepDoc 심층 문서 이해 모듈
  • 벡터 저장소: Elasticsearch 및 Infinity 지원
  • 데이터 저장소: MySQL, Redis, MinIO 등
  • 모델 서비스: 다양한 LLM 및 임베딩 모델 지원

기술 요구 사항

최소 시스템 구성

  • CPU: ≥ 4 코어
  • 메모리: ≥ 16 GB
  • 디스크 공간: ≥ 50 GB
  • Docker: ≥ 24.0.0
  • Docker Compose: ≥ v2.26.1

지원 플랫폼

  • 주로 x86 플랫폼 지원
  • ARM64 플랫폼은 Docker 이미지 직접 빌드 필요

설치 및 배포

Docker 빠른 배포

# 저장소 복제
git clone https://github.com/infiniflow/ragflow.git

# docker 디렉토리로 이동
cd ragflow/docker

# 서비스 시작 (CPU 버전)
docker compose -f docker-compose.yml up -d

# 서비스 시작 (GPU 가속 버전)
docker compose -f docker-compose-gpu.yml up -d

이미지 버전 설명

이미지 태그 크기 임베딩 모델 포함 안정성
v0.18.0 ~9GB ✔️ 안정 버전
v0.18.0-slim ~2GB 안정 버전
nightly ~9GB ✔️ 개발 버전
nightly-slim ~2GB 개발 버전

소스 코드 개발 배포

소스 코드에서 개발 환경 시작, Python 환경 구성, 종속 서비스 시작, 프론트엔드/백엔드 서비스 시작 등 전체 프로세스 지원.

구성 관리

시스템은 다음 구성 파일을 통해 관리됩니다.

  • .env: 기본 시스템 구성 (HTTP 포트, 데이터베이스 비밀번호 등)
  • service_conf.yaml.template: 백엔드 서비스 구성
  • docker-compose.yml: Docker 컨테이너 오케스트레이션 구성

활용 시나리오

  • 기업 지식 관리: 내부 지식 베이스 질의응답 시스템 구축
  • 문서 지능형 분석: 복잡한 형식 문서의 지능형 분석 및 쿼리
  • 고객 서비스: 기업 문서 기반 지능형 고객 서비스 시스템
  • 연구 지원: 학술 문헌 및 연구 자료의 지능형 검색
  • 데이터 분석: 구조화 및 비정형 데이터의 통합 쿼리

RAGFlow는 강력한 문서 이해 능력과 유연한 구성 옵션을 통해 각 산업에 신뢰할 수 있는 RAG 솔루션을 제공하며, 지능형 질의응답 시스템 구축에 이상적인 선택입니다.