LlamaCloud 서비스의 Python SDK로, 지식 에이전트 및 클라우드 데이터 관리 솔루션을 제공합니다.

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: October 06, 2025

LlamaCloud Services 프로젝트 상세 소개

프로젝트 개요

LlamaCloud Services는 LlamaIndex 팀이 개발한 Python SDK로, LlamaCloud 클라우드 서비스와 상호 작용하는 데 사용됩니다. 이 프로젝트는 지능형 문서 구문 분석, 구조화된 데이터 추출, 클라우드 인덱스 관리 등 핵심 기능을 포함하여 대규모 언어 모델(LLM) 애플리케이션 시나리오를 위해 특별히 설계된 완전한 지식 에이전트 및 데이터 관리 도구 세트를 제공합니다.

핵심 서비스 구성 요소

🔍 LlamaParse - AI 네이티브 문서 파서

LlamaParse는 LLM 사용 사례를 위해 구축된 세계 최초의 GenAI 네이티브 문서 파서이며, 다음과 같은 특징을 가집니다:

지원 형식:

  • 130개 이상의 파일 형식 지원 (PDF, DOCX, PPTX, XLSX, ODT, ODS, HTML, EPUB, 이미지, EML 등)
  • 복잡한 PDF 문서의 표 및 차트 구문 분석에 특화된 최적화
  • LLM 및 LVM을 사용하여 복잡한 문서를 처리하는 멀티모달 구문 분석 지원

구문 분석 모드:

  • Cost Effective: 속도와 비용 최적화, 텍스트 위주의 간단한 구조 문서에 적합
  • Agentic: 기본 옵션, 이미지 및 차트가 포함된 문서에 적합
  • Agentic Plus: 최고 충실도, 복잡한 레이아웃, 표 및 시각적 구조에 적합
  • Use-case Oriented: 특정 문서 유형(송장, 양식, 기술 이력서, 과학 논문)에 특화된 구문 분석 옵션

기술적 특징:

  • 문서의 의미론적 구조를 유지하는 Markdown 출력
  • 고급 표, 차트 및 레이아웃 추출
  • 원본 문서 위치로 추적 가능한 시각적 참조 기능
  • 페이지를 시각적 블록으로 분해하는 레이아웃 인식 구문 분석

📊 LlamaExtract - 지능형 데이터 추출기

LlamaExtract는 데이터를 구조화된 JSON 표현으로 변환할 수 있는 사전 구축된 지능형 데이터 추출기입니다.

핵심 기능:

  • 사용자 정의 스키마 기반 구조화된 데이터 추출
  • 에이전트 기반 데이터 추출 워크플로우 지원
  • 이력서 심사, 양식 데이터 추출 등 시나리오 처리 가능
  • 자동화된 데이터 유효성 검사 및 정제

사용 시나리오:

  • 이력서 및 입사 지원서 처리
  • 재무 문서 데이터 추출
  • 양식 및 설문조사 데이터 구조화
  • 계약서 및 법률 문서 정보 추출

🗂️ LlamaCloud Index - 클라우드 인덱스 서비스

LlamaCloud Index는 검색 기능을 동시에 제공하는 고도로 맞춤 설정 가능한 완전 자동 문서 수집 파이프라인입니다.

특징:

  • 자동화된 문서 수집 및 인덱싱
  • 다양한 데이터 소스 통합 지원
  • 검색 API 서비스 제공
  • 확장 가능한 클라우드 스토리지 솔루션

📋 LlamaReport - 지능형 보고서 생성기

LlamaReport는 다양한 데이터 소스에서 보고서를 구축할 수 있는 사전 구축된 지능형 보고서 빌더입니다 (현재 베타/초대 전용 단계).

설치 및 사용

기본 설치

pip install llama-cloud-services

기본 사용법

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# 문서 구문 분석
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# 데이터 추출
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# 클라우드 인덱스
index = LlamaCloudIndex(
    "my_index",
    project_name="default",
    api_key="YOUR_API_KEY"
)

# 보고서 생성
report = LlamaReport(api_key="YOUR_API_KEY")

명령줄 도구

# API 키를 얻은 후 환경 변수 설정
export LLAMA_CLOUD_API_KEY='llx-...'

# 문서를 텍스트로 구문 분석
llama-parse my_file.pdf --result-type text --output-file output.txt

# 문서를 Markdown으로 구문 분석
llama-parse my_file.pdf --result-type markdown --output-file output.md

# 원본 JSON 출력
llama-parse my_file.pdf --output-raw-json --output-file output.json

통합 및 호환성

LlamaIndex 통합

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# SimpleDirectoryReader에 직접 통합
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

다국어 및 지역 지원

# EU 지역 지원
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY",
    base_url=EU_BASE_URL,
    language="en"  # 다양한 언어 지원
)

기술적 특징

🚀 성능 최적화

  • 다중 워커 프로세스 병렬 처리
  • 비동기 구문 분석 지원
  • 대량 파일 처리 능력
  • 지능형 캐싱 메커니즘

🔧 높은 사용자 정의 가능성

  • 유연한 구문 분석 매개변수 구성
  • 사용자 정의 데이터 스키마 정의
  • 다양한 출력 형식 선택
  • 구성 가능한 품질 수준

🛡️ 엔터프라이즈급 기능

  • 데이터 프라이버시 보호
  • 고가용성 클라우드 서비스
  • API 제한 및 할당량 관리
  • 상세한 사용 통계

가격 모델

LlamaParse 가격

  • 무료 플랜: 일일 최대 1000페이지
  • 유료 플랜: 주간 7000페이지 무료 + 추가 페이지당 $0.003
  • 엔터프라이즈 플랜: 대량 및 온프레미스 배포 지원

사용 제한

  • 단일 파일 최대 약 3000페이지 지원
  • 지원되는 최대 파일 크기는 형식에 따라 다름
  • API 호출 빈도 제한

적용 시나리오

📚 문서 지능형 처리

  • 학술 논문 구문 분석 및 지식 추출
  • 기술 문서 구조화 처리
  • 법률 계약 정보 추출
  • 재무 보고서 데이터 분석

🏢 기업 데이터 관리

  • 내부 문서 지식 기반 구축
  • 고객 자료 데이터 추출
  • 비즈니스 프로세스 자동화
  • 규정 준수 문서 처리

🔬 연구 및 개발

  • 과학 연구 문헌 데이터 마이닝
  • 특허 문서 분석
  • 기술 보고서 처리
  • 데이터셋 구축 및 정제

개발 및 배포

개발 환경 설정

  1. LlamaCloud 계정 등록: https://cloud.llamaindex.ai/
  2. API 키 획득
  3. Python SDK 설치
  4. 환경 변수 구성

프로덕션 환경 배포

  • 클라우드 API 호출 지원
  • 기존 데이터 파이프라인에 통합 가능
  • 배치 처리 워크플로우 지원
  • 모니터링 및 로깅 기능 제공

MCP (Model Context Protocol) 지원

LlamaCloud Services는 MCP 서버 지원도 제공하며, MCP를 지원하는 클라이언트(예: Claude Desktop)와 통합할 수 있습니다:

# MCP 서버 통합 예시
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

커뮤니티 및 지원

향후 개발

LlamaCloud Services는 다음 영역에서 지속적으로 개선될 예정입니다:

  • 더 많은 파일 형식 지원
  • 향상된 차트 및 표 구문 분석 기능
  • 더 나은 다국어 지원
  • 고급 AI 에이전트 기능
  • 더 많은 엔터프라이즈급 기능

이 프로젝트는 문서 처리 및 지식 관리 분야의 최첨단 기술을 대표하며, 고품질 LLM 애플리케이션 구축을 위한 강력한 데이터 인프라 지원을 제공합니다.

Star History Chart