LlamaCloudサービスのPython SDK。知識エージェントとクラウドデータ管理ソリューションを提供します。

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: October 06, 2025

LlamaCloud Services プロジェクト詳細

プロジェクト概要

LlamaCloud Services は、LlamaIndex チームによって開発された、LlamaCloud クラウドサービスと連携するための Python SDK です。このプロジェクトは、スマートドキュメント解析、構造化データ抽出、クラウドインデックス管理などのコア機能を含め、大規模言語モデル (LLM) アプリケーションのシナリオ向けに特別に設計された、知識エージェントとデータ管理ツールの完全なセットを提供します。

コアサービスコンポーネント

🔍 LlamaParse - AIネイティブドキュメントパーサー

LlamaParse は、LLM ユースケース向けに構築された世界初の生成AI (GenAI) ネイティブドキュメントパーサーであり、以下の特徴を備えています。

サポート形式:

  • 130種類以上のファイル形式(PDF、DOCX、PPTX、XLSX、ODT、ODS、HTML、EPUB、画像、EMLなど)をサポート
  • 複雑なPDFドキュメントのテーブルとグラフ解析に特化して最適化
  • LLMとLVMを使用して複雑なドキュメントを処理するマルチモーダル解析をサポート

解析モード:

  • Cost Effective: 速度とコストを最適化し、テキスト中心のシンプルな構造のドキュメントに適しています。
  • Agentic: デフォルトオプションで、画像やグラフを含むドキュメントに適しています。
  • Agentic Plus: 最高レベルの忠実度で、複雑なレイアウト、テーブル、視覚的構造に適しています。
  • Use-case Oriented: 特定のドキュメントタイプ(請求書、フォーム、技術履歴書、科学論文)に特化した解析オプションです。

技術特性:

  • ドキュメントのセマンティック構造を保持するMarkdown出力
  • 高度なテーブル、グラフ、レイアウト抽出
  • 元のドキュメント位置に追跡可能な視覚的参照機能
  • ページを視覚的ブロックに分解するレイアウト認識型解析

📊 LlamaExtract - スマートデータ抽出器

LlamaExtract は、データを構造化されたJSON形式に変換できる、事前に構築されたスマートデータ抽出器です。

コア機能:

  • ユーザー定義のスキーマに基づいて構造化データを抽出
  • エージェント型データ抽出ワークフローをサポート
  • 履歴書スクリーニング、フォームデータ抽出などのシナリオに対応
  • データ検証とクレンジングを自動化

使用シーン:

  • 履歴書と応募書類の処理
  • 財務書類のデータ抽出
  • フォームとアンケートのデータ構造化
  • 契約書と法的文書の情報抽出

🗂️ LlamaCloud Index - クラウドインデックスサービス

LlamaCloud Index は、高度にカスタマイズ可能な全自動ドキュメント取り込みパイプラインであり、検索機能も提供します。

特性:

  • ドキュメントの取り込みとインデックス作成を自動化
  • 複数のデータソース統合をサポート
  • 検索APIサービスを提供
  • スケーラブルなクラウドストレージソリューション

📋 LlamaReport - スマートレポート生成器

LlamaReport は、複数のデータソースからレポートを構築できる、事前に構築されたスマートレポートビルダーです(現在ベータ/招待制段階)。

インストールと使用

基本インストール

pip install llama-cloud-services

基本使用法

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# ドキュメント解析
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# データ抽出
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# クラウドインデックス
index = LlamaCloudIndex(
    "my_index", 
    project_name="default", 
    api_key="YOUR_API_KEY"
)

# レポート生成
report = LlamaReport(api_key="YOUR_API_KEY")

コマンドラインツール

# APIキーを取得後、環境変数を設定
export LLAMA_CLOUD_API_KEY='llx-...'

# ドキュメントをテキストとして解析
llama-parse my_file.pdf --result-type text --output-file output.txt

# ドキュメントをMarkdownとして解析
llama-parse my_file.pdf --result-type markdown --output-file output.md

# 生のJSONを出力
llama-parse my_file.pdf --output-raw-json --output-file output.json

統合と互換性

LlamaIndex 統合

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# 直接SimpleDirectoryReaderに統合
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

多言語と地域サポート

# EU地域サポート
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY", 
    base_url=EU_BASE_URL,
    language="en"  # 多言語をサポート
)

技術的特徴

🚀 性能最適化

  • マルチワーカープロセス並列処理
  • 非同期解析サポート
  • バッチファイル処理能力
  • スマートキャッシュメカニズム

🔧 高度なカスタマイズ性

  • 柔軟な解析パラメータ設定
  • カスタムデータスキーマ定義
  • 複数の出力形式選択
  • 設定可能な品質レベル

🛡️ エンタープライズ級機能

  • データプライバシー保護
  • 高可用性クラウドサービス
  • APIレート制限とクォータ管理
  • 詳細な使用統計

価格モデル

LlamaParse 価格

  • 無料プラン: 1日あたり最大1000ページ
  • 有料プラン: 毎週7000ページ無料 + 追加ページ $0.003/ページ
  • エンタープライズプラン: 大量処理とオンプレミスデプロイをサポート

使用制限

  • 単一ファイルは最大約3000ページをサポート
  • 最大ファイルサイズは形式によって異なります
  • API呼び出し頻度制限

アプリケーションシナリオ

📚 ドキュメントインテリジェント処理

  • 学術論文解析と知識抽出
  • 技術文書構造化処理
  • 法的契約情報抽出
  • 財務報告データ分析

🏢 企業データ管理

  • 内部文書知識ベース構築
  • 顧客データ抽出
  • ビジネスプロセス自動化
  • コンプライアンス文書処理

🔬 研究開発

  • 科学文献データマイニング
  • 特許文書分析
  • 技術報告書処理
  • データセット構築とクレンジング

開発とデプロイ

開発環境設定

  1. LlamaCloud アカウントを登録:https://cloud.llamaindex.ai/
  2. APIキーを取得
  3. Python SDKをインストール
  4. 環境変数を設定

本番環境デプロイ

  • クラウドAPI呼び出しをサポート
  • 既存のデータパイプラインへの統合が可能
  • バッチ処理ワークフローをサポート
  • 監視とログ機能を提供

MCP (Model Context Protocol) サポート

LlamaCloud Services は MCP サーバーサポートも提供しており、MCP をサポートするクライアント(例:Claude Desktop)と統合できます。

# MCPサーバー統合例
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

コミュニティとサポート

将来の展望

LlamaCloud Services は以下の点で継続的に改善を行っています。

  • より多くのファイル形式サポート
  • 強化されたグラフとテーブル解析能力
  • より良い多言語サポート
  • 高度なAIエージェント機能
  • より多くのエンタープライズ級機能

このプロジェクトは、ドキュメント処理と知識管理分野の最先端技術を代表し、高品質なLLMアプリケーションを構築するための強力なデータインフラストラクチャサポートを提供します。

Star History Chart