run-llama/llama_cloud_servicesView GitHub Homepage for Latest Official Releases

Das Python SDK für LlamaCloud-Dienste bietet Wissensagenten und Cloud-Datenmanagementlösungen.

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: October 06, 2025

LlamaCloud Services Projekt – Detaillierte Beschreibung

Projektübersicht

LlamaCloud Services ist ein von dem LlamaIndex-Team entwickeltes Python SDK zur Interaktion mit den LlamaCloud-Clouddiensten. Dieses Projekt bietet eine vollständige Suite von Wissensagenten- und Datenverwaltungstools, die speziell für Anwendungen großer Sprachmodelle (LLM) entwickelt wurden, einschließlich Kernfunktionen wie intelligenter Dokumentenanalyse, strukturierter Datenextraktion und Cloud-Index-Verwaltung.

Kernservice-Komponenten

🔍 LlamaParse - AI-nativer Dokumentenparser

LlamaParse ist der weltweit erste GenAI-native Dokumentenparser, der speziell für LLM-Anwendungsfälle entwickelt wurde und folgende Merkmale aufweist:

Unterstützte Formate:

Unterstützt über 130 Dateiformate (PDF, DOCX, PPTX, XLSX, ODT, ODS, HTML, EPUB, Bilder, EML usw.)
Speziell optimiert für die Analyse von Tabellen und Diagrammen in komplexen PDF-Dokumenten
Unterstützt multimodale Analyse unter Verwendung von LLM und LVM zur Verarbeitung komplexer Dokumente

Analysemodi:

Cost Effective: Optimiert für Geschwindigkeit und Kosten, geeignet für textlastige Dokumente mit einfacher Struktur
Agentic: Standardoption, geeignet für Dokumente mit Bildern und Diagrammen
Agentic Plus: Höchste Wiedergabetreue, geeignet für komplexe Layouts, Tabellen und visuelle Strukturen
Use-case Oriented: Spezielle Analyseoptionen für bestimmte Dokumenttypen (Rechnungen, Formulare, technische Lebensläufe, wissenschaftliche Arbeiten)

Technische Merkmale:

Markdown-Ausgabe, die die semantische Struktur des Dokuments beibehält
Erweiterte Extraktion von Tabellen, Diagrammen und Layouts
Visuelle Referenzierungsfunktion zur Rückverfolgung zur ursprünglichen Dokumentposition
Layout-bewusste Analyse, die Seiten in visuelle Blöcke zerlegt

📊 LlamaExtract - Intelligenter Datenextraktor

LlamaExtract ist ein vorgefertigter intelligenter Datenextraktor, der Daten in eine strukturierte JSON-Darstellung umwandelt.

Kernfunktionen:

Extrahiert strukturierte Daten basierend auf benutzerdefinierten Schemata
Unterstützt agentenbasierte Datenextraktions-Workflows
Kann Szenarien wie Lebenslauf-Screening, Formular-Datenextraktion usw. verarbeiten
Automatisierte Datenvalidierung und -bereinigung

Anwendungsszenarien:

Bearbeitung von Lebensläufen und Bewerbungen
Datenextraktion aus Finanzdokumenten
Strukturierung von Formular- und Umfragedaten
Informationsgewinnung aus Verträgen und juristischen Dokumenten

🗂️ LlamaCloud Index - Cloud-Indexierungsdienst

LlamaCloud Index ist eine hochgradig anpassbare, vollautomatische Dokumenten-Ingestionspipeline, die gleichzeitig Abruffunktionen bietet.

Merkmale:

Automatisierte Dokumentenaufnahme und -indexierung
Unterstützung für die Integration verschiedener Datenquellen
Bereitstellung von Retrieval-API-Diensten
Skalierbare Cloud-Speicherlösung

📋 LlamaReport - Intelligenter Berichtsgenerator

LlamaReport ist ein vorgefertigter intelligenter Berichtsgenerator, der Berichte aus verschiedenen Datenquellen erstellen kann (derzeit in der Beta-/Einladungsphase).

Installation und Verwendung

Basisinstallation

pip install llama-cloud-services

Grundlegende Verwendung

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# Dokumentenanalyse
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# Datenextraktion
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# Cloud-Index
index = LlamaCloudIndex(
    "my_index",
    project_name="default",
    api_key="YOUR_API_KEY"
)

# Berichtsgenerierung
report = LlamaReport(api_key="YOUR_API_KEY")

Befehlszeilentool

# Nach Erhalt des API-Schlüssels die Umgebungsvariable setzen
export LLAMA_CLOUD_API_KEY='llx-...'

# Dokument als Text analysieren
llama-parse my_file.pdf --result-type text --output-file output.txt

# Dokument als Markdown analysieren
llama-parse my_file.pdf --result-type markdown --output-file output.md

# Rohes JSON ausgeben
llama-parse my_file.pdf --output-raw-json --output-file output.json

Integration und Kompatibilität

LlamaIndex Integration

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# Direkte Integration in SimpleDirectoryReader
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

Mehrsprachige und regionale Unterstützung

# Unterstützung für die EU-Region
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY",
    base_url=EU_BASE_URL,
    language="en"  # Unterstützt mehrere Sprachen
)

Technische Merkmale

🚀 Leistungsoptimierung

Parallele Verarbeitung mit mehreren Workern
Unterstützung für asynchrone Analyse
Fähigkeit zur Stapelverarbeitung von Dateien
Intelligenter Caching-Mechanismus

🔧 Hochgradig anpassbar

Flexible Konfiguration der Analyseparameter
Definition benutzerdefinierter Datenschemata
Auswahl verschiedener Ausgabeformate
Konfigurierbare Qualitätsstufen

🛡️ Enterprise-Funktionen

Datenschutz
Hochverfügbare Cloud-Dienste
API-Begrenzungen und Kontingentverwaltung
Detaillierte Nutzungsstatistiken

Preismodell

LlamaParse Preisgestaltung

Kostenloser Plan: Bis zu 1000 Seiten pro Tag
Kostenpflichtiger Plan: 7000 kostenlose Seiten pro Woche + zusätzliche Seiten für 0,003 $/Seite
Enterprise Plan: Unterstützung für große Mengen und lokale Bereitstellung

Nutzungsbeschränkungen

Einzelne Datei unterstützt maximal ca. 3000 Seiten
Maximale Dateigröße hängt vom Format ab
API-Aufruffrequenzbeschränkungen

Anwendungsszenarien

📚 Intelligente Dokumentenverarbeitung

Analyse wissenschaftlicher Arbeiten und Wissensextraktion
Strukturierte Verarbeitung technischer Dokumente
Informationsgewinnung aus juristischen Verträgen
Datenanalyse von Finanzberichten

🏢 Unternehmensdatenmanagement

Aufbau interner Dokumenten-Wissensdatenbanken
Datenextraktion aus Kundenprofilen
Automatisierung von Geschäftsprozessen
Verarbeitung von Compliance-Dokumenten

🔬 Forschung und Entwicklung

Data Mining aus wissenschaftlicher Literatur
Analyse von Patentdokumenten
Verarbeitung technischer Berichte
Aufbau und Bereinigung von Datensätzen

Entwicklung und Bereitstellung

Einrichtung der Entwicklungsumgebung

Registrieren Sie ein LlamaCloud-Konto: https://cloud.llamaindex.ai/
Besorgen Sie sich einen API-Schlüssel
Installieren Sie das Python SDK
Konfigurieren Sie Umgebungsvariablen

Bereitstellung in der Produktionsumgebung

Unterstützung für Cloud-API-Aufrufe
Kann in bestehende Datenpipelines integriert werden
Unterstützung für Batch-Verarbeitungs-Workflows
Bietet Überwachungs- und Protokollierungsfunktionen

MCP (Model Context Protocol) Unterstützung

LlamaCloud Services bietet auch MCP-Server-Unterstützung, die mit MCP-fähigen Clients (wie Claude Desktop) integriert werden kann:

# MCP Server-Integrationsbeispiel
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

Community und Support

Offizielle Dokumentation: https://docs.cloud.llamaindex.ai/
GitHub Repository: https://github.com/run-llama/llama_cloud_services
Community-Support: LlamaIndex Community Forum
Enterprise-Support: Erhalten Sie Enterprise-Support über die offiziellen Kontaktmöglichkeiten

Zukünftige Entwicklung

LlamaCloud Services wird kontinuierlich in folgenden Bereichen verbessert:

Unterstützung weiterer Dateiformate
Verbesserte Diagramm- und Tabellenanalysefunktionen
Bessere mehrsprachige Unterstützung
Erweiterte AI-Agentenfunktionen
Weitere Enterprise-Funktionen

Dieses Projekt repräsentiert die Spitzentechnologie im Bereich der Dokumentenverarbeitung und des Wissensmanagements und bietet eine leistungsstarke Dateninfrastruktur zur Erstellung hochwertiger LLM-Anwendungen.