run-llama/llama_cloud_services View GitHub Homepage for Latest Official Releases

SDK de Python para los servicios de LlamaCloud, que proporciona agentes de conocimiento y soluciones de gestión de datos en la nube.

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: January 30, 2026

Detalles del Proyecto LlamaCloud Services

Resumen del Proyecto

LlamaCloud Services es un SDK de Python desarrollado por el equipo de LlamaIndex para interactuar con los servicios en la nube de LlamaCloud. Este proyecto ofrece un conjunto completo de herramientas de gestión de datos y agentes de conocimiento, diseñadas específicamente para escenarios de aplicaciones de Grandes Modelos de Lenguaje (LLM), incluyendo funciones centrales como el análisis inteligente de documentos, la extracción de datos estructurados y la gestión de índices en la nube.

Componentes Clave del Servicio

🔍 LlamaParse - Analizador de Documentos Nativo de IA

LlamaParse es el primer analizador de documentos nativo de GenAI del mundo, construido para casos de uso de LLM, con las siguientes características:

Formatos Soportados:

Soporta más de 130 formatos de archivo (PDF, DOCX, PPTX, XLSX, ODT, ODS, HTML, EPUB, imágenes, EML, etc.)
Optimizado específicamente para el análisis de tablas y gráficos en documentos PDF complejos
Soporta análisis multimodal, utilizando LLM y LVM para procesar documentos complejos

Modos de Análisis:

Cost Effective: Optimiza la velocidad y el costo, adecuado para documentos con estructuras simples y mucho texto.
Agentic: Opción predeterminada, adecuada para documentos que contienen imágenes y gráficos.
Agentic Plus: Máxima fidelidad, adecuada para diseños complejos, tablas y estructuras visuales.
Use-case Oriented: Opciones de análisis dedicadas para tipos de documentos específicos (facturas, formularios, currículums técnicos, artículos científicos).

Características Técnicas:

Salida en Markdown que mantiene la estructura semántica del documento
Extracción avanzada de tablas, gráficos y diseños
Funcionalidad de referencia visual, rastreable hasta la ubicación original del documento
Análisis consciente del diseño, que descompone las páginas en bloques visuales

📊 LlamaExtract - Extractor Inteligente de Datos

LlamaExtract es un extractor inteligente de datos preconstruido que puede convertir datos en una representación JSON estructurada.

Funciones Principales:

Extrae datos estructurados basándose en esquemas definidos por el usuario
Soporta flujos de trabajo de extracción de datos basados en agentes
Puede manejar escenarios como el cribado de currículums y la extracción de datos de formularios
Automatización de la validación y limpieza de datos

Casos de Uso:

Procesamiento de currículums y solicitudes de empleo
Extracción de datos de documentos financieros
Estructuración de datos de formularios y encuestas
Extracción de información de contratos y documentos legales

🗂️ LlamaCloud Index - Servicio de Indexación en la Nube

LlamaCloud Index es una tubería de ingesta de documentos totalmente automatizada y altamente personalizable, que también proporciona funcionalidad de recuperación.

Características:

Ingesta e indexación automatizada de documentos
Soporta integración con múltiples fuentes de datos
Ofrece un servicio API de recuperación
Solución de almacenamiento en la nube escalable

📋 LlamaReport - Generador Inteligente de Informes

LlamaReport es un generador inteligente de informes preconstruido que puede crear informes a partir de múltiples fuentes de datos (actualmente en fase beta/solo por invitación).

Instalación y Uso

Instalación Básica

pip install llama-cloud-services

Uso Básico

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# Análisis de documentos
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# Extracción de datos
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# Índice en la nube
index = LlamaCloudIndex(
    "my_index", 
    project_name="default", 
    api_key="YOUR_API_KEY"
)

# Generación de informes
report = LlamaReport(api_key="YOUR_API_KEY")

Herramientas de Línea de Comandos

# Después de obtener la clave API, configura la variable de entorno
export LLAMA_CLOUD_API_KEY='llx-...'

# Analizar documento a texto
llama-parse my_file.pdf --result-type text --output-file output.txt

# Analizar documento a Markdown
llama-parse my_file.pdf --result-type markdown --output-file output.md

# Salida JSON crudo
llama-parse my_file.pdf --output-raw-json --output-file output.json

Integración y Compatibilidad

Integración con LlamaIndex

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# Integración directa en SimpleDirectoryReader
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

Soporte Multilingüe y Regional

# Soporte para la región de la UE
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY", 
    base_url=EU_BASE_URL,
    language="en"  # Soporta múltiples idiomas
)

Características Técnicas

🚀 Optimización del Rendimiento

Procesamiento paralelo con múltiples procesos de trabajo
Soporte de análisis asíncrono
Capacidad de procesamiento por lotes de archivos
Mecanismo de caché inteligente

🔧 Altamente Personalizable

Configuración flexible de parámetros de análisis
Definición de esquemas de datos personalizados
Múltiples opciones de formato de salida
Niveles de calidad configurables

🛡️ Características de Nivel Empresarial

Protección de la privacidad de los datos
Servicio en la nube de alta disponibilidad
Gestión de límites y cuotas de API
Estadísticas de uso detalladas

Modelo de Precios

Precios de LlamaParse

Plan Gratuito: Hasta 1000 páginas diarias
Plan de Pago: 7000 páginas gratuitas por semana + páginas adicionales a $0.003/página
Plan Empresarial: Soporte para grandes volúmenes y despliegue local

Límites de Uso

Un solo archivo soporta un máximo de aproximadamente 3000 páginas
El tamaño máximo de archivo soportado varía según el formato
Límites de frecuencia de llamadas a la API

Escenarios de Aplicación

📚 Procesamiento Inteligente de Documentos

Análisis de artículos académicos y extracción de conocimiento
Procesamiento estructurado de documentos técnicos
Extracción de información de contratos legales
Análisis de datos de informes financieros

🏢 Gestión de Datos Empresariales

Construcción de bases de conocimiento de documentos internos
Extracción de datos de perfiles de clientes
Automatización de procesos de negocio
Procesamiento de documentos de cumplimiento

🔬 Investigación y Desarrollo

Minería de datos de literatura científica
Análisis de documentos de patentes
Procesamiento de informes técnicos
Construcción y limpieza de conjuntos de datos

Desarrollo y Despliegue

Configuración del Entorno de Desarrollo

Regístrate en una cuenta de LlamaCloud: https://cloud.llamaindex.ai/
Obtén tu clave API
Instala el SDK de Python
Configura las variables de entorno

Despliegue en Entorno de Producción

Soporte para llamadas a la API en la nube
Puede integrarse en tuberías de datos existentes
Soporta flujos de trabajo de procesamiento por lotes
Ofrece funciones de monitoreo y registro

Soporte MCP (Model Context Protocol)

LlamaCloud Services también ofrece soporte para servidores MCP, que pueden integrarse con clientes compatibles con MCP (como Claude Desktop):

# Ejemplo de integración de servidor MCP
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

Comunidad y Soporte

Documentación Oficial: https://docs.cloud.llamaindex.ai/
Repositorio GitHub: https://github.com/run-llama/llama_cloud_services
Soporte Comunitario: Foro de la comunidad LlamaIndex
Soporte Empresarial: Obtén soporte de nivel empresarial a través de los contactos oficiales

Desarrollo Futuro

LlamaCloud Services continúa mejorando en las siguientes áreas:

Más formatos de archivo soportados
Capacidades mejoradas de análisis de gráficos y tablas
Mejor soporte multilingüe
Funciones avanzadas de agentes de IA
Más características de nivel empresarial

Este proyecto representa la tecnología de vanguardia en el procesamiento de documentos y la gestión del conocimiento, proporcionando una potente infraestructura de datos para construir aplicaciones LLM de alta calidad.