SDK de Python para los servicios de LlamaCloud, que proporciona agentes de conocimiento y soluciones de gestión de datos en la nube.

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: October 06, 2025

Detalles del Proyecto LlamaCloud Services

Resumen del Proyecto

LlamaCloud Services es un SDK de Python desarrollado por el equipo de LlamaIndex para interactuar con los servicios en la nube de LlamaCloud. Este proyecto ofrece un conjunto completo de herramientas de gestión de datos y agentes de conocimiento, diseñadas específicamente para escenarios de aplicaciones de Grandes Modelos de Lenguaje (LLM), incluyendo funciones centrales como el análisis inteligente de documentos, la extracción de datos estructurados y la gestión de índices en la nube.

Componentes Clave del Servicio

🔍 LlamaParse - Analizador de Documentos Nativo de IA

LlamaParse es el primer analizador de documentos nativo de GenAI del mundo, construido para casos de uso de LLM, con las siguientes características:

Formatos Soportados:

  • Soporta más de 130 formatos de archivo (PDF, DOCX, PPTX, XLSX, ODT, ODS, HTML, EPUB, imágenes, EML, etc.)
  • Optimizado específicamente para el análisis de tablas y gráficos en documentos PDF complejos
  • Soporta análisis multimodal, utilizando LLM y LVM para procesar documentos complejos

Modos de Análisis:

  • Cost Effective: Optimiza la velocidad y el costo, adecuado para documentos con estructuras simples y mucho texto.
  • Agentic: Opción predeterminada, adecuada para documentos que contienen imágenes y gráficos.
  • Agentic Plus: Máxima fidelidad, adecuada para diseños complejos, tablas y estructuras visuales.
  • Use-case Oriented: Opciones de análisis dedicadas para tipos de documentos específicos (facturas, formularios, currículums técnicos, artículos científicos).

Características Técnicas:

  • Salida en Markdown que mantiene la estructura semántica del documento
  • Extracción avanzada de tablas, gráficos y diseños
  • Funcionalidad de referencia visual, rastreable hasta la ubicación original del documento
  • Análisis consciente del diseño, que descompone las páginas en bloques visuales

📊 LlamaExtract - Extractor Inteligente de Datos

LlamaExtract es un extractor inteligente de datos preconstruido que puede convertir datos en una representación JSON estructurada.

Funciones Principales:

  • Extrae datos estructurados basándose en esquemas definidos por el usuario
  • Soporta flujos de trabajo de extracción de datos basados en agentes
  • Puede manejar escenarios como el cribado de currículums y la extracción de datos de formularios
  • Automatización de la validación y limpieza de datos

Casos de Uso:

  • Procesamiento de currículums y solicitudes de empleo
  • Extracción de datos de documentos financieros
  • Estructuración de datos de formularios y encuestas
  • Extracción de información de contratos y documentos legales

🗂️ LlamaCloud Index - Servicio de Indexación en la Nube

LlamaCloud Index es una tubería de ingesta de documentos totalmente automatizada y altamente personalizable, que también proporciona funcionalidad de recuperación.

Características:

  • Ingesta e indexación automatizada de documentos
  • Soporta integración con múltiples fuentes de datos
  • Ofrece un servicio API de recuperación
  • Solución de almacenamiento en la nube escalable

📋 LlamaReport - Generador Inteligente de Informes

LlamaReport es un generador inteligente de informes preconstruido que puede crear informes a partir de múltiples fuentes de datos (actualmente en fase beta/solo por invitación).

Instalación y Uso

Instalación Básica

pip install llama-cloud-services

Uso Básico

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# Análisis de documentos
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# Extracción de datos
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# Índice en la nube
index = LlamaCloudIndex(
    "my_index", 
    project_name="default", 
    api_key="YOUR_API_KEY"
)

# Generación de informes
report = LlamaReport(api_key="YOUR_API_KEY")

Herramientas de Línea de Comandos

# Después de obtener la clave API, configura la variable de entorno
export LLAMA_CLOUD_API_KEY='llx-...'

# Analizar documento a texto
llama-parse my_file.pdf --result-type text --output-file output.txt

# Analizar documento a Markdown
llama-parse my_file.pdf --result-type markdown --output-file output.md

# Salida JSON crudo
llama-parse my_file.pdf --output-raw-json --output-file output.json

Integración y Compatibilidad

Integración con LlamaIndex

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# Integración directa en SimpleDirectoryReader
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

Soporte Multilingüe y Regional

# Soporte para la región de la UE
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY", 
    base_url=EU_BASE_URL,
    language="en"  # Soporta múltiples idiomas
)

Características Técnicas

🚀 Optimización del Rendimiento

  • Procesamiento paralelo con múltiples procesos de trabajo
  • Soporte de análisis asíncrono
  • Capacidad de procesamiento por lotes de archivos
  • Mecanismo de caché inteligente

🔧 Altamente Personalizable

  • Configuración flexible de parámetros de análisis
  • Definición de esquemas de datos personalizados
  • Múltiples opciones de formato de salida
  • Niveles de calidad configurables

🛡️ Características de Nivel Empresarial

  • Protección de la privacidad de los datos
  • Servicio en la nube de alta disponibilidad
  • Gestión de límites y cuotas de API
  • Estadísticas de uso detalladas

Modelo de Precios

Precios de LlamaParse

  • Plan Gratuito: Hasta 1000 páginas diarias
  • Plan de Pago: 7000 páginas gratuitas por semana + páginas adicionales a $0.003/página
  • Plan Empresarial: Soporte para grandes volúmenes y despliegue local

Límites de Uso

  • Un solo archivo soporta un máximo de aproximadamente 3000 páginas
  • El tamaño máximo de archivo soportado varía según el formato
  • Límites de frecuencia de llamadas a la API

Escenarios de Aplicación

📚 Procesamiento Inteligente de Documentos

  • Análisis de artículos académicos y extracción de conocimiento
  • Procesamiento estructurado de documentos técnicos
  • Extracción de información de contratos legales
  • Análisis de datos de informes financieros

🏢 Gestión de Datos Empresariales

  • Construcción de bases de conocimiento de documentos internos
  • Extracción de datos de perfiles de clientes
  • Automatización de procesos de negocio
  • Procesamiento de documentos de cumplimiento

🔬 Investigación y Desarrollo

  • Minería de datos de literatura científica
  • Análisis de documentos de patentes
  • Procesamiento de informes técnicos
  • Construcción y limpieza de conjuntos de datos

Desarrollo y Despliegue

Configuración del Entorno de Desarrollo

  1. Regístrate en una cuenta de LlamaCloud: https://cloud.llamaindex.ai/
  2. Obtén tu clave API
  3. Instala el SDK de Python
  4. Configura las variables de entorno

Despliegue en Entorno de Producción

  • Soporte para llamadas a la API en la nube
  • Puede integrarse en tuberías de datos existentes
  • Soporta flujos de trabajo de procesamiento por lotes
  • Ofrece funciones de monitoreo y registro

Soporte MCP (Model Context Protocol)

LlamaCloud Services también ofrece soporte para servidores MCP, que pueden integrarse con clientes compatibles con MCP (como Claude Desktop):

# Ejemplo de integración de servidor MCP
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

Comunidad y Soporte

Desarrollo Futuro

LlamaCloud Services continúa mejorando en las siguientes áreas:

  • Más formatos de archivo soportados
  • Capacidades mejoradas de análisis de gráficos y tablas
  • Mejor soporte multilingüe
  • Funciones avanzadas de agentes de IA
  • Más características de nivel empresarial

Este proyecto representa la tecnología de vanguardia en el procesamiento de documentos y la gestión del conocimiento, proporcionando una potente infraestructura de datos para construir aplicaciones LLM de alta calidad.

Star History Chart