SDK Python para os serviços LlamaCloud, oferecendo agentes de conhecimento e soluções de gerenciamento de dados na nuvem.

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: October 06, 2025

Detalhes do Projeto LlamaCloud Services

Visão Geral do Projeto

LlamaCloud Services é um SDK Python desenvolvido pela equipe LlamaIndex para interagir com os serviços em nuvem LlamaCloud. Este projeto oferece um conjunto completo de ferramentas de agente de conhecimento e gestão de dados, projetadas especificamente para cenários de aplicação de Grandes Modelos de Linguagem (LLM), incluindo funcionalidades essenciais como análise inteligente de documentos, extração de dados estruturados e gestão de índices em nuvem.

Componentes Essenciais do Serviço

🔍 LlamaParse - Analisador de Documentos Nativo de IA

LlamaParse é o primeiro analisador de documentos nativo de GenAI do mundo, construído especificamente para casos de uso de LLM, com as seguintes características:

Formatos Suportados:

  • Suporta mais de 130 formatos de arquivo (PDF, DOCX, PPTX, XLSX, ODT, ODS, HTML, EPUB, imagens, EML, etc.)
  • Otimizado especificamente para análise de tabelas e gráficos em documentos PDF complexos
  • Suporta análise multimodal, usando LLM e LVM para processar documentos complexos

Modos de Análise:

  • Cost Effective: Otimiza velocidade e custo, adequado para documentos com estrutura simples e ricos em texto.
  • Agentic: Opção padrão, adequada para documentos que contêm imagens e gráficos.
  • Agentic Plus: Fidelidade máxima, adequada para layouts complexos, tabelas e estruturas visuais.
  • Use-case Oriented: Opções de análise dedicadas para tipos de documentos específicos (faturas, formulários, currículos técnicos, artigos científicos).

Características Técnicas:

  • Saída Markdown que mantém a estrutura semântica do documento
  • Extração avançada de tabelas, gráficos e layouts
  • Funcionalidade de referência visual, rastreável até a localização original no documento
  • Análise com reconhecimento de layout, dividindo as páginas em blocos visuais

📊 LlamaExtract - Extrator Inteligente de Dados

LlamaExtract é um extrator inteligente de dados pré-construído que pode converter dados em uma representação JSON estruturada.

Funcionalidades Essenciais:

  • Extração de dados estruturados com base em esquemas definidos pelo usuário
  • Suporta fluxos de trabalho de extração de dados baseados em agentes
  • Capaz de lidar com cenários como triagem de currículos e extração de dados de formulários
  • Validação e limpeza automatizada de dados

Casos de Uso:

  • Processamento de currículos e candidaturas a emprego
  • Extração de dados de documentos financeiros
  • Estruturação de dados de formulários e pesquisas
  • Extração de informações de contratos e documentos legais

🗂️ LlamaCloud Index - Serviço de Indexação em Nuvem

LlamaCloud Index é um pipeline de ingestão de documentos totalmente automatizado e altamente personalizável, que também oferece funcionalidades de recuperação.

Características:

  • Ingestão e indexação automatizada de documentos
  • Suporte para integração de múltiplas fontes de dados
  • Oferece serviço de API de recuperação
  • Solução de armazenamento em nuvem escalável

📋 LlamaReport - Gerador Inteligente de Relatórios

LlamaReport é um construtor inteligente de relatórios pré-construído que pode gerar relatórios a partir de múltiplas fontes de dados (atualmente em fase beta/apenas por convite).

Instalação e Uso

Instalação Básica

pip install llama-cloud-services

Uso Básico

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# Análise de Documentos
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# Extração de Dados
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# Indexação em Nuvem
index = LlamaCloudIndex(
    "my_index",
    project_name="default",
    api_key="YOUR_API_KEY"
)

# Geração de Relatórios
report = LlamaReport(api_key="YOUR_API_KEY")

Ferramenta de Linha de Comando

# Após obter a chave de API, defina a variável de ambiente
export LLAMA_CLOUD_API_KEY='llx-...'

# Analisar documento como texto
llama-parse my_file.pdf --result-type text --output-file output.txt

# Analisar documento como Markdown
llama-parse my_file.pdf --result-type markdown --output-file output.md

# Saída JSON bruto
llama-parse my_file.pdf --output-raw-json --output-file output.json

Integração e Compatibilidade

Integração com LlamaIndex

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# Integração direta com SimpleDirectoryReader
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

Suporte Multilíngue e Regional

# Suporte para a região da UE
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY",
    base_url=EU_BASE_URL,
    language="en"  # Suporta múltiplos idiomas
)

Características Técnicas

🚀 Otimização de Desempenho

  • Processamento paralelo com múltiplos workers
  • Suporte para análise assíncrona
  • Capacidade de processamento em lote de arquivos
  • Mecanismo de cache inteligente

🔧 Altamente Personalizável

  • Configuração flexível de parâmetros de análise
  • Definição de esquemas de dados personalizados
  • Múltiplas opções de formato de saída
  • Níveis de qualidade configuráveis

🛡️ Recursos de Nível Empresarial

  • Proteção da privacidade dos dados
  • Serviços em nuvem de alta disponibilidade
  • Limites de API e gestão de cotas
  • Estatísticas de uso detalhadas

Modelo de Preços

Preços do LlamaParse

  • Plano Gratuito: Até 1000 páginas por dia
  • Plano Pago: 7000 páginas gratuitas por semana + páginas adicionais a $0.003/página
  • Plano Empresarial: Suporta grandes volumes e implantação local

Limitações de Uso

  • Um único arquivo suporta no máximo aproximadamente 3000 páginas
  • O tamanho máximo de arquivo suportado varia de acordo com o formato
  • Limites de frequência de chamadas da API

Cenários de Aplicação

📚 Processamento Inteligente de Documentos

  • Análise de artigos acadêmicos e extração de conhecimento
  • Processamento estruturado de documentos técnicos
  • Extração de informações de contratos legais
  • Análise de dados de relatórios financeiros

🏢 Gestão de Dados Corporativos

  • Construção de bases de conhecimento de documentos internos
  • Extração de dados de perfis de clientes
  • Automação de processos de negócios
  • Processamento de documentos de conformidade

🔬 Pesquisa e Desenvolvimento

  • Mineração de dados de literatura científica
  • Análise de documentos de patentes
  • Processamento de relatórios técnicos
  • Construção e limpeza de conjuntos de dados

Desenvolvimento e Implantação

Configuração do Ambiente de Desenvolvimento

  1. Registre uma conta LlamaCloud: https://cloud.llamaindex.ai/
  2. Obtenha sua chave de API
  3. Instale o SDK Python
  4. Configure as variáveis de ambiente

Implantação em Ambiente de Produção

  • Suporta chamadas de API em nuvem
  • Pode ser integrado a pipelines de dados existentes
  • Suporta fluxos de trabalho de processamento em lote
  • Oferece funcionalidades de monitoramento e log

Suporte a MCP (Model Context Protocol)

LlamaCloud Services também oferece suporte a servidores MCP, permitindo a integração com clientes que suportam MCP (como Claude Desktop):

# Exemplo de integração de servidor MCP
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

Comunidade e Suporte

Desenvolvimento Futuro

LlamaCloud Services continua a aprimorar-se nas seguintes áreas:

  • Suporte a mais formatos de arquivo
  • Capacidade aprimorada de análise de gráficos e tabelas
  • Melhor suporte multilíngue
  • Funcionalidades avançadas de agentes de IA
  • Mais recursos de nível empresarial

Este projeto representa a tecnologia de ponta no campo de processamento de documentos e gestão de conhecimento, fornecendo um poderoso suporte de infraestrutura de dados para a construção de aplicações LLM de alta qualidade.

Star History Chart