run-llama/llama_cloud_services View GitHub Homepage for Latest Official Releases

SDK Python para os serviços LlamaCloud, oferecendo agentes de conhecimento e soluções de gerenciamento de dados na nuvem.

MITTypeScriptllama_cloud_servicesrun-llama 4.2k Last Updated: January 30, 2026

Detalhes do Projeto LlamaCloud Services

Visão Geral do Projeto

LlamaCloud Services é um SDK Python desenvolvido pela equipe LlamaIndex para interagir com os serviços em nuvem LlamaCloud. Este projeto oferece um conjunto completo de ferramentas de agente de conhecimento e gestão de dados, projetadas especificamente para cenários de aplicação de Grandes Modelos de Linguagem (LLM), incluindo funcionalidades essenciais como análise inteligente de documentos, extração de dados estruturados e gestão de índices em nuvem.

Componentes Essenciais do Serviço

🔍 LlamaParse - Analisador de Documentos Nativo de IA

LlamaParse é o primeiro analisador de documentos nativo de GenAI do mundo, construído especificamente para casos de uso de LLM, com as seguintes características:

Formatos Suportados:

Suporta mais de 130 formatos de arquivo (PDF, DOCX, PPTX, XLSX, ODT, ODS, HTML, EPUB, imagens, EML, etc.)
Otimizado especificamente para análise de tabelas e gráficos em documentos PDF complexos
Suporta análise multimodal, usando LLM e LVM para processar documentos complexos

Modos de Análise:

Cost Effective: Otimiza velocidade e custo, adequado para documentos com estrutura simples e ricos em texto.
Agentic: Opção padrão, adequada para documentos que contêm imagens e gráficos.
Agentic Plus: Fidelidade máxima, adequada para layouts complexos, tabelas e estruturas visuais.
Use-case Oriented: Opções de análise dedicadas para tipos de documentos específicos (faturas, formulários, currículos técnicos, artigos científicos).

Características Técnicas:

Saída Markdown que mantém a estrutura semântica do documento
Extração avançada de tabelas, gráficos e layouts
Funcionalidade de referência visual, rastreável até a localização original no documento
Análise com reconhecimento de layout, dividindo as páginas em blocos visuais

📊 LlamaExtract - Extrator Inteligente de Dados

LlamaExtract é um extrator inteligente de dados pré-construído que pode converter dados em uma representação JSON estruturada.

Funcionalidades Essenciais:

Extração de dados estruturados com base em esquemas definidos pelo usuário
Suporta fluxos de trabalho de extração de dados baseados em agentes
Capaz de lidar com cenários como triagem de currículos e extração de dados de formulários
Validação e limpeza automatizada de dados

Casos de Uso:

Processamento de currículos e candidaturas a emprego
Extração de dados de documentos financeiros
Estruturação de dados de formulários e pesquisas
Extração de informações de contratos e documentos legais

🗂️ LlamaCloud Index - Serviço de Indexação em Nuvem

LlamaCloud Index é um pipeline de ingestão de documentos totalmente automatizado e altamente personalizável, que também oferece funcionalidades de recuperação.

Características:

Ingestão e indexação automatizada de documentos
Suporte para integração de múltiplas fontes de dados
Oferece serviço de API de recuperação
Solução de armazenamento em nuvem escalável

📋 LlamaReport - Gerador Inteligente de Relatórios

LlamaReport é um construtor inteligente de relatórios pré-construído que pode gerar relatórios a partir de múltiplas fontes de dados (atualmente em fase beta/apenas por convite).

Instalação e Uso

Instalação Básica

pip install llama-cloud-services

Uso Básico

from llama_cloud_services import (
    LlamaParse,
    LlamaExtract,
    LlamaCloudIndex,
    LlamaReport
)

# Análise de Documentos
parser = LlamaParse(api_key="YOUR_API_KEY")
result = parser.parse("./document.pdf")

# Extração de Dados
extract = LlamaExtract(api_key="YOUR_API_KEY")
agent = extract.create_agent(name="data-extraction", data_schema=your_schema)

# Indexação em Nuvem
index = LlamaCloudIndex(
    "my_index",
    project_name="default",
    api_key="YOUR_API_KEY"
)

# Geração de Relatórios
report = LlamaReport(api_key="YOUR_API_KEY")

Ferramenta de Linha de Comando

# Após obter a chave de API, defina a variável de ambiente
export LLAMA_CLOUD_API_KEY='llx-...'

# Analisar documento como texto
llama-parse my_file.pdf --result-type text --output-file output.txt

# Analisar documento como Markdown
llama-parse my_file.pdf --result-type markdown --output-file output.md

# Saída JSON bruto
llama-parse my_file.pdf --output-raw-json --output-file output.json

Integração e Compatibilidade

Integração com LlamaIndex

from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader

parser = LlamaParse(api_key="YOUR_API_KEY")

# Integração direta com SimpleDirectoryReader
reader = SimpleDirectoryReader(
    input_files=["./document.pdf"],
    file_extractor={".pdf": parser}
)
documents = reader.load_data()

Suporte Multilíngue e Regional

# Suporte para a região da UE
from llama_cloud_services import LlamaParse, EU_BASE_URL

parser = LlamaParse(
    api_key="YOUR_API_KEY",
    base_url=EU_BASE_URL,
    language="en"  # Suporta múltiplos idiomas
)

Características Técnicas

🚀 Otimização de Desempenho

Processamento paralelo com múltiplos workers
Suporte para análise assíncrona
Capacidade de processamento em lote de arquivos
Mecanismo de cache inteligente

🔧 Altamente Personalizável

Configuração flexível de parâmetros de análise
Definição de esquemas de dados personalizados
Múltiplas opções de formato de saída
Níveis de qualidade configuráveis

🛡️ Recursos de Nível Empresarial

Proteção da privacidade dos dados
Serviços em nuvem de alta disponibilidade
Limites de API e gestão de cotas
Estatísticas de uso detalhadas

Modelo de Preços

Preços do LlamaParse

Plano Gratuito: Até 1000 páginas por dia
Plano Pago: 7000 páginas gratuitas por semana + páginas adicionais a $0.003/página
Plano Empresarial: Suporta grandes volumes e implantação local

Limitações de Uso

Um único arquivo suporta no máximo aproximadamente 3000 páginas
O tamanho máximo de arquivo suportado varia de acordo com o formato
Limites de frequência de chamadas da API

Cenários de Aplicação

📚 Processamento Inteligente de Documentos

Análise de artigos acadêmicos e extração de conhecimento
Processamento estruturado de documentos técnicos
Extração de informações de contratos legais
Análise de dados de relatórios financeiros

🏢 Gestão de Dados Corporativos

Construção de bases de conhecimento de documentos internos
Extração de dados de perfis de clientes
Automação de processos de negócios
Processamento de documentos de conformidade

🔬 Pesquisa e Desenvolvimento

Mineração de dados de literatura científica
Análise de documentos de patentes
Processamento de relatórios técnicos
Construção e limpeza de conjuntos de dados

Desenvolvimento e Implantação

Configuração do Ambiente de Desenvolvimento

Registre uma conta LlamaCloud: https://cloud.llamaindex.ai/
Obtenha sua chave de API
Instale o SDK Python
Configure as variáveis de ambiente

Implantação em Ambiente de Produção

Suporta chamadas de API em nuvem
Pode ser integrado a pipelines de dados existentes
Suporta fluxos de trabalho de processamento em lote
Oferece funcionalidades de monitoramento e log

Suporte a MCP (Model Context Protocol)

LlamaCloud Services também oferece suporte a servidores MCP, permitindo a integração com clientes que suportam MCP (como Claude Desktop):

# Exemplo de integração de servidor MCP
from llamacloud_mcp import LlamaCloudMCPServer

server = LlamaCloudMCPServer(
    api_key="YOUR_API_KEY",
    indexes=["your_index_name"],
    agents=["your_agent_name"]
)

Comunidade e Suporte

Documentação Oficial: https://docs.cloud.llamaindex.ai/
Repositório GitHub: https://github.com/run-llama/llama_cloud_services
Suporte da Comunidade: Fórum da Comunidade LlamaIndex
Suporte Empresarial: Obtenha suporte de nível empresarial através dos contatos oficiais

Desenvolvimento Futuro

LlamaCloud Services continua a aprimorar-se nas seguintes áreas:

Suporte a mais formatos de arquivo
Capacidade aprimorada de análise de gráficos e tabelas
Melhor suporte multilíngue
Funcionalidades avançadas de agentes de IA
Mais recursos de nível empresarial

Este projeto representa a tecnologia de ponta no campo de processamento de documentos e gestão de conhecimento, fornecendo um poderoso suporte de infraestrutura de dados para a construção de aplicações LLM de alta qualidade.