Um assistente de pesquisa profunda de código aberto que usa agentes de IA para realizar pesquisas profundas automaticamente e gerar relatórios abrangentes.
Detalhes do Projeto Open Deep Research
Visão Geral do Projeto
Open Deep Research é um assistente de pesquisa profunda experimental e totalmente de código aberto, desenvolvido pela LangChain AI, capaz de automatizar a pesquisa profunda e gerar relatórios abrangentes sobre qualquer tópico. O objetivo central deste projeto é fornecer uma solução de código aberto simples e configurável para competir com produtos de pesquisa profunda de empresas como OpenAI, Anthropic, Perplexity e Google.
Características Principais
🎯 Design de Dupla Arquitetura
O projeto oferece duas implementações distintas, cada uma com suas vantagens:
Arquitetura de Fluxo de Trabalho (Workflow Architecture)
- Fluxo de trabalho estruturado de planejamento-execução
- Loop de interação humano-máquina, permitindo feedback do usuário e aprovação do plano do relatório
- Criação seção por seção, com reflexão entre as iterações de busca
- Suporta todos os provedores de ferramentas de busca
Arquitetura Multiagente (Multi-Agent Architecture)
- Arquitetura Supervisor-Pesquisador
- Múltiplos agentes independentes trabalhando em paralelo
- Redução significativa no tempo de geração de relatórios
- Design de ferramentas especializadas
🔧 Altamente Configurável
Open Deep Research oferece uma ampla gama de opções de configuração para personalizar o processo de pesquisa e o comportamento do modelo. Todas as configurações podem ser definidas via Web UI, variáveis de ambiente ou modificação direta da configuração:
- Max Structured Output Retries (Padrão: 3): Número máximo de tentativas para chamadas de saída estruturada
- Allow Clarification (Padrão: true): Se o pesquisador pode fazer perguntas de esclarecimento antes de iniciar a pesquisa
- Max Concurrent Research Units (Padrão: 5): Número máximo de unidades de pesquisa a serem executadas concorrentemente usando subagentes
- Search API (Padrão: Tavily): Suporta múltiplas opções de API de busca
- Max Researcher Iterations (Padrão: 3): Número de vezes que o supervisor de pesquisa reflete sobre a pesquisa e faz perguntas de acompanhamento
🤖 Suporte a Múltiplos Modelos
Open Deep Research utiliza múltiplos modelos especializados para diferentes tarefas de pesquisa:
- Modelo de Resumo (Padrão: openai:gpt-4.1-nano): Para resumir os resultados da pesquisa da API de busca
- Modelo de Pesquisa (Padrão: openai:gpt-4.1): Para conduzir a pesquisa e análise
- Modelo de Compressão (Padrão: openai:gpt-4.1-mini): Para comprimir as descobertas de pesquisa dos subagentes
- Modelo de Relatório Final (Padrão: openai:gpt-4.1): Para redigir o relatório sintético final
Todos os modelos são configurados usando a API init_chat_model()
, que suporta provedores como OpenAI, Anthropic, Google Vertex AI, entre outros.
🔍 Rica Integração de Ferramentas de Busca
O projeto suporta várias APIs de busca:
- Tavily API - Busca web geral
- Perplexity API - Busca web geral
- Exa API - Poderosa busca de rede neural
- ArXiv - Artigos acadêmicos de física, matemática, ciência da computação, etc.
- PubMed - Literatura biomédica
- Linkup API - Busca web geral
- DuckDuckGo API - Busca web geral
- Google Search API - Mecanismo de busca personalizado
Arquitetura Técnica
Construído com Base no LangGraph
Open Deep Research é construído com base no LangGraph, um framework para construir grafos de agentes de linguagem resilientes. Essa arquitetura permite que o projeto:
- Aplique flexivelmente diferentes estratégias de pesquisa
- Use resultados intermediários para guiar a exploração
- Lide com tarefas de pesquisa abertas
Processo de Pesquisa em Três Etapas
Open Deep Research utiliza agentes como parte de um processo de pesquisa em três etapas:
Definição do Escopo (Scoping)
- Esclarecimento do usuário: Coleta todo o contexto do usuário necessário para a pesquisa
- Geração de resumo: Transforma interações de chat detalhadas em um resumo de pesquisa abrangente e focado
Pesquisa (Research)
- Realiza a pesquisa usando um agente supervisor
- Delega tarefas de pesquisa a um número apropriado de subagentes
- Determina se o resumo da pesquisa pode ser decomposto em subtópicos independentes
Geração de Relatório (Report Generation)
- Redige o relatório de uma só vez
- Evita dificuldades de coordenação da escrita paralela de múltiplos agentes
Instalação e Uso
Início Rápido
# Clonar o repositório
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research
# Configurar variáveis de ambiente
cp .env.example .env
# Instalar e iniciar o servidor LangGraph
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking
Instalação como Pacote Python
pip install open-deep-research
Modo de Uso
Via Studio UI:
- 🚀 API: http://127.0.0.1:2024
- 🎨 Studio UI: https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024
- 📚 API Docs: http://127.0.0.1:2024/docs
Jupyter Notebook:
- Ver exemplos:
src/open_deep_research/graph.ipynb
- Exemplo multiagente:
src/open_deep_research/multi_agent.ipynb
- Ver exemplos:
Integração de Plataformas
Open Agent Platform (OAP)
Open Agent Platform (OAP) é uma interface de usuário onde usuários não técnicos podem construir e configurar seus próprios agentes. O OAP é ideal para permitir que os usuários configurem o pesquisador profundo, usando diferentes ferramentas MCP e APIs de busca mais adequadas às suas necessidades.
Desempenho e Avaliação
Resultados de Benchmarking
De acordo com os resultados, o Open Deep Research melhora consistentemente e significativamente a qualidade das respostas em modelos de base, o que é evidente nos modelos carro-chefe Llama, DeepSeek e Qwen, demonstrando a qualidade do fluxo de trabalho.
Funcionalidades de Teste
# Testar com o modelo Anthropic padrão
python tests/run_test.py --all
# Testar com o modelo OpenAI o3
python tests/run_test.py --all \
--supervisor-model "openai:o3" \
--researcher-model "openai:o3" \
--planner-provider "openai" \
--planner-model "o3" \
--writer-provider "openai" \
--writer-model "o3" \
--eval-model "openai:o3" \
--search-api "tavily"
Opções de Implantação
- Implantação Local: Execução local via servidor LangGraph
- Implantação em Nuvem: Facilmente implantável na LangGraph Platform
Ecossistema do Projeto
Projetos Relacionados
- local-deep-researcher: Assistente de pesquisa web e escrita de relatórios totalmente local
- LangGraph: Framework para construir grafos de agentes de linguagem resilientes
- LangChain: Para construir aplicações de raciocínio sensíveis ao contexto
Comunidade e Código Aberto
Desde o lançamento do OpenAI, a comunidade de código aberto tem feito esforços notáveis no desenvolvimento de alternativas de pesquisa profunda. Este projeto visa fornecer à comunidade um kit de ferramentas de pesquisa profunda de código aberto acessível.
Requisitos Técnicos
Compatibilidade de Modelos
- Suporte a Saída Estruturada: Todos os modelos devem suportar saída estruturada
- Suporte a Chamada de Ferramentas: Modelos de agente precisam suportar chamadas de ferramentas
- Compatibilidade com API de Busca: Modelos de pesquisa e compressão devem suportar a API de busca selecionada
Modelos Testados
- Claude 3.7
- o3 e o3-mini
- gpt-4.1
- llama-3.3-70b-versatile (via Groq)
Vantagens e Características
Princípios de Design
Um princípio de design chave do Open Deep Research é a flexibilidade, a capacidade de explorar diferentes estratégias de pesquisa com base na solicitação. Os agentes são ideais para pesquisa, pois podem aplicar flexivelmente diferentes estratégias, usando resultados intermediários para guiar a exploração.
Vantagens Principais
- Transparência de Código Aberto: Totalmente de código aberto, a comunidade pode revisar e aprimorar
- Altamente Configurável: Suporta modelos personalizados, ferramentas de busca e estrutura de relatório
- Suporte a Múltiplas Arquiteturas: Oferece implementações de fluxo de trabalho e multiagente
- Ampla Compatibilidade: Suporta múltiplos provedores de modelos de IA e APIs de busca
- Interação Humano-Máquina: Suporta feedback do usuário e aprovação do plano de relatório
- Design Especializado: Utiliza modelos especializados para diferentes tarefas
Desenvolvimento Futuro
O projeto está em constante desenvolvimento, com planos para adicionar mais funcionalidades e melhorias:
- Expandir o suporte da arquitetura multiagente para mais ferramentas de busca
- Melhorar a qualidade da geração de relatórios
- Aprimorar a experiência de interação do usuário
- Otimizar o desempenho e a utilização de recursos
Resumo
Open Deep Research representa um avanço significativo nas ferramentas de pesquisa de IA de código aberto, não apenas fornecendo funcionalidades que competem com produtos comerciais, mas também mantendo a transparência e a personalização de um projeto de código aberto. Seja para pesquisadores, desenvolvedores ou usuários corporativos, este poderoso assistente de pesquisa pode ser personalizado e implantado de acordo com suas necessidades.