Un asistente de investigación profunda de código abierto que utiliza agentes de IA para realizar investigaciones profundas automáticamente y generar informes integrales.

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Descripción Detallada del Proyecto Open Deep Research

Resumen del Proyecto

Open Deep Research es un asistente de investigación profunda experimental y completamente de código abierto desarrollado por LangChain AI, capaz de automatizar la investigación profunda y generar informes exhaustivos sobre cualquier tema. El objetivo principal de este proyecto es proporcionar una solución de código abierto sencilla y configurable que compita con los productos de investigación profunda de empresas como OpenAI, Anthropic, Perplexity y Google.

Características Principales

🎯 Diseño de Doble Arquitectura

El proyecto ofrece dos implementaciones diferentes, cada una con sus ventajas:

  1. Arquitectura de Flujo de Trabajo (Workflow Architecture)

    • Flujo de trabajo estructurado de planificación-ejecución
    • Bucle de interacción humano-máquina que permite la retroalimentación del usuario y la aprobación del plan del informe
    • Creación sección por sección, con reflexión entre iteraciones de búsqueda
    • Soporta todos los proveedores de herramientas de búsqueda
  2. Arquitectura Multiagente (Multi-Agent Architecture)

    • Arquitectura de supervisor-investigador
    • Múltiples agentes independientes trabajando en paralelo
    • Reducción significativa del tiempo de generación de informes
    • Diseño de herramientas especializadas

🔧 Altamente Configurable

Open Deep Research ofrece una amplia gama de opciones de configuración para personalizar el proceso de investigación y el comportamiento del modelo. Todas las configuraciones se pueden establecer a través de la interfaz de usuario web (Web UI), variables de entorno o modificando directamente la configuración:

  • Max Structured Output Retries (predeterminado: 3): Número máximo de reintentos para llamadas de salida estructurada
  • Allow Clarification (predeterminado: true): Si se permite al investigador hacer preguntas de aclaración antes de comenzar la investigación
  • Max Concurrent Research Units (predeterminado: 5): Número máximo de unidades de investigación que se ejecutarán concurrentemente utilizando subagentes
  • Search API (predeterminado: Tavily): Soporta múltiples opciones de API de búsqueda
  • Max Researcher Iterations (predeterminado: 3): Número de veces que el supervisor de investigación reflexiona sobre la investigación y plantea preguntas de seguimiento

🤖 Soporte Multimodelo

Open Deep Research utiliza múltiples modelos especializados para diferentes tareas de investigación:

  • Modelo de Resumen (predeterminado: openai:gpt-4.1-nano): Para resumir los resultados de la investigación de la API de búsqueda
  • Modelo de Investigación (predeterminado: openai:gpt-4.1): Para realizar investigación y análisis
  • Modelo de Compresión (predeterminado: openai:gpt-4.1-mini): Para comprimir los hallazgos de investigación de los subagentes
  • Modelo de Informe Final (predeterminado: openai:gpt-4.1): Para redactar el informe final completo

Todos los modelos se configuran utilizando la API init_chat_model(), que soporta proveedores como OpenAI, Anthropic, Google Vertex AI, entre otros.

🔍 Amplia Integración de Herramientas de Búsqueda

El proyecto soporta múltiples APIs de búsqueda:

  • Tavily API - Búsqueda web general
  • Perplexity API - Búsqueda web general
  • Exa API - Búsqueda potente de redes neuronales
  • ArXiv - Artículos académicos de física, matemáticas, informática, etc.
  • PubMed - Literatura biomédica
  • Linkup API - Búsqueda web general
  • DuckDuckGo API - Búsqueda web general
  • Google Search API - Motor de búsqueda personalizado

Arquitectura Técnica

Construido sobre LangGraph

Open Deep Research está construido sobre LangGraph, un framework para construir gráficos de agentes de lenguaje resilientes. Esta arquitectura permite que el proyecto:

  • Aplique estrategias de investigación diferentes de forma flexible
  • Utilice resultados intermedios para guiar la exploración
  • Maneje tareas de investigación de tipo abierto

Proceso de Investigación en Tres Pasos

Open Deep Research utiliza agentes como parte de un proceso de investigación de tres pasos:

  1. Definición del Alcance (Scoping)

    • Aclaración del usuario: Recopilar todo el contexto del usuario necesario para la investigación
    • Generación de resumen: Convertir interacciones detalladas de chat en un resumen de investigación completo y enfocado
  2. Investigación (Research)

    • Realizar la investigación utilizando un agente supervisor
    • Delegar tareas de investigación a un número apropiado de subagentes
    • Determinar si el resumen de investigación se puede descomponer en subtemas independientes
  3. Generación de Informes (Report Generation)

    • Redactar el informe de una sola vez
    • Evitar las dificultades de coordinación de la escritura paralela de múltiples agentes

Instalación y Uso

Inicio Rápido

# Clonar el repositorio
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# Configurar variables de entorno
cp .env.example .env

# Instalar e iniciar el servidor LangGraph
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

Instalar como Paquete Python

pip install open-deep-research

Modo de Uso

  1. A través de la UI de Studio:

  2. Jupyter Notebook:

    • Ver ejemplo: src/open_deep_research/graph.ipynb
    • Ejemplo multiagente: src/open_deep_research/multi_agent.ipynb

Integración de Plataformas

Open Agent Platform (OAP)

Open Agent Platform (OAP) es una interfaz de usuario desde la cual los usuarios no técnicos pueden construir y configurar sus propios agentes. OAP es ideal para permitir a los usuarios configurar investigadores profundos, utilizando diferentes herramientas MCP y APIs de búsqueda que mejor se adapten a sus necesidades.

Rendimiento y Evaluación

Resultados de Benchmarking

Según los resultados, Open Deep Research mejora continuamente y de forma significativa la calidad de las respuestas en los modelos base, lo cual se evidencia en los modelos insignia de Llama, DeepSeek y Qwen, demostrando la calidad del flujo de trabajo.

Funcionalidad de Prueba

# Probar con el modelo Anthropic predeterminado
python tests/run_test.py --all

# Probar con el modelo OpenAI o3
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

Opciones de Despliegue

  • Despliegue Local: Ejecución local a través del servidor LangGraph
  • Despliegue en la Nube: Fácilmente desplegable en la Plataforma LangGraph

Ecosistema del Proyecto

Proyectos Relacionados

  • local-deep-researcher: Asistente de investigación web y redacción de informes completamente local
  • LangGraph: Framework para construir gráficos de agentes de lenguaje resilientes
  • LangChain: Para construir aplicaciones de razonamiento conscientes del contexto

Comunidad y Código Abierto

Desde el lanzamiento de OpenAI, la comunidad de código abierto ha realizado esfuerzos notables en el desarrollo de alternativas de investigación profunda. Este proyecto tiene como objetivo proporcionar a la comunidad un kit de herramientas de investigación profunda de código abierto accesible.

Requisitos Técnicos

Compatibilidad de Modelos

  1. Soporte de Salida Estructurada: Todos los modelos deben soportar salida estructurada
  2. Soporte de Llamada a Herramientas: Los modelos de agente requieren soporte para llamada a herramientas
  3. Compatibilidad con API de Búsqueda: Los modelos de investigación y compresión deben soportar la API de búsqueda seleccionada

Modelos Probados

  • Claude 3.7
  • o3 y o3-mini
  • gpt-4.1
  • llama-3.3-70b-versatile (a través de Groq)

Ventajas y Características

Principios de Diseño

Un principio de diseño clave de Open Deep Research es la flexibilidad, la capacidad de explorar diferentes estrategias de investigación según la solicitud. Los agentes son ideales para la investigación porque pueden aplicar estrategias diversas de forma flexible, utilizando resultados intermedios para guiar la exploración.

Ventajas Clave

  1. Transparencia de Código Abierto: Completamente de código abierto, la comunidad puede revisarlo y mejorarlo
  2. Altamente Configurable: Soporta modelos personalizados, herramientas de búsqueda y estructuras de informe
  3. Soporte Multi-Arquitectura: Ofrece dos implementaciones: flujo de trabajo y multiagente
  4. Amplia Compatibilidad: Soporta múltiples proveedores de modelos de IA y APIs de búsqueda
  5. Interacción Humano-Máquina: Soporta la retroalimentación del usuario y la aprobación del plan del informe
  6. Diseño Especializado: Utiliza modelos especializados para diferentes tareas

Desarrollo Futuro

El proyecto está en continuo desarrollo, con planes para incorporar más funcionalidades y mejoras:

  • Ampliar el soporte de la arquitectura multiagente a más herramientas de búsqueda
  • Mejorar la calidad de la generación de informes
  • Mejorar la experiencia de interacción del usuario
  • Optimizar el rendimiento y la utilización de recursos

Conclusión

Open Deep Research representa un avance significativo en las herramientas de investigación de IA de código abierto. No solo ofrece funcionalidades que compiten con los productos comerciales, sino que también mantiene la transparencia y la personalización inherentes a los proyectos de código abierto. Investigadores, desarrolladores y usuarios empresariales pueden personalizar y desplegar este potente asistente de investigación según sus propias necesidades.

Star History Chart