langchain-ai/open_deep_researchView GitHub Homepage for Latest Official Releases

Un asistente de investigación profunda de código abierto que utiliza agentes de IA para realizar investigaciones profundas automáticamente y generar informes integrales.

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Descripción Detallada del Proyecto Open Deep Research

Resumen del Proyecto

Open Deep Research es un asistente de investigación profunda experimental y completamente de código abierto desarrollado por LangChain AI, capaz de automatizar la investigación profunda y generar informes exhaustivos sobre cualquier tema. El objetivo principal de este proyecto es proporcionar una solución de código abierto sencilla y configurable que compita con los productos de investigación profunda de empresas como OpenAI, Anthropic, Perplexity y Google.

Características Principales

🎯 Diseño de Doble Arquitectura

El proyecto ofrece dos implementaciones diferentes, cada una con sus ventajas:

Arquitectura de Flujo de Trabajo (Workflow Architecture)
- Flujo de trabajo estructurado de planificación-ejecución
- Bucle de interacción humano-máquina que permite la retroalimentación del usuario y la aprobación del plan del informe
- Creación sección por sección, con reflexión entre iteraciones de búsqueda
- Soporta todos los proveedores de herramientas de búsqueda
Arquitectura Multiagente (Multi-Agent Architecture)
- Arquitectura de supervisor-investigador
- Múltiples agentes independientes trabajando en paralelo
- Reducción significativa del tiempo de generación de informes
- Diseño de herramientas especializadas

🔧 Altamente Configurable

Open Deep Research ofrece una amplia gama de opciones de configuración para personalizar el proceso de investigación y el comportamiento del modelo. Todas las configuraciones se pueden establecer a través de la interfaz de usuario web (Web UI), variables de entorno o modificando directamente la configuración:

Max Structured Output Retries (predeterminado: 3): Número máximo de reintentos para llamadas de salida estructurada
Allow Clarification (predeterminado: true): Si se permite al investigador hacer preguntas de aclaración antes de comenzar la investigación
Max Concurrent Research Units (predeterminado: 5): Número máximo de unidades de investigación que se ejecutarán concurrentemente utilizando subagentes
Search API (predeterminado: Tavily): Soporta múltiples opciones de API de búsqueda
Max Researcher Iterations (predeterminado: 3): Número de veces que el supervisor de investigación reflexiona sobre la investigación y plantea preguntas de seguimiento

🤖 Soporte Multimodelo

Open Deep Research utiliza múltiples modelos especializados para diferentes tareas de investigación:

Modelo de Resumen (predeterminado: openai:gpt-4.1-nano): Para resumir los resultados de la investigación de la API de búsqueda
Modelo de Investigación (predeterminado: openai:gpt-4.1): Para realizar investigación y análisis
Modelo de Compresión (predeterminado: openai:gpt-4.1-mini): Para comprimir los hallazgos de investigación de los subagentes
Modelo de Informe Final (predeterminado: openai:gpt-4.1): Para redactar el informe final completo

Todos los modelos se configuran utilizando la API init_chat_model(), que soporta proveedores como OpenAI, Anthropic, Google Vertex AI, entre otros.

🔍 Amplia Integración de Herramientas de Búsqueda

El proyecto soporta múltiples APIs de búsqueda:

Tavily API - Búsqueda web general
Perplexity API - Búsqueda web general
Exa API - Búsqueda potente de redes neuronales
ArXiv - Artículos académicos de física, matemáticas, informática, etc.
PubMed - Literatura biomédica
Linkup API - Búsqueda web general
DuckDuckGo API - Búsqueda web general
Google Search API - Motor de búsqueda personalizado

Arquitectura Técnica

Construido sobre LangGraph

Open Deep Research está construido sobre LangGraph, un framework para construir gráficos de agentes de lenguaje resilientes. Esta arquitectura permite que el proyecto:

Aplique estrategias de investigación diferentes de forma flexible
Utilice resultados intermedios para guiar la exploración
Maneje tareas de investigación de tipo abierto

Proceso de Investigación en Tres Pasos

Open Deep Research utiliza agentes como parte de un proceso de investigación de tres pasos:

Definición del Alcance (Scoping)
- Aclaración del usuario: Recopilar todo el contexto del usuario necesario para la investigación
- Generación de resumen: Convertir interacciones detalladas de chat en un resumen de investigación completo y enfocado
Investigación (Research)
- Realizar la investigación utilizando un agente supervisor
- Delegar tareas de investigación a un número apropiado de subagentes
- Determinar si el resumen de investigación se puede descomponer en subtemas independientes
Generación de Informes (Report Generation)
- Redactar el informe de una sola vez
- Evitar las dificultades de coordinación de la escritura paralela de múltiples agentes

Instalación y Uso

Inicio Rápido

# Clonar el repositorio
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# Configurar variables de entorno
cp .env.example .env

# Instalar e iniciar el servidor LangGraph
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

Instalar como Paquete Python

pip install open-deep-research

Modo de Uso

A través de la UI de Studio:
- 🚀 API: http://127.0.0.1:2024
- 🎨 UI de Studio: https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024
- 📚 Documentación de la API: http://127.0.0.1:2024/docs
Jupyter Notebook:
- Ver ejemplo: src/open_deep_research/graph.ipynb
- Ejemplo multiagente: src/open_deep_research/multi_agent.ipynb

Integración de Plataformas

Open Agent Platform (OAP)

Open Agent Platform (OAP) es una interfaz de usuario desde la cual los usuarios no técnicos pueden construir y configurar sus propios agentes. OAP es ideal para permitir a los usuarios configurar investigadores profundos, utilizando diferentes herramientas MCP y APIs de búsqueda que mejor se adapten a sus necesidades.

Rendimiento y Evaluación

Resultados de Benchmarking

Según los resultados, Open Deep Research mejora continuamente y de forma significativa la calidad de las respuestas en los modelos base, lo cual se evidencia en los modelos insignia de Llama, DeepSeek y Qwen, demostrando la calidad del flujo de trabajo.

Funcionalidad de Prueba

# Probar con el modelo Anthropic predeterminado
python tests/run_test.py --all

# Probar con el modelo OpenAI o3
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

Opciones de Despliegue

Despliegue Local: Ejecución local a través del servidor LangGraph
Despliegue en la Nube: Fácilmente desplegable en la Plataforma LangGraph

Ecosistema del Proyecto

Proyectos Relacionados

local-deep-researcher: Asistente de investigación web y redacción de informes completamente local
LangGraph: Framework para construir gráficos de agentes de lenguaje resilientes
LangChain: Para construir aplicaciones de razonamiento conscientes del contexto

Comunidad y Código Abierto

Desde el lanzamiento de OpenAI, la comunidad de código abierto ha realizado esfuerzos notables en el desarrollo de alternativas de investigación profunda. Este proyecto tiene como objetivo proporcionar a la comunidad un kit de herramientas de investigación profunda de código abierto accesible.

Requisitos Técnicos

Compatibilidad de Modelos

Soporte de Salida Estructurada: Todos los modelos deben soportar salida estructurada
Soporte de Llamada a Herramientas: Los modelos de agente requieren soporte para llamada a herramientas
Compatibilidad con API de Búsqueda: Los modelos de investigación y compresión deben soportar la API de búsqueda seleccionada

Modelos Probados

Claude 3.7
o3 y o3-mini
gpt-4.1
llama-3.3-70b-versatile (a través de Groq)

Ventajas y Características

Principios de Diseño

Un principio de diseño clave de Open Deep Research es la flexibilidad, la capacidad de explorar diferentes estrategias de investigación según la solicitud. Los agentes son ideales para la investigación porque pueden aplicar estrategias diversas de forma flexible, utilizando resultados intermedios para guiar la exploración.

Ventajas Clave

Transparencia de Código Abierto: Completamente de código abierto, la comunidad puede revisarlo y mejorarlo
Altamente Configurable: Soporta modelos personalizados, herramientas de búsqueda y estructuras de informe
Soporte Multi-Arquitectura: Ofrece dos implementaciones: flujo de trabajo y multiagente
Amplia Compatibilidad: Soporta múltiples proveedores de modelos de IA y APIs de búsqueda
Interacción Humano-Máquina: Soporta la retroalimentación del usuario y la aprobación del plan del informe
Diseño Especializado: Utiliza modelos especializados para diferentes tareas

Desarrollo Futuro

El proyecto está en continuo desarrollo, con planes para incorporar más funcionalidades y mejoras:

Ampliar el soporte de la arquitectura multiagente a más herramientas de búsqueda
Mejorar la calidad de la generación de informes
Mejorar la experiencia de interacción del usuario
Optimizar el rendimiento y la utilización de recursos

Conclusión

Open Deep Research representa un avance significativo en las herramientas de investigación de IA de código abierto. No solo ofrece funcionalidades que compiten con los productos comerciales, sino que también mantiene la transparencia y la personalización inherentes a los proyectos de código abierto. Investigadores, desarrolladores y usuarios empresariales pueden personalizar y desplegar este potente asistente de investigación según sus propias necesidades.