Un assistant de recherche approfondie open source qui utilise des agents d'IA pour effectuer automatiquement des recherches approfondies et générer des rapports complets.

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Présentation Détaillée du Projet Open Deep Research

Aperçu du Projet

Open Deep Research est un assistant de recherche approfondie expérimental et entièrement open source, développé par LangChain AI. Il est capable d'automatiser la recherche approfondie et de générer des rapports exhaustifs sur n'importe quel sujet. L'objectif principal de ce projet est de fournir une solution open source simple et configurable, capable de concurrencer les produits de recherche approfondie d'entreprises telles qu'OpenAI, Anthropic, Perplexity et Google.

Fonctionnalités Clés

🎯 Conception à Double Architecture

Le projet propose deux approches d'implémentation distinctes, chacune avec ses propres avantages :

  1. Architecture de Flux de Travail (Workflow Architecture)

    • Flux de travail structuré de planification et d'exécution
    • Boucle d'interaction homme-machine, permettant le feedback de l'utilisateur et l'approbation du plan de rapport
    • Création section par section, avec réflexion entre les itérations de recherche
    • Prend en charge tous les fournisseurs d'outils de recherche
  2. Architecture Multi-Agents (Multi-Agent Architecture)

    • Architecture Superviseur-Chercheur
    • Plusieurs agents indépendants travaillant en parallèle
    • Réduction significative du temps de génération des rapports
    • Conception d'outils spécialisés

🔧 Haute Configurabilité

Open Deep Research offre un large éventail d'options de configuration pour personnaliser le processus de recherche et le comportement du modèle. Toutes les configurations peuvent être définies via l'interface utilisateur web (Web UI), les variables d'environnement ou en modifiant directement la configuration :

  • Max Structured Output Retries (par défaut : 3) : Nombre maximal de tentatives pour les appels de sortie structurée
  • Allow Clarification (par défaut : true) : Indique si le chercheur est autorisé à poser des questions de clarification avant de commencer la recherche
  • Max Concurrent Research Units (par défaut : 5) : Nombre maximal d'unités de recherche exécutées simultanément à l'aide de sous-agents
  • Search API (par défaut : Tavily) : Prend en charge plusieurs choix d'API de recherche
  • Max Researcher Iterations (par défaut : 3) : Nombre de fois où le superviseur de recherche réfléchit à la recherche et pose des questions de suivi

🤖 Prise en Charge Multi-Modèles

Open Deep Research utilise plusieurs modèles spécialisés pour différentes tâches de recherche :

  • Modèle de Résumé (par défaut : openai:gpt-4.1-nano) : Résume les résultats de recherche de l'API de recherche
  • Modèle de Recherche (par défaut : openai:gpt-4.1) : Effectue la recherche et l'analyse
  • Modèle de Compression (par défaut : openai:gpt-4.1-mini) : Compresse les découvertes de recherche des sous-agents
  • Modèle de Rapport Final (par défaut : openai:gpt-4.1) : Rédige le rapport synthétique final

Tous les modèles sont configurés à l'aide de l'API init_chat_model(), prenant en charge des fournisseurs tels qu'OpenAI, Anthropic, Google Vertex AI, etc.

🔍 Intégration Riche d'Outils de Recherche

Le projet prend en charge plusieurs API de recherche :

  • API Tavily - Recherche web générale
  • API Perplexity - Recherche web générale
  • API Exa - Recherche neuronale puissante
  • ArXiv - Articles académiques en physique, mathématiques, informatique, etc.
  • PubMed - Littérature biomédicale
  • API Linkup - Recherche web générale
  • API DuckDuckGo - Recherche web générale
  • API Google Search - Moteur de recherche personnalisé

Architecture Technique

Construit sur LangGraph

Open Deep Research est construit sur LangGraph, un cadre pour la construction de graphes d'agents linguistiques résilients. Cette architecture permet au projet de :

  • Appliquer de manière flexible différentes stratégies de recherche
  • Utiliser les résultats intermédiaires pour guider l'exploration
  • Gérer les tâches de recherche ouvertes

Processus de Recherche en Trois Étapes

Open Deep Research utilise des agents pour effectuer la recherche dans le cadre d'un processus en trois étapes :

  1. Délimitation du Périmètre (Scoping)

    • Clarification de l'utilisateur : Recueillir tout le contexte utilisateur nécessaire à la recherche
    • Génération de brève : Convertir les interactions de chat détaillées en une brève de recherche complète et ciblée
  2. Recherche (Research)

    • Effectuer la recherche à l'aide d'un agent superviseur
    • Déléguer les tâches de recherche à un nombre approprié de sous-agents
    • Déterminer si la brève de recherche peut être décomposée en sous-thèmes indépendants
  3. Génération de Rapport (Report Generation)

    • Rédiger le rapport en une seule fois
    • Éviter les difficultés de coordination liées à la rédaction parallèle par plusieurs agents

Installation et Utilisation

Démarrage Rapide

# Cloner le dépôt
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# Configurer les variables d'environnement
cp .env.example .env

# Installer et démarrer le serveur LangGraph
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

Installation en tant que Paquet Python

pip install open-deep-research

Modes d'Utilisation

  1. Via l'interface utilisateur de Studio (Studio UI) :

  2. Jupyter Notebook :

    • Voir les exemples : src/open_deep_research/graph.ipynb
    • Exemple multi-agents : src/open_deep_research/multi_agent.ipynb

Intégration de Plateforme

Plateforme Open Agent (OAP)

L'Open Agent Platform (OAP) est une interface utilisateur qui permet aux utilisateurs non techniques de construire et de configurer leurs propres agents. L'OAP est idéale pour permettre aux utilisateurs de configurer des chercheurs approfondis, en utilisant les différents outils MCP et API de recherche les mieux adaptés à leurs besoins.

Performance et Évaluation

Résultats des Benchmarks

Selon les résultats, Open Deep Research améliore constamment et significativement la qualité des réponses sur les modèles de base, ce qui est démontré par les modèles phares Llama, DeepSeek et Qwen, et témoigne de la qualité du flux de travail.

Fonctionnalités de Test

# Tester avec le modèle Anthropic par défaut
python tests/run_test.py --all

# Tester avec le modèle OpenAI o3
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

Options de Déploiement

  • Déploiement Local : Exécution locale via le serveur LangGraph
  • Déploiement Cloud : Peut être facilement déployé sur la Plateforme LangGraph

Écosystème du Projet

Projets Connexes

  • local-deep-researcher : Assistant de recherche web et de rédaction de rapports entièrement local
  • LangGraph : Cadre pour la construction de graphes d'agents linguistiques résilients
  • LangChain : Pour la construction d'applications de raisonnement sensibles au contexte

Communauté et Open Source

Depuis la publication d'OpenAI, la communauté open source a déployé des efforts remarquables pour développer des alternatives de recherche approfondie. Ce projet vise à fournir à la communauté une boîte à outils de recherche approfondie open source et accessible.

Exigences Techniques

Compatibilité des Modèles

  1. Prise en charge de la sortie structurée : Tous les modèles doivent prendre en charge la sortie structurée
  2. Prise en charge de l'appel d'outils : Les modèles d'agents doivent prendre en charge l'appel d'outils
  3. Compatibilité API de recherche : Les modèles de recherche et de compression doivent prendre en charge l'API de recherche sélectionnée

Modèles Testés

  • Claude 3.7
  • o3 et o3-mini
  • gpt-4.1
  • llama-3.3-70b-versatile (via Groq)

Avantages et Caractéristiques

Principes de Conception

Un principe de conception clé d'Open Deep Research est la flexibilité, permettant d'explorer différentes stratégies de recherche en fonction de la demande. Les agents sont particulièrement adaptés à la recherche car ils peuvent appliquer des stratégies variées de manière flexible et utiliser des résultats intermédiaires pour guider l'exploration.

Avantages Clés

  1. Transparence Open Source : Entièrement open source, la communauté peut l'examiner et l'améliorer
  2. Hautement Configurable : Prend en charge la personnalisation des modèles, des outils de recherche et de la structure des rapports
  3. Support Multi-Architecture : Propose deux implémentations : flux de travail et multi-agents
  4. Large Compatibilité : Prend en charge plusieurs fournisseurs de modèles d'IA et API de recherche
  5. Interaction Homme-Machine : Prend en charge le feedback de l'utilisateur et l'approbation du plan de rapport
  6. Conception Spécialisée : Utilise des modèles spécialisés pour différentes tâches

Développement Futur

Le projet est en développement continu, avec des plans pour ajouter davantage de fonctionnalités et d'améliorations :

  • Extension de la prise en charge de l'architecture multi-agents à davantage d'outils de recherche
  • Amélioration de la qualité de la génération des rapports
  • Amélioration de l'expérience d'interaction utilisateur
  • Optimisation des performances et de l'utilisation des ressources

Résumé

Open Deep Research représente une avancée significative dans les outils de recherche IA open source. Il offre non seulement des fonctionnalités capables de concurrencer les produits commerciaux, mais maintient également la transparence et la personnalisation inhérentes aux projets open source. Que ce soit pour les chercheurs, les développeurs ou les utilisateurs professionnels, cet assistant de recherche puissant peut être personnalisé et déployé selon leurs besoins.

Star History Chart