Ein Open-Source-Tool zur Unterstützung von Tiefenrecherchen, das KI-Agenten verwendet, um automatisch Tiefenrecherchen durchzuführen und umfassende Berichte zu erstellen.

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Detaillierte Beschreibung des Open Deep Research Projekts

Projektübersicht

Open Deep Research ist ein experimenteller, vollständig quelloffener Tiefenforschungsassistent, der von LangChain AI entwickelt wurde. Er ist in der Lage, Tiefenrecherchen zu automatisieren und umfassende Berichte zu jedem Thema zu erstellen. Das Kernziel des Projekts ist es, eine einfache, konfigurierbare Open-Source-Lösung bereitzustellen, die mit den Tiefenforschungsprodukten von Unternehmen wie OpenAI, Anthropic, Perplexity und Google konkurrieren kann.

Kernfunktionen

🎯 Duales Architekturdesign

Das Projekt bietet zwei verschiedene Implementierungsansätze, jeder mit seinen eigenen Vorteilen:

  1. Workflow-Architektur

    • Strukturierter Planungs- und Ausführungs-Workflow
    • Mensch-in-der-Schleife-Interaktion, die Benutzerfeedback und die Genehmigung von Berichtsplanungen ermöglicht
    • Abschnittsweise Erstellung mit Reflexionen zwischen Suchiterationen
    • Unterstützt alle Suchtool-Anbieter
  2. Multi-Agenten-Architektur

    • Supervisor-Forscher-Architektur
    • Mehrere unabhängige Agenten arbeiten parallel
    • Deutliche Reduzierung der Berichtsgenerierungszeit
    • Spezialisiertes Tool-Design

🔧 Hohe Konfigurierbarkeit

Open Deep Research bietet umfangreiche Konfigurationsoptionen zur Anpassung des Forschungsprozesses und des Modellverhaltens. Alle Konfigurationen können über die Web-Benutzeroberfläche, Umgebungsvariablen oder durch direkte Änderung der Konfiguration vorgenommen werden:

  • Max Structured Output Retries (Standard: 3): Maximale Anzahl von Wiederholungsversuchen für strukturierte Ausgabeaufrufe
  • Allow Clarification (Standard: true): Ob der Forscher vor Beginn der Recherche Klärungsfragen stellen darf
  • Max Concurrent Research Units (Standard: 5): Maximale Anzahl gleichzeitig laufender Forschungseinheiten bei Verwendung von Sub-Agenten
  • Search API (Standard: Tavily): Unterstützt die Auswahl mehrerer Such-APIs
  • Max Researcher Iterations (Standard: 3): Anzahl der Male, die der Forschungs-Supervisor die Recherche reflektiert und Folgefragen stellt

🤖 Unterstützung mehrerer Modelle

Open Deep Research verwendet mehrere spezialisierte Modelle für verschiedene Forschungsaufgaben:

  • Zusammenfassungsmodell (Standard: openai:gpt-4.1-nano): Fasst die Forschungsergebnisse der Such-API zusammen
  • Forschungsmodell (Standard: openai:gpt-4.1): Führt Forschung und Analyse durch
  • Kompressionsmodell (Standard: openai:gpt-4.1-mini): Komprimiert die Forschungsergebnisse der Sub-Agenten
  • Endgültiges Berichtsmodell (Standard: openai:gpt-4.1): Verfasst den endgültigen, umfassenden Bericht

Alle Modelle werden über die init_chat_model() API konfiguriert und unterstützen Anbieter wie OpenAI, Anthropic, Google Vertex AI und andere.

🔍 Umfangreiche Suchtool-Integration

Das Projekt unterstützt mehrere Such-APIs:

  • Tavily API - Allgemeine Websuche
  • Perplexity API - Allgemeine Websuche
  • Exa API - Leistungsstarke neuronale Suche
  • ArXiv - Akademische Arbeiten in Physik, Mathematik, Informatik usw.
  • PubMed - Biomedizinische Literatur
  • Linkup API - Allgemeine Websuche
  • DuckDuckGo API - Allgemeine Websuche
  • Google Search API - Benutzerdefinierte Suchmaschine

Technische Architektur

Basierend auf LangGraph aufgebaut

Open Deep Research basiert auf LangGraph, einem Framework zum Erstellen robuster Sprachagentengraphen. Diese Architektur ermöglicht es dem Projekt:

  • Flexible Anwendung verschiedener Forschungsstrategien
  • Verwendung von Zwischenergebnissen zur Steuerung der Exploration
  • Bearbeitung offener Forschungsaufgaben

Dreistufiger Forschungsprozess

Open Deep Research nutzt Agenten als Teil eines dreistufigen Prozesses für die Forschung:

  1. Umfangsbestimmung (Scoping)

    • Benutzerklärung: Sammeln aller für die Forschung erforderlichen Benutzerkontexte
    • Brief-Generierung: Umwandlung detaillierter Chat-Interaktionen in einen umfassenden, fokussierten Forschungsbrief
  2. Forschung (Research)

    • Durchführung der Forschung mithilfe eines Supervisor-Agenten
    • Delegierung von Forschungsaufgaben an eine angemessene Anzahl von Sub-Agenten
    • Bestimmung, ob der Forschungsbrief in unabhängige Unterthemen zerlegt werden kann
  3. Berichtsgenerierung (Report Generation)

    • Erstellung des Berichts in einem Durchgang
    • Vermeidung von Koordinationsschwierigkeiten bei parallelem Schreiben durch mehrere Agenten

Installation und Nutzung

Schnellstart

# Repository klonen
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# Umgebungsvariablen einrichten
cp .env.example .env

# LangGraph Server installieren und starten
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

Als Python-Paket installieren

pip install open-deep-research

Nutzung

  1. Über die Studio UI:

  2. Jupyter Notebook:

    • Beispiele ansehen: src/open_deep_research/graph.ipynb
    • Multi-Agenten-Beispiel: src/open_deep_research/multi_agent.ipynb

Plattformintegration

Open Agent Platform (OAP)

Die Open Agent Platform (OAP) ist eine Benutzeroberfläche, über die nicht-technische Benutzer ihre eigenen Agenten erstellen und konfigurieren können. OAP eignet sich hervorragend, um Benutzern die Konfiguration des Tiefenforschers zu ermöglichen, indem sie verschiedene MCP-Tools und Such-APIs verwenden, die am besten zu ihren Anforderungen passen.

Leistung und Bewertung

Benchmarking-Ergebnisse

Den Ergebnissen zufolge verbessert Open Deep Research die Antwortqualität bei den Basismodellen kontinuierlich und signifikant, was sich in den Flaggschiffmodellen von Llama, DeepSeek und Qwen zeigt und die Qualität des Workflows demonstriert.

Testfunktionen

# Mit Standard-Anthropic-Modell testen
python tests/run_test.py --all

# Mit OpenAI o3 Modell testen
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

Bereitstellungsoptionen

  • Lokale Bereitstellung: Lokaler Betrieb über den LangGraph Server
  • Cloud-Bereitstellung: Einfache Bereitstellung auf der LangGraph Platform

Projekt-Ökosystem

Verwandte Projekte

  • local-deep-researcher: Vollständig lokaler Web-Recherche- und Berichterstellungsassistent
  • LangGraph: Framework zum Erstellen robuster Sprachagentengraphen
  • LangChain: Zum Erstellen kontextsensitiver Inferenzanwendungen

Community und Open Source

Seit der Veröffentlichung von OpenAI hat die Open-Source-Community bemerkenswerte Anstrengungen unternommen, um Alternativen für die Tiefenforschung zu entwickeln. Dieses Projekt zielt darauf ab, der Community ein zugängliches Open-Source-Toolkit für die Tiefenforschung bereitzustellen.

Technische Anforderungen

Modellkompatibilität

  1. Unterstützung für strukturierte Ausgabe: Alle Modelle müssen strukturierte Ausgabe unterstützen
  2. Unterstützung für Tool-Aufrufe: Agentenmodelle müssen Tool-Aufrufe unterstützen
  3. Such-API-Kompatibilität: Forschungs- und Kompressionsmodelle müssen die ausgewählte Such-API unterstützen

Getestete Modelle

  • Claude 3.7
  • o3 und o3-mini
  • gpt-4.1
  • llama-3.3-70b-versatile (über Groq)

Vorteile und Merkmale

Designprinzipien

Ein zentrales Designprinzip von Open Deep Research ist Flexibilität, die es ermöglicht, verschiedene Forschungsstrategien je nach Anfrage zu erkunden. Agenten eignen sich hervorragend für die Forschung, da sie flexibel verschiedene Strategien anwenden und Zwischenergebnisse zur Steuerung der Exploration nutzen können.

Kernvorteile

  1. Open Source und transparent: Vollständig quelloffen, die Community kann es überprüfen und verbessern
  2. Hochgradig konfigurierbar: Unterstützt benutzerdefinierte Modelle, Suchtools und Berichtsstrukturen
  3. Unterstützung mehrerer Architekturen: Bietet sowohl Workflow- als auch Multi-Agenten-Implementierungen
  4. Breite Kompatibilität: Unterstützt verschiedene KI-Modellanbieter und Such-APIs
  5. Mensch-Maschine-Interaktion: Unterstützt Benutzerfeedback und die Genehmigung von Berichtsplanungen
  6. Spezialisiertes Design: Verwendet spezialisierte Modelle für verschiedene Aufgaben

Zukünftige Entwicklung

Das Projekt befindet sich in ständiger Entwicklung, und es sind weitere Funktionen und Verbesserungen geplant:

  • Erweiterung der Multi-Agenten-Architektur zur Unterstützung weiterer Suchtools
  • Verbesserung der Berichtsgenerierungsqualität
  • Verbesserung der Benutzerinteraktion
  • Optimierung von Leistung und Ressourcennutzung

Zusammenfassung

Open Deep Research stellt einen bedeutenden Fortschritt bei Open-Source-KI-Forschungstools dar. Es bietet nicht nur Funktionen, die mit kommerziellen Produkten konkurrieren können, sondern bewahrt auch die Transparenz und Anpassbarkeit eines Open-Source-Projekts. Ob Forscher, Entwickler oder Unternehmensanwender, jeder kann diesen leistungsstarken Forschungsassistenten an seine Bedürfnisse anpassen und bereitstellen.

Star History Chart