Ein Open-Source-Tool zur Unterstützung von Tiefenrecherchen, das KI-Agenten verwendet, um automatisch Tiefenrecherchen durchzuführen und umfassende Berichte zu erstellen.
Detaillierte Beschreibung des Open Deep Research Projekts
Projektübersicht
Open Deep Research ist ein experimenteller, vollständig quelloffener Tiefenforschungsassistent, der von LangChain AI entwickelt wurde. Er ist in der Lage, Tiefenrecherchen zu automatisieren und umfassende Berichte zu jedem Thema zu erstellen. Das Kernziel des Projekts ist es, eine einfache, konfigurierbare Open-Source-Lösung bereitzustellen, die mit den Tiefenforschungsprodukten von Unternehmen wie OpenAI, Anthropic, Perplexity und Google konkurrieren kann.
Kernfunktionen
🎯 Duales Architekturdesign
Das Projekt bietet zwei verschiedene Implementierungsansätze, jeder mit seinen eigenen Vorteilen:
Workflow-Architektur
- Strukturierter Planungs- und Ausführungs-Workflow
- Mensch-in-der-Schleife-Interaktion, die Benutzerfeedback und die Genehmigung von Berichtsplanungen ermöglicht
- Abschnittsweise Erstellung mit Reflexionen zwischen Suchiterationen
- Unterstützt alle Suchtool-Anbieter
Multi-Agenten-Architektur
- Supervisor-Forscher-Architektur
- Mehrere unabhängige Agenten arbeiten parallel
- Deutliche Reduzierung der Berichtsgenerierungszeit
- Spezialisiertes Tool-Design
🔧 Hohe Konfigurierbarkeit
Open Deep Research bietet umfangreiche Konfigurationsoptionen zur Anpassung des Forschungsprozesses und des Modellverhaltens. Alle Konfigurationen können über die Web-Benutzeroberfläche, Umgebungsvariablen oder durch direkte Änderung der Konfiguration vorgenommen werden:
- Max Structured Output Retries (Standard: 3): Maximale Anzahl von Wiederholungsversuchen für strukturierte Ausgabeaufrufe
- Allow Clarification (Standard: true): Ob der Forscher vor Beginn der Recherche Klärungsfragen stellen darf
- Max Concurrent Research Units (Standard: 5): Maximale Anzahl gleichzeitig laufender Forschungseinheiten bei Verwendung von Sub-Agenten
- Search API (Standard: Tavily): Unterstützt die Auswahl mehrerer Such-APIs
- Max Researcher Iterations (Standard: 3): Anzahl der Male, die der Forschungs-Supervisor die Recherche reflektiert und Folgefragen stellt
🤖 Unterstützung mehrerer Modelle
Open Deep Research verwendet mehrere spezialisierte Modelle für verschiedene Forschungsaufgaben:
- Zusammenfassungsmodell (Standard: openai:gpt-4.1-nano): Fasst die Forschungsergebnisse der Such-API zusammen
- Forschungsmodell (Standard: openai:gpt-4.1): Führt Forschung und Analyse durch
- Kompressionsmodell (Standard: openai:gpt-4.1-mini): Komprimiert die Forschungsergebnisse der Sub-Agenten
- Endgültiges Berichtsmodell (Standard: openai:gpt-4.1): Verfasst den endgültigen, umfassenden Bericht
Alle Modelle werden über die init_chat_model()
API konfiguriert und unterstützen Anbieter wie OpenAI, Anthropic, Google Vertex AI und andere.
🔍 Umfangreiche Suchtool-Integration
Das Projekt unterstützt mehrere Such-APIs:
- Tavily API - Allgemeine Websuche
- Perplexity API - Allgemeine Websuche
- Exa API - Leistungsstarke neuronale Suche
- ArXiv - Akademische Arbeiten in Physik, Mathematik, Informatik usw.
- PubMed - Biomedizinische Literatur
- Linkup API - Allgemeine Websuche
- DuckDuckGo API - Allgemeine Websuche
- Google Search API - Benutzerdefinierte Suchmaschine
Technische Architektur
Basierend auf LangGraph aufgebaut
Open Deep Research basiert auf LangGraph, einem Framework zum Erstellen robuster Sprachagentengraphen. Diese Architektur ermöglicht es dem Projekt:
- Flexible Anwendung verschiedener Forschungsstrategien
- Verwendung von Zwischenergebnissen zur Steuerung der Exploration
- Bearbeitung offener Forschungsaufgaben
Dreistufiger Forschungsprozess
Open Deep Research nutzt Agenten als Teil eines dreistufigen Prozesses für die Forschung:
Umfangsbestimmung (Scoping)
- Benutzerklärung: Sammeln aller für die Forschung erforderlichen Benutzerkontexte
- Brief-Generierung: Umwandlung detaillierter Chat-Interaktionen in einen umfassenden, fokussierten Forschungsbrief
Forschung (Research)
- Durchführung der Forschung mithilfe eines Supervisor-Agenten
- Delegierung von Forschungsaufgaben an eine angemessene Anzahl von Sub-Agenten
- Bestimmung, ob der Forschungsbrief in unabhängige Unterthemen zerlegt werden kann
Berichtsgenerierung (Report Generation)
- Erstellung des Berichts in einem Durchgang
- Vermeidung von Koordinationsschwierigkeiten bei parallelem Schreiben durch mehrere Agenten
Installation und Nutzung
Schnellstart
# Repository klonen
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research
# Umgebungsvariablen einrichten
cp .env.example .env
# LangGraph Server installieren und starten
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking
Als Python-Paket installieren
pip install open-deep-research
Nutzung
Über die Studio UI:
- 🚀 API: http://127.0.0.1:2024
- 🎨 Studio UI: https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024
- 📚 API Docs: http://127.0.0.1:2024/docs
Jupyter Notebook:
- Beispiele ansehen:
src/open_deep_research/graph.ipynb
- Multi-Agenten-Beispiel:
src/open_deep_research/multi_agent.ipynb
- Beispiele ansehen:
Plattformintegration
Open Agent Platform (OAP)
Die Open Agent Platform (OAP) ist eine Benutzeroberfläche, über die nicht-technische Benutzer ihre eigenen Agenten erstellen und konfigurieren können. OAP eignet sich hervorragend, um Benutzern die Konfiguration des Tiefenforschers zu ermöglichen, indem sie verschiedene MCP-Tools und Such-APIs verwenden, die am besten zu ihren Anforderungen passen.
Leistung und Bewertung
Benchmarking-Ergebnisse
Den Ergebnissen zufolge verbessert Open Deep Research die Antwortqualität bei den Basismodellen kontinuierlich und signifikant, was sich in den Flaggschiffmodellen von Llama, DeepSeek und Qwen zeigt und die Qualität des Workflows demonstriert.
Testfunktionen
# Mit Standard-Anthropic-Modell testen
python tests/run_test.py --all
# Mit OpenAI o3 Modell testen
python tests/run_test.py --all \
--supervisor-model "openai:o3" \
--researcher-model "openai:o3" \
--planner-provider "openai" \
--planner-model "o3" \
--writer-provider "openai" \
--writer-model "o3" \
--eval-model "openai:o3" \
--search-api "tavily"
Bereitstellungsoptionen
- Lokale Bereitstellung: Lokaler Betrieb über den LangGraph Server
- Cloud-Bereitstellung: Einfache Bereitstellung auf der LangGraph Platform
Projekt-Ökosystem
Verwandte Projekte
- local-deep-researcher: Vollständig lokaler Web-Recherche- und Berichterstellungsassistent
- LangGraph: Framework zum Erstellen robuster Sprachagentengraphen
- LangChain: Zum Erstellen kontextsensitiver Inferenzanwendungen
Community und Open Source
Seit der Veröffentlichung von OpenAI hat die Open-Source-Community bemerkenswerte Anstrengungen unternommen, um Alternativen für die Tiefenforschung zu entwickeln. Dieses Projekt zielt darauf ab, der Community ein zugängliches Open-Source-Toolkit für die Tiefenforschung bereitzustellen.
Technische Anforderungen
Modellkompatibilität
- Unterstützung für strukturierte Ausgabe: Alle Modelle müssen strukturierte Ausgabe unterstützen
- Unterstützung für Tool-Aufrufe: Agentenmodelle müssen Tool-Aufrufe unterstützen
- Such-API-Kompatibilität: Forschungs- und Kompressionsmodelle müssen die ausgewählte Such-API unterstützen
Getestete Modelle
- Claude 3.7
- o3 und o3-mini
- gpt-4.1
- llama-3.3-70b-versatile (über Groq)
Vorteile und Merkmale
Designprinzipien
Ein zentrales Designprinzip von Open Deep Research ist Flexibilität, die es ermöglicht, verschiedene Forschungsstrategien je nach Anfrage zu erkunden. Agenten eignen sich hervorragend für die Forschung, da sie flexibel verschiedene Strategien anwenden und Zwischenergebnisse zur Steuerung der Exploration nutzen können.
Kernvorteile
- Open Source und transparent: Vollständig quelloffen, die Community kann es überprüfen und verbessern
- Hochgradig konfigurierbar: Unterstützt benutzerdefinierte Modelle, Suchtools und Berichtsstrukturen
- Unterstützung mehrerer Architekturen: Bietet sowohl Workflow- als auch Multi-Agenten-Implementierungen
- Breite Kompatibilität: Unterstützt verschiedene KI-Modellanbieter und Such-APIs
- Mensch-Maschine-Interaktion: Unterstützt Benutzerfeedback und die Genehmigung von Berichtsplanungen
- Spezialisiertes Design: Verwendet spezialisierte Modelle für verschiedene Aufgaben
Zukünftige Entwicklung
Das Projekt befindet sich in ständiger Entwicklung, und es sind weitere Funktionen und Verbesserungen geplant:
- Erweiterung der Multi-Agenten-Architektur zur Unterstützung weiterer Suchtools
- Verbesserung der Berichtsgenerierungsqualität
- Verbesserung der Benutzerinteraktion
- Optimierung von Leistung und Ressourcennutzung
Zusammenfassung
Open Deep Research stellt einen bedeutenden Fortschritt bei Open-Source-KI-Forschungstools dar. Es bietet nicht nur Funktionen, die mit kommerziellen Produkten konkurrieren können, sondern bewahrt auch die Transparenz und Anpassbarkeit eines Open-Source-Projekts. Ob Forscher, Entwickler oder Unternehmensanwender, jeder kann diesen leistungsstarken Forschungsassistenten an seine Bedürfnisse anpassen und bereitstellen.