Ein Open-Source, autonomer KI-Wissenschaftler, angetrieben von Claude, der den gesamten wissenschaftlichen Forschungszyklus automatisiert ausführen kann: Literaturanalyse, Hypothesengenerierung, Versuchsplanung, Durchführung der Analyse und iterative Verbesserung.
Kosmos - Plattform für autonome AI-Wissenschaftler, detaillierte Vorstellung
Projektübersicht
Kosmos ist eine Open-Source-Implementierung eines autonomen AI-Wissenschaftlers, der den gesamten wissenschaftlichen Forschungszyklus ausführen kann: von der Literaturanalyse und Hypothesengenerierung bis zum Experimentdesign, Durchführung, Analyse und iterativer Verbesserung. Das Projekt basiert auf dem Kosmos AI-Papier, das im November 2025 veröffentlicht wurde (https://arxiv.org/abs/2511.02824), und ist anpassbar, um von Claude Code oder der Anthropic API getrieben zu werden.
Kernfunktionen
🔬 Autonomer Forschungszyklus
- End-to-End-Wissenschaftsworkflow: Automatisierung des vollständigen Forschungszyklus
- Mehrere Fachgebiete: Biologie, Physik, Chemie, Neurowissenschaften, Materialwissenschaften
- Iterative Verbesserung: Automatische Optimierung von Hypothesen und Experimentdesign basierend auf Ergebnissen
🤖 KI-gesteuertes intelligentes System
- Claude Sonnet 4 Antrieb: Für Hypothesengenerierung und fortgeschrittene Analyse
- Unterstützung mehrerer Modelle: Unterstützung für Anthropic Claude, OpenAI GPT und lokale Modelle (Ollama, LM Studio)
- Intelligente Modellauswahl: Automatische Auswahl des optimalen Modells basierend auf der Komplexität der Aufgabe
🔧 Flexibles Integrationskonzept
- Doppelte Integrationsmöglichkeiten:
- Option A: Anthropic API (Pay-as-you-go)
- Option B: Claude Code CLI (benötigt Max-Abonnement)
- Reifere Analysemuster: Integration bewährter statistischer Methoden aus kosmos-figures
📚 Literaturintegration
- Automatische Papierrecherche: Unterstützung für arXiv, Semantic Scholar, PubMed
- Literaturzusammenfassung: Automatische Extraktion von Schlüsselinformationen
- Neuartigkeitsprüfung: Überprüfung der Innovativität der Forschungshypothesen
🏗️ Agentenarchitektur
- Modulares Design: Jede Forschungsaufgabe entspricht einem eigenständigen Agenten
- Parallelverarbeitung: Gleichzeitige Ausführung mehrerer Forschungsaufgaben
- Kollaboration: Informationsaustausch zwischen Agenten über strukturierte Weltmodelle
🛡️ Sicherheit im Vordergrund
- Sandbox-Ausführung: Isolierte Code-Laufzeitumgebung
- Validierungsmechanismen: Ergebnisvalidierung und Reproduzierbarkeitsprüfungen
- Menschliche Genehmigungsschleuse: Optionale menschliche Prüfung
💰 Kostenoptimierung
- Mehrschichtiges Cachesystem: Reduzierung der API-Kosten um 30-40%
- Intelligenter Prompt-Cache: Signifikante Kosteneinsparungen bei Verwendung von Anthropic
- Optimierung der Modellauswahl: Intelligente Modellauswahl basierend auf der Aufgabenkomplexität, reduziert die Kosten um 15-20%
Systemarchitektur
Kernkomponenten
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (Hauptkontroller für den autonomen │
│ Forschungszyklus) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Literature│ │Hypothesis Generator│ │Experiment │ │Data Analyst │
│Analyzer │ │ (Claude) │ │Designer │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Execution Engine │
│ (kosmos-figures │
│ proven patterns) │
└─────────────────────┘
Agentenbeschreibung
- Research Director (Forschungsleiter): Hauptkoordinator für den Forschungsworkflow
- Literature Analyzer (Literaturanalyseur): Sucht und analysiert wissenschaftliche Papiere (arXiv, Semantic Scholar, PubMed)
- Hypothesis Generator (Hypothesengenerator): Generiert testbare Hypothesen mit Claude
- Experiment Designer (Experimentdesigner): Entwirft computergestützte Experimente
- Execution Engine (Ausführungsengine): Führt Experimente mit validierten statistischen Methoden durch
- Data Analyst (Datenanalyst): Interpretiert Ergebnisse mit Claude
- Feedback Loop (Rückkopplungsschleife): Iterative Verbesserung von Hypothesen basierend auf Ergebnissen
Technische Anforderungen
Grundanforderungen
- Python 3.11 oder 3.12
- Eines der Folgenden:
- Option A: Anthropic API-Schlüssel (Pay-as-you-go)
- Option B: Claude Code CLI installiert (benötigt Max-Abonnement)
Installationsanleitung
Grundinstallation
# Repository klonen
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# Virtuelle Umgebung erstellen
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# Abhängigkeiten installieren
pip install -e .
# Unterstützung für Claude Code CLI (Option B)
pip install -e ".[router]"
Option A: Anthropic API-Konfiguration
# Beispieleinstellungen kopieren
cp .env.example .env
# .env bearbeiten und deinen API-Schlüssel eintragen
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
Deinen API-Schlüssel erhältst du von console.anthropic.com
Vorteile:
- Pay-as-you-go
- Keine CLI-Installation erforderlich
- Kann von überall verwendet werden
Nachteile:
- Gebühren pro Token
- Rate Limits
Option B: Claude Code CLI-Konfiguration
# 1. Claude Code CLI installieren
# Besuche https://claude.ai/download und folge den Anweisungen
# 2. Claude CLI authentifizieren
claude auth
# 3. Beispieleinstellungen kopieren
cp .env.example .env
# 4. .env bearbeiten und setze den API-Schlüssel auf alle Neun (trigger CLI-Routing)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
Dies leitet alle API-Aufrufe an die lokale Claude Code CLI weiter, nutzt dein Max-Abonnement und erfordert keine Token-Gebühren.
Vorteile:
- Keine Token-Kosten
- Unbegrenzte Nutzung
- Aktuellste Claude-Modelle
- Lokale Ausführung
Nachteile:
- Erfordert Claude CLI-Installation
- Erfordert Max-Abonnement
Datenbankinitialisierung
# Datenbankmigrationen ausführen
alembic upgrade head
# Überprüfen, ob die Datenbank erstellt wurde
ls -la kosmos.db
Schnellstart
Beispielnutzung
from kosmos import ResearchDirector
# Forschungsleiter initialisieren
director = ResearchDirector()
# Forschungsfrage stellen
question = "Was ist die Beziehung zwischen Schlafentzug und Gedächtniskonsolidierung?"
# Autonome Forschung durchführen
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# Ergebnisse anzeigen
print(results.summary)
print(results.key_findings)
Konfigurationsmöglichkeiten
Alle Konfigurationen erfolgen über Umgebungsvariablen (siehe .env.example):
Kernkonfiguration
ANTHROPIC_API_KEY: API-Schlüssel oder999...für CLI-ModusCLAUDE_MODEL: Zu verwendendes Modell (nur API-Modus)DATABASE_URL: DatenbankverbindungsstringLOG_LEVEL: Detailgrad der Protokollierung
Forschungskonfiguration
MAX_RESEARCH_ITERATIONS: Maximale Anzahl an autonomen IterationenENABLED_DOMAINS: Unterstützte wissenschaftliche FachgebieteENABLED_EXPERIMENT_TYPES: Erlaubte ExperimenttypenMIN_NOVELTY_SCORE: Mindestschwellenwert für Neuartigkeit
Sicherheitskonfiguration
ENABLE_SAFETY_CHECKS: Code-SicherheitsüberprüfungenMAX_EXPERIMENT_EXECUTION_TIME: Timeout für ExperimenteENABLE_SANDBOXING: Sandboxing der CodeausführungREQUIRE_HUMAN_APPROVAL: Menschliche Genehmigungsschleuse
Leistungsverbesserungen
Cachesystem
Kosmos enthält ein mehrschichtiges Cachesystem, das die API-Kosten um 30-40% reduziert:
# Cache-Leistung anzeigen
kosmos cache --stats
# Beispiel-Ausgabe:
# Gesamtcache-Leistung:
# Gesamtzahl der Anfragen: 500
# Cache-Trefferrate: 175 (35%)
# Geschätzte Kosteneinsparung: $15.75
Hinweis: Der signifikante Kosteneinsparung durch den Prompt-Cache ist derzeit nur bei Verwendung von Anthropic Claude verfügbar. OpenAI und lokale Anbieter nutzen nur In-Memory-Antwort-Caching.
Intelligente Modellauswahl
Bei Verwendung von Anthropic als LLM-Anbieter wählt Kosmos intelligente Claude-Modelle basierend auf der Aufgabenkomplexität aus:
- Claude Sonnet 4.5: Komplexe Inferenz, Hypothesengenerierung, Analyse
- Claude Haiku 4: Einfache Aufgaben, Datenauszug, Formatierung
Dies reduziert die Kosten um 15-20%, während die Qualität beibehalten wird.
Hinweis: Diese Funktion ist spezifisch für Anthropic Claude.
Projektstruktur
kosmos/
├── core/ # Kerninfrastruktur (LLM, Konfiguration, Protokollierung)
├── agents/ # Agentenimplementierung
├── db/ # Datenbankmodelle und -operationen
├── execution/ # Experimentausführungsengine
├── analysis/ # Ergebnisanalyse und Visualisierung
├── hypothesis/ # Hypothesengenerierung und -management
├── experiments/ # Experimentvorlagen
├── literature/ # Literaturrecherche und -analyse
├── knowledge/ # Wissensgraph und semantische Suche
├── domains/ # Fachspezifische Tools (Biologie, Physik usw.)
├── safety/ # Sicherheitsprüfungen und -validierungen
└── cli/ # Befehlszeileninterface
tests/
├── unit/ # Unit-Tests
├── integration/ # Integrations-Tests
└── e2e/ # End-to-End-Tests
docs/
├── kosmos-figures-analysis.md # Analysemuster von kosmos-figures
├── integration-plan.md # Integrationsstrategie
└── domain-roadmaps/ # Fachspezifische Handbücher
Entwicklung und Testen
# Entwicklungsumgebungsabhängigkeiten installieren
pip install -e ".[dev]"
# Alle Tests ausführen
pytest
# Coverage-Tests ausführen
pytest --cov=kosmos --cov-report=html
# Spezifische Testpakete ausführen
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# Codeformatierung
black kosmos/ tests/
# Codeprüfung
ruff check kosmos/ tests/
# Typenprüfung
mypy kosmos/
Entwicklungsroadmap
✅ Abgeschlossen (10 Phasen)
Phase 1: Projektfundament ✅
- Projektstruktur
- Claude-Integration (API + CLI)
- Konfigurationssystem
- Agentenframework
- Datenbankeinrichtung
Phase 2: Literaturfähigkeiten ✅
- Literatur-API (arXiv, Semantic Scholar, PubMed)
- Literaturanalyse-Agent
- Semantische Suchvektor-Datenbank
- Wissensgraph
Phase 3: Hypothesengenerierung ✅
- Hypothesengenerator-Agent
- Neuartigkeitsprüfung
- Priorisierung von Hypothesen
Phase 4: Experimentdesign ✅
- Experimentdesigner-Agent
- Protokollvorlagen
- Ressourcenabschätzung
Phase 5: Experimentausführung ✅
- Sandboxed-Ausführungs-Umgebung
- Integration von kosmos-figures-Mustern
- Statistische Analyse
Phase 6: Ergebnisanalyse ✅
- Datenanalyse-Agent
- Erzeugung von Visualisierungen
- Ergebniszusammenfassung
Phase 7: Forschungskoordination ✅
- Forschungsleiter-Agent
- Rückkopplungsschleife
- Konvergenzdetektion
Phase 8: Sicherheit und Validierung ✅
- Sicherheitsvalidierung
- Fachspezifische Werkzeuge
Phase 9: Produktiveinsatz ✅
- Leistungsverbesserungen (20-40× Steigerung)
- Mehrschichtiges Cachesystem
- Komplette Tests (90%+ Abdeckung)
Phase 10: Dokumentation und Verbesserung ✅
- Reiche Dokumentation (10.000+ Zeilen)
- Benutzerhandbuch
- API-Dokumentation
- Beispiele
Wissenschaftliche Entdeckungsbeispiele
Kosmos hat in verschiedenen Bereichen validierte wissenschaftliche Entdeckungen erbracht:
1. Metabolomik - Hirnschutz durch Hypothermie
Unabhängige Replikation der Ergebnisse eines unveröffentlichten Manuskripts, Identifizierung der Nukleotidmetabolismuswege als Hauptänderungspfade im hypothermischen Maushirn.
2. Materialwissenschaft - Effizienz von Solarzellen
Entdeckung, dass die Luftfeuchtigkeit während der Wärmebehandlung ein entscheidender Faktor für die Effizienz von Solarzellen ist, und Identifizierung eines kritischen Feuchteschwelle.
3. Neurowissenschaft - Verbindungen neuronaler Netzwerke
Zeigte, dass neuronale Netzwerke in verschiedenen Arten einem Log-Normal-Modell folgen, nicht einem Potenzgesetz.
4. Herzkrankheiten - SOD2-Schutzfaktor
Entdeckung, dass das SOD2-Protein anscheinend durch Reduzierung der Fibrose das Herz schützt.
5. Diabetes - SSR1-Genvarianten
Entdeckung, dass genetische Varianten in der Nähe des SSR1-Gens möglicherweise einen schützenden Effekt gegen Typ-2-Diabetes haben.
6. Alzheimer-Krankheit - Zeitliche Analysemethode
Einführung einer neuen Analysetechnik zur Verfolgung der zeitlichen Veränderungen von Proteinen in Krankheitszellen des Gehirns.
7. Neurodegenerative Erkrankungen - Phosphatidylserin-Exposition
Identifizierung, dass Neuronen durch altersbedingten Verlust der Flippase-Expression ein "Phagocytiere mich"-Signal exponieren.
Forschungseffizienz: Unabhängige Wissenschaftler stellten fest, dass 79,4% der Aussagen in Kosmos-Berichten korrekt sind, und Kooperationspartner berichteten, dass ein einzelner 20-Zyklus-Kosmos-Lauf im Durchschnitt dementspricht, was sie selbst in 6 Monaten erreichen würden.
Inspirationsquellen
Dieses Projekt wurde von folgender Arbeit inspiriert:
- Papier: Kosmos: An AI Scientist for Autonomous Discovery (November 2025)
- Analysemuster: kosmos-figures Repository
- Claude Router: claude_n_codex_api_proxy
Beitragserklärung
Beiträge sind willkommen! Siehe CONTRIBUTING.md für Richtlinien.
Willkommene Beiträge:
- Fachspezifische Tools und APIs
- Experimentvorlagen für verschiedene Bereiche
- Literatur-API-Integration
- Sicherheitsvalidierung
- Dokumentation
- Tests
Lizenz
MIT-Lizenz - siehe LICENSE
Zitieren
Wenn Sie Kosmos in Ihrer Forschung verwenden, zitieren Sie bitte:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
Danksagung
- Anthropic für die Bereitstellung von Claude und Claude Code
- Edison Scientific für die Bereitstellung der kosmos-figures-Analysenmuster
- Die offene Wissenschaftsgemeinschaft für Literatur-APIs und -Tools
Unterstützung und Community
- Issues: GitHub Issues
- Diskussionen: GitHub Discussions
Projektstatus
Status: Produktionsbereit (v0.2.0) - Alle 10 Entwicklungsphasen abgeschlossen
Letztes Update: 2025-11-07
Dokumentationsressourcen
- Architekturübersicht - Systemdesign und -komponenten
- Integrationsplan - Integrationsansätze für kosmos-figures-Muster
- Fachgebiet-Roadmaps - Implementierungsleitfäden für spezifische Fachgebiete
- API-Referenz - API-Dokumentation
- Beitragserklärung - Wie man beiträgt
Zusammenfassung der Kernvorteile
- Völlig autonom: End-to-End-Automatisierung von Hypothese bis Entdeckung
- Mehrere Fachgebiete: Unterstützung für Biologie, Physik, Chemie und mehr
- Validiert: 7 nachgewiesene wissenschaftliche Entdeckungen
- Kostenoptimierung: Mehrschichtiges Cachesystem reduziert die Kosten um 30-40%
- Flexibilität: Unterstützung von API und CLI
- Sicher und verlässlich: Sandbox-Ausführung, Validierungsmechanismen, 90%+ Testabdeckung
- Produktionsbereit: Version v0.2.0, alle Entwicklungsphasen abgeschlossen