Ein Open-Source, autonomer KI-Wissenschaftler, angetrieben von Claude, der den gesamten wissenschaftlichen Forschungszyklus automatisiert ausführen kann: Literaturanalyse, Hypothesengenerierung, Versuchsplanung, Durchführung der Analyse und iterative Verbesserung.

PythonKosmosjimmc414 308 Last Updated: December 12, 2025

Kosmos - Plattform für autonome AI-Wissenschaftler, detaillierte Vorstellung

Projektübersicht

Kosmos ist eine Open-Source-Implementierung eines autonomen AI-Wissenschaftlers, der den gesamten wissenschaftlichen Forschungszyklus ausführen kann: von der Literaturanalyse und Hypothesengenerierung bis zum Experimentdesign, Durchführung, Analyse und iterativer Verbesserung. Das Projekt basiert auf dem Kosmos AI-Papier, das im November 2025 veröffentlicht wurde (https://arxiv.org/abs/2511.02824), und ist anpassbar, um von Claude Code oder der Anthropic API getrieben zu werden.

Kernfunktionen

🔬 Autonomer Forschungszyklus

  • End-to-End-Wissenschaftsworkflow: Automatisierung des vollständigen Forschungszyklus
  • Mehrere Fachgebiete: Biologie, Physik, Chemie, Neurowissenschaften, Materialwissenschaften
  • Iterative Verbesserung: Automatische Optimierung von Hypothesen und Experimentdesign basierend auf Ergebnissen

🤖 KI-gesteuertes intelligentes System

  • Claude Sonnet 4 Antrieb: Für Hypothesengenerierung und fortgeschrittene Analyse
  • Unterstützung mehrerer Modelle: Unterstützung für Anthropic Claude, OpenAI GPT und lokale Modelle (Ollama, LM Studio)
  • Intelligente Modellauswahl: Automatische Auswahl des optimalen Modells basierend auf der Komplexität der Aufgabe

🔧 Flexibles Integrationskonzept

  • Doppelte Integrationsmöglichkeiten:
    • Option A: Anthropic API (Pay-as-you-go)
    • Option B: Claude Code CLI (benötigt Max-Abonnement)
  • Reifere Analysemuster: Integration bewährter statistischer Methoden aus kosmos-figures

📚 Literaturintegration

  • Automatische Papierrecherche: Unterstützung für arXiv, Semantic Scholar, PubMed
  • Literaturzusammenfassung: Automatische Extraktion von Schlüsselinformationen
  • Neuartigkeitsprüfung: Überprüfung der Innovativität der Forschungshypothesen

🏗️ Agentenarchitektur

  • Modulares Design: Jede Forschungsaufgabe entspricht einem eigenständigen Agenten
  • Parallelverarbeitung: Gleichzeitige Ausführung mehrerer Forschungsaufgaben
  • Kollaboration: Informationsaustausch zwischen Agenten über strukturierte Weltmodelle

🛡️ Sicherheit im Vordergrund

  • Sandbox-Ausführung: Isolierte Code-Laufzeitumgebung
  • Validierungsmechanismen: Ergebnisvalidierung und Reproduzierbarkeitsprüfungen
  • Menschliche Genehmigungsschleuse: Optionale menschliche Prüfung

💰 Kostenoptimierung

  • Mehrschichtiges Cachesystem: Reduzierung der API-Kosten um 30-40%
  • Intelligenter Prompt-Cache: Signifikante Kosteneinsparungen bei Verwendung von Anthropic
  • Optimierung der Modellauswahl: Intelligente Modellauswahl basierend auf der Aufgabenkomplexität, reduziert die Kosten um 15-20%

Systemarchitektur

Kernkomponenten

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (Hauptkontroller für den autonomen             │
│               Forschungszyklus)                             │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

Agentenbeschreibung

  • Research Director (Forschungsleiter): Hauptkoordinator für den Forschungsworkflow
  • Literature Analyzer (Literaturanalyseur): Sucht und analysiert wissenschaftliche Papiere (arXiv, Semantic Scholar, PubMed)
  • Hypothesis Generator (Hypothesengenerator): Generiert testbare Hypothesen mit Claude
  • Experiment Designer (Experimentdesigner): Entwirft computergestützte Experimente
  • Execution Engine (Ausführungsengine): Führt Experimente mit validierten statistischen Methoden durch
  • Data Analyst (Datenanalyst): Interpretiert Ergebnisse mit Claude
  • Feedback Loop (Rückkopplungsschleife): Iterative Verbesserung von Hypothesen basierend auf Ergebnissen

Technische Anforderungen

Grundanforderungen

  • Python 3.11 oder 3.12
  • Eines der Folgenden:
    • Option A: Anthropic API-Schlüssel (Pay-as-you-go)
    • Option B: Claude Code CLI installiert (benötigt Max-Abonnement)

Installationsanleitung

Grundinstallation

# Repository klonen
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Virtuelle Umgebung erstellen
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Abhängigkeiten installieren
pip install -e .

# Unterstützung für Claude Code CLI (Option B)
pip install -e ".[router]"

Option A: Anthropic API-Konfiguration

# Beispieleinstellungen kopieren
cp .env.example .env

# .env bearbeiten und deinen API-Schlüssel eintragen
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Deinen API-Schlüssel erhältst du von console.anthropic.com

Vorteile:

  • Pay-as-you-go
  • Keine CLI-Installation erforderlich
  • Kann von überall verwendet werden

Nachteile:

  • Gebühren pro Token
  • Rate Limits

Option B: Claude Code CLI-Konfiguration

# 1. Claude Code CLI installieren
# Besuche https://claude.ai/download und folge den Anweisungen

# 2. Claude CLI authentifizieren
claude auth

# 3. Beispieleinstellungen kopieren
cp .env.example .env

# 4. .env bearbeiten und setze den API-Schlüssel auf alle Neun (trigger CLI-Routing)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Dies leitet alle API-Aufrufe an die lokale Claude Code CLI weiter, nutzt dein Max-Abonnement und erfordert keine Token-Gebühren.

Vorteile:

  • Keine Token-Kosten
  • Unbegrenzte Nutzung
  • Aktuellste Claude-Modelle
  • Lokale Ausführung

Nachteile:

  • Erfordert Claude CLI-Installation
  • Erfordert Max-Abonnement

Datenbankinitialisierung

# Datenbankmigrationen ausführen
alembic upgrade head

# Überprüfen, ob die Datenbank erstellt wurde
ls -la kosmos.db

Schnellstart

Beispielnutzung

from kosmos import ResearchDirector

# Forschungsleiter initialisieren
director = ResearchDirector()

# Forschungsfrage stellen
question = "Was ist die Beziehung zwischen Schlafentzug und Gedächtniskonsolidierung?"

# Autonome Forschung durchführen
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Ergebnisse anzeigen
print(results.summary)
print(results.key_findings)

Konfigurationsmöglichkeiten

Alle Konfigurationen erfolgen über Umgebungsvariablen (siehe .env.example):

Kernkonfiguration

  • ANTHROPIC_API_KEY: API-Schlüssel oder 999... für CLI-Modus
  • CLAUDE_MODEL: Zu verwendendes Modell (nur API-Modus)
  • DATABASE_URL: Datenbankverbindungsstring
  • LOG_LEVEL: Detailgrad der Protokollierung

Forschungskonfiguration

  • MAX_RESEARCH_ITERATIONS: Maximale Anzahl an autonomen Iterationen
  • ENABLED_DOMAINS: Unterstützte wissenschaftliche Fachgebiete
  • ENABLED_EXPERIMENT_TYPES: Erlaubte Experimenttypen
  • MIN_NOVELTY_SCORE: Mindestschwellenwert für Neuartigkeit

Sicherheitskonfiguration

  • ENABLE_SAFETY_CHECKS: Code-Sicherheitsüberprüfungen
  • MAX_EXPERIMENT_EXECUTION_TIME: Timeout für Experimente
  • ENABLE_SANDBOXING: Sandboxing der Codeausführung
  • REQUIRE_HUMAN_APPROVAL: Menschliche Genehmigungsschleuse

Leistungsverbesserungen

Cachesystem

Kosmos enthält ein mehrschichtiges Cachesystem, das die API-Kosten um 30-40% reduziert:

# Cache-Leistung anzeigen
kosmos cache --stats

# Beispiel-Ausgabe:
# Gesamtcache-Leistung:
# Gesamtzahl der Anfragen: 500
# Cache-Trefferrate: 175 (35%)
# Geschätzte Kosteneinsparung: $15.75

Hinweis: Der signifikante Kosteneinsparung durch den Prompt-Cache ist derzeit nur bei Verwendung von Anthropic Claude verfügbar. OpenAI und lokale Anbieter nutzen nur In-Memory-Antwort-Caching.

Intelligente Modellauswahl

Bei Verwendung von Anthropic als LLM-Anbieter wählt Kosmos intelligente Claude-Modelle basierend auf der Aufgabenkomplexität aus:

  • Claude Sonnet 4.5: Komplexe Inferenz, Hypothesengenerierung, Analyse
  • Claude Haiku 4: Einfache Aufgaben, Datenauszug, Formatierung

Dies reduziert die Kosten um 15-20%, während die Qualität beibehalten wird.

Hinweis: Diese Funktion ist spezifisch für Anthropic Claude.

Projektstruktur

kosmos/
├── core/              # Kerninfrastruktur (LLM, Konfiguration, Protokollierung)
├── agents/            # Agentenimplementierung
├── db/                # Datenbankmodelle und -operationen
├── execution/         # Experimentausführungsengine
├── analysis/          # Ergebnisanalyse und Visualisierung
├── hypothesis/        # Hypothesengenerierung und -management
├── experiments/       # Experimentvorlagen
├── literature/        # Literaturrecherche und -analyse
├── knowledge/         # Wissensgraph und semantische Suche
├── domains/           # Fachspezifische Tools (Biologie, Physik usw.)
├── safety/            # Sicherheitsprüfungen und -validierungen
└── cli/               # Befehlszeileninterface

tests/
├── unit/              # Unit-Tests
├── integration/       # Integrations-Tests
└── e2e/               # End-to-End-Tests

docs/
├── kosmos-figures-analysis.md      # Analysemuster von kosmos-figures
├── integration-plan.md             # Integrationsstrategie
└── domain-roadmaps/                # Fachspezifische Handbücher

Entwicklung und Testen

# Entwicklungsumgebungsabhängigkeiten installieren
pip install -e ".[dev]"

# Alle Tests ausführen
pytest

# Coverage-Tests ausführen
pytest --cov=kosmos --cov-report=html

# Spezifische Testpakete ausführen
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Codeformatierung
black kosmos/ tests/

# Codeprüfung
ruff check kosmos/ tests/

# Typenprüfung
mypy kosmos/

Entwicklungsroadmap

✅ Abgeschlossen (10 Phasen)

Phase 1: Projektfundament ✅

  • Projektstruktur
  • Claude-Integration (API + CLI)
  • Konfigurationssystem
  • Agentenframework
  • Datenbankeinrichtung

Phase 2: Literaturfähigkeiten ✅

  • Literatur-API (arXiv, Semantic Scholar, PubMed)
  • Literaturanalyse-Agent
  • Semantische Suchvektor-Datenbank
  • Wissensgraph

Phase 3: Hypothesengenerierung ✅

  • Hypothesengenerator-Agent
  • Neuartigkeitsprüfung
  • Priorisierung von Hypothesen

Phase 4: Experimentdesign ✅

  • Experimentdesigner-Agent
  • Protokollvorlagen
  • Ressourcenabschätzung

Phase 5: Experimentausführung ✅

  • Sandboxed-Ausführungs-Umgebung
  • Integration von kosmos-figures-Mustern
  • Statistische Analyse

Phase 6: Ergebnisanalyse ✅

  • Datenanalyse-Agent
  • Erzeugung von Visualisierungen
  • Ergebniszusammenfassung

Phase 7: Forschungskoordination ✅

  • Forschungsleiter-Agent
  • Rückkopplungsschleife
  • Konvergenzdetektion

Phase 8: Sicherheit und Validierung ✅

  • Sicherheitsvalidierung
  • Fachspezifische Werkzeuge

Phase 9: Produktiveinsatz ✅

  • Leistungsverbesserungen (20-40× Steigerung)
  • Mehrschichtiges Cachesystem
  • Komplette Tests (90%+ Abdeckung)

Phase 10: Dokumentation und Verbesserung ✅

  • Reiche Dokumentation (10.000+ Zeilen)
  • Benutzerhandbuch
  • API-Dokumentation
  • Beispiele

Wissenschaftliche Entdeckungsbeispiele

Kosmos hat in verschiedenen Bereichen validierte wissenschaftliche Entdeckungen erbracht:

1. Metabolomik - Hirnschutz durch Hypothermie

Unabhängige Replikation der Ergebnisse eines unveröffentlichten Manuskripts, Identifizierung der Nukleotidmetabolismuswege als Hauptänderungspfade im hypothermischen Maushirn.

2. Materialwissenschaft - Effizienz von Solarzellen

Entdeckung, dass die Luftfeuchtigkeit während der Wärmebehandlung ein entscheidender Faktor für die Effizienz von Solarzellen ist, und Identifizierung eines kritischen Feuchteschwelle.

3. Neurowissenschaft - Verbindungen neuronaler Netzwerke

Zeigte, dass neuronale Netzwerke in verschiedenen Arten einem Log-Normal-Modell folgen, nicht einem Potenzgesetz.

4. Herzkrankheiten - SOD2-Schutzfaktor

Entdeckung, dass das SOD2-Protein anscheinend durch Reduzierung der Fibrose das Herz schützt.

5. Diabetes - SSR1-Genvarianten

Entdeckung, dass genetische Varianten in der Nähe des SSR1-Gens möglicherweise einen schützenden Effekt gegen Typ-2-Diabetes haben.

6. Alzheimer-Krankheit - Zeitliche Analysemethode

Einführung einer neuen Analysetechnik zur Verfolgung der zeitlichen Veränderungen von Proteinen in Krankheitszellen des Gehirns.

7. Neurodegenerative Erkrankungen - Phosphatidylserin-Exposition

Identifizierung, dass Neuronen durch altersbedingten Verlust der Flippase-Expression ein "Phagocytiere mich"-Signal exponieren.

Forschungseffizienz: Unabhängige Wissenschaftler stellten fest, dass 79,4% der Aussagen in Kosmos-Berichten korrekt sind, und Kooperationspartner berichteten, dass ein einzelner 20-Zyklus-Kosmos-Lauf im Durchschnitt dementspricht, was sie selbst in 6 Monaten erreichen würden.

Inspirationsquellen

Dieses Projekt wurde von folgender Arbeit inspiriert:

Beitragserklärung

Beiträge sind willkommen! Siehe CONTRIBUTING.md für Richtlinien.

Willkommene Beiträge:

  • Fachspezifische Tools und APIs
  • Experimentvorlagen für verschiedene Bereiche
  • Literatur-API-Integration
  • Sicherheitsvalidierung
  • Dokumentation
  • Tests

Lizenz

MIT-Lizenz - siehe LICENSE

Zitieren

Wenn Sie Kosmos in Ihrer Forschung verwenden, zitieren Sie bitte:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Danksagung

  • Anthropic für die Bereitstellung von Claude und Claude Code
  • Edison Scientific für die Bereitstellung der kosmos-figures-Analysenmuster
  • Die offene Wissenschaftsgemeinschaft für Literatur-APIs und -Tools

Unterstützung und Community

Projektstatus

Status: Produktionsbereit (v0.2.0) - Alle 10 Entwicklungsphasen abgeschlossen

Letztes Update: 2025-11-07


Dokumentationsressourcen

Zusammenfassung der Kernvorteile

  1. Völlig autonom: End-to-End-Automatisierung von Hypothese bis Entdeckung
  2. Mehrere Fachgebiete: Unterstützung für Biologie, Physik, Chemie und mehr
  3. Validiert: 7 nachgewiesene wissenschaftliche Entdeckungen
  4. Kostenoptimierung: Mehrschichtiges Cachesystem reduziert die Kosten um 30-40%
  5. Flexibilität: Unterstützung von API und CLI
  6. Sicher und verlässlich: Sandbox-Ausführung, Validierungsmechanismen, 90%+ Testabdeckung
  7. Produktionsbereit: Version v0.2.0, alle Entwicklungsphasen abgeschlossen

Star History Chart