jimmc414/Kosmos View GitHub Homepage for Latest Official Releases

Ein Open-Source, autonomer KI-Wissenschaftler, angetrieben von Claude, der den gesamten wissenschaftlichen Forschungszyklus automatisiert ausführen kann: Literaturanalyse, Hypothesengenerierung, Versuchsplanung, Durchführung der Analyse und iterative Verbesserung.

PythonKosmosjimmc414 413 Last Updated: January 26, 2026

Kosmos - Plattform für autonome AI-Wissenschaftler, detaillierte Vorstellung

Projektübersicht

Kosmos ist eine Open-Source-Implementierung eines autonomen AI-Wissenschaftlers, der den gesamten wissenschaftlichen Forschungszyklus ausführen kann: von der Literaturanalyse und Hypothesengenerierung bis zum Experimentdesign, Durchführung, Analyse und iterativer Verbesserung. Das Projekt basiert auf dem Kosmos AI-Papier, das im November 2025 veröffentlicht wurde (https://arxiv.org/abs/2511.02824), und ist anpassbar, um von Claude Code oder der Anthropic API getrieben zu werden.

Kernfunktionen

🔬 Autonomer Forschungszyklus

End-to-End-Wissenschaftsworkflow: Automatisierung des vollständigen Forschungszyklus
Mehrere Fachgebiete: Biologie, Physik, Chemie, Neurowissenschaften, Materialwissenschaften
Iterative Verbesserung: Automatische Optimierung von Hypothesen und Experimentdesign basierend auf Ergebnissen

🤖 KI-gesteuertes intelligentes System

Claude Sonnet 4 Antrieb: Für Hypothesengenerierung und fortgeschrittene Analyse
Unterstützung mehrerer Modelle: Unterstützung für Anthropic Claude, OpenAI GPT und lokale Modelle (Ollama, LM Studio)
Intelligente Modellauswahl: Automatische Auswahl des optimalen Modells basierend auf der Komplexität der Aufgabe

🔧 Flexibles Integrationskonzept

Doppelte Integrationsmöglichkeiten:
- Option A: Anthropic API (Pay-as-you-go)
- Option B: Claude Code CLI (benötigt Max-Abonnement)
Reifere Analysemuster: Integration bewährter statistischer Methoden aus kosmos-figures

📚 Literaturintegration

Automatische Papierrecherche: Unterstützung für arXiv, Semantic Scholar, PubMed
Literaturzusammenfassung: Automatische Extraktion von Schlüsselinformationen
Neuartigkeitsprüfung: Überprüfung der Innovativität der Forschungshypothesen

🏗️ Agentenarchitektur

Modulares Design: Jede Forschungsaufgabe entspricht einem eigenständigen Agenten
Parallelverarbeitung: Gleichzeitige Ausführung mehrerer Forschungsaufgaben
Kollaboration: Informationsaustausch zwischen Agenten über strukturierte Weltmodelle

🛡️ Sicherheit im Vordergrund

Sandbox-Ausführung: Isolierte Code-Laufzeitumgebung
Validierungsmechanismen: Ergebnisvalidierung und Reproduzierbarkeitsprüfungen
Menschliche Genehmigungsschleuse: Optionale menschliche Prüfung

💰 Kostenoptimierung

Mehrschichtiges Cachesystem: Reduzierung der API-Kosten um 30-40%
Intelligenter Prompt-Cache: Signifikante Kosteneinsparungen bei Verwendung von Anthropic
Optimierung der Modellauswahl: Intelligente Modellauswahl basierend auf der Aufgabenkomplexität, reduziert die Kosten um 15-20%

Systemarchitektur

Kernkomponenten

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (Hauptkontroller für den autonomen             │
│               Forschungszyklus)                             │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

Agentenbeschreibung

Research Director (Forschungsleiter): Hauptkoordinator für den Forschungsworkflow
Literature Analyzer (Literaturanalyseur): Sucht und analysiert wissenschaftliche Papiere (arXiv, Semantic Scholar, PubMed)
Hypothesis Generator (Hypothesengenerator): Generiert testbare Hypothesen mit Claude
Experiment Designer (Experimentdesigner): Entwirft computergestützte Experimente
Execution Engine (Ausführungsengine): Führt Experimente mit validierten statistischen Methoden durch
Data Analyst (Datenanalyst): Interpretiert Ergebnisse mit Claude
Feedback Loop (Rückkopplungsschleife): Iterative Verbesserung von Hypothesen basierend auf Ergebnissen

Technische Anforderungen

Grundanforderungen

Python 3.11 oder 3.12
Eines der Folgenden:
- Option A: Anthropic API-Schlüssel (Pay-as-you-go)
- Option B: Claude Code CLI installiert (benötigt Max-Abonnement)

Installationsanleitung

Grundinstallation

# Repository klonen
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Virtuelle Umgebung erstellen
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Abhängigkeiten installieren
pip install -e .

# Unterstützung für Claude Code CLI (Option B)
pip install -e ".[router]"

Option A: Anthropic API-Konfiguration

# Beispieleinstellungen kopieren
cp .env.example .env

# .env bearbeiten und deinen API-Schlüssel eintragen
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Deinen API-Schlüssel erhältst du von console.anthropic.com

Vorteile:

Pay-as-you-go
Keine CLI-Installation erforderlich
Kann von überall verwendet werden

Nachteile:

Gebühren pro Token
Rate Limits

Option B: Claude Code CLI-Konfiguration

# 1. Claude Code CLI installieren
# Besuche https://claude.ai/download und folge den Anweisungen

# 2. Claude CLI authentifizieren
claude auth

# 3. Beispieleinstellungen kopieren
cp .env.example .env

# 4. .env bearbeiten und setze den API-Schlüssel auf alle Neun (trigger CLI-Routing)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Dies leitet alle API-Aufrufe an die lokale Claude Code CLI weiter, nutzt dein Max-Abonnement und erfordert keine Token-Gebühren.

Vorteile:

Keine Token-Kosten
Unbegrenzte Nutzung
Aktuellste Claude-Modelle
Lokale Ausführung

Nachteile:

Erfordert Claude CLI-Installation
Erfordert Max-Abonnement

Datenbankinitialisierung

# Datenbankmigrationen ausführen
alembic upgrade head

# Überprüfen, ob die Datenbank erstellt wurde
ls -la kosmos.db

Schnellstart

Beispielnutzung

from kosmos import ResearchDirector

# Forschungsleiter initialisieren
director = ResearchDirector()

# Forschungsfrage stellen
question = "Was ist die Beziehung zwischen Schlafentzug und Gedächtniskonsolidierung?"

# Autonome Forschung durchführen
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Ergebnisse anzeigen
print(results.summary)
print(results.key_findings)

Konfigurationsmöglichkeiten

Alle Konfigurationen erfolgen über Umgebungsvariablen (siehe .env.example):

Kernkonfiguration

ANTHROPIC_API_KEY: API-Schlüssel oder 999... für CLI-Modus
CLAUDE_MODEL: Zu verwendendes Modell (nur API-Modus)
DATABASE_URL: Datenbankverbindungsstring
LOG_LEVEL: Detailgrad der Protokollierung

Forschungskonfiguration

MAX_RESEARCH_ITERATIONS: Maximale Anzahl an autonomen Iterationen
ENABLED_DOMAINS: Unterstützte wissenschaftliche Fachgebiete
ENABLED_EXPERIMENT_TYPES: Erlaubte Experimenttypen
MIN_NOVELTY_SCORE: Mindestschwellenwert für Neuartigkeit

Sicherheitskonfiguration

ENABLE_SAFETY_CHECKS: Code-Sicherheitsüberprüfungen
MAX_EXPERIMENT_EXECUTION_TIME: Timeout für Experimente
ENABLE_SANDBOXING: Sandboxing der Codeausführung
REQUIRE_HUMAN_APPROVAL: Menschliche Genehmigungsschleuse

Leistungsverbesserungen

Cachesystem

Kosmos enthält ein mehrschichtiges Cachesystem, das die API-Kosten um 30-40% reduziert:

# Cache-Leistung anzeigen
kosmos cache --stats

# Beispiel-Ausgabe:
# Gesamtcache-Leistung:
# Gesamtzahl der Anfragen: 500
# Cache-Trefferrate: 175 (35%)
# Geschätzte Kosteneinsparung: $15.75

Hinweis: Der signifikante Kosteneinsparung durch den Prompt-Cache ist derzeit nur bei Verwendung von Anthropic Claude verfügbar. OpenAI und lokale Anbieter nutzen nur In-Memory-Antwort-Caching.

Intelligente Modellauswahl

Bei Verwendung von Anthropic als LLM-Anbieter wählt Kosmos intelligente Claude-Modelle basierend auf der Aufgabenkomplexität aus:

Claude Sonnet 4.5: Komplexe Inferenz, Hypothesengenerierung, Analyse
Claude Haiku 4: Einfache Aufgaben, Datenauszug, Formatierung

Dies reduziert die Kosten um 15-20%, während die Qualität beibehalten wird.

Hinweis: Diese Funktion ist spezifisch für Anthropic Claude.

Projektstruktur

kosmos/
├── core/              # Kerninfrastruktur (LLM, Konfiguration, Protokollierung)
├── agents/            # Agentenimplementierung
├── db/                # Datenbankmodelle und -operationen
├── execution/         # Experimentausführungsengine
├── analysis/          # Ergebnisanalyse und Visualisierung
├── hypothesis/        # Hypothesengenerierung und -management
├── experiments/       # Experimentvorlagen
├── literature/        # Literaturrecherche und -analyse
├── knowledge/         # Wissensgraph und semantische Suche
├── domains/           # Fachspezifische Tools (Biologie, Physik usw.)
├── safety/            # Sicherheitsprüfungen und -validierungen
└── cli/               # Befehlszeileninterface

tests/
├── unit/              # Unit-Tests
├── integration/       # Integrations-Tests
└── e2e/               # End-to-End-Tests

docs/
├── kosmos-figures-analysis.md      # Analysemuster von kosmos-figures
├── integration-plan.md             # Integrationsstrategie
└── domain-roadmaps/                # Fachspezifische Handbücher

Entwicklung und Testen

# Entwicklungsumgebungsabhängigkeiten installieren
pip install -e ".[dev]"

# Alle Tests ausführen
pytest

# Coverage-Tests ausführen
pytest --cov=kosmos --cov-report=html

# Spezifische Testpakete ausführen
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Codeformatierung
black kosmos/ tests/

# Codeprüfung
ruff check kosmos/ tests/

# Typenprüfung
mypy kosmos/

Entwicklungsroadmap

✅ Abgeschlossen (10 Phasen)

Phase 1: Projektfundament ✅

Projektstruktur
Claude-Integration (API + CLI)
Konfigurationssystem
Agentenframework
Datenbankeinrichtung

Phase 2: Literaturfähigkeiten ✅

Literatur-API (arXiv, Semantic Scholar, PubMed)
Literaturanalyse-Agent
Semantische Suchvektor-Datenbank
Wissensgraph

Phase 3: Hypothesengenerierung ✅

Hypothesengenerator-Agent
Neuartigkeitsprüfung
Priorisierung von Hypothesen

Phase 4: Experimentdesign ✅

Experimentdesigner-Agent
Protokollvorlagen
Ressourcenabschätzung

Phase 5: Experimentausführung ✅

Sandboxed-Ausführungs-Umgebung
Integration von kosmos-figures-Mustern
Statistische Analyse

Phase 6: Ergebnisanalyse ✅

Datenanalyse-Agent
Erzeugung von Visualisierungen
Ergebniszusammenfassung

Phase 7: Forschungskoordination ✅

Forschungsleiter-Agent
Rückkopplungsschleife
Konvergenzdetektion

Phase 8: Sicherheit und Validierung ✅

Sicherheitsvalidierung
Fachspezifische Werkzeuge

Phase 9: Produktiveinsatz ✅

Leistungsverbesserungen (20-40× Steigerung)
Mehrschichtiges Cachesystem
Komplette Tests (90%+ Abdeckung)

Phase 10: Dokumentation und Verbesserung ✅

Reiche Dokumentation (10.000+ Zeilen)
Benutzerhandbuch
API-Dokumentation
Beispiele

Wissenschaftliche Entdeckungsbeispiele

Kosmos hat in verschiedenen Bereichen validierte wissenschaftliche Entdeckungen erbracht:

1. Metabolomik - Hirnschutz durch Hypothermie

Unabhängige Replikation der Ergebnisse eines unveröffentlichten Manuskripts, Identifizierung der Nukleotidmetabolismuswege als Hauptänderungspfade im hypothermischen Maushirn.

2. Materialwissenschaft - Effizienz von Solarzellen

Entdeckung, dass die Luftfeuchtigkeit während der Wärmebehandlung ein entscheidender Faktor für die Effizienz von Solarzellen ist, und Identifizierung eines kritischen Feuchteschwelle.

3. Neurowissenschaft - Verbindungen neuronaler Netzwerke

Zeigte, dass neuronale Netzwerke in verschiedenen Arten einem Log-Normal-Modell folgen, nicht einem Potenzgesetz.

4. Herzkrankheiten - SOD2-Schutzfaktor

Entdeckung, dass das SOD2-Protein anscheinend durch Reduzierung der Fibrose das Herz schützt.

5. Diabetes - SSR1-Genvarianten

Entdeckung, dass genetische Varianten in der Nähe des SSR1-Gens möglicherweise einen schützenden Effekt gegen Typ-2-Diabetes haben.

6. Alzheimer-Krankheit - Zeitliche Analysemethode

Einführung einer neuen Analysetechnik zur Verfolgung der zeitlichen Veränderungen von Proteinen in Krankheitszellen des Gehirns.

7. Neurodegenerative Erkrankungen - Phosphatidylserin-Exposition

Identifizierung, dass Neuronen durch altersbedingten Verlust der Flippase-Expression ein "Phagocytiere mich"-Signal exponieren.

Forschungseffizienz: Unabhängige Wissenschaftler stellten fest, dass 79,4% der Aussagen in Kosmos-Berichten korrekt sind, und Kooperationspartner berichteten, dass ein einzelner 20-Zyklus-Kosmos-Lauf im Durchschnitt dementspricht, was sie selbst in 6 Monaten erreichen würden.

Inspirationsquellen

Dieses Projekt wurde von folgender Arbeit inspiriert:

Papier: Kosmos: An AI Scientist for Autonomous Discovery (November 2025)
Analysemuster: kosmos-figures Repository
Claude Router: claude_n_codex_api_proxy

Beitragserklärung

Beiträge sind willkommen! Siehe CONTRIBUTING.md für Richtlinien.

Willkommene Beiträge:

Fachspezifische Tools und APIs
Experimentvorlagen für verschiedene Bereiche
Literatur-API-Integration
Sicherheitsvalidierung
Dokumentation
Tests

Lizenz

MIT-Lizenz - siehe LICENSE

Zitieren

Wenn Sie Kosmos in Ihrer Forschung verwenden, zitieren Sie bitte:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Danksagung

Anthropic für die Bereitstellung von Claude und Claude Code
Edison Scientific für die Bereitstellung der kosmos-figures-Analysenmuster
Die offene Wissenschaftsgemeinschaft für Literatur-APIs und -Tools

Unterstützung und Community

Issues: GitHub Issues
Diskussionen: GitHub Discussions

Projektstatus

Status: Produktionsbereit (v0.2.0) - Alle 10 Entwicklungsphasen abgeschlossen

Letztes Update: 2025-11-07

Dokumentationsressourcen

Architekturübersicht - Systemdesign und -komponenten
Integrationsplan - Integrationsansätze für kosmos-figures-Muster
Fachgebiet-Roadmaps - Implementierungsleitfäden für spezifische Fachgebiete
API-Referenz - API-Dokumentation
Beitragserklärung - Wie man beiträgt

Zusammenfassung der Kernvorteile

Völlig autonom: End-to-End-Automatisierung von Hypothese bis Entdeckung
Mehrere Fachgebiete: Unterstützung für Biologie, Physik, Chemie und mehr
Validiert: 7 nachgewiesene wissenschaftliche Entdeckungen
Kostenoptimierung: Mehrschichtiges Cachesystem reduziert die Kosten um 30-40%
Flexibilität: Unterstützung von API und CLI
Sicher und verlässlich: Sandbox-Ausführung, Validierungsmechanismen, 90%+ Testabdeckung
Produktionsbereit: Version v0.2.0, alle Entwicklungsphasen abgeschlossen