jimmc414/Kosmos View GitHub Homepage for Latest Official Releases

Scientifique IA autonome open source alimenté par Claude, capable d'exécuter automatiquement un cycle complet de recherche scientifique : analyse de la littérature, génération d'hypothèses, conception d'expériences, analyse des résultats et amélioration itérative.

PythonKosmosjimmc414 413 Last Updated: January 26, 2026

Kosmos - Plateforme de scientifique autonome IA détaillée

Aperçu du projet

Kosmos est une réalisation open-source d'un scientifique autonome IA capable d'exécuter le cycle complet de la recherche scientifique : de l'analyse de la littérature et de la génération d'hypothèses, à la conception, l'exécution, l'analyse et l'amélioration itérative des expériences. Le projet est basé sur le papier Kosmos AI publié en novembre 2025 (https://arxiv.org/abs/2511.02824) et a été adapté pour être alimenté par Claude Code ou l'API Anthropic.

Caractéristiques clés

🔬 Cycle de recherche autonome

Workflow scientifique bout à bout : Automatisation complète du cycle de recherche
Support multi-domaines : Biologie, physique, chimie, neurosciences, science des matériaux
Amélioration itérative : Optimisation automatique des hypothèses et de la conception des expériences en fonction des résultats

🤖 Système intelligent piloté par l'IA

Piloté par Claude Sonnet 4 : Pour la génération d'hypothèses et l'analyse avancée
Support multi-modèles : Supporte Anthropic Claude, OpenAI GPT et modèles locaux (Ollama, LM Studio)
Sélection intelligente des modèles : Choix automatique du modèle optimal en fonction de la complexité de la tâche

🔧 Intégration flexible

Options d'intégration doubles :
- Option A : API Anthropic (payante au prorata de l'utilisation)
- Option B : CLI Claude Code (nécessite un abonnement Max)
Modèles d'analyse éprouvés : Intégration de méthodes statistiques éprouvées provenant de kosmos-figures

📚 Intégration de la littérature

Recherche automatisée d'articles : Supporte arXiv, Semantic Scholar, PubMed
Résumé de la littérature : Extraction automatique des informations clés
Vérification de la nouveauté : Vérification de l'innovation des hypothèses de recherche

🏗️ Architecture d'agents

Conception modulaire : Chaque tâche de recherche correspond à un agent indépendant
Exécution parallèle : Exécution simultanée de plusieurs tâches de recherche
Collaboration : Partage d'informations entre les agents via un modèle de monde structuré

🛡️ Sécurité en priorité

Exécution dans un bac à sable : Environnement d'exécution isolé pour le code
Mécanismes de vérification : Vérification des résultats et contrôle de la reproductibilité
Porte d'approbation humaine : Option d'approbation humaine facultative

💰 Optimisation des coûts

Système de cache multi-niveaux : Réduction de 30-40% des coûts API
Cache intelligent des prompts : Économies significatives lors de l'utilisation d'Anthropic
Optimisation de la sélection des modèles : Choix intelligent du modèle en fonction de la complexité de la tâche, réduction de 15-20% des coûts

Architecture du système

Composants clés

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (contrôleur principal coordonnant le cycle de  │
│               recherche autonome)                           │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Analyse  │  │Générateur d'hypothèse│  │Concepteur  │ │Analyste de  │
│de       │  │     (Claude)        │  │d'expérience│ │données      │
│littérature│  │                   │  │           │ │   (Claude)  │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Moteur d'exécution  │
            │   (kosmos-figures,   │
            │   motifs éprouvés)   │
            └──────────────────────┘

Description des agents

Directeur de recherche (Research Director) : Coordonnateur principal de l'workflow de recherche
Analyseur de littérature (Literature Analyzer) : Recherche et analyse des articles scientifiques (arXiv, Semantic Scholar, PubMed)
Générateur d'hypothèses (Hypothesis Generator) : Génération d'hypothèses testables avec Claude
Concepteur d'expériences (Experiment Designer) : Conception d'expériences computationnelles
Moteur d'exécution (Execution Engine) : Exécution des expériences avec des méthodes statistiques éprouvées
Analyste de données (Data Analyst) : Interprétation des résultats avec Claude
Boucle de rétroaction (Feedback Loop) : Amélioration itérative des hypothèses en fonction des résultats

Exigences techniques

Exigences de base

Python 3.11 ou 3.12
L'une des options suivantes :
- Option A : Clé API Anthropic (payante au prorata de l'utilisation)
- Option B : CLI Claude Code installée (nécessite un abonnement Max)

Guide d'installation

Installation de base

# Cloner le dépôt
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Créer un environnement virtuel
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Installer les dépendances
pip install -e .

# Support de la CLI Claude Code (option B)
pip install -e ".[router]"

Option A : Configuration de l'API Anthropic

# Copier la configuration d'exemple
cp .env.example .env

# Éditer .env et définir votre clé API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Obtenez votre clé API depuis console.anthropic.com

Avantages :

Payable au prorata de l'utilisation
Pas besoin d'installer la CLI
Fonctionne n'importe où

Inconvénients :

Facturation par token
Limites de taux

Option B : Configuration de la CLI Claude Code

# 1. Installer la CLI Claude Code
# Visitez https://claude.ai/download et suivez les instructions

# 2. Authentifier la CLI Claude
claude auth

# 3. Copier la configuration d'exemple
cp .env.example .env

# 4. Éditer .env et définir la clé API sur tout 9 (déclenche la routage CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Cela routera toutes les appels API vers la CLI Claude Code locale, utilisant votre abonnement Max, sans frais par token.

Avantages :

Pas de frais par token
Utilisation illimitée
Modèles Claude les plus récents
Exécution locale

Inconvénients :

Nécessite l'installation de la CLI Claude
Nécessite un abonnement Max

Initialisation de la base de données

# Exécuter les migrations de la base de données
alembic upgrade head

# Vérifier que la base de données a été créée
ls -la kosmos.db

Démarrage rapide

Exemple d'utilisation de base

from kosmos import ResearchDirector

# Initialiser le directeur de recherche
director = ResearchDirector()

# Poser une question de recherche
question = "Quelle est la relation entre le manque de sommeil et la consolidation de la mémoire ?"

# Exécuter la recherche autonome
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Afficher les résultats
print(results.summary)
print(results.key_findings)

Options de configuration

Toutes les configurations se font via des variables d'environnement (voir .env.example):

Configuration principale

ANTHROPIC_API_KEY : Clé API ou 999... pour le mode CLI
CLAUDE_MODEL : Modèle à utiliser (mode API uniquement)
DATABASE_URL : Chaîne de connexion à la base de données
LOG_LEVEL : Niveau de détail des logs

Configuration de la recherche

MAX_RESEARCH_ITERATIONS : Nombre maximal d'itérations autonomes
ENABLED_DOMAINS : Domaines scientifiques pris en charge
ENABLED_EXPERIMENT_TYPES : Types d'expériences autorisés
MIN_NOVELTY_SCORE : Seuil minimal de nouveauté

Configuration de sécurité

ENABLE_SAFETY_CHECKS : Vérifications de sécurité du code
MAX_EXPERIMENT_EXECUTION_TIME : Délai d'exécution des expériences
ENABLE_SANDBOXING : Exécution dans un bac à sable
REQUIRE_HUMAN_APPROVAL : Porte d'approbation humaine

Optimisation des performances

Système de cache

Kosmos inclut un système de cache multi-niveaux qui peut réduire les coûts API de 30-40% :

# Voir les performances du cache
kosmos cache --stats

# Exemple de sortie :
# Performances globales du cache :
# Nombre total de requêtes : 500
# Hits de cache : 175 (35%)
# Estimation des économies : $15.75

Remarque : Le cache de prompts, qui permet des économies significatives, est actuellement disponible uniquement avec Anthropic Claude. OpenAI et les fournisseurs locaux utilisent uniquement un cache de réponse en mémoire.

Sélection intelligente des modèles

Lors de l'utilisation d'Anthropic comme fournisseur de LLM, Kosmos choisit intelligemment le modèle Claude en fonction de la complexité de la tâche :

Claude Sonnet 4.5 : Raisonnement complexe, génération d'hypothèses, analyse
Claude Haiku 4 : Tâches simples, extraction de données, mise en forme

Cela réduit les coûts de 15-20% tout en maintenant la qualité.

Remarque : Cette fonctionnalité est spécifique à Anthropic Claude.

Structure du projet

kosmos/
├── core/              # Infrastructures de base (LLM, configuration, logs)
├── agents/            # Implémentations des agents
├── db/                # Modèles et opérations de base de données
├── execution/         # Moteur d'exécution des expériences
├── analysis/          # Analyse et visualisation des résultats
├── hypothesis/        # Génération et gestion des hypothèses
├── experiments/       # Modèles d'expériences
├── literature/        # Recherche et analyse de la littérature
├── knowledge/         # Graphe de connaissances et recherche sémantique
├── domains/           # Outils spécifiques aux domaines (biologie, physique, etc.)
├── safety/            # Vérifications et validations de sécurité
└── cli/               # Interface en ligne de commande

tests/
├── unit/              # Tests unitaires
├── integration/       # Tests d'intégration
└── e2e/               # Tests bout à bout

docs/
├── kosmos-figures-analysis.md      # Modes d'analyse de kosmos-figures
├── integration-plan.md             # Stratégie d'intégration
└── domain-roadmaps/                # Guides spécifiques aux domaines

Tests de développement

# Installer les dépendances de développement
pip install -e ".[dev]"

# Exécuter tous les tests
pytest

# Exécuter les tests de couverture
pytest --cov=kosmos --cov-report=html

# Exécuter un ensemble de tests spécifique
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Formater le code
black kosmos/ tests/

# Vérifier le code
ruff check kosmos/ tests/

# Vérification des types
mypy kosmos/

Feuille de route de développement

✅ Terminé (10 étapes)

Étape 1 : Fondements du projet ✅

Structure du projet
Intégration de Claude (API + CLI)
Système de configuration
Cadre d'agents
Configuration de la base de données

Étape 2 : Capacités de littérature ✅

API de littérature (arXiv, Semantic Scholar, PubMed)
Agent d'analyse de littérature
Base de données vectorielle de recherche sémantique
Graphe de connaissances

Étape 3 : Génération d'hypothèses ✅

Agent de génération d'hypothèses
Vérification de la nouveauté
Priorisation des hypothèses

Étape 4 : Conception d'expériences ✅

Agent de concepteur d'expériences
Modèles de protocoles
Estimation des ressources

Étape 5 : Exécution d'expériences ✅

Environnement d'exécution en bac à sable
Intégration des modes kosmos-figures
Analyse statistique

Étape 6 : Analyse des résultats ✅

Agent d'analyste de données
Génération de visualisations
Résumé des résultats

Étape 7 : Orchestration de la recherche ✅

Agent de directeur de recherche
Boucle de rétroaction
Détection de convergence

Étape 8 : Sécurité et validation ✅

Vérifications de sécurité
Outils spécifiques aux domaines

Étape 9 : Déploiement en production ✅

Optimisation des performances (amélioration de 20-40×)
Système de cache multi-niveaux
Tests complets (couverture de 90%+)

Étape 10 : Documentation et finalisation ✅

Documentation riche (plus de 10 000 lignes)
Guide de l'utilisateur
Documentation de l'API
Exemples de code

Cas de découvertes scientifiques

Kosmos a généré des découvertes scientifiques validées dans plusieurs domaines :

1. Métabolomique - Protection cérébrale par hypothermie

Répliqué indépendamment les résultats d'un manuscrit non publié, identifiant le métabolisme des nucléotides comme le principal changement dans le cerveau de souris hypothermiques.

2. Science des matériaux - Efficacité des cellules solaires

Découvert que l'humidité pendant le traitement thermique est un facteur clé de l'efficacité des cellules solaires, et identifié un seuil critique d'humidité.

3. Neurosciences - Connexions de réseaux neuronaux

Montré que les réseaux cérébraux trans-spécifiques suivent un modèle log-normal plutôt qu'un modèle de loi de puissance.

4. Maladie cardiaque - Facteur protecteur SOD2

Découvert que la protéine SOD2 semble protéger le cœur en réduisant la fibrose.

5. Diabète - Variation génétique SSR1

Découvert que les variations génétiques près du gène SSR1 peuvent avoir un effet protecteur contre le diabète de type 2.

6. Maladie d'Alzheimer - Méthode d'analyse temporelle

Proposé une nouvelle technique d'analyse pour suivre l'évolution des protéines dans les cellules cérébrales au fil du temps.

7. Maladies neurodégénératives - Exposition à la phosphatidylsérine

Identifié l'exposition de la phosphatidylsérine par les neurones en raison de la perte d'expression de la flippase liée à l'âge.

Efficacité de la recherche : Les scientifiques indépendants ont trouvé que 79,4% des affirmations dans les rapports de Kosmos étaient précises, et les collaborateurs ont signalé qu'un seul cycle de 20 itérations de Kosmos équivalait en moyenne à 6 mois de recherche personnelle.

Sources d'inspiration

Ce projet est inspiré par les travaux suivants :

Article : Kosmos: An AI Scientist for Autonomous Discovery (novembre 2025)
Modes d'analyse : Dépôt kosmos-figures
Routeur Claude : claude_n_codex_api_proxy

Guide de contribution

Les contributions sont bienvenues ! Veuillez consulter CONTRIBUTING.md pour plus de détails.

Domaines de contribution souhaités :

Outils et API spécifiques aux domaines
Modèles d'expériences pour différents domaines
Intégration des API de littérature
Vérifications de sécurité
Documentation
Tests

Licence

Licence MIT - voir LICENSE

Citation

Si vous utilisez Kosmos dans vos recherches, veuillez citer :

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Remerciements

Anthropic pour la fourniture de Claude et Claude Code
Edison Scientific pour les modes d'analyse kosmos-figures
La communauté de la science ouverte pour les API de littérature et les outils

Support et communauté

Issues : GitHub Issues
Discussions : GitHub Discussions

Statut du projet

Statut : Prêt pour la production (v0.2.0) - Toutes les 10 étapes de développement sont terminées

Dernière mise à jour : 2025-11-07

Ressources de documentation

Aperçu de l'architecture - Conception du système et composants
Plan d'intégration - Mode d'intégration des modes kosmos-figures
Feuilles de route des domaines - Guides d'implémentation spécifiques aux domaines
Référence de l'API - Documentation de l'API
Guide de contribution - Comment contribuer

Résumé des avantages clés

Entièrement autonome : Automatisation bout à bout, de l'hypothèse à la découverte
Support multi-domaines : Couvre la biologie, la physique, la chimie, et plus encore
Validé : A généré 7 découvertes scientifiques validées
Optimisation des coûts : Système de cache multi-niveaux réduisant les coûts de 30-40%
Intégration flexible : Supporte les options API et CLI
Sécurité et fiabilité : Exécution en bac à sable, mécanismes de vérification, couverture de tests de 90%+
Prêt pour la production : Version v0.2.0, toutes les étapes de développement terminées