Scientifique IA autonome open source alimenté par Claude, capable d'exécuter automatiquement un cycle complet de recherche scientifique : analyse de la littérature, génération d'hypothèses, conception d'expériences, analyse des résultats et amélioration itérative.

PythonKosmosjimmc414 308 Last Updated: December 12, 2025

Kosmos - Plateforme de scientifique autonome IA détaillée

Aperçu du projet

Kosmos est une réalisation open-source d'un scientifique autonome IA capable d'exécuter le cycle complet de la recherche scientifique : de l'analyse de la littérature et de la génération d'hypothèses, à la conception, l'exécution, l'analyse et l'amélioration itérative des expériences. Le projet est basé sur le papier Kosmos AI publié en novembre 2025 (https://arxiv.org/abs/2511.02824) et a été adapté pour être alimenté par Claude Code ou l'API Anthropic.

Caractéristiques clés

🔬 Cycle de recherche autonome

  • Workflow scientifique bout à bout : Automatisation complète du cycle de recherche
  • Support multi-domaines : Biologie, physique, chimie, neurosciences, science des matériaux
  • Amélioration itérative : Optimisation automatique des hypothèses et de la conception des expériences en fonction des résultats

🤖 Système intelligent piloté par l'IA

  • Piloté par Claude Sonnet 4 : Pour la génération d'hypothèses et l'analyse avancée
  • Support multi-modèles : Supporte Anthropic Claude, OpenAI GPT et modèles locaux (Ollama, LM Studio)
  • Sélection intelligente des modèles : Choix automatique du modèle optimal en fonction de la complexité de la tâche

🔧 Intégration flexible

  • Options d'intégration doubles :
    • Option A : API Anthropic (payante au prorata de l'utilisation)
    • Option B : CLI Claude Code (nécessite un abonnement Max)
  • Modèles d'analyse éprouvés : Intégration de méthodes statistiques éprouvées provenant de kosmos-figures

📚 Intégration de la littérature

  • Recherche automatisée d'articles : Supporte arXiv, Semantic Scholar, PubMed
  • Résumé de la littérature : Extraction automatique des informations clés
  • Vérification de la nouveauté : Vérification de l'innovation des hypothèses de recherche

🏗️ Architecture d'agents

  • Conception modulaire : Chaque tâche de recherche correspond à un agent indépendant
  • Exécution parallèle : Exécution simultanée de plusieurs tâches de recherche
  • Collaboration : Partage d'informations entre les agents via un modèle de monde structuré

🛡️ Sécurité en priorité

  • Exécution dans un bac à sable : Environnement d'exécution isolé pour le code
  • Mécanismes de vérification : Vérification des résultats et contrôle de la reproductibilité
  • Porte d'approbation humaine : Option d'approbation humaine facultative

💰 Optimisation des coûts

  • Système de cache multi-niveaux : Réduction de 30-40% des coûts API
  • Cache intelligent des prompts : Économies significatives lors de l'utilisation d'Anthropic
  • Optimisation de la sélection des modèles : Choix intelligent du modèle en fonction de la complexité de la tâche, réduction de 15-20% des coûts

Architecture du système

Composants clés

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (contrôleur principal coordonnant le cycle de  │
│               recherche autonome)                           │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Analyse  │  │Générateur d'hypothèse│  │Concepteur  │ │Analyste de  │
│de       │  │     (Claude)        │  │d'expérience│ │données      │
│littérature│  │                   │  │           │ │   (Claude)  │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Moteur d'exécution  │
            │   (kosmos-figures,   │
            │   motifs éprouvés)   │
            └──────────────────────┘

Description des agents

  • Directeur de recherche (Research Director) : Coordonnateur principal de l'workflow de recherche
  • Analyseur de littérature (Literature Analyzer) : Recherche et analyse des articles scientifiques (arXiv, Semantic Scholar, PubMed)
  • Générateur d'hypothèses (Hypothesis Generator) : Génération d'hypothèses testables avec Claude
  • Concepteur d'expériences (Experiment Designer) : Conception d'expériences computationnelles
  • Moteur d'exécution (Execution Engine) : Exécution des expériences avec des méthodes statistiques éprouvées
  • Analyste de données (Data Analyst) : Interprétation des résultats avec Claude
  • Boucle de rétroaction (Feedback Loop) : Amélioration itérative des hypothèses en fonction des résultats

Exigences techniques

Exigences de base

  • Python 3.11 ou 3.12
  • L'une des options suivantes :
    • Option A : Clé API Anthropic (payante au prorata de l'utilisation)
    • Option B : CLI Claude Code installée (nécessite un abonnement Max)

Guide d'installation

Installation de base

# Cloner le dépôt
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Créer un environnement virtuel
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Installer les dépendances
pip install -e .

# Support de la CLI Claude Code (option B)
pip install -e ".[router]"

Option A : Configuration de l'API Anthropic

# Copier la configuration d'exemple
cp .env.example .env

# Éditer .env et définir votre clé API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Obtenez votre clé API depuis console.anthropic.com

Avantages :

  • Payable au prorata de l'utilisation
  • Pas besoin d'installer la CLI
  • Fonctionne n'importe où

Inconvénients :

  • Facturation par token
  • Limites de taux

Option B : Configuration de la CLI Claude Code

# 1. Installer la CLI Claude Code
# Visitez https://claude.ai/download et suivez les instructions

# 2. Authentifier la CLI Claude
claude auth

# 3. Copier la configuration d'exemple
cp .env.example .env

# 4. Éditer .env et définir la clé API sur tout 9 (déclenche la routage CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Cela routera toutes les appels API vers la CLI Claude Code locale, utilisant votre abonnement Max, sans frais par token.

Avantages :

  • Pas de frais par token
  • Utilisation illimitée
  • Modèles Claude les plus récents
  • Exécution locale

Inconvénients :

  • Nécessite l'installation de la CLI Claude
  • Nécessite un abonnement Max

Initialisation de la base de données

# Exécuter les migrations de la base de données
alembic upgrade head

# Vérifier que la base de données a été créée
ls -la kosmos.db

Démarrage rapide

Exemple d'utilisation de base

from kosmos import ResearchDirector

# Initialiser le directeur de recherche
director = ResearchDirector()

# Poser une question de recherche
question = "Quelle est la relation entre le manque de sommeil et la consolidation de la mémoire ?"

# Exécuter la recherche autonome
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Afficher les résultats
print(results.summary)
print(results.key_findings)

Options de configuration

Toutes les configurations se font via des variables d'environnement (voir .env.example):

Configuration principale

  • ANTHROPIC_API_KEY : Clé API ou 999... pour le mode CLI
  • CLAUDE_MODEL : Modèle à utiliser (mode API uniquement)
  • DATABASE_URL : Chaîne de connexion à la base de données
  • LOG_LEVEL : Niveau de détail des logs

Configuration de la recherche

  • MAX_RESEARCH_ITERATIONS : Nombre maximal d'itérations autonomes
  • ENABLED_DOMAINS : Domaines scientifiques pris en charge
  • ENABLED_EXPERIMENT_TYPES : Types d'expériences autorisés
  • MIN_NOVELTY_SCORE : Seuil minimal de nouveauté

Configuration de sécurité

  • ENABLE_SAFETY_CHECKS : Vérifications de sécurité du code
  • MAX_EXPERIMENT_EXECUTION_TIME : Délai d'exécution des expériences
  • ENABLE_SANDBOXING : Exécution dans un bac à sable
  • REQUIRE_HUMAN_APPROVAL : Porte d'approbation humaine

Optimisation des performances

Système de cache

Kosmos inclut un système de cache multi-niveaux qui peut réduire les coûts API de 30-40% :

# Voir les performances du cache
kosmos cache --stats

# Exemple de sortie :
# Performances globales du cache :
# Nombre total de requêtes : 500
# Hits de cache : 175 (35%)
# Estimation des économies : $15.75

Remarque : Le cache de prompts, qui permet des économies significatives, est actuellement disponible uniquement avec Anthropic Claude. OpenAI et les fournisseurs locaux utilisent uniquement un cache de réponse en mémoire.

Sélection intelligente des modèles

Lors de l'utilisation d'Anthropic comme fournisseur de LLM, Kosmos choisit intelligemment le modèle Claude en fonction de la complexité de la tâche :

  • Claude Sonnet 4.5 : Raisonnement complexe, génération d'hypothèses, analyse
  • Claude Haiku 4 : Tâches simples, extraction de données, mise en forme

Cela réduit les coûts de 15-20% tout en maintenant la qualité.

Remarque : Cette fonctionnalité est spécifique à Anthropic Claude.

Structure du projet

kosmos/
├── core/              # Infrastructures de base (LLM, configuration, logs)
├── agents/            # Implémentations des agents
├── db/                # Modèles et opérations de base de données
├── execution/         # Moteur d'exécution des expériences
├── analysis/          # Analyse et visualisation des résultats
├── hypothesis/        # Génération et gestion des hypothèses
├── experiments/       # Modèles d'expériences
├── literature/        # Recherche et analyse de la littérature
├── knowledge/         # Graphe de connaissances et recherche sémantique
├── domains/           # Outils spécifiques aux domaines (biologie, physique, etc.)
├── safety/            # Vérifications et validations de sécurité
└── cli/               # Interface en ligne de commande

tests/
├── unit/              # Tests unitaires
├── integration/       # Tests d'intégration
└── e2e/               # Tests bout à bout

docs/
├── kosmos-figures-analysis.md      # Modes d'analyse de kosmos-figures
├── integration-plan.md             # Stratégie d'intégration
└── domain-roadmaps/                # Guides spécifiques aux domaines

Tests de développement

# Installer les dépendances de développement
pip install -e ".[dev]"

# Exécuter tous les tests
pytest

# Exécuter les tests de couverture
pytest --cov=kosmos --cov-report=html

# Exécuter un ensemble de tests spécifique
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Formater le code
black kosmos/ tests/

# Vérifier le code
ruff check kosmos/ tests/

# Vérification des types
mypy kosmos/

Feuille de route de développement

✅ Terminé (10 étapes)

Étape 1 : Fondements du projet ✅

  • Structure du projet
  • Intégration de Claude (API + CLI)
  • Système de configuration
  • Cadre d'agents
  • Configuration de la base de données

Étape 2 : Capacités de littérature ✅

  • API de littérature (arXiv, Semantic Scholar, PubMed)
  • Agent d'analyse de littérature
  • Base de données vectorielle de recherche sémantique
  • Graphe de connaissances

Étape 3 : Génération d'hypothèses ✅

  • Agent de génération d'hypothèses
  • Vérification de la nouveauté
  • Priorisation des hypothèses

Étape 4 : Conception d'expériences ✅

  • Agent de concepteur d'expériences
  • Modèles de protocoles
  • Estimation des ressources

Étape 5 : Exécution d'expériences ✅

  • Environnement d'exécution en bac à sable
  • Intégration des modes kosmos-figures
  • Analyse statistique

Étape 6 : Analyse des résultats ✅

  • Agent d'analyste de données
  • Génération de visualisations
  • Résumé des résultats

Étape 7 : Orchestration de la recherche ✅

  • Agent de directeur de recherche
  • Boucle de rétroaction
  • Détection de convergence

Étape 8 : Sécurité et validation ✅

  • Vérifications de sécurité
  • Outils spécifiques aux domaines

Étape 9 : Déploiement en production ✅

  • Optimisation des performances (amélioration de 20-40×)
  • Système de cache multi-niveaux
  • Tests complets (couverture de 90%+)

Étape 10 : Documentation et finalisation ✅

  • Documentation riche (plus de 10 000 lignes)
  • Guide de l'utilisateur
  • Documentation de l'API
  • Exemples de code

Cas de découvertes scientifiques

Kosmos a généré des découvertes scientifiques validées dans plusieurs domaines :

1. Métabolomique - Protection cérébrale par hypothermie

Répliqué indépendamment les résultats d'un manuscrit non publié, identifiant le métabolisme des nucléotides comme le principal changement dans le cerveau de souris hypothermiques.

2. Science des matériaux - Efficacité des cellules solaires

Découvert que l'humidité pendant le traitement thermique est un facteur clé de l'efficacité des cellules solaires, et identifié un seuil critique d'humidité.

3. Neurosciences - Connexions de réseaux neuronaux

Montré que les réseaux cérébraux trans-spécifiques suivent un modèle log-normal plutôt qu'un modèle de loi de puissance.

4. Maladie cardiaque - Facteur protecteur SOD2

Découvert que la protéine SOD2 semble protéger le cœur en réduisant la fibrose.

5. Diabète - Variation génétique SSR1

Découvert que les variations génétiques près du gène SSR1 peuvent avoir un effet protecteur contre le diabète de type 2.

6. Maladie d'Alzheimer - Méthode d'analyse temporelle

Proposé une nouvelle technique d'analyse pour suivre l'évolution des protéines dans les cellules cérébrales au fil du temps.

7. Maladies neurodégénératives - Exposition à la phosphatidylsérine

Identifié l'exposition de la phosphatidylsérine par les neurones en raison de la perte d'expression de la flippase liée à l'âge.

Efficacité de la recherche : Les scientifiques indépendants ont trouvé que 79,4% des affirmations dans les rapports de Kosmos étaient précises, et les collaborateurs ont signalé qu'un seul cycle de 20 itérations de Kosmos équivalait en moyenne à 6 mois de recherche personnelle.

Sources d'inspiration

Ce projet est inspiré par les travaux suivants :

Guide de contribution

Les contributions sont bienvenues ! Veuillez consulter CONTRIBUTING.md pour plus de détails.

Domaines de contribution souhaités :

  • Outils et API spécifiques aux domaines
  • Modèles d'expériences pour différents domaines
  • Intégration des API de littérature
  • Vérifications de sécurité
  • Documentation
  • Tests

Licence

Licence MIT - voir LICENSE

Citation

Si vous utilisez Kosmos dans vos recherches, veuillez citer :

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Remerciements

  • Anthropic pour la fourniture de Claude et Claude Code
  • Edison Scientific pour les modes d'analyse kosmos-figures
  • La communauté de la science ouverte pour les API de littérature et les outils

Support et communauté

Statut du projet

Statut : Prêt pour la production (v0.2.0) - Toutes les 10 étapes de développement sont terminées

Dernière mise à jour : 2025-11-07


Ressources de documentation

Résumé des avantages clés

  1. Entièrement autonome : Automatisation bout à bout, de l'hypothèse à la découverte
  2. Support multi-domaines : Couvre la biologie, la physique, la chimie, et plus encore
  3. Validé : A généré 7 découvertes scientifiques validées
  4. Optimisation des coûts : Système de cache multi-niveaux réduisant les coûts de 30-40%
  5. Intégration flexible : Supporte les options API et CLI
  6. Sécurité et fiabilité : Exécution en bac à sable, mécanismes de vérification, couverture de tests de 90%+
  7. Prêt pour la production : Version v0.2.0, toutes les étapes de développement terminées

Star History Chart