Scientifique IA autonome open source alimenté par Claude, capable d'exécuter automatiquement un cycle complet de recherche scientifique : analyse de la littérature, génération d'hypothèses, conception d'expériences, analyse des résultats et amélioration itérative.
Kosmos - Plateforme de scientifique autonome IA détaillée
Aperçu du projet
Kosmos est une réalisation open-source d'un scientifique autonome IA capable d'exécuter le cycle complet de la recherche scientifique : de l'analyse de la littérature et de la génération d'hypothèses, à la conception, l'exécution, l'analyse et l'amélioration itérative des expériences. Le projet est basé sur le papier Kosmos AI publié en novembre 2025 (https://arxiv.org/abs/2511.02824) et a été adapté pour être alimenté par Claude Code ou l'API Anthropic.
Caractéristiques clés
🔬 Cycle de recherche autonome
- Workflow scientifique bout à bout : Automatisation complète du cycle de recherche
- Support multi-domaines : Biologie, physique, chimie, neurosciences, science des matériaux
- Amélioration itérative : Optimisation automatique des hypothèses et de la conception des expériences en fonction des résultats
🤖 Système intelligent piloté par l'IA
- Piloté par Claude Sonnet 4 : Pour la génération d'hypothèses et l'analyse avancée
- Support multi-modèles : Supporte Anthropic Claude, OpenAI GPT et modèles locaux (Ollama, LM Studio)
- Sélection intelligente des modèles : Choix automatique du modèle optimal en fonction de la complexité de la tâche
🔧 Intégration flexible
- Options d'intégration doubles :
- Option A : API Anthropic (payante au prorata de l'utilisation)
- Option B : CLI Claude Code (nécessite un abonnement Max)
- Modèles d'analyse éprouvés : Intégration de méthodes statistiques éprouvées provenant de kosmos-figures
📚 Intégration de la littérature
- Recherche automatisée d'articles : Supporte arXiv, Semantic Scholar, PubMed
- Résumé de la littérature : Extraction automatique des informations clés
- Vérification de la nouveauté : Vérification de l'innovation des hypothèses de recherche
🏗️ Architecture d'agents
- Conception modulaire : Chaque tâche de recherche correspond à un agent indépendant
- Exécution parallèle : Exécution simultanée de plusieurs tâches de recherche
- Collaboration : Partage d'informations entre les agents via un modèle de monde structuré
🛡️ Sécurité en priorité
- Exécution dans un bac à sable : Environnement d'exécution isolé pour le code
- Mécanismes de vérification : Vérification des résultats et contrôle de la reproductibilité
- Porte d'approbation humaine : Option d'approbation humaine facultative
💰 Optimisation des coûts
- Système de cache multi-niveaux : Réduction de 30-40% des coûts API
- Cache intelligent des prompts : Économies significatives lors de l'utilisation d'Anthropic
- Optimisation de la sélection des modèles : Choix intelligent du modèle en fonction de la complexité de la tâche, réduction de 15-20% des coûts
Architecture du système
Composants clés
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (contrôleur principal coordonnant le cycle de │
│ recherche autonome) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Analyse │ │Générateur d'hypothèse│ │Concepteur │ │Analyste de │
│de │ │ (Claude) │ │d'expérience│ │données │
│littérature│ │ │ │ │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Moteur d'exécution │
│ (kosmos-figures, │
│ motifs éprouvés) │
└──────────────────────┘
Description des agents
- Directeur de recherche (Research Director) : Coordonnateur principal de l'workflow de recherche
- Analyseur de littérature (Literature Analyzer) : Recherche et analyse des articles scientifiques (arXiv, Semantic Scholar, PubMed)
- Générateur d'hypothèses (Hypothesis Generator) : Génération d'hypothèses testables avec Claude
- Concepteur d'expériences (Experiment Designer) : Conception d'expériences computationnelles
- Moteur d'exécution (Execution Engine) : Exécution des expériences avec des méthodes statistiques éprouvées
- Analyste de données (Data Analyst) : Interprétation des résultats avec Claude
- Boucle de rétroaction (Feedback Loop) : Amélioration itérative des hypothèses en fonction des résultats
Exigences techniques
Exigences de base
- Python 3.11 ou 3.12
- L'une des options suivantes :
- Option A : Clé API Anthropic (payante au prorata de l'utilisation)
- Option B : CLI Claude Code installée (nécessite un abonnement Max)
Guide d'installation
Installation de base
# Cloner le dépôt
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# Créer un environnement virtuel
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# Installer les dépendances
pip install -e .
# Support de la CLI Claude Code (option B)
pip install -e ".[router]"
Option A : Configuration de l'API Anthropic
# Copier la configuration d'exemple
cp .env.example .env
# Éditer .env et définir votre clé API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
Obtenez votre clé API depuis console.anthropic.com
Avantages :
- Payable au prorata de l'utilisation
- Pas besoin d'installer la CLI
- Fonctionne n'importe où
Inconvénients :
- Facturation par token
- Limites de taux
Option B : Configuration de la CLI Claude Code
# 1. Installer la CLI Claude Code
# Visitez https://claude.ai/download et suivez les instructions
# 2. Authentifier la CLI Claude
claude auth
# 3. Copier la configuration d'exemple
cp .env.example .env
# 4. Éditer .env et définir la clé API sur tout 9 (déclenche la routage CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
Cela routera toutes les appels API vers la CLI Claude Code locale, utilisant votre abonnement Max, sans frais par token.
Avantages :
- Pas de frais par token
- Utilisation illimitée
- Modèles Claude les plus récents
- Exécution locale
Inconvénients :
- Nécessite l'installation de la CLI Claude
- Nécessite un abonnement Max
Initialisation de la base de données
# Exécuter les migrations de la base de données
alembic upgrade head
# Vérifier que la base de données a été créée
ls -la kosmos.db
Démarrage rapide
Exemple d'utilisation de base
from kosmos import ResearchDirector
# Initialiser le directeur de recherche
director = ResearchDirector()
# Poser une question de recherche
question = "Quelle est la relation entre le manque de sommeil et la consolidation de la mémoire ?"
# Exécuter la recherche autonome
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# Afficher les résultats
print(results.summary)
print(results.key_findings)
Options de configuration
Toutes les configurations se font via des variables d'environnement (voir .env.example):
Configuration principale
ANTHROPIC_API_KEY: Clé API ou999...pour le mode CLICLAUDE_MODEL: Modèle à utiliser (mode API uniquement)DATABASE_URL: Chaîne de connexion à la base de donnéesLOG_LEVEL: Niveau de détail des logs
Configuration de la recherche
MAX_RESEARCH_ITERATIONS: Nombre maximal d'itérations autonomesENABLED_DOMAINS: Domaines scientifiques pris en chargeENABLED_EXPERIMENT_TYPES: Types d'expériences autorisésMIN_NOVELTY_SCORE: Seuil minimal de nouveauté
Configuration de sécurité
ENABLE_SAFETY_CHECKS: Vérifications de sécurité du codeMAX_EXPERIMENT_EXECUTION_TIME: Délai d'exécution des expériencesENABLE_SANDBOXING: Exécution dans un bac à sableREQUIRE_HUMAN_APPROVAL: Porte d'approbation humaine
Optimisation des performances
Système de cache
Kosmos inclut un système de cache multi-niveaux qui peut réduire les coûts API de 30-40% :
# Voir les performances du cache
kosmos cache --stats
# Exemple de sortie :
# Performances globales du cache :
# Nombre total de requêtes : 500
# Hits de cache : 175 (35%)
# Estimation des économies : $15.75
Remarque : Le cache de prompts, qui permet des économies significatives, est actuellement disponible uniquement avec Anthropic Claude. OpenAI et les fournisseurs locaux utilisent uniquement un cache de réponse en mémoire.
Sélection intelligente des modèles
Lors de l'utilisation d'Anthropic comme fournisseur de LLM, Kosmos choisit intelligemment le modèle Claude en fonction de la complexité de la tâche :
- Claude Sonnet 4.5 : Raisonnement complexe, génération d'hypothèses, analyse
- Claude Haiku 4 : Tâches simples, extraction de données, mise en forme
Cela réduit les coûts de 15-20% tout en maintenant la qualité.
Remarque : Cette fonctionnalité est spécifique à Anthropic Claude.
Structure du projet
kosmos/
├── core/ # Infrastructures de base (LLM, configuration, logs)
├── agents/ # Implémentations des agents
├── db/ # Modèles et opérations de base de données
├── execution/ # Moteur d'exécution des expériences
├── analysis/ # Analyse et visualisation des résultats
├── hypothesis/ # Génération et gestion des hypothèses
├── experiments/ # Modèles d'expériences
├── literature/ # Recherche et analyse de la littérature
├── knowledge/ # Graphe de connaissances et recherche sémantique
├── domains/ # Outils spécifiques aux domaines (biologie, physique, etc.)
├── safety/ # Vérifications et validations de sécurité
└── cli/ # Interface en ligne de commande
tests/
├── unit/ # Tests unitaires
├── integration/ # Tests d'intégration
└── e2e/ # Tests bout à bout
docs/
├── kosmos-figures-analysis.md # Modes d'analyse de kosmos-figures
├── integration-plan.md # Stratégie d'intégration
└── domain-roadmaps/ # Guides spécifiques aux domaines
Tests de développement
# Installer les dépendances de développement
pip install -e ".[dev]"
# Exécuter tous les tests
pytest
# Exécuter les tests de couverture
pytest --cov=kosmos --cov-report=html
# Exécuter un ensemble de tests spécifique
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# Formater le code
black kosmos/ tests/
# Vérifier le code
ruff check kosmos/ tests/
# Vérification des types
mypy kosmos/
Feuille de route de développement
✅ Terminé (10 étapes)
Étape 1 : Fondements du projet ✅
- Structure du projet
- Intégration de Claude (API + CLI)
- Système de configuration
- Cadre d'agents
- Configuration de la base de données
Étape 2 : Capacités de littérature ✅
- API de littérature (arXiv, Semantic Scholar, PubMed)
- Agent d'analyse de littérature
- Base de données vectorielle de recherche sémantique
- Graphe de connaissances
Étape 3 : Génération d'hypothèses ✅
- Agent de génération d'hypothèses
- Vérification de la nouveauté
- Priorisation des hypothèses
Étape 4 : Conception d'expériences ✅
- Agent de concepteur d'expériences
- Modèles de protocoles
- Estimation des ressources
Étape 5 : Exécution d'expériences ✅
- Environnement d'exécution en bac à sable
- Intégration des modes kosmos-figures
- Analyse statistique
Étape 6 : Analyse des résultats ✅
- Agent d'analyste de données
- Génération de visualisations
- Résumé des résultats
Étape 7 : Orchestration de la recherche ✅
- Agent de directeur de recherche
- Boucle de rétroaction
- Détection de convergence
Étape 8 : Sécurité et validation ✅
- Vérifications de sécurité
- Outils spécifiques aux domaines
Étape 9 : Déploiement en production ✅
- Optimisation des performances (amélioration de 20-40×)
- Système de cache multi-niveaux
- Tests complets (couverture de 90%+)
Étape 10 : Documentation et finalisation ✅
- Documentation riche (plus de 10 000 lignes)
- Guide de l'utilisateur
- Documentation de l'API
- Exemples de code
Cas de découvertes scientifiques
Kosmos a généré des découvertes scientifiques validées dans plusieurs domaines :
1. Métabolomique - Protection cérébrale par hypothermie
Répliqué indépendamment les résultats d'un manuscrit non publié, identifiant le métabolisme des nucléotides comme le principal changement dans le cerveau de souris hypothermiques.
2. Science des matériaux - Efficacité des cellules solaires
Découvert que l'humidité pendant le traitement thermique est un facteur clé de l'efficacité des cellules solaires, et identifié un seuil critique d'humidité.
3. Neurosciences - Connexions de réseaux neuronaux
Montré que les réseaux cérébraux trans-spécifiques suivent un modèle log-normal plutôt qu'un modèle de loi de puissance.
4. Maladie cardiaque - Facteur protecteur SOD2
Découvert que la protéine SOD2 semble protéger le cœur en réduisant la fibrose.
5. Diabète - Variation génétique SSR1
Découvert que les variations génétiques près du gène SSR1 peuvent avoir un effet protecteur contre le diabète de type 2.
6. Maladie d'Alzheimer - Méthode d'analyse temporelle
Proposé une nouvelle technique d'analyse pour suivre l'évolution des protéines dans les cellules cérébrales au fil du temps.
7. Maladies neurodégénératives - Exposition à la phosphatidylsérine
Identifié l'exposition de la phosphatidylsérine par les neurones en raison de la perte d'expression de la flippase liée à l'âge.
Efficacité de la recherche : Les scientifiques indépendants ont trouvé que 79,4% des affirmations dans les rapports de Kosmos étaient précises, et les collaborateurs ont signalé qu'un seul cycle de 20 itérations de Kosmos équivalait en moyenne à 6 mois de recherche personnelle.
Sources d'inspiration
Ce projet est inspiré par les travaux suivants :
- Article : Kosmos: An AI Scientist for Autonomous Discovery (novembre 2025)
- Modes d'analyse : Dépôt kosmos-figures
- Routeur Claude : claude_n_codex_api_proxy
Guide de contribution
Les contributions sont bienvenues ! Veuillez consulter CONTRIBUTING.md pour plus de détails.
Domaines de contribution souhaités :
- Outils et API spécifiques aux domaines
- Modèles d'expériences pour différents domaines
- Intégration des API de littérature
- Vérifications de sécurité
- Documentation
- Tests
Licence
Licence MIT - voir LICENSE
Citation
Si vous utilisez Kosmos dans vos recherches, veuillez citer :
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
Remerciements
- Anthropic pour la fourniture de Claude et Claude Code
- Edison Scientific pour les modes d'analyse kosmos-figures
- La communauté de la science ouverte pour les API de littérature et les outils
Support et communauté
- Issues : GitHub Issues
- Discussions : GitHub Discussions
Statut du projet
Statut : Prêt pour la production (v0.2.0) - Toutes les 10 étapes de développement sont terminées
Dernière mise à jour : 2025-11-07
Ressources de documentation
- Aperçu de l'architecture - Conception du système et composants
- Plan d'intégration - Mode d'intégration des modes kosmos-figures
- Feuilles de route des domaines - Guides d'implémentation spécifiques aux domaines
- Référence de l'API - Documentation de l'API
- Guide de contribution - Comment contribuer
Résumé des avantages clés
- Entièrement autonome : Automatisation bout à bout, de l'hypothèse à la découverte
- Support multi-domaines : Couvre la biologie, la physique, la chimie, et plus encore
- Validé : A généré 7 découvertes scientifiques validées
- Optimisation des coûts : Système de cache multi-niveaux réduisant les coûts de 30-40%
- Intégration flexible : Supporte les options API et CLI
- Sécurité et fiabilité : Exécution en bac à sable, mécanismes de vérification, couverture de tests de 90%+
- Prêt pour la production : Version v0.2.0, toutes les étapes de développement terminées