Científico de IA autónomo y de código abierto impulsado por Claude, capaz de ejecutar automáticamente un ciclo completo de investigación científica: análisis de literatura, generación de hipótesis, diseño experimental, análisis de resultados e iteración continua.
Kosmos - Plataforma de Científico Autónomo de IA: Descripción Detallada
Resumen del Proyecto
Kosmos es una implementación de código abierto de un científico autónomo de IA capaz de ejecutar el ciclo completo de investigación científica: desde el análisis de literatura y la generación de hipótesis, hasta el diseño, ejecución, análisis y mejora iterativa de experimentos. El proyecto se basa en el artículo de Kosmos AI publicado en noviembre de 2025 (https://arxiv.org/abs/2511.02824) y está adaptado para ser impulsado por Claude Code o la API de Anthropic.
Características Principales
🔬 Ciclo de Investigación Autónomo
- Flujo de trabajo científico de extremo a extremo: Automatización completa del ciclo de investigación.
- Soporte multiárea: Biología, física, química, neurociencia, ciencia de materiales.
- Mejora iterativa: Optimización automática de hipótesis y diseño de experimentos basada en resultados.
🤖 Sistema Inteligente Impulsado por IA
- Impulsado por Claude Sonnet 4: Para la generación de hipótesis y análisis avanzados.
- Soporte multi-modelo: Soporta Anthropic Claude, OpenAI GPT y modelos locales (Ollama, LM Studio).
- Selección inteligente de modelos: Selección automática del modelo óptimo según la complejidad de la tarea.
🔧 Integración Flexible
- Opciones de integración dobles:
- Opción A: API de Anthropic (pago por uso).
- Opción B: CLI de Claude Code (requiere suscripción Max).
- Modos de análisis probados: Integra métodos estadísticos probados de kosmos-figures.
📚 Integración de Literatura
- Búsqueda automatizada de artículos: Soporta arXiv, Semantic Scholar, PubMed.
- Resúmenes de literatura: Extracción automática de información clave.
- Verificación de novedad: Validación de la innovación de las hipótesis de investigación.
🏗️ Arquitectura de Agentes
- Diseño modular: Cada tarea de investigación corresponde a un agente independiente.
- Ejecución paralela: Ejecución simultánea de múltiples tareas de investigación.
- Colaboración: Compartir información entre agentes a través de un modelo estructurado del mundo.
🛡️ Seguridad Primero
- Ejecución en sandbox: Entorno de ejecución de código aislado.
- Mecanismos de verificación: Verificación de resultados y comprobación de reproducibilidad.
- Puerta de aprobación humana: Paso de revisión humana opcional.
💰 Optimización de Costos
- Sistema de caché multinivel: Reducción del 30-40% de los costos de API.
- Caché inteligente de prompts: Ahorro significativo de costos al usar Anthropic.
- Optimización de selección de modelos: Selección inteligente de modelos según la complejidad de la tarea, reduciendo el 15-20% de los costos.
Arquitectura del Sistema
Componentes Principales
┌─────────────────────────────────────────────────────────────┐
│ Director de Investigación │
│ (controlador principal que coordina el ciclo de investigación autónoma) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Analizador│ │Generador de Hipótesis│ │Diseñador de│ │Analista de │
│de Literatura│ │ (Claude) │ │Experimentos│ │Datos (Claude)│
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Motor de Ejecución │
│ (patrones probados │
│ de kosmos-figures) │
└──────────────────────┘
Descripción de Agentes
- Director de Investigación (Director de Investigación): Coordinador principal del flujo de trabajo de investigación.
- Analizador de Literatura (Analizador de Literatura): Busca y analiza artículos científicos (arXiv, Semantic Scholar, PubMed).
- Generador de Hipótesis (Generador de Hipótesis): Genera hipótesis testables usando Claude.
- Diseñador de Experimentos (Diseñador de Experimentos): Diseña experimentos computacionales.
- Motor de Ejecución (Motor de Ejecución): Ejecuta experimentos usando métodos estadísticos probados.
- Analista de Datos (Analista de Datos): Interpreta los resultados usando Claude.
- Bucle de Retroalimentación (Bucle de Retroalimentación): Mejora iterativa de hipótesis basada en los resultados.
Requisitos Técnicos
Requisitos Básicos
- Python 3.11 o 3.12
- Uno de los siguientes:
- Opción A: Clave de API de Anthropic (pago por uso)
- Opción B: CLI de Claude Code instalado (requiere suscripción Max)
Guía de Instalación
Instalación Básica
# Clona el repositorio
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# Crea un entorno virtual
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# Instala las dependencias
pip install -e .
# Soporte para CLI de Claude Code (Opción B)
pip install -e ".[router]"
Opción A: Configuración de API de Anthropic
# Copia el archivo de configuración de ejemplo
cp .env.example .env
# Edita .env y establece tu clave de API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
Obtén tu clave de API en console.anthropic.com
Ventajas:
- Pago por uso
- No requiere instalación de CLI
- Funciona en cualquier lugar
Desventajas:
- Cobro por token
- Límites de velocidad
Opción B: Configuración de CLI de Claude Code
# 1. Instala CLI de Claude Code
# Visita https://claude.ai/download y sigue las instrucciones
# 2. Autentica CLI de Claude
claude auth
# 3. Copia el archivo de configuración de ejemplo
cp .env.example .env
# 4. Edita .env y establece la clave de API como todos 9 (para activar la ruta CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
Esto enruta todas las llamadas de API a la CLI local de Claude Code, utilizando tu suscripción Max, sin costo por token.
Ventajas:
- Sin costo por token
- Uso ilimitado
- Modelos Claude más recientes
- Ejecución local
Desventajas:
- Requiere instalación de CLI de Claude
- Requiere suscripción Max
Inicialización de la Base de Datos
# Ejecuta las migraciones de la base de datos
alembic upgrade head
# Verifica que la base de datos se ha creado
ls -la kosmos.db
Comenzando Rápido
Ejemplo de Uso Básico
from kosmos import ResearchDirector
# Inicializa el director de investigación
director = ResearchDirector()
# Propone una pregunta de investigación
question = "¿Cuál es la relación entre la privación del sueño y la consolidación de la memoria?"
# Ejecuta la investigación autónoma
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# Muestra los resultados
print(results.summary)
print(results.key_findings)
Opciones de Configuración
Todas las configuraciones se realizan a través de variables de entorno (ver .env.example):
Configuración Principal
ANTHROPIC_API_KEY: Clave de API o999...para el modo CLICLAUDE_MODEL: Modelo a utilizar (solo modo API)DATABASE_URL: Cadena de conexión de la base de datosLOG_LEVEL: Nivel de detalle de los registros
Configuración de Investigación
MAX_RESEARCH_ITERATIONS: Número máximo de iteraciones autónomasENABLED_DOMAINS: Áreas científicas soportadasENABLED_EXPERIMENT_TYPES: Tipos de experimentos permitidosMIN_NOVELTY_SCORE: Umbral mínimo de novedad
Configuración de Seguridad
ENABLE_SAFETY_CHECKS: Verificación de seguridad del códigoMAX_EXPERIMENT_EXECUTION_TIME: Tiempo de ejecución máximo de experimentosENABLE_SANDBOXING: Ejecución de código en sandboxREQUIRE_HUMAN_APPROVAL: Puerta de aprobación humana
Optimización de Rendimiento
Sistema de Caché
Kosmos incluye un sistema de caché multinivel que puede reducir el 30-40% de los costos de API:
# Ver rendimiento de la caché
kosmos cache --stats
# Salida de ejemplo:
# Rendimiento general de la caché:
# Solicitudes totales: 500
# Hits de caché: 175 (35%)
# Costo estimado ahorrado: $15.75
Nota: La caché de prompts, que ahorra costos significativos, está disponible actualmente solo al usar Anthropic Claude. OpenAI y proveedores locales usan solo caché de respuestas en memoria.
Selección Inteligente de Modelos
Al usar Anthropic como proveedor de LLM, Kosmos selecciona inteligentemente el modelo Claude según la complejidad de la tarea:
- Claude Sonnet 4.5: Inferencia compleja, generación de hipótesis, análisis
- Claude Haiku 4: Tareas simples, extracción de datos, formateo
Esto reduce el costo en un 15-20%, manteniendo la calidad.
Nota: Esta función es específica de Anthropic Claude.
Estructura del Proyecto
kosmos/
├── core/ # Infraestructura central (LLM, configuración, registros)
├── agents/ # Implementación de agentes
├── db/ # Modelos y operaciones de base de datos
├── execution/ # Motor de ejecución de experimentos
├── analysis/ # Análisis y visualización de resultados
├── hypothesis/ # Generación y gestión de hipótesis
├── experiments/ # Plantillas de experimentos
├── literature/ # Búsqueda y análisis de literatura
├── knowledge/ # Gráfico de conocimientos y búsqueda semántica
├── domains/ # Herramientas específicas de dominio (biología, física, etc.)
├── safety/ # Comprobaciones de seguridad y validación
└── cli/ # Interfaz de línea de comandos
tests/
├── unit/ # Pruebas unitarias
├── integration/ # Pruebas de integración
└── e2e/ # Pruebas de extremo a extremo
docs/
├── kosmos-figures-analysis.md # Modos de análisis de kosmos-figures
├── integration-plan.md # Plan de integración
└── domain-roadmaps/ # Guías específicas de dominio
Pruebas de Desarrollo
# Instala las dependencias de desarrollo
pip install -e ".[dev]"
# Ejecuta todas las pruebas
pytest
# Ejecuta pruebas de cobertura
pytest --cov=kosmos --cov-report=html
# Ejecuta un conjunto específico de pruebas
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# Formatea el código
black kosmos/ tests/
# Verifica el código
ruff check kosmos/ tests/
# Verifica tipos
mypy kosmos/
Hoja de Ruta de Desarrollo
✅ Completado (10 etapas)
Etapa 1: Fundamentos del Proyecto ✅
- Estructura del proyecto
- Integración de Claude (API + CLI)
- Sistema de configuración
- Marco de agentes
- Configuración de la base de datos
Etapa 2: Capacidad de Literatura ✅
- API de literatura (arXiv, Semantic Scholar, PubMed)
- Agente de análisis de literatura
- Base de datos de vectores de búsqueda semántica
- Gráfico de conocimientos
Etapa 3: Generación de Hipótesis ✅
- Agente generador de hipótesis
- Verificación de novedad
- Priorización de hipótesis
Etapa 4: Diseño de Experimentos ✅
- Agente diseñador de experimentos
- Plantillas de protocolos
- Estimación de recursos
Etapa 5: Ejecución de Experimentos ✅
- Entorno de ejecución en sandbox
- Integración de patrones de kosmos-figures
- Análisis estadístico
Etapa 6: Análisis de Resultados ✅
- Agente analista de datos
- Generación de visualizaciones
- Resúmenes de resultados
Etapa 7: Orquestación de Investigación ✅
- Agente director de investigación
- Bucle de retroalimentación
- Detección de convergencia
Etapa 8: Seguridad y Validación ✅
- Verificaciones de seguridad
- Herramientas específicas de dominio
Etapa 9: Despliegue en Producción ✅
- Optimización de rendimiento (mejora de 20-40×)
- Sistema de caché multinivel
- Pruebas integrales (cobertura del 90%+)
Etapa 10: Documentación y Refinamiento ✅
- Documentación extensa (10,000+ líneas)
- Guía del usuario
- Documentación de API
- Código de ejemplo
Casos de Descubrimiento Científico
Kosmos ha producido descubrimientos científicos validados en varios campos:
1. Metabolómica - Protección Cerebral por Hipotermia
Reprodujo independientemente los hallazgos de un manuscrito no publicado, identificando que el metabolismo de nucleótidos es la vía principal alterada en cerebros de ratones sometidos a hipotermia.
2. Ciencia de Materiales - Eficiencia de Células Solares
Descubrió que la humedad durante el tratamiento térmico es un factor clave en la eficiencia de las células solares, identificando un umbral crítico de humedad.
3. Neurociencia - Conexiones de Redes Neuronales
Mostró que las redes neuronales a través de especies siguen un patrón log-normal, en lugar de un patrón de ley de potencias.
4. Enfermedades Cardiacas - Factor Protector SOD2
Descubrió que la proteína SOD2 parece proteger el corazón mediante la reducción de la fibrosis.
5. Diabetes - Variante Genética SSR1
Identificó que las variantes genéticas cerca del gen SSR1 pueden tener un efecto protector contra la diabetes tipo 2.
6. Enfermedad de Alzheimer - Método de Análisis Temporal
Propuso una nueva técnica de análisis para rastrear los cambios temporales de proteínas en células cerebrales con enfermedad de Alzheimer.
7. Enfermedades Neurodegenerativas - Exposición a Fosfatidilserina
Identificó que las neuronas exponen señales "fágome" debido a la pérdida de expresión de la flippasa relacionada con la edad.
Eficiencia de la Investigación: Los científicos independientes encontraron que el 79.4% de las afirmaciones en los informes de Kosmos son precisas, y los colaboradores informan que un ciclo de 20 iteraciones de Kosmos equivale a aproximadamente 6 meses de su propia investigación.
Inspiración
Este proyecto se inspira en los siguientes trabajos:
- Artículo: Kosmos: Un Científico de IA para el Descubrimiento Autónomo (noviembre de 2025)
- Modos de Análisis: Repositorio kosmos-figures
- Router Claude: claude_n_codex_api_proxy
Guía de Contribución
¡Se aceptan contribuciones! Consulta CONTRIBUTING.md para obtener más detalles.
Áreas de Contribución Bienvenidas:
- Herramientas y API específicas de dominio
- Plantillas de experimentos para diferentes campos
- Integración de API de literatura
- Verificaciones de seguridad
- Documentación
- Pruebas
Licencia
Licencia MIT - Ver LICENSE
Citación
Si usas Kosmos en tu investigación, cita:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
Agradecimientos
- Anthropic por proporcionar Claude y Claude Code
- Edison Scientific por proporcionar los modos de análisis de kosmos-figures
- La comunidad de ciencia abierta por proporcionar API de literatura y herramientas
Soporte y Comunidad
- Issues: GitHub Issues
- Discusiones: GitHub Discussions
Estado del Proyecto
Estado: Listo para producción (v0.2.0) - Todas las 10 etapas de desarrollo completadas
Última Actualización: 2025-11-07
Recursos de Documentación
- Resumen de la Arquitectura - Diseño del sistema y componentes
- Plan de Integración - Manera de integrar los modos de kosmos-figures
- Mapas de Ruta de Dominios - Guías de implementación específicas de dominio
- Referencia de API - Documentación de la API
- Guía de Contribución - Cómo contribuir
Resumen de Ventajas Principales
- Totalmente Autónomo: Automatización de extremo a extremo, desde la hipótesis hasta el descubrimiento.
- Soporte Multiárea: Soporta biología, física, química y más.
- Validado: Ha producido 7 descubrimientos científicos validados.
- Optimización de Costos: Sistema de caché multinivel que reduce el 30-40% de los costos.
- Integración Flexible: Soporta API y CLI.
- Seguro y Confiable: Ejecución en sandbox, mecanismos de verificación, cobertura de pruebas del 90%+.
- Listo para Producción: Versión v0.2.0, todas las etapas de desarrollo completadas.