jimmc414/Kosmos View GitHub Homepage for Latest Official Releases

Científico de IA autónomo y de código abierto impulsado por Claude, capaz de ejecutar automáticamente un ciclo completo de investigación científica: análisis de literatura, generación de hipótesis, diseño experimental, análisis de resultados e iteración continua.

PythonKosmosjimmc414 413 Last Updated: January 26, 2026

Kosmos - Plataforma de Científico Autónomo de IA: Descripción Detallada

Resumen del Proyecto

Kosmos es una implementación de código abierto de un científico autónomo de IA capaz de ejecutar el ciclo completo de investigación científica: desde el análisis de literatura y la generación de hipótesis, hasta el diseño, ejecución, análisis y mejora iterativa de experimentos. El proyecto se basa en el artículo de Kosmos AI publicado en noviembre de 2025 (https://arxiv.org/abs/2511.02824) y está adaptado para ser impulsado por Claude Code o la API de Anthropic.

Características Principales

🔬 Ciclo de Investigación Autónomo

Flujo de trabajo científico de extremo a extremo: Automatización completa del ciclo de investigación.
Soporte multiárea: Biología, física, química, neurociencia, ciencia de materiales.
Mejora iterativa: Optimización automática de hipótesis y diseño de experimentos basada en resultados.

🤖 Sistema Inteligente Impulsado por IA

Impulsado por Claude Sonnet 4: Para la generación de hipótesis y análisis avanzados.
Soporte multi-modelo: Soporta Anthropic Claude, OpenAI GPT y modelos locales (Ollama, LM Studio).
Selección inteligente de modelos: Selección automática del modelo óptimo según la complejidad de la tarea.

🔧 Integración Flexible

Opciones de integración dobles:
- Opción A: API de Anthropic (pago por uso).
- Opción B: CLI de Claude Code (requiere suscripción Max).
Modos de análisis probados: Integra métodos estadísticos probados de kosmos-figures.

📚 Integración de Literatura

Búsqueda automatizada de artículos: Soporta arXiv, Semantic Scholar, PubMed.
Resúmenes de literatura: Extracción automática de información clave.
Verificación de novedad: Validación de la innovación de las hipótesis de investigación.

🏗️ Arquitectura de Agentes

Diseño modular: Cada tarea de investigación corresponde a un agente independiente.
Ejecución paralela: Ejecución simultánea de múltiples tareas de investigación.
Colaboración: Compartir información entre agentes a través de un modelo estructurado del mundo.

🛡️ Seguridad Primero

Ejecución en sandbox: Entorno de ejecución de código aislado.
Mecanismos de verificación: Verificación de resultados y comprobación de reproducibilidad.
Puerta de aprobación humana: Paso de revisión humana opcional.

💰 Optimización de Costos

Sistema de caché multinivel: Reducción del 30-40% de los costos de API.
Caché inteligente de prompts: Ahorro significativo de costos al usar Anthropic.
Optimización de selección de modelos: Selección inteligente de modelos según la complejidad de la tarea, reduciendo el 15-20% de los costos.

Arquitectura del Sistema

Componentes Principales

┌─────────────────────────────────────────────────────────────┐
│                    Director de Investigación                  │
│              (controlador principal que coordina el ciclo de investigación autónoma)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Analizador│  │Generador de Hipótesis│  │Diseñador de│ │Analista de  │
│de Literatura│  │     (Claude)       │  │Experimentos│ │Datos (Claude)│
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Motor de Ejecución  │
            │   (patrones probados  │
            │   de kosmos-figures)  │
            └──────────────────────┘

Descripción de Agentes

Director de Investigación (Director de Investigación): Coordinador principal del flujo de trabajo de investigación.
Analizador de Literatura (Analizador de Literatura): Busca y analiza artículos científicos (arXiv, Semantic Scholar, PubMed).
Generador de Hipótesis (Generador de Hipótesis): Genera hipótesis testables usando Claude.
Diseñador de Experimentos (Diseñador de Experimentos): Diseña experimentos computacionales.
Motor de Ejecución (Motor de Ejecución): Ejecuta experimentos usando métodos estadísticos probados.
Analista de Datos (Analista de Datos): Interpreta los resultados usando Claude.
Bucle de Retroalimentación (Bucle de Retroalimentación): Mejora iterativa de hipótesis basada en los resultados.

Requisitos Técnicos

Requisitos Básicos

Python 3.11 o 3.12
Uno de los siguientes:
- Opción A: Clave de API de Anthropic (pago por uso)
- Opción B: CLI de Claude Code instalado (requiere suscripción Max)

Guía de Instalación

Instalación Básica

# Clona el repositorio
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Crea un entorno virtual
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Instala las dependencias
pip install -e .

# Soporte para CLI de Claude Code (Opción B)
pip install -e ".[router]"

Opción A: Configuración de API de Anthropic

# Copia el archivo de configuración de ejemplo
cp .env.example .env

# Edita .env y establece tu clave de API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Obtén tu clave de API en console.anthropic.com

Ventajas:

Pago por uso
No requiere instalación de CLI
Funciona en cualquier lugar

Desventajas:

Cobro por token
Límites de velocidad

Opción B: Configuración de CLI de Claude Code

# 1. Instala CLI de Claude Code
# Visita https://claude.ai/download y sigue las instrucciones

# 2. Autentica CLI de Claude
claude auth

# 3. Copia el archivo de configuración de ejemplo
cp .env.example .env

# 4. Edita .env y establece la clave de API como todos 9 (para activar la ruta CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Esto enruta todas las llamadas de API a la CLI local de Claude Code, utilizando tu suscripción Max, sin costo por token.

Ventajas:

Sin costo por token
Uso ilimitado
Modelos Claude más recientes
Ejecución local

Desventajas:

Requiere instalación de CLI de Claude
Requiere suscripción Max

Inicialización de la Base de Datos

# Ejecuta las migraciones de la base de datos
alembic upgrade head

# Verifica que la base de datos se ha creado
ls -la kosmos.db

Comenzando Rápido

Ejemplo de Uso Básico

from kosmos import ResearchDirector

# Inicializa el director de investigación
director = ResearchDirector()

# Propone una pregunta de investigación
question = "¿Cuál es la relación entre la privación del sueño y la consolidación de la memoria?"

# Ejecuta la investigación autónoma
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Muestra los resultados
print(results.summary)
print(results.key_findings)

Opciones de Configuración

Todas las configuraciones se realizan a través de variables de entorno (ver .env.example):

Configuración Principal

ANTHROPIC_API_KEY: Clave de API o 999... para el modo CLI
CLAUDE_MODEL: Modelo a utilizar (solo modo API)
DATABASE_URL: Cadena de conexión de la base de datos
LOG_LEVEL: Nivel de detalle de los registros

Configuración de Investigación

MAX_RESEARCH_ITERATIONS: Número máximo de iteraciones autónomas
ENABLED_DOMAINS: Áreas científicas soportadas
ENABLED_EXPERIMENT_TYPES: Tipos de experimentos permitidos
MIN_NOVELTY_SCORE: Umbral mínimo de novedad

Configuración de Seguridad

ENABLE_SAFETY_CHECKS: Verificación de seguridad del código
MAX_EXPERIMENT_EXECUTION_TIME: Tiempo de ejecución máximo de experimentos
ENABLE_SANDBOXING: Ejecución de código en sandbox
REQUIRE_HUMAN_APPROVAL: Puerta de aprobación humana

Optimización de Rendimiento

Sistema de Caché

Kosmos incluye un sistema de caché multinivel que puede reducir el 30-40% de los costos de API:

# Ver rendimiento de la caché
kosmos cache --stats

# Salida de ejemplo:
# Rendimiento general de la caché:
# Solicitudes totales: 500
# Hits de caché: 175 (35%)
# Costo estimado ahorrado: $15.75

Nota: La caché de prompts, que ahorra costos significativos, está disponible actualmente solo al usar Anthropic Claude. OpenAI y proveedores locales usan solo caché de respuestas en memoria.

Selección Inteligente de Modelos

Al usar Anthropic como proveedor de LLM, Kosmos selecciona inteligentemente el modelo Claude según la complejidad de la tarea:

Claude Sonnet 4.5: Inferencia compleja, generación de hipótesis, análisis
Claude Haiku 4: Tareas simples, extracción de datos, formateo

Esto reduce el costo en un 15-20%, manteniendo la calidad.

Nota: Esta función es específica de Anthropic Claude.

Estructura del Proyecto

kosmos/
├── core/              # Infraestructura central (LLM, configuración, registros)
├── agents/            # Implementación de agentes
├── db/                # Modelos y operaciones de base de datos
├── execution/         # Motor de ejecución de experimentos
├── analysis/          # Análisis y visualización de resultados
├── hypothesis/        # Generación y gestión de hipótesis
├── experiments/       # Plantillas de experimentos
├── literature/        # Búsqueda y análisis de literatura
├── knowledge/         # Gráfico de conocimientos y búsqueda semántica
├── domains/           # Herramientas específicas de dominio (biología, física, etc.)
├── safety/            # Comprobaciones de seguridad y validación
└── cli/               # Interfaz de línea de comandos

tests/
├── unit/              # Pruebas unitarias
├── integration/       # Pruebas de integración
└── e2e/               # Pruebas de extremo a extremo

docs/
├── kosmos-figures-analysis.md      # Modos de análisis de kosmos-figures
├── integration-plan.md             # Plan de integración
└── domain-roadmaps/                # Guías específicas de dominio

Pruebas de Desarrollo

# Instala las dependencias de desarrollo
pip install -e ".[dev]"

# Ejecuta todas las pruebas
pytest

# Ejecuta pruebas de cobertura
pytest --cov=kosmos --cov-report=html

# Ejecuta un conjunto específico de pruebas
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Formatea el código
black kosmos/ tests/

# Verifica el código
ruff check kosmos/ tests/

# Verifica tipos
mypy kosmos/

Hoja de Ruta de Desarrollo

✅ Completado (10 etapas)

Etapa 1: Fundamentos del Proyecto ✅

Estructura del proyecto
Integración de Claude (API + CLI)
Sistema de configuración
Marco de agentes
Configuración de la base de datos

Etapa 2: Capacidad de Literatura ✅

API de literatura (arXiv, Semantic Scholar, PubMed)
Agente de análisis de literatura
Base de datos de vectores de búsqueda semántica
Gráfico de conocimientos

Etapa 3: Generación de Hipótesis ✅

Agente generador de hipótesis
Verificación de novedad
Priorización de hipótesis

Etapa 4: Diseño de Experimentos ✅

Agente diseñador de experimentos
Plantillas de protocolos
Estimación de recursos

Etapa 5: Ejecución de Experimentos ✅

Entorno de ejecución en sandbox
Integración de patrones de kosmos-figures
Análisis estadístico

Etapa 6: Análisis de Resultados ✅

Agente analista de datos
Generación de visualizaciones
Resúmenes de resultados

Etapa 7: Orquestación de Investigación ✅

Agente director de investigación
Bucle de retroalimentación
Detección de convergencia

Etapa 8: Seguridad y Validación ✅

Verificaciones de seguridad
Herramientas específicas de dominio

Etapa 9: Despliegue en Producción ✅

Optimización de rendimiento (mejora de 20-40×)
Sistema de caché multinivel
Pruebas integrales (cobertura del 90%+)

Etapa 10: Documentación y Refinamiento ✅

Documentación extensa (10,000+ líneas)
Guía del usuario
Documentación de API
Código de ejemplo

Casos de Descubrimiento Científico

Kosmos ha producido descubrimientos científicos validados en varios campos:

1. Metabolómica - Protección Cerebral por Hipotermia

Reprodujo independientemente los hallazgos de un manuscrito no publicado, identificando que el metabolismo de nucleótidos es la vía principal alterada en cerebros de ratones sometidos a hipotermia.

2. Ciencia de Materiales - Eficiencia de Células Solares

Descubrió que la humedad durante el tratamiento térmico es un factor clave en la eficiencia de las células solares, identificando un umbral crítico de humedad.

3. Neurociencia - Conexiones de Redes Neuronales

Mostró que las redes neuronales a través de especies siguen un patrón log-normal, en lugar de un patrón de ley de potencias.

4. Enfermedades Cardiacas - Factor Protector SOD2

Descubrió que la proteína SOD2 parece proteger el corazón mediante la reducción de la fibrosis.

5. Diabetes - Variante Genética SSR1

Identificó que las variantes genéticas cerca del gen SSR1 pueden tener un efecto protector contra la diabetes tipo 2.

6. Enfermedad de Alzheimer - Método de Análisis Temporal

Propuso una nueva técnica de análisis para rastrear los cambios temporales de proteínas en células cerebrales con enfermedad de Alzheimer.

7. Enfermedades Neurodegenerativas - Exposición a Fosfatidilserina

Identificó que las neuronas exponen señales "fágome" debido a la pérdida de expresión de la flippasa relacionada con la edad.

Eficiencia de la Investigación: Los científicos independientes encontraron que el 79.4% de las afirmaciones en los informes de Kosmos son precisas, y los colaboradores informan que un ciclo de 20 iteraciones de Kosmos equivale a aproximadamente 6 meses de su propia investigación.

Inspiración

Este proyecto se inspira en los siguientes trabajos:

Artículo: Kosmos: Un Científico de IA para el Descubrimiento Autónomo (noviembre de 2025)
Modos de Análisis: Repositorio kosmos-figures
Router Claude: claude_n_codex_api_proxy

Guía de Contribución

¡Se aceptan contribuciones! Consulta CONTRIBUTING.md para obtener más detalles.

Áreas de Contribución Bienvenidas:

Herramientas y API específicas de dominio
Plantillas de experimentos para diferentes campos
Integración de API de literatura
Verificaciones de seguridad
Documentación
Pruebas

Licencia

Licencia MIT - Ver LICENSE

Citación

Si usas Kosmos en tu investigación, cita:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Agradecimientos

Anthropic por proporcionar Claude y Claude Code
Edison Scientific por proporcionar los modos de análisis de kosmos-figures
La comunidad de ciencia abierta por proporcionar API de literatura y herramientas

Soporte y Comunidad

Issues: GitHub Issues
Discusiones: GitHub Discussions

Estado del Proyecto

Estado: Listo para producción (v0.2.0) - Todas las 10 etapas de desarrollo completadas

Última Actualización: 2025-11-07

Recursos de Documentación

Resumen de la Arquitectura - Diseño del sistema y componentes
Plan de Integración - Manera de integrar los modos de kosmos-figures
Mapas de Ruta de Dominios - Guías de implementación específicas de dominio
Referencia de API - Documentación de la API
Guía de Contribución - Cómo contribuir

Resumen de Ventajas Principales

Totalmente Autónomo: Automatización de extremo a extremo, desde la hipótesis hasta el descubrimiento.
Soporte Multiárea: Soporta biología, física, química y más.
Validado: Ha producido 7 descubrimientos científicos validados.
Optimización de Costos: Sistema de caché multinivel que reduce el 30-40% de los costos.
Integración Flexible: Soporta API y CLI.
Seguro y Confiable: Ejecución en sandbox, mecanismos de verificación, cobertura de pruebas del 90%+.
Listo para Producción: Versión v0.2.0, todas las etapas de desarrollo completadas.