jimmc414/Kosmos View GitHub Homepage for Latest Official Releases

Cientista de IA autônomo e de código aberto, impulsionado pelo Claude, capaz de executar automaticamente todo o ciclo da pesquisa científica: análise de literatura, geração de hipóteses, planejamento de experimentos, análise de resultados e melhoria iterativa.

PythonKosmosjimmc414 413 Last Updated: January 26, 2026

Kosmos - Plataforma de Cientista Autônomo de IA Detalhada

Visão Geral do Projeto

Kosmos é uma implementação de código aberto de um cientista autônomo de IA capaz de executar o ciclo completo de pesquisa científica: desde a análise de literatura e geração de hipóteses, até o design, execução, análise e iteração de melhorias nos experimentos. O projeto é baseado no artigo Kosmos AI publicado em novembro de 2025 (https://arxiv.org/abs/2511.02824) e adaptado para ser impulsionado por Claude Code ou Anthropic API.

Recursos Principais

🔬 Ciclo de Pesquisa Autônoma

Fluxo de trabalho científico de ponta a ponta: automação completa do ciclo de pesquisa
Suporte a múltiplas áreas: biologia, física, química, neurociência, ciência dos materiais
Iteração e melhoria: otimização automática de hipóteses e design de experimentos com base nos resultados

🤖 Sistema Inteligente Impulsionado por IA

Impulsionado por Claude Sonnet 4: para geração de hipóteses e análise avançada
Suporte a múltiplos modelos: suporte a Anthropic Claude, OpenAI GPT e modelos locais (Ollama, LM Studio)
Seleção inteligente de modelos: seleção automática do modelo ideal com base na complexidade da tarefa

🔧 Integração Flexível

Duas opções de integração:
- Opção A: Anthropic API (pagamento por uso)
- Opção B: Claude Code CLI (requer assinatura Max)
Modos de análise maduros: integração de métodos estatísticos comprovados de kosmos-figures

📚 Integração de Literatura

Busca automatizada de artigos: suporte a arXiv, Semantic Scholar, PubMed
Resumo de literatura: extração automática de informações-chave
Verificação de novidade: validação da inovação das hipóteses de pesquisa

🏗️ Arquitetura de Agentes

Design modular: cada tarefa de pesquisa corresponde a um agente independente
Execução paralela: execução simultânea de várias tarefas de pesquisa
Colaboração: compartilhamento de informações entre agentes através de um modelo de mundo estruturado

🛡️ Prioridade à Segurança

Execução em sandbox: ambiente isolado para execução de código
Mecanismos de verificação: verificação de resultados e checagem de reprodutibilidade
Porta de aprovação humana: etapa opcional de revisão humana

💰 Otimização de Custos

Sistema de cache multicamadas: redução de 30-40% nos custos de API
Cache de prompts inteligentes: economia significativa de custos com o uso de Anthropic
Otimização de seleção de modelos: escolha inteligente de modelos com base na complexidade da tarefa, reduzindo 15-20% dos custos

Arquitetura do Sistema

Componentes Principais

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (controlador principal que coordena o ciclo de pesquisa autônoma)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

Descrição dos Agentes

Research Director (Diretor de Pesquisa): coordenador principal do fluxo de trabalho de pesquisa
Literature Analyzer (Analisador de Literatura): busca e análise de artigos científicos (arXiv, Semantic Scholar, PubMed)
Hypothesis Generator (Gerador de Hipóteses): geração de hipóteses testáveis usando Claude
Experiment Designer (Projetista de Experimentos): design de experimentos computacionais
Execution Engine (Motor de Execução): execução de experimentos com métodos estatísticos comprovados
Data Analyst (Analista de Dados): interpretação de resultados usando Claude
Feedback Loop (Loop de Feedback): iteração e melhoria de hipóteses com base nos resultados

Requisitos Técnicos

Requisitos Básicos

Python 3.11 ou 3.12
Uma das seguintes opções:
- Opção A: Chave de API da Anthropic (pagamento por uso)
- Opção B: Claude Code CLI instalado (requer assinatura Max)

Guia de Instalação

Instalação Básica

# Clonar o repositório
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Criar ambiente virtual
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Instalar dependências
pip install -e .

# Suporte ao Claude Code CLI (Opção B)
pip install -e ".[router]"

Opção A: Configuração da API da Anthropic

# Copiar o arquivo de configuração de exemplo
cp .env.example .env

# Editar .env e definir sua chave de API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Obtenha sua chave de API em console.anthropic.com

Vantagens:

Pagamento por uso
Sem necessidade de instalação de CLI
Funciona em qualquer lugar

Desvantagens:

Cobrança por token
Limitações de taxa

Opção B: Configuração do Claude Code CLI

# 1. Instalar o Claude Code CLI
# Visite https://claude.ai/download e siga as instruções

# 2. Autenticar o Claude CLI
claude auth

# 3. Copiar o arquivo de configuração de exemplo
cp .env.example .env

# 4. Editar .env e definir a chave de API como todos 9s (para rotear via CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Isso roteará todas as chamadas de API para o Claude Code CLI local, usando sua assinatura Max, sem cobrança por token.

Vantagens:

Sem custos por token
Uso ilimitado
Modelos Claude mais recentes
Execução local

Desvantagens:

Necessidade de instalação do Claude CLI
Necessidade de assinatura Max

Inicialização do Banco de Dados

# Executar as migrações do banco de dados
alembic upgrade head

# Verificar se o banco de dados foi criado
ls -la kosmos.db

Começando Rapidamente

Exemplo de Uso Básico

from kosmos import ResearchDirector

# Inicializar o diretor de pesquisa
director = ResearchDirector()

# Propor uma questão de pesquisa
question = "Qual é a relação entre privação de sono e consolidação de memória?"

# Executar a pesquisa autônoma
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Ver os resultados
print(results.summary)
print(results.key_findings)

Opções de Configuração

Todas as configurações são feitas através de variáveis de ambiente (veja .env.example):

Configuração Principal

ANTHROPIC_API_KEY: chave de API ou 999... para modo CLI
CLAUDE_MODEL: modelo a ser usado (somente modo API)
DATABASE_URL: string de conexão do banco de dados
LOG_LEVEL: nível de detalhe do log

Configuração de Pesquisa

MAX_RESEARCH_ITERATIONS: número máximo de iterações autônomas
ENABLED_DOMAINS: quais domínios científicos são suportados
ENABLED_EXPERIMENT_TYPES: tipos de experimentos permitidos
MIN_NOVELTY_SCORE: limite mínimo de novidade

Configuração de Segurança

ENABLE_SAFETY_CHECKS: verificação de segurança de código
MAX_EXPERIMENT_EXECUTION_TIME: tempo máximo de execução do experimento
ENABLE_SANDBOXING: execução de código em sandbox
REQUIRE_HUMAN_APPROVAL: porta de aprovação humana

Otimização de Desempenho

Sistema de Cache

Kosmos inclui um sistema de cache multicamadas que pode reduzir 30-40% dos custos de API:

# Ver desempenho do cache
kosmos cache --stats

# Exemplo de saída:
# Desempenho geral do cache:
# Total de solicitações: 500
# Acertos no cache: 175 (35%)
# Economia estimada: $15.75

Nota: o cache de prompts, que proporciona economia significativa, está atualmente disponível apenas com o uso de Anthropic Claude. OpenAI e provedores locais usam apenas cache de respostas em memória.

Seleção Inteligente de Modelos

Quando Anthropic é usado como provedor de LLM, o Kosmos seleciona inteligentemente o modelo Claude com base na complexidade da tarefa:

Claude Sonnet 4.5: inferência complexa, geração de hipóteses, análise
Claude Haiku 4: tarefas simples, extração de dados, formatação

Isso reduz os custos em 15-20%, mantendo a qualidade.

Nota: este recurso é específico para Anthropic Claude.

Estrutura do Projeto

kosmos/
├── core/              # Infraestrutura central (LLM, configuração, logs)
├── agents/            # Implementação de agentes
├── db/                # Modelos e operações de banco de dados
├── execution/         # Motor de execução de experimentos
├── analysis/          # Análise e visualização de resultados
├── hypothesis/        # Geração e gerenciamento de hipóteses
├── experiments/       # Modelos de experimentos
├── literature/        # Busca e análise de literatura
├── knowledge/         # Grafos de conhecimento e busca semântica
├── domains/           # Ferramentas específicas de domínio (biologia, física, etc.)
├── safety/            # Verificações de segurança e validação
└── cli/               # Interface de linha de comando

tests/
├── unit/              # Testes de unidade
├── integration/       # Testes de integração
└── e2e/               # Testes de ponta a ponta

docs/
├── kosmos-figures-analysis.md      # Modos de análise de kosmos-figures
├── integration-plan.md             # Estratégia de integração
└── domain-roadmaps/                # Guias específicos de domínio

Testes de Desenvolvimento

# Instalar dependências de desenvolvimento
pip install -e ".[dev]"

# Executar todos os testes
pytest

# Executar testes de cobertura
pytest --cov=kosmos --cov-report=html

# Executar conjunto específico de testes
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Formatar o código
black kosmos/ tests/

# Verificar o código
ruff check kosmos/ tests/

# Verificar tipos
mypy kosmos/

Roadmap de Desenvolvimento

✅ Concluído (10 fases)

Fase 1: Fundamentos do Projeto ✅

Estrutura do projeto
Integração com Claude (API + CLI)
Sistema de configuração
Framework de agentes
Configuração do banco de dados

Fase 2: Capacidades de Literatura ✅

APIs de literatura (arXiv, Semantic Scholar, PubMed)
Agente de análise de literatura
Banco de dados de vetores para busca semântica
Grafo de conhecimento

Fase 3: Geração de Hipóteses ✅

Agente gerador de hipóteses
Verificação de novidade
Priorização de hipóteses

Fase 4: Design de Experimentos ✅

Agente projetista de experimentos
Modelos de protocolos
Estimativa de recursos

Fase 5: Execução de Experimentos ✅

Ambiente de execução em sandbox
Integração de padrões de kosmos-figures
Análise estatística

Fase 6: Análise de Resultados ✅

Agente analista de dados
Geração de visualizações
Resumo de resultados

Fase 7: Orquestração de Pesquisa ✅

Agente diretor de pesquisa
Loop de feedback
Detecção de convergência

Fase 8: Segurança e Validação ✅

Verificações de segurança
Ferramentas específicas de domínio

Fase 9: Implantação de Produção ✅

Otimização de desempenho (20-40× de melhoria)
Sistema de cache multicamadas
Testes abrangentes (cobertura de 90%+)

Fase 10: Documentação e Polimento ✅

Documentação extensa (10.000+ linhas)
Guia do usuário
Documentação de API
Código de exemplo

Casos de Descobertas Científicas

Kosmos já produziu descobertas científicas validadas em várias áreas:

1. Metabolômica - Proteção Hipotérmica do Cérebro

Reproduziu independentemente a descoberta de um manuscrito não publicado, identificando que o metabolismo de nucleotídeos é a principal via alterada no cérebro de ratos submetidos a hipotermia.

2. Ciência dos Materiais - Eficiência de Células Fotovoltaicas

Descobriu que a umidade durante o tratamento térmico é um fator crítico na eficiência das células fotovoltaicas e identificou um limiar de umidade crítico.

3. Neurociência - Conexões de Redes Neurais

Demonstrou que as redes neurais em diferentes espécies seguem um padrão log-normal, em vez de um padrão potencial.

4. Doença Cardíaca - Fator Protetor SOD2

Descobriu que a proteína SOD2 parece proteger o coração, reduzindo a fibrose.

5. Diabetes - Variante Genética SSR1

Identificou que a variante genética próxima ao gene SSR1 pode ter um efeito protetor contra o diabetes tipo 2.

6. Doença de Alzheimer - Método de Análise Temporal

Propôs uma nova técnica de análise para rastrear mudanças temporais de proteínas em células cerebrais afetadas pela doença.

7. Doenças Neurodegenerativas - Exposição a Fosfatidilserina

Identificou que as neurônios expõem sinais de "fagocitose" devido à perda de expressão de flippases relacionadas à idade.

Eficiência da Pesquisa: Cientistas independentes relataram que 79,4% das afirmações nos relatórios do Kosmos eram precisas, e colaboradores relataram que uma única execução de 20 ciclos do Kosmos equivale, em média, a 6 meses de pesquisa própria.

Fontes de Inspiração

Este projeto foi inspirado pelo seguinte trabalho:

Artigo: Kosmos: An AI Scientist for Autonomous Discovery (novembro de 2025)
Modos de Análise: Repositório kosmos-figures
Claude Router: claude_n_codex_api_proxy

Diretrizes de Contribuição

Contribuições são bem-vindas! Consulte CONTRIBUTING.md para obter as diretrizes.

Áreas de Contribuição Bem-Vindas:

Ferramentas e APIs específicas de domínio
Modelos de experimentos para diferentes domínios
Integração de APIs de literatura
Verificações de segurança
Documentação
Testes

Licença

Licença MIT - veja LICENSE

Citação

Se você usar o Kosmos em sua pesquisa, cite:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Agradecimentos

Anthropic por fornecer Claude e Claude Code
Edison Scientific por fornecer os modos de análise de kosmos-figures
Comunidade de ciência aberta por fornecer APIs e ferramentas de literatura

Suporte e Comunidade

Issues: GitHub Issues
Discussões: GitHub Discussions

Status do Projeto

Status: Pronto para produção (v0.2.0) - Todas as 10 fases de desenvolvimento concluídas

Última Atualização: 2025-11-07

Recursos de Documentação

Visão Geral da Arquitetura - Design do sistema e componentes
Plano de Integração - Integração dos padrões de kosmos-figures
Mapas de Domínio - Guias de implementação específicos de domínio
Referência de API - Documentação de API
Diretrizes de Contribuição - Como contribuir

Resumo das Vantagens Principais

Totalmente Autônomo: automação de ponta a ponta, desde a geração de hipóteses até a descoberta
Suporte a Múltiplos Domínios: atende a áreas como biologia, física, química, entre outras
Validado: já produziu 7 descobertas científicas validadas
Otimização de Custos: sistema de cache multicamadas reduz 30-40% dos custos
Integração Flexível: suporte a API e CLI
Seguro e Confiável: execução em sandbox, mecanismos de verificação, cobertura de testes de 90%+
Pronto para Produção: versão v0.2.0, todas as fases de desenvolvimento concluídas