Cientista de IA autônomo e de código aberto, impulsionado pelo Claude, capaz de executar automaticamente todo o ciclo da pesquisa científica: análise de literatura, geração de hipóteses, planejamento de experimentos, análise de resultados e melhoria iterativa.

PythonKosmosjimmc414 308 Last Updated: December 12, 2025

Kosmos - Plataforma de Cientista Autônomo de IA Detalhada

Visão Geral do Projeto

Kosmos é uma implementação de código aberto de um cientista autônomo de IA capaz de executar o ciclo completo de pesquisa científica: desde a análise de literatura e geração de hipóteses, até o design, execução, análise e iteração de melhorias nos experimentos. O projeto é baseado no artigo Kosmos AI publicado em novembro de 2025 (https://arxiv.org/abs/2511.02824) e adaptado para ser impulsionado por Claude Code ou Anthropic API.

Recursos Principais

🔬 Ciclo de Pesquisa Autônoma

  • Fluxo de trabalho científico de ponta a ponta: automação completa do ciclo de pesquisa
  • Suporte a múltiplas áreas: biologia, física, química, neurociência, ciência dos materiais
  • Iteração e melhoria: otimização automática de hipóteses e design de experimentos com base nos resultados

🤖 Sistema Inteligente Impulsionado por IA

  • Impulsionado por Claude Sonnet 4: para geração de hipóteses e análise avançada
  • Suporte a múltiplos modelos: suporte a Anthropic Claude, OpenAI GPT e modelos locais (Ollama, LM Studio)
  • Seleção inteligente de modelos: seleção automática do modelo ideal com base na complexidade da tarefa

🔧 Integração Flexível

  • Duas opções de integração:
    • Opção A: Anthropic API (pagamento por uso)
    • Opção B: Claude Code CLI (requer assinatura Max)
  • Modos de análise maduros: integração de métodos estatísticos comprovados de kosmos-figures

📚 Integração de Literatura

  • Busca automatizada de artigos: suporte a arXiv, Semantic Scholar, PubMed
  • Resumo de literatura: extração automática de informações-chave
  • Verificação de novidade: validação da inovação das hipóteses de pesquisa

🏗️ Arquitetura de Agentes

  • Design modular: cada tarefa de pesquisa corresponde a um agente independente
  • Execução paralela: execução simultânea de várias tarefas de pesquisa
  • Colaboração: compartilhamento de informações entre agentes através de um modelo de mundo estruturado

🛡️ Prioridade à Segurança

  • Execução em sandbox: ambiente isolado para execução de código
  • Mecanismos de verificação: verificação de resultados e checagem de reprodutibilidade
  • Porta de aprovação humana: etapa opcional de revisão humana

💰 Otimização de Custos

  • Sistema de cache multicamadas: redução de 30-40% nos custos de API
  • Cache de prompts inteligentes: economia significativa de custos com o uso de Anthropic
  • Otimização de seleção de modelos: escolha inteligente de modelos com base na complexidade da tarefa, reduzindo 15-20% dos custos

Arquitetura do Sistema

Componentes Principais

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (controlador principal que coordena o ciclo de pesquisa autônoma)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

Descrição dos Agentes

  • Research Director (Diretor de Pesquisa): coordenador principal do fluxo de trabalho de pesquisa
  • Literature Analyzer (Analisador de Literatura): busca e análise de artigos científicos (arXiv, Semantic Scholar, PubMed)
  • Hypothesis Generator (Gerador de Hipóteses): geração de hipóteses testáveis usando Claude
  • Experiment Designer (Projetista de Experimentos): design de experimentos computacionais
  • Execution Engine (Motor de Execução): execução de experimentos com métodos estatísticos comprovados
  • Data Analyst (Analista de Dados): interpretação de resultados usando Claude
  • Feedback Loop (Loop de Feedback): iteração e melhoria de hipóteses com base nos resultados

Requisitos Técnicos

Requisitos Básicos

  • Python 3.11 ou 3.12
  • Uma das seguintes opções:
    • Opção A: Chave de API da Anthropic (pagamento por uso)
    • Opção B: Claude Code CLI instalado (requer assinatura Max)

Guia de Instalação

Instalação Básica

# Clonar o repositório
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# Criar ambiente virtual
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Instalar dependências
pip install -e .

# Suporte ao Claude Code CLI (Opção B)
pip install -e ".[router]"

Opção A: Configuração da API da Anthropic

# Copiar o arquivo de configuração de exemplo
cp .env.example .env

# Editar .env e definir sua chave de API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

Obtenha sua chave de API em console.anthropic.com

Vantagens:

  • Pagamento por uso
  • Sem necessidade de instalação de CLI
  • Funciona em qualquer lugar

Desvantagens:

  • Cobrança por token
  • Limitações de taxa

Opção B: Configuração do Claude Code CLI

# 1. Instalar o Claude Code CLI
# Visite https://claude.ai/download e siga as instruções

# 2. Autenticar o Claude CLI
claude auth

# 3. Copiar o arquivo de configuração de exemplo
cp .env.example .env

# 4. Editar .env e definir a chave de API como todos 9s (para rotear via CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

Isso roteará todas as chamadas de API para o Claude Code CLI local, usando sua assinatura Max, sem cobrança por token.

Vantagens:

  • Sem custos por token
  • Uso ilimitado
  • Modelos Claude mais recentes
  • Execução local

Desvantagens:

  • Necessidade de instalação do Claude CLI
  • Necessidade de assinatura Max

Inicialização do Banco de Dados

# Executar as migrações do banco de dados
alembic upgrade head

# Verificar se o banco de dados foi criado
ls -la kosmos.db

Começando Rapidamente

Exemplo de Uso Básico

from kosmos import ResearchDirector

# Inicializar o diretor de pesquisa
director = ResearchDirector()

# Propor uma questão de pesquisa
question = "Qual é a relação entre privação de sono e consolidação de memória?"

# Executar a pesquisa autônoma
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# Ver os resultados
print(results.summary)
print(results.key_findings)

Opções de Configuração

Todas as configurações são feitas através de variáveis de ambiente (veja .env.example):

Configuração Principal

  • ANTHROPIC_API_KEY: chave de API ou 999... para modo CLI
  • CLAUDE_MODEL: modelo a ser usado (somente modo API)
  • DATABASE_URL: string de conexão do banco de dados
  • LOG_LEVEL: nível de detalhe do log

Configuração de Pesquisa

  • MAX_RESEARCH_ITERATIONS: número máximo de iterações autônomas
  • ENABLED_DOMAINS: quais domínios científicos são suportados
  • ENABLED_EXPERIMENT_TYPES: tipos de experimentos permitidos
  • MIN_NOVELTY_SCORE: limite mínimo de novidade

Configuração de Segurança

  • ENABLE_SAFETY_CHECKS: verificação de segurança de código
  • MAX_EXPERIMENT_EXECUTION_TIME: tempo máximo de execução do experimento
  • ENABLE_SANDBOXING: execução de código em sandbox
  • REQUIRE_HUMAN_APPROVAL: porta de aprovação humana

Otimização de Desempenho

Sistema de Cache

Kosmos inclui um sistema de cache multicamadas que pode reduzir 30-40% dos custos de API:

# Ver desempenho do cache
kosmos cache --stats

# Exemplo de saída:
# Desempenho geral do cache:
# Total de solicitações: 500
# Acertos no cache: 175 (35%)
# Economia estimada: $15.75

Nota: o cache de prompts, que proporciona economia significativa, está atualmente disponível apenas com o uso de Anthropic Claude. OpenAI e provedores locais usam apenas cache de respostas em memória.

Seleção Inteligente de Modelos

Quando Anthropic é usado como provedor de LLM, o Kosmos seleciona inteligentemente o modelo Claude com base na complexidade da tarefa:

  • Claude Sonnet 4.5: inferência complexa, geração de hipóteses, análise
  • Claude Haiku 4: tarefas simples, extração de dados, formatação

Isso reduz os custos em 15-20%, mantendo a qualidade.

Nota: este recurso é específico para Anthropic Claude.

Estrutura do Projeto

kosmos/
├── core/              # Infraestrutura central (LLM, configuração, logs)
├── agents/            # Implementação de agentes
├── db/                # Modelos e operações de banco de dados
├── execution/         # Motor de execução de experimentos
├── analysis/          # Análise e visualização de resultados
├── hypothesis/        # Geração e gerenciamento de hipóteses
├── experiments/       # Modelos de experimentos
├── literature/        # Busca e análise de literatura
├── knowledge/         # Grafos de conhecimento e busca semântica
├── domains/           # Ferramentas específicas de domínio (biologia, física, etc.)
├── safety/            # Verificações de segurança e validação
└── cli/               # Interface de linha de comando

tests/
├── unit/              # Testes de unidade
├── integration/       # Testes de integração
└── e2e/               # Testes de ponta a ponta

docs/
├── kosmos-figures-analysis.md      # Modos de análise de kosmos-figures
├── integration-plan.md             # Estratégia de integração
└── domain-roadmaps/                # Guias específicos de domínio

Testes de Desenvolvimento

# Instalar dependências de desenvolvimento
pip install -e ".[dev]"

# Executar todos os testes
pytest

# Executar testes de cobertura
pytest --cov=kosmos --cov-report=html

# Executar conjunto específico de testes
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# Formatar o código
black kosmos/ tests/

# Verificar o código
ruff check kosmos/ tests/

# Verificar tipos
mypy kosmos/

Roadmap de Desenvolvimento

✅ Concluído (10 fases)

Fase 1: Fundamentos do Projeto ✅

  • Estrutura do projeto
  • Integração com Claude (API + CLI)
  • Sistema de configuração
  • Framework de agentes
  • Configuração do banco de dados

Fase 2: Capacidades de Literatura ✅

  • APIs de literatura (arXiv, Semantic Scholar, PubMed)
  • Agente de análise de literatura
  • Banco de dados de vetores para busca semântica
  • Grafo de conhecimento

Fase 3: Geração de Hipóteses ✅

  • Agente gerador de hipóteses
  • Verificação de novidade
  • Priorização de hipóteses

Fase 4: Design de Experimentos ✅

  • Agente projetista de experimentos
  • Modelos de protocolos
  • Estimativa de recursos

Fase 5: Execução de Experimentos ✅

  • Ambiente de execução em sandbox
  • Integração de padrões de kosmos-figures
  • Análise estatística

Fase 6: Análise de Resultados ✅

  • Agente analista de dados
  • Geração de visualizações
  • Resumo de resultados

Fase 7: Orquestração de Pesquisa ✅

  • Agente diretor de pesquisa
  • Loop de feedback
  • Detecção de convergência

Fase 8: Segurança e Validação ✅

  • Verificações de segurança
  • Ferramentas específicas de domínio

Fase 9: Implantação de Produção ✅

  • Otimização de desempenho (20-40× de melhoria)
  • Sistema de cache multicamadas
  • Testes abrangentes (cobertura de 90%+)

Fase 10: Documentação e Polimento ✅

  • Documentação extensa (10.000+ linhas)
  • Guia do usuário
  • Documentação de API
  • Código de exemplo

Casos de Descobertas Científicas

Kosmos já produziu descobertas científicas validadas em várias áreas:

1. Metabolômica - Proteção Hipotérmica do Cérebro

Reproduziu independentemente a descoberta de um manuscrito não publicado, identificando que o metabolismo de nucleotídeos é a principal via alterada no cérebro de ratos submetidos a hipotermia.

2. Ciência dos Materiais - Eficiência de Células Fotovoltaicas

Descobriu que a umidade durante o tratamento térmico é um fator crítico na eficiência das células fotovoltaicas e identificou um limiar de umidade crítico.

3. Neurociência - Conexões de Redes Neurais

Demonstrou que as redes neurais em diferentes espécies seguem um padrão log-normal, em vez de um padrão potencial.

4. Doença Cardíaca - Fator Protetor SOD2

Descobriu que a proteína SOD2 parece proteger o coração, reduzindo a fibrose.

5. Diabetes - Variante Genética SSR1

Identificou que a variante genética próxima ao gene SSR1 pode ter um efeito protetor contra o diabetes tipo 2.

6. Doença de Alzheimer - Método de Análise Temporal

Propôs uma nova técnica de análise para rastrear mudanças temporais de proteínas em células cerebrais afetadas pela doença.

7. Doenças Neurodegenerativas - Exposição a Fosfatidilserina

Identificou que as neurônios expõem sinais de "fagocitose" devido à perda de expressão de flippases relacionadas à idade.

Eficiência da Pesquisa: Cientistas independentes relataram que 79,4% das afirmações nos relatórios do Kosmos eram precisas, e colaboradores relataram que uma única execução de 20 ciclos do Kosmos equivale, em média, a 6 meses de pesquisa própria.

Fontes de Inspiração

Este projeto foi inspirado pelo seguinte trabalho:

Diretrizes de Contribuição

Contribuições são bem-vindas! Consulte CONTRIBUTING.md para obter as diretrizes.

Áreas de Contribuição Bem-Vindas:

  • Ferramentas e APIs específicas de domínio
  • Modelos de experimentos para diferentes domínios
  • Integração de APIs de literatura
  • Verificações de segurança
  • Documentação
  • Testes

Licença

Licença MIT - veja LICENSE

Citação

Se você usar o Kosmos em sua pesquisa, cite:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

Agradecimentos

  • Anthropic por fornecer Claude e Claude Code
  • Edison Scientific por fornecer os modos de análise de kosmos-figures
  • Comunidade de ciência aberta por fornecer APIs e ferramentas de literatura

Suporte e Comunidade

Status do Projeto

Status: Pronto para produção (v0.2.0) - Todas as 10 fases de desenvolvimento concluídas

Última Atualização: 2025-11-07


Recursos de Documentação

Resumo das Vantagens Principais

  1. Totalmente Autônomo: automação de ponta a ponta, desde a geração de hipóteses até a descoberta
  2. Suporte a Múltiplos Domínios: atende a áreas como biologia, física, química, entre outras
  3. Validado: já produziu 7 descobertas científicas validadas
  4. Otimização de Custos: sistema de cache multicamadas reduz 30-40% dos custos
  5. Integração Flexível: suporte a API e CLI
  6. Seguro e Confiável: execução em sandbox, mecanismos de verificação, cobertura de testes de 90%+
  7. Pronto para Produção: versão v0.2.0, todas as fases de desenvolvimento concluídas

Star History Chart