Cientista de IA autônomo e de código aberto, impulsionado pelo Claude, capaz de executar automaticamente todo o ciclo da pesquisa científica: análise de literatura, geração de hipóteses, planejamento de experimentos, análise de resultados e melhoria iterativa.
Kosmos - Plataforma de Cientista Autônomo de IA Detalhada
Visão Geral do Projeto
Kosmos é uma implementação de código aberto de um cientista autônomo de IA capaz de executar o ciclo completo de pesquisa científica: desde a análise de literatura e geração de hipóteses, até o design, execução, análise e iteração de melhorias nos experimentos. O projeto é baseado no artigo Kosmos AI publicado em novembro de 2025 (https://arxiv.org/abs/2511.02824) e adaptado para ser impulsionado por Claude Code ou Anthropic API.
Recursos Principais
🔬 Ciclo de Pesquisa Autônoma
- Fluxo de trabalho científico de ponta a ponta: automação completa do ciclo de pesquisa
- Suporte a múltiplas áreas: biologia, física, química, neurociência, ciência dos materiais
- Iteração e melhoria: otimização automática de hipóteses e design de experimentos com base nos resultados
🤖 Sistema Inteligente Impulsionado por IA
- Impulsionado por Claude Sonnet 4: para geração de hipóteses e análise avançada
- Suporte a múltiplos modelos: suporte a Anthropic Claude, OpenAI GPT e modelos locais (Ollama, LM Studio)
- Seleção inteligente de modelos: seleção automática do modelo ideal com base na complexidade da tarefa
🔧 Integração Flexível
- Duas opções de integração:
- Opção A: Anthropic API (pagamento por uso)
- Opção B: Claude Code CLI (requer assinatura Max)
- Modos de análise maduros: integração de métodos estatísticos comprovados de kosmos-figures
📚 Integração de Literatura
- Busca automatizada de artigos: suporte a arXiv, Semantic Scholar, PubMed
- Resumo de literatura: extração automática de informações-chave
- Verificação de novidade: validação da inovação das hipóteses de pesquisa
🏗️ Arquitetura de Agentes
- Design modular: cada tarefa de pesquisa corresponde a um agente independente
- Execução paralela: execução simultânea de várias tarefas de pesquisa
- Colaboração: compartilhamento de informações entre agentes através de um modelo de mundo estruturado
🛡️ Prioridade à Segurança
- Execução em sandbox: ambiente isolado para execução de código
- Mecanismos de verificação: verificação de resultados e checagem de reprodutibilidade
- Porta de aprovação humana: etapa opcional de revisão humana
💰 Otimização de Custos
- Sistema de cache multicamadas: redução de 30-40% nos custos de API
- Cache de prompts inteligentes: economia significativa de custos com o uso de Anthropic
- Otimização de seleção de modelos: escolha inteligente de modelos com base na complexidade da tarefa, reduzindo 15-20% dos custos
Arquitetura do Sistema
Componentes Principais
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (controlador principal que coordena o ciclo de pesquisa autônoma) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Literature│ │Hypothesis Generator│ │Experiment │ │Data Analyst │
│Analyzer │ │ (Claude) │ │Designer │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Execution Engine │
│ (kosmos-figures │
│ proven patterns) │
└─────────────────────┘
Descrição dos Agentes
- Research Director (Diretor de Pesquisa): coordenador principal do fluxo de trabalho de pesquisa
- Literature Analyzer (Analisador de Literatura): busca e análise de artigos científicos (arXiv, Semantic Scholar, PubMed)
- Hypothesis Generator (Gerador de Hipóteses): geração de hipóteses testáveis usando Claude
- Experiment Designer (Projetista de Experimentos): design de experimentos computacionais
- Execution Engine (Motor de Execução): execução de experimentos com métodos estatísticos comprovados
- Data Analyst (Analista de Dados): interpretação de resultados usando Claude
- Feedback Loop (Loop de Feedback): iteração e melhoria de hipóteses com base nos resultados
Requisitos Técnicos
Requisitos Básicos
- Python 3.11 ou 3.12
- Uma das seguintes opções:
- Opção A: Chave de API da Anthropic (pagamento por uso)
- Opção B: Claude Code CLI instalado (requer assinatura Max)
Guia de Instalação
Instalação Básica
# Clonar o repositório
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# Criar ambiente virtual
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# Instalar dependências
pip install -e .
# Suporte ao Claude Code CLI (Opção B)
pip install -e ".[router]"
Opção A: Configuração da API da Anthropic
# Copiar o arquivo de configuração de exemplo
cp .env.example .env
# Editar .env e definir sua chave de API
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
Obtenha sua chave de API em console.anthropic.com
Vantagens:
- Pagamento por uso
- Sem necessidade de instalação de CLI
- Funciona em qualquer lugar
Desvantagens:
- Cobrança por token
- Limitações de taxa
Opção B: Configuração do Claude Code CLI
# 1. Instalar o Claude Code CLI
# Visite https://claude.ai/download e siga as instruções
# 2. Autenticar o Claude CLI
claude auth
# 3. Copiar o arquivo de configuração de exemplo
cp .env.example .env
# 4. Editar .env e definir a chave de API como todos 9s (para rotear via CLI)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
Isso roteará todas as chamadas de API para o Claude Code CLI local, usando sua assinatura Max, sem cobrança por token.
Vantagens:
- Sem custos por token
- Uso ilimitado
- Modelos Claude mais recentes
- Execução local
Desvantagens:
- Necessidade de instalação do Claude CLI
- Necessidade de assinatura Max
Inicialização do Banco de Dados
# Executar as migrações do banco de dados
alembic upgrade head
# Verificar se o banco de dados foi criado
ls -la kosmos.db
Começando Rapidamente
Exemplo de Uso Básico
from kosmos import ResearchDirector
# Inicializar o diretor de pesquisa
director = ResearchDirector()
# Propor uma questão de pesquisa
question = "Qual é a relação entre privação de sono e consolidação de memória?"
# Executar a pesquisa autônoma
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# Ver os resultados
print(results.summary)
print(results.key_findings)
Opções de Configuração
Todas as configurações são feitas através de variáveis de ambiente (veja .env.example):
Configuração Principal
ANTHROPIC_API_KEY: chave de API ou999...para modo CLICLAUDE_MODEL: modelo a ser usado (somente modo API)DATABASE_URL: string de conexão do banco de dadosLOG_LEVEL: nível de detalhe do log
Configuração de Pesquisa
MAX_RESEARCH_ITERATIONS: número máximo de iterações autônomasENABLED_DOMAINS: quais domínios científicos são suportadosENABLED_EXPERIMENT_TYPES: tipos de experimentos permitidosMIN_NOVELTY_SCORE: limite mínimo de novidade
Configuração de Segurança
ENABLE_SAFETY_CHECKS: verificação de segurança de códigoMAX_EXPERIMENT_EXECUTION_TIME: tempo máximo de execução do experimentoENABLE_SANDBOXING: execução de código em sandboxREQUIRE_HUMAN_APPROVAL: porta de aprovação humana
Otimização de Desempenho
Sistema de Cache
Kosmos inclui um sistema de cache multicamadas que pode reduzir 30-40% dos custos de API:
# Ver desempenho do cache
kosmos cache --stats
# Exemplo de saída:
# Desempenho geral do cache:
# Total de solicitações: 500
# Acertos no cache: 175 (35%)
# Economia estimada: $15.75
Nota: o cache de prompts, que proporciona economia significativa, está atualmente disponível apenas com o uso de Anthropic Claude. OpenAI e provedores locais usam apenas cache de respostas em memória.
Seleção Inteligente de Modelos
Quando Anthropic é usado como provedor de LLM, o Kosmos seleciona inteligentemente o modelo Claude com base na complexidade da tarefa:
- Claude Sonnet 4.5: inferência complexa, geração de hipóteses, análise
- Claude Haiku 4: tarefas simples, extração de dados, formatação
Isso reduz os custos em 15-20%, mantendo a qualidade.
Nota: este recurso é específico para Anthropic Claude.
Estrutura do Projeto
kosmos/
├── core/ # Infraestrutura central (LLM, configuração, logs)
├── agents/ # Implementação de agentes
├── db/ # Modelos e operações de banco de dados
├── execution/ # Motor de execução de experimentos
├── analysis/ # Análise e visualização de resultados
├── hypothesis/ # Geração e gerenciamento de hipóteses
├── experiments/ # Modelos de experimentos
├── literature/ # Busca e análise de literatura
├── knowledge/ # Grafos de conhecimento e busca semântica
├── domains/ # Ferramentas específicas de domínio (biologia, física, etc.)
├── safety/ # Verificações de segurança e validação
└── cli/ # Interface de linha de comando
tests/
├── unit/ # Testes de unidade
├── integration/ # Testes de integração
└── e2e/ # Testes de ponta a ponta
docs/
├── kosmos-figures-analysis.md # Modos de análise de kosmos-figures
├── integration-plan.md # Estratégia de integração
└── domain-roadmaps/ # Guias específicos de domínio
Testes de Desenvolvimento
# Instalar dependências de desenvolvimento
pip install -e ".[dev]"
# Executar todos os testes
pytest
# Executar testes de cobertura
pytest --cov=kosmos --cov-report=html
# Executar conjunto específico de testes
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# Formatar o código
black kosmos/ tests/
# Verificar o código
ruff check kosmos/ tests/
# Verificar tipos
mypy kosmos/
Roadmap de Desenvolvimento
✅ Concluído (10 fases)
Fase 1: Fundamentos do Projeto ✅
- Estrutura do projeto
- Integração com Claude (API + CLI)
- Sistema de configuração
- Framework de agentes
- Configuração do banco de dados
Fase 2: Capacidades de Literatura ✅
- APIs de literatura (arXiv, Semantic Scholar, PubMed)
- Agente de análise de literatura
- Banco de dados de vetores para busca semântica
- Grafo de conhecimento
Fase 3: Geração de Hipóteses ✅
- Agente gerador de hipóteses
- Verificação de novidade
- Priorização de hipóteses
Fase 4: Design de Experimentos ✅
- Agente projetista de experimentos
- Modelos de protocolos
- Estimativa de recursos
Fase 5: Execução de Experimentos ✅
- Ambiente de execução em sandbox
- Integração de padrões de kosmos-figures
- Análise estatística
Fase 6: Análise de Resultados ✅
- Agente analista de dados
- Geração de visualizações
- Resumo de resultados
Fase 7: Orquestração de Pesquisa ✅
- Agente diretor de pesquisa
- Loop de feedback
- Detecção de convergência
Fase 8: Segurança e Validação ✅
- Verificações de segurança
- Ferramentas específicas de domínio
Fase 9: Implantação de Produção ✅
- Otimização de desempenho (20-40× de melhoria)
- Sistema de cache multicamadas
- Testes abrangentes (cobertura de 90%+)
Fase 10: Documentação e Polimento ✅
- Documentação extensa (10.000+ linhas)
- Guia do usuário
- Documentação de API
- Código de exemplo
Casos de Descobertas Científicas
Kosmos já produziu descobertas científicas validadas em várias áreas:
1. Metabolômica - Proteção Hipotérmica do Cérebro
Reproduziu independentemente a descoberta de um manuscrito não publicado, identificando que o metabolismo de nucleotídeos é a principal via alterada no cérebro de ratos submetidos a hipotermia.
2. Ciência dos Materiais - Eficiência de Células Fotovoltaicas
Descobriu que a umidade durante o tratamento térmico é um fator crítico na eficiência das células fotovoltaicas e identificou um limiar de umidade crítico.
3. Neurociência - Conexões de Redes Neurais
Demonstrou que as redes neurais em diferentes espécies seguem um padrão log-normal, em vez de um padrão potencial.
4. Doença Cardíaca - Fator Protetor SOD2
Descobriu que a proteína SOD2 parece proteger o coração, reduzindo a fibrose.
5. Diabetes - Variante Genética SSR1
Identificou que a variante genética próxima ao gene SSR1 pode ter um efeito protetor contra o diabetes tipo 2.
6. Doença de Alzheimer - Método de Análise Temporal
Propôs uma nova técnica de análise para rastrear mudanças temporais de proteínas em células cerebrais afetadas pela doença.
7. Doenças Neurodegenerativas - Exposição a Fosfatidilserina
Identificou que as neurônios expõem sinais de "fagocitose" devido à perda de expressão de flippases relacionadas à idade.
Eficiência da Pesquisa: Cientistas independentes relataram que 79,4% das afirmações nos relatórios do Kosmos eram precisas, e colaboradores relataram que uma única execução de 20 ciclos do Kosmos equivale, em média, a 6 meses de pesquisa própria.
Fontes de Inspiração
Este projeto foi inspirado pelo seguinte trabalho:
- Artigo: Kosmos: An AI Scientist for Autonomous Discovery (novembro de 2025)
- Modos de Análise: Repositório kosmos-figures
- Claude Router: claude_n_codex_api_proxy
Diretrizes de Contribuição
Contribuições são bem-vindas! Consulte CONTRIBUTING.md para obter as diretrizes.
Áreas de Contribuição Bem-Vindas:
- Ferramentas e APIs específicas de domínio
- Modelos de experimentos para diferentes domínios
- Integração de APIs de literatura
- Verificações de segurança
- Documentação
- Testes
Licença
Licença MIT - veja LICENSE
Citação
Se você usar o Kosmos em sua pesquisa, cite:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
Agradecimentos
- Anthropic por fornecer Claude e Claude Code
- Edison Scientific por fornecer os modos de análise de kosmos-figures
- Comunidade de ciência aberta por fornecer APIs e ferramentas de literatura
Suporte e Comunidade
- Issues: GitHub Issues
- Discussões: GitHub Discussions
Status do Projeto
Status: Pronto para produção (v0.2.0) - Todas as 10 fases de desenvolvimento concluídas
Última Atualização: 2025-11-07
Recursos de Documentação
- Visão Geral da Arquitetura - Design do sistema e componentes
- Plano de Integração - Integração dos padrões de kosmos-figures
- Mapas de Domínio - Guias de implementação específicos de domínio
- Referência de API - Documentação de API
- Diretrizes de Contribuição - Como contribuir
Resumo das Vantagens Principais
- Totalmente Autônomo: automação de ponta a ponta, desde a geração de hipóteses até a descoberta
- Suporte a Múltiplos Domínios: atende a áreas como biologia, física, química, entre outras
- Validado: já produziu 7 descobertas científicas validadas
- Otimização de Custos: sistema de cache multicamadas reduz 30-40% dos custos
- Integração Flexível: suporte a API e CLI
- Seguro e Confiável: execução em sandbox, mecanismos de verificação, cobertura de testes de 90%+
- Pronto para Produção: versão v0.2.0, todas as fases de desenvolvimento concluídas