Login

Roteador Claude Code, que permite rotear solicitações Claude Code para diferentes modelos de IA, suportando colaboração multi-modelo e otimização de custos.

MITTypeScript 5.1kmusistudioclaude-code-router Last Updated: 2025-07-17

Introdução ao Projeto Claude Code Router

Visão Geral do Projeto

Claude Code Router é um projeto de código aberto que visa rotear requisições do Claude Code para diferentes modelos de IA, servindo como base para uma infraestrutura de codificação. Ele permite que os usuários decidam como interagir com os modelos, enquanto desfrutam das atualizações da Anthropic. O objetivo principal deste projeto é reduzir significativamente o custo de uso do Claude Code através de roteamento inteligente e colaboração entre múltiplos modelos.

Motivação do Projeto

As ferramentas tradicionais de programação com IA apresentam os seguintes problemas:

  • Custo Elevado: Usar modelos de ponta como o Claude diretamente para todas as tarefas é muito caro.
  • Limitação do Modelo: Um único modelo não consegue ter o melhor desempenho em todos os cenários.
  • Desperdício de Recursos: Tarefas simples também utilizam modelos complexos, resultando em desperdício de recursos.

O Claude Code Router resolve esses problemas através de roteamento inteligente. O autor menciona que, ao usar o Claude-4 no VSCode Copilot para lidar com um problema de Flutter, três rodadas de conversa bagunçaram os arquivos e exigiram um rollback. Em contraste, usando o Claude Code em conjunto com o DeepSeek, a tarefa foi concluída com sucesso após três ou quatro rodadas de conversa, a um custo inferior a 1 RMB.

Funcionalidades Principais

1. Operação em Dois Modos

  • Modo Normal: Utiliza um único modelo para completar todas as tarefas.
  • Modo Roteador: Utiliza múltiplos modelos especializados para colaborar na conclusão de diferentes tipos de tarefas.

2. Divisão Inteligente de Modelos

No modo roteador, o sistema utiliza quatro modelos especializados diferentes:

  • Router Agent (Agente Roteador): qwen2.5-coder-3b

    • Responsável pelo roteamento e distribuição de requisições.
    • Não requer alta inteligência, um modelo pequeno é suficiente.
    • Atualmente utiliza o modelo oficial gratuito qwen2.5-coder-3b da Alibaba Cloud.
  • Tool Agent (Agente de Ferramentas): qwen-max-0125

    • Responsável pela chamada de ferramentas.
    • Deve suportar chamada de função (function calling).
    • Precisa suportar um comprimento de descrição de ferramenta suficientemente grande (idealmente maior que 1754).
  • Coder Agent (Agente de Codificação): deepseek-v3

    • Especializado em tarefas de geração de código.
    • Utiliza modelos da série DeepSeek.
  • Think Agent (Modelo de Raciocínio): deepseek-r1

    • Responsável por tarefas de raciocínio complexo.
    • Utiliza o modelo de raciocínio DeepSeek R1.

3. Otimização de Custos

  • Beneficia-se do modelo gratuito qwen2.5-coder-3b da Alibaba Cloud e da tecnologia KV-Cache do DeepSeek.
  • Pode reduzir significativamente o custo de uso do Claude Code.
  • Evita o uso de modelos caros para tarefas simples através da divisão de tarefas.

Instalação e Configuração

1. Instalar Claude Code

npm install -g @anthropic-ai/claude-code

2. Clonar o Projeto

git clone https://github.com/musistudio/claude-code-reverse.git

3. Instalar Dependências

npm i

4. Configurar Variáveis de Ambiente

Configuração do Modo Normal

# Desabilitar o roteador
ENABLE_ROUTER=false
OPENAI_API_KEY=""
OPENAI_BASE_URL=""
OPENAI_MODEL=""

Configuração do Modo Roteador

# Habilitar o roteador
ENABLE_ROUTER=true
export TOOL_AGENT_API_KEY=""
export TOOL_AGENT_BASE_URL=""
export TOOL_AGENT_MODEL="qwen-max-2025-01-25"
export CODER_AGENT_API_KEY=""
export CODER_AGENT_BASE_URL="https://api.deepseek.com"
export CODER_AGENT_MODEL="deepseek-chat"
export THINK_AGENT_API_KEY=""
export THINK_AGENT_BASE_URL="https://api.deepseek.com"
export THINK_AGENT_MODEL="deepseek-reasoner"
export ROUTER_AGENT_API_KEY=""
export ROUTER_AGENT_BASE_URL=""
export ROUTER_AGENT_MODEL="qwen2.5-coder-3b-instruct"

5. Iniciar o Serviço

node index.mjs

6. Configurar Variáveis de Ambiente do Claude Code

export DISABLE_PROMPT_CACHING=1
export ANTHROPIC_AUTH_TOKEN="test"
export ANTHROPIC_BASE_URL="http://127.0.0.1:3456"
export API_TIMEOUT_MS=600000
claude

Arquitetura Técnica

Princípio de Funcionamento do Modo Roteador

  1. Recebimento da Requisição: O Claude Code envia a requisição para o servidor proxy local.
  2. Roteamento Inteligente: O Router Agent analisa o tipo de requisição e decide para qual modelo especializado encaminhá-la.
  3. Execução da Tarefa:
    • Tarefas de chamada de ferramenta → Tool Agent
    • Tarefas de geração de código → Coder Agent
    • Tarefas de raciocínio complexo → Think Agent
  4. Retorno do Resultado: Cada modelo retorna o resultado após concluir a tarefa.

Vantagens Chave

  • Separação de Tarefas: Separa as tarefas de chamada de ferramentas e de codificação.
  • Especialização de Modelos: Cada modelo se concentra na tarefa em que é mais proficiente.
  • Controle de Custos: Seleciona o modelo apropriado com base na complexidade da tarefa.
  • Suporte a Modelos de Raciocínio: Suporta modelos de raciocínio como o R1, que não suportam chamada de função.

Observações

⚠️ Aviso Importante:

  • Este projeto está em fase de testes e pode consumir um grande número de tokens.
  • Podem ocorrer falhas na execução de tarefas.
  • Recomenda-se configurar ignorePatterns apropriados para o projeto.

Significado do Projeto

O Claude Code Router representa uma direção importante no desenvolvimento de ferramentas de programação com IA:

  • Democratização de Custos: Torna os assistentes de programação com IA mais acessíveis para mais desenvolvedores.
  • Diversidade de Modelos: Não depende mais de um único modelo, permitindo a escolha flexível do modelo mais adequado.
  • Inovação Arquitetônica: Aumenta a eficiência geral através de roteamento e divisão de tarefas especializadas.

Este projeto oferece aos desenvolvedores uma ferramenta poderosa que, ao mesmo tempo em que mantém a poderosa funcionalidade do Claude Code, reduz significativamente os custos de uso, sendo uma contribuição importante para a popularização das ferramentas de programação com IA.

Star History Chart