Claude Code Router, der das Routing von Claude Code Anfragen zu verschiedenen KI-Modellen ermöglicht und Multi-Modell-Zusammenarbeit und Kostenoptimierung unterstützt.
Vorstellung des Claude Code Router Projekts
Projektübersicht
Claude Code Router ist ein Open-Source-Projekt, das darauf abzielt, Claude Code-Anfragen an verschiedene KI-Modelle weiterzuleiten. Es dient als Grundlage für die Code-Infrastruktur und ermöglicht es Benutzern, selbst zu entscheiden, wie sie mit den Modellen interagieren, während sie gleichzeitig Updates von Anthropic erhalten. Das Kernziel dieses Projekts ist es, die Kosten für die Nutzung von Claude Code durch intelligentes Routing und die Zusammenarbeit mehrerer Modelle erheblich zu senken.
Projektmotivation
Herkömmliche KI-Programmierwerkzeuge weisen folgende Probleme auf:
- Hohe Kosten: Die direkte Nutzung von High-End-Modellen wie Claude für alle Aufgaben ist sehr kostspielig.
- Modellbeschränkungen: Ein einzelnes Modell kann nicht in allen Szenarien optimal funktionieren.
- Ressourcenverschwendung: Einfache Aufgaben werden ebenfalls mit komplexen Modellen bearbeitet, was zu Ressourcenverschwendung führt.
Claude Code Router löst diese Probleme durch intelligentes Routing. Der Autor erwähnt, dass bei der Verwendung von Claude-4 in VSCode Copilot zur Lösung von Flutter-Problemen bereits drei Gesprächsrunden die Dateien durcheinandergebracht und ein Rollback erforderlich gemacht haben. Im Gegensatz dazu konnte die Aufgabe mit Claude Code in Kombination mit DeepSeek nach drei bis vier Gesprächsrunden erfolgreich abgeschlossen werden, und das zu Kosten von weniger als 1 RMB.
Kernfunktionen
1. Zwei Betriebsmodi
- Normalmodus: Verwendet ein einziges Modell, um alle Aufgaben zu erledigen.
- Router-Modus: Verwendet mehrere spezialisierte Modelle, die zusammenarbeiten, um verschiedene Arten von Aufgaben zu erledigen.
2. Intelligente Modellaufteilung
Im Router-Modus verwendet das System vier verschiedene spezialisierte Modelle:
Router-Agent:
qwen2.5-coder-3b
- Verantwortlich für die Weiterleitung von Anfragen.
- Benötigt keine hohe Intelligenz, ein kleines Modell ist ausreichend.
- Derzeit wird das offizielle kostenlose qwen2.5-coder-3b-Modell von Alibaba Cloud verwendet.
Tool-Agent:
qwen-max-0125
- Verantwortlich für Tool-Aufrufe.
- Muss Funktionsaufrufe unterstützen.
- Muss eine ausreichend große Länge für Tool-Beschreibungen unterstützen (idealerweise über 1754 Zeichen).
Coder-Agent:
deepseek-v3
- Speziell für Code-Generierungsaufgaben zuständig.
- Verwendet Modelle der DeepSeek-Serie.
Think-Agent:
deepseek-r1
- Verantwortlich für komplexe Inferenzaufgaben.
- Verwendet das DeepSeek R1 Inferenzmodell.
3. Kostenoptimierung
- Dank des kostenlosen qwen2.5-coder-3b-Modells von Alibaba Cloud und der KV-Cache-Technologie von DeepSeek.
- Kann die Kosten für die Nutzung von Claude Code erheblich senken.
- Vermeidet durch Aufgabenaufteilung die Verwendung teurer Modelle für einfache Aufgaben.
Installation und Konfiguration
1. Claude Code installieren
npm install -g @anthropic-ai/claude-code
2. Projekt klonen
git clone https://github.com/musistudio/claude-code-reverse.git
3. Abhängigkeiten installieren
npm i
4. Umgebungsvariablen konfigurieren
Konfiguration für den Normalmodus
# Router deaktivieren
ENABLE_ROUTER=false
OPENAI_API_KEY=""
OPENAI_BASE_URL=""
OPENAI_MODEL=""
Konfiguration für den Router-Modus
# Router aktivieren
ENABLE_ROUTER=true
export TOOL_AGENT_API_KEY=""
export TOOL_AGENT_BASE_URL=""
export TOOL_AGENT_MODEL="qwen-max-2025-01-25"
export CODER_AGENT_API_KEY=""
export CODER_AGENT_BASE_URL="https://api.deepseek.com"
export CODER_AGENT_MODEL="deepseek-chat"
export THINK_AGENT_API_KEY=""
export THINK_AGENT_BASE_URL="https://api.deepseek.com"
export THINK_AGENT_MODEL="deepseek-reasoner"
export ROUTER_AGENT_API_KEY=""
export ROUTER_AGENT_BASE_URL=""
export ROUTER_AGENT_MODEL="qwen2.5-coder-3b-instruct"
5. Dienst starten
node index.mjs
6. Claude Code Umgebungsvariablen konfigurieren
export DISABLE_PROMPT_CACHING=1
export ANTHROPIC_AUTH_TOKEN="test"
export ANTHROPIC_BASE_URL="http://127.0.0.1:3456"
export API_TIMEOUT_MS=600000
claude
Technische Architektur
Funktionsweise des Router-Modus
- Anfrageempfang: Claude Code sendet Anfragen an den lokalen Proxy-Server.
- Intelligentes Routing: Der Router-Agent analysiert den Anfragetyp und entscheidet, an welches spezialisierte Modell die Anfrage weitergeleitet werden soll.
- Aufgabenausführung:
- Tool-Aufrufe → Tool-Agent
- Code-Generierungsaufgaben → Coder-Agent
- Komplexe Inferenzaufgaben → Think-Agent
- Ergebnisrückgabe: Die jeweiligen Modelle schließen die Aufgaben ab und geben die Ergebnisse zurück.
Wesentliche Vorteile
- Aufgabentrennung: Trennung von Tool-Aufrufen und Kodierungsaufgaben.
- Modellspezialisierung: Jedes Modell konzentriert sich auf die Aufgaben, die es am besten beherrscht.
- Kostenkontrolle: Auswahl des geeigneten Modells basierend auf der Aufgabenkomplexität.
- Unterstützung von Inferenzmodellen: Unterstützung von Inferenzmodellen wie R1, die keine Funktionsaufrufe unterstützen.
Wichtige Hinweise
⚠️ Wichtiger Hinweis:
- Das Projekt befindet sich in der Testphase und kann eine große Menge an Tokens verbrauchen.
- Es kann zu Fehlern bei der Aufgabenausführung kommen.
- Es wird empfohlen, für das Projekt eine geeignete
ignorePatterns
-Konfiguration einzurichten.
Bedeutung des Projekts
Claude Code Router repräsentiert eine wichtige Richtung in der Entwicklung von KI-Programmierwerkzeugen:
- Demokratisierung der Kosten: Ermöglicht es mehr Entwicklern, KI-Programmierassistenten zu nutzen.
- Modellvielfalt: Keine Abhängigkeit mehr von einem einzigen Modell, flexible Auswahl des am besten geeigneten Modells.
- Architektonische Innovation: Steigerung der Gesamteffizienz durch Routing und Spezialisierung.
Dieses Projekt bietet Entwicklern ein leistungsstarkes Werkzeug, das die Kosten für die Nutzung von Claude Code erheblich senken kann, während die leistungsstarken Funktionen von Claude Code erhalten bleiben. Es ist ein wichtiger Beitrag zur Popularisierung von KI-Programmierwerkzeugen.