Ein leistungsstarkes Framework zum Aufbau, Ausführen und Bewerten autonomer Agenten auf Basis von Open-Source-Modellen, das die automatische Konfigurationsgenerierung, die multimodale Werkzeugintegration und tiefgehende Forschungsfähigkeiten unterstützt.

NOASSERTIONPythonyoutu-agentTencentCloudADP 2.8k Last Updated: September 11, 2025

Detaillierte Vorstellung des Youtu-Agent Projekts

Projektübersicht

Youtu-Agent ist ein flexibles, leistungsstarkes Agenten-Framework, das speziell für den Aufbau, die Ausführung und die Bewertung autonomer intelligenter Agenten entwickelt wurde. Das Framework zeichnet sich nicht nur durch hervorragende Leistungen in Benchmarks aus, sondern bietet auch leistungsstarke Agentenfunktionen auf Basis von Open-Source-Modellen, darunter Datenanalyse, Dateiverarbeitung und tiefgehende Forschung.

Projektursprung

Kernfunktionen

🌟 Verifizierte Leistungsfähigkeit

  • WebWalkerQA: Erreicht eine Genauigkeit von 71,47 % (pass@1) mit DeepSeek-V3.1
  • GAIA Benchmark: Erreicht 72,8 % pass@1 auf dem Text-Subset
  • Rein Open-Source-Modelle: Verwendet ausschließlich Modelle der DeepSeek-V3-Reihe, ohne Abhängigkeit von Claude oder GPT

🚀 Open-Source-freundlich und kostenbewusst

  • Optimiert für zugängliche, kostengünstige Bereitstellung, ohne Abhängigkeit von Closed-Source-Modellen
  • Unterstützt verschiedene Modell-APIs, von DeepSeek bis gpt-oss
  • Verfügt über erweiterbare Tool-Integration und Framework-Implementierung

💡 Praktische Anwendungsszenarien

Das Framework bietet sofort einsatzbereite Aufgabenunterstützung für:

  • CSV-Datenanalyse
  • Literaturübersichten
  • Persönliche Dateiorganisation
  • Podcast- und Videogenerierung (bald verfügbar)
  • Tiefgehende Forschungsberichte
  • Webseiten-Generierung

🛠️ Flexibles Architekturdesign

  • Modulares Design: Schlüsselkomponenten wie Environment und ContextManager sind gut gekapselt und hochgradig anpassbar
  • YAML-Konfiguration: Strukturierte Konfiguration basierend auf YAML, einfach zu verwalten
  • Vollständig asynchron: Ermöglicht hohe Leistung und effiziente Ausführung, besonders geeignet für Benchmark-Bewertungen
  • Tracking und Analyse: Bietet tiefgehende Analyse von Tool-Aufrufen und Agenten-Trajektorien

Systemarchitektur

Kernkomponenten

  1. Agent: Ein LLM, konfiguriert mit spezifischen Prompts, Tools und Umgebungen
  2. Toolkit: Eine Sammlung gekapselter Tools, die der Agent verwenden kann
  3. Environment: Die Welt, in der der Agent agiert (z.B. Browser, Shell)
  4. ContextManager: Ein konfigurierbares Modul zur Verwaltung des Kontextfensters des Agenten
  5. Benchmark: Ein gekapselter Workflow für spezifische Datensätze

Agentenmodi

Das Framework unterstützt zwei Haupt-Agentenmodi:

  • SimpleAgent: Das klassische Einzelagentenmodell, das einen Denk-Handlungs-Zyklus (ReAct-Stil) verwendet
  • OrchestraAgent: Ein Multi-Agenten-System, das eine Plan-Ausführungs-Strategie verwendet und Planer, Arbeiter und Berichterstatter koordiniert

Installation und Schnellstart

Systemanforderungen

  • Python 3.12+
  • Empfohlen wird die Verwendung von uv für das Abhängigkeitsmanagement

Installationsschritte

# Klone das Repository
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent

# Synchronisiere Abhängigkeiten
uv sync # Oder verwende make sync

# Aktiviere die virtuelle Umgebung
source ./.venv/bin/activate

# Kopiere die Umgebungskonfigurationsdatei
cp .env.example .env

Umgebungskonfiguration

Konfigurieren Sie die erforderlichen API-Schlüssel in der .env-Datei:

# LLM Konfiguration (DeepSeek Beispiel)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=replace-to-your-api-key

# Tencent Cloud DeepSeek API (neue Benutzer erhalten 3 Millionen kostenlose Tokens)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=replace-with-your-api-key

# Tool API Schlüssel
SERPER_API_KEY=<Erhalten Sie von https://serper.dev/playground>
JINA_API_KEY=<Erhalten Sie von https://jina.ai/reader>

Verwendung

1. Grundlegende Konversation

# Starte den interaktiven Chatbot mit Standardkonfiguration
python scripts/cli_chat.py --stream --config default

# Basisversion ohne Suchwerkzeug
python scripts/cli_chat.py --stream --config base

2. Automatische Generierung von Agentenkonfigurationen

Ein herausragendes Merkmal von Youtu-Agent ist die Fähigkeit, Agentenkonfigurationen automatisch zu generieren. Im Gegensatz zu anderen Frameworks, die das Schreiben von Code oder das sorgfältige Erstellen von Prompts erfordern, verwendet Youtu-Agent einfache YAML-Konfigurationen. Ein integrierter "Meta-Agent" interagiert mit Ihnen, um Ihre Anforderungen zu verstehen, und generiert und speichert dann automatisch die Konfiguration.

# Interaktive Konfigurationsgenerierung
python scripts/gen_simple_agent.py

# Ausführen der generierten Konfiguration
python scripts/cli_chat.py --stream --config generated/xxx

3. Beispielanwendungen

SVG-Bilderzeugung

python examples/svg_generator/main.py

Web-UI-Version

# Frontend-Paket herunterladen
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl

# Frontend-Paket installieren
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

# Web-Version ausführen
python examples/svg_generator/main_web.py

Besuchen Sie http://127.0.0.1:8848/, um die Web-Oberfläche zu nutzen.

4. Benchmark-Bewertung

# Datensatz vorbereiten (WebWalkerQA-Datensatz herunterladen und verarbeiten)
python scripts/data/process_web_walker_qa.py

# Bewertung ausführen
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

Praktische Anwendungsfälle

Datenanalyse

Der Agent kann CSV-Dateien analysieren und HTML-Berichte generieren, indem er automatisch Datenmuster erkennt, Visualisierungen erstellt und Einblicke liefert.

Dateiverwaltung

Der Agent kann lokale Dateien umbenennen und klassifizieren, um die Dokumentenstruktur basierend auf dem Inhalt automatisch zu organisieren.

Umfassende Forschung

Ähnlich der Manus-Funktionalität, sammelt der Agent große Mengen an Informationen, um umfassende Forschungsberichte zu erstellen.

Papieranalyse

Analysiert gegebene Papiere, führt Analysen durch und kompiliert relevante Literatur, um Endergebnisse zu liefern.

Technische Merkmale

1. Minimalistisches Design

Das Framework ist bestrebt, einfach und benutzerfreundlich zu bleiben und unnötigen Overhead zu vermeiden.

2. Streaming und Tracking

Basiert auf dem openai-agents SDK und erbt dessen Fähigkeiten für Streaming, Tracking und Agenten-Loops.

3. Tiefgehendes Analysesystem

Neben OTEL bietet das DBTracingProcessor-System eine tiefgehende Analyse von Tool-Aufrufen und Agenten-Trajektorien.

4. Trajektoriensammlung

Unterstützt die Datensammlung für Trainings- und Forschungszwecke.

Zielgruppen

Forscher

  • Bietet leistungsstarke Open-Source-Benchmarks und eine flexible Architektur
  • Unterstützt Modelltraining, -bewertung und Ablationsstudien
  • Ein-Klick-Evaluierungsskripte vereinfachen den Experimentierprozess

Anwendungsentwickler

  • Praktische Anwendungsfälle und benutzerfreundliche Scaffolding-Tools
  • Schneller Aufbau realer Agenten-Anwendungen

KI- und Agenten-Enthusiasten

  • Umfangreiche Beispiele und intuitive Entwicklungstools
  • Einfacher Einstieg, ideal zum Lernen und Erkunden

Technische Teams in Unternehmen

  • Unterstützt kostengünstige Bereitstellung und Open-Source-Modelle
  • Geeignet für Anwendungen wie intelligenten Kundenservice, Datenanalyse in Unternehmensumgebungen

Pädagogen und Studenten

  • Bietet Funktionen wie personalisiertes Lernen und automatische Bewertung
  • Unterstützt Lehr- und Lernprozesse

Zukünftige Entwicklung

Die Projekt-Roadmap umfasst:

  • Tool-Bewertung und automatische Optimierung
  • Generierung benutzerdefinierter Tools
  • Erweiterung der multimodalen Tool-Integration
  • Verbesserung der Benchmark-Abdeckung
  • Verfeinerung des Tracking- und Analysesystems

Community und Support

Zitation

Wenn Sie dieses Projekt nützlich finden, zitieren Sie es bitte wie folgt:

@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

Zusammenfassung

Youtu-Agent ist ein leistungsstarkes und benutzerfreundliches Open-Source-Agenten-Framework, das Entwicklern eine komplette Lösung für den Aufbau hochleistungsfähiger KI-Anwendungen bietet. Sein Designansatz, der auf Open-Source-Modellen basiert, seine hervorragende Leistungsfähigkeit und seine reichhaltigen Funktionen machen es zu einem wichtigen Werkzeug im Bereich der Agentenentwicklung. Ob für Forschungszwecke oder kommerzielle Anwendungen, Youtu-Agent kann Benutzern zuverlässige und effiziente Agenten-Lösungen bieten.

Star History Chart