ultralytics/yolov5 View GitHub Homepage for Latest Official Releases

YOLOv5 ist ein hochmodernes Echtzeit-Objekterkennungsmodell, das auf PyTorch basiert und Aufgaben wie Objekterkennung, Bildsegmentierung und Bildklassifizierung unterstützt.

AGPL-3.0Pythonyolov5ultralytics 56.8k Last Updated: February 10, 2026

Detaillierte Einführung in das YOLOv5-Projekt

Projektübersicht

Ultralytics YOLOv5 🚀 ist ein hochmodernes (SOTA) Computervisionsmodell, das von Ultralytics entwickelt wurde. Basierend auf dem PyTorch-Framework ist YOLOv5 für seine Benutzerfreundlichkeit, Geschwindigkeit und Genauigkeit bekannt. Es vereint Erkenntnisse aus umfangreicher Forschung und Entwicklung mit Best Practices und ist somit eine beliebte Wahl für verschiedene visuelle KI-Aufgaben.

Projektadresse: https://github.com/ultralytics/yolov5

Kernfunktionen

Unterstützung für mehrere Aufgaben

YOLOv5 unterstützt verschiedene Computer Vision Aufgaben:

Objekterkennung: Identifizierung und Lokalisierung mehrerer Objekte in Bildern
Instanzsegmentierung: Objektsegmentierung auf Pixelebene
Bildklassifizierung: Kategorisierung einzelner Bilder

Technische Vorteile

Zu den wichtigsten Merkmalen gehören Echtzeit-Inferenz, Unterstützung für verschiedene Trainingstechniken wie Test Time Augmentation (TTA) und Modell-Ensembling sowie Kompatibilität mit Exportformaten wie TFLite, ONNX, CoreML und TensorRT.

Modellarchitektur und Leistung

Modellspezifikationen

YOLOv5 bietet verschiedene Modellgrößen, um unterschiedlichen Anforderungen gerecht zu werden:

Modell	Parameteranzahl (M)	Geschwindigkeit	Genauigkeit	Anwendungsbereich
YOLOv5n	1.9	Am schnellsten	Niedriger	Mobile Geräte, Edge Computing
YOLOv5s	7.2	Schnell	Mittel	Allgemeine Anwendungen
YOLOv5m	21.2	Mittel	Höher	Ausgewogene Leistung
YOLOv5l	46.5	Langsamer	Hoch	Hohe Präzisionsanforderungen
YOLOv5x	86.7	Am langsamsten	Am höchsten	Höchste Präzisionsanforderungen

Leistungsindikatoren

Leistung auf dem COCO-Datensatz:

YOLOv5s: mAP@0.5:0.95 = 37.4%, Geschwindigkeit 6.4ms (V100)
YOLOv5m: mAP@0.5:0.95 = 45.4%, Geschwindigkeit 8.2ms (V100)
YOLOv5l: mAP@0.5:0.95 = 49.0%, Geschwindigkeit 10.1ms (V100)
YOLOv5x: mAP@0.5:0.95 = 50.7%, Geschwindigkeit 12.1ms (V100)

Installation und Schnellstart

Systemanforderungen

Python >= 3.8.0
PyTorch >= 1.8

Installationsschritte

# Klonen des Repository
git clone https://github.com/ultralytics/yolov5
cd yolov5

# Installation der Abhängigkeiten
pip install -r requirements.txt

Inferenz mit PyTorch Hub

import torch

# Laden des YOLOv5-Modells
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Definition der Eingabebildquelle
img = "https://ultralytics.com/images/zidane.jpg"

# Ausführen der Inferenz
results = model(img)

# Verarbeitung der Ergebnisse
results.print()  # Ausgabe der Ergebnisse in der Konsole
results.show()   # Anzeige der Ergebnisse in einem Fenster
results.save()   # Speichern der Ergebnisse in runs/detect/exp

Befehlszeilen-Inferenz

# Inferenz mit der Kamera
python detect.py --weights yolov5s.pt --source 0

# Inferenz mit einer lokalen Bilddatei
python detect.py --weights yolov5s.pt --source img.jpg

# Inferenz mit einer Videodatei
python detect.py --weights yolov5s.pt --source vid.mp4

# Inferenz mit einem Bildverzeichnis
python detect.py --weights yolov5s.pt --source path/to/images/

# Inferenz mit einem YouTube-Video
python detect.py --weights yolov5s.pt --source 'https://youtu.be/LNwODJXcvt4'

Training benutzerdefinierter Modelle

Beispiel für einen Trainingsbefehl

# Training von YOLOv5s auf dem COCO-Datensatz, 300 Epochen
python train.py --data coco.yaml --epochs 300 --weights '' --cfg yolov5s.yaml --batch-size 64

# Training von YOLOv5m
python train.py --data coco.yaml --epochs 300 --weights '' --cfg yolov5m.yaml --batch-size 40

# Training von YOLOv5l
python train.py --data coco.yaml --epochs 300 --weights '' --cfg yolov5l.yaml --batch-size 24

Multi-GPU-Training

# Verwendung von Multi-GPU-verteiltem Training
python -m torch.distributed.run --nproc_per_node 4 --master_port 1 train.py --data coco.yaml --weights '' --cfg yolov5s.yaml --batch-size 64 --device 0,1,2,3

Instanzsegmentierungsfunktion

YOLOv5 v7.0 führte die Instanzsegmentierungsfunktion ein und erreichte auf dem COCO-Datensatz modernste Leistung.

Leistung des Segmentierungsmodells

Modell	mAP^box	mAP^mask	Parameteranzahl (M)	Geschwindigkeit (ms)
YOLOv5n-seg	27.6	23.4	2.0	59.2
YOLOv5s-seg	37.6	32.0	7.6	63.7
YOLOv5m-seg	45.0	37.1	22.0	89.5
YOLOv5l-seg	49.0	39.9	47.8	168.4
YOLOv5x-seg	50.7	41.4	88.8	265.7

Beispiel für Segmentierungstraining

# Training des Segmentierungsmodells
python segment/train.py --data coco128-seg.yaml --weights yolov5s-seg.pt --img 640

# Validierung des Segmentierungsmodells
python segment/val.py --weights yolov5s-seg.pt --data coco.yaml --img 640

# Verwendung des Segmentierungsmodells zur Vorhersage
python segment/predict.py --weights yolov5m-seg.pt --source data/images/bus.jpg

Bildklassifizierungsfunktion

YOLOv5 v6.2 fügte die Bildklassifizierungsfunktion hinzu. Hier sind die Ergebnisse des Trainings für 90 Epochen auf dem ImageNet-Datensatz:

Leistung des Klassifizierungsmodells

Modell	Top1-Genauigkeit	Top5-Genauigkeit	Parameteranzahl (M)	Geschwindigkeit (ms)
YOLOv5s-cls	71.5%	90.2%	5.5	1.7
YOLOv5m-cls	75.9%	92.9%	13.0	2.8
YOLOv5l-cls	78.0%	94.0%	27.4	4.9
YOLOv5x-cls	79.0%	94.4%	55.4	8.7

Beispiel für Klassifizierungstraining

# Training auf dem CIFAR-100-Datensatz
python classify/train.py --model yolov5s-cls.pt --data cifar100 --epochs 5 --img 224 --batch 128

# Validierung des ImageNet-Modells
python classify/val.py --weights yolov5m-cls.pt --data ../datasets/imagenet --img 224

# Bildklassifizierungsvorhersage
python classify/predict.py --weights yolov5s-cls.pt --source data/images/bus.jpg

Modellexport und -bereitstellung

YOLOv5 unterstützt verschiedene Bereitstellungsformate:

# Export in das ONNX-Format
python export.py --weights yolov5s.pt --include onnx

# Export in das TensorRT-Format
python export.py --weights yolov5s.pt --include engine

# Export in das CoreML-Format (für iOS)
python export.py --weights yolov5s.pt --include coreml

# Export in das TFLite-Format (für mobile Geräte)
python export.py --weights yolov5s.pt --include tflite

Erweiterte Funktionen

Test Time Augmentation (TTA)

Verbesserung der Vorhersagegenauigkeit durch Reflexions- und Skalierungserweiterung:

python val.py --data coco.yaml --img 1536 --iou 0.7 --augment

Modell-Ensembling

Kombination mehrerer Modelle für eine bessere Leistung:

python val.py --data coco.yaml --weights yolov5s.pt yolov5m.pt yolov5l.pt yolov5x.pt

Hyperparameter-Evolution

Automatische Suche nach optimalen Trainingshyperparametern:

python train.py --data coco.yaml --evolve 300

Integration und Ökosystem

YOLOv5 ist tief in mehrere Mainstream-KI-Plattformen integriert:

Weights & Biases: Experimentverfolgung und -visualisierung
Comet ML: Experimentverwaltung und -überwachung
Roboflow: Datenannotation und -verwaltung
Intel OpenVINO: Modelloptimierung und -bereitstellung
Neural Magic: Modellsparsifizierung und -beschleunigung
Ultralytics HUB: One-Stop-Trainings- und Bereitstellungsplattform

Community und Support

GitHub-Repository: https://github.com/ultralytics/yolov5
Offizielle Dokumentation: https://docs.ultralytics.com/yolov5/
Discord-Community: https://discord.com/invite/ultralytics
Problem-Feedback: https://github.com/ultralytics/yolov5/issues

Zusammenfassung

YOLOv5 ist ein wichtiger Meilenstein im Bereich der Objekterkennung und hat sich aufgrund seiner hervorragenden Leistung, Benutzerfreundlichkeit und seines Funktionsumfangs zu einem bevorzugten Framework für akademische Forschung und industrielle Anwendungen entwickelt. Ob Anfänger oder professioneller Entwickler, jeder kann im YOLOv5-Ökosystem die passende Lösung finden.