Home
Login

YOLOv5 ist ein hochmodernes Echtzeit-Objekterkennungsmodell, das auf PyTorch basiert und Objekterkennung, Bildsegmentierung und Bildklassifizierungsaufgaben unterstützt.

AGPL-3.0Python 42.3kultralyticsultralytics Last Updated: 2025-06-24

Ultralytics YOLO Projekt – Detaillierte Vorstellung

Projektübersicht

Ultralytics YOLO ist ein fortschrittliches Computer-Vision-Framework, das sich auf die Bereitstellung modernster Funktionen für Objekterkennung, Instanzsegmentierung, Pose-Schätzung, Tracking und Klassifizierung konzentriert. Das Projekt ist eine Sammlung modernster YOLO-Modelle, die auf jahrelanger Grundlagenforschung im Bereich Computer Vision und KI aufbauen.

Projektadresse: https://github.com/ultralytics/ultralytics

Kernfunktionen

🎯 Multi-Task-Unterstützung

  • Objekterkennung: Identifizierung und Lokalisierung von Objekten in Bildern oder Videos
  • Instanzsegmentierung: Segmentierung von Bildern oder Videos in Bereiche, die verschiedenen Objekten oder Kategorien entsprechen
  • Pose-Schätzung: Erkennung und Analyse der Pose und der Schlüsselpunkte von Menschen oder Objekten
  • Bildklassifizierung: Klassifizierung und Erkennung des gesamten Bildes
  • Objektverfolgung: Verfolgung mehrerer Objekte in Videosequenzen
  • Orientierte Begrenzungsbox-Erkennung (OBB): Unterstützung der Erkennung rotierter Objekte

🚀 Neueste Modellversionen

YOLO11

YOLO11 ist das neueste YOLO-Modell von Ultralytics, das in mehreren Aufgaben modernste Leistung bietet, darunter Objekterkennung, Segmentierung, Pose-Schätzung, Tracking und Klassifizierung, und verfügt über verbesserte Funktionen zur Merkmalsextraktion.

Hauptverbesserungen:

  • Verbesserte Merkmalsextraktion: Verbesserte Backbone-Netzwerk- und Halsarchitektur
  • Optimierte Genauigkeit und Effizienz: Erhöhte Verarbeitungsgeschwindigkeit bei gleichbleibend hoher Genauigkeit
  • Präzisere Objekterkennung: Bessere Erkennungsleistung durch verbesserte Architektur

YOLO12

YOLO12 verwendet einen auf Aufmerksamkeitsmechanismen zentrierten Ansatz zur Objekterkennung und zeichnet sich in einer Vielzahl von Kernaufgaben der Computer Vision aus.

🔧 Technische Vorteile

  1. Echtzeit-Performance: Modelle sind schnell, genau und einfach zu bedienen, optimierte Architektur sorgt für hohe Geschwindigkeit ohne Einbußen bei der Genauigkeit
  2. Kontinuierliche Updates: Ständige Aktualisierungen zur Verbesserung von Leistung und Flexibilität
  3. Einfache Integration: Einfache Python-API und umfangreiche Dokumentation
  4. Plattformübergreifende Bereitstellung: Unterstützung für die Bereitstellung auf verschiedenen Geräten wie NVIDIA Jetson, NVIDIA GPU und macOS-Systemen

Hauptfunktionsmodule

Trainingsmodus (Training)

  • Unterstützung für das Training mit benutzerdefinierten Datensätzen
  • Integration verschiedener Tracking-Tools (wie Comet, Weights & Biases usw.)
  • Hyperparameteroptimierung und Experimentmanagement
  • Echtzeit-Metriküberwachung

Inferenzmodus (Inference)

  • Stapelverarbeitung und Inferenz einzelner Bilder
  • Echtzeitverarbeitung von Videostreams
  • Unterstützung verschiedener Inferenz-Backends

Validierungsmodus (Validation)

  • Bewertung der Modellleistung
  • Berechnung und Visualisierung von Metriken
  • Benchmark-Tools

Exportmodus (Export)

  • Unterstützung für den Export in verschiedene Formate (ONNX, TensorRT, CoreML usw.)
  • Optimierung für mobile und eingebettete Geräte

Anwendungsbereiche

Branchenanwendungen

  • Intelligente Sicherheit: Echtzeitüberwachung und Anomalieerkennung
  • Autonomes Fahren: Erkennung und Verfolgung von Objekten auf der Straße
  • Industrielle Qualitätskontrolle: Erkennung und Klassifizierung von Produktfehlern
  • Medizinische Bildgebung: Analyse medizinischer Bilder und Unterstützung bei der Diagnose
  • Einzelhandel: Kundenstromanalyse und Produkterkennung
  • Sportanalyse: Analyse von Athletenbewegungen und Spielstatistiken

Technische Integration

  • Robotervision: Umgebungswahrnehmung und Navigation
  • Augmented Reality: Echtzeit-Objekterkennung und -Verfolgung
  • Smart Home: Personenerkennung und Verhaltenserkennung

Technische Architektur

Merkmale der Modellarchitektur

  • Verbessertes Backbone-Netzwerk: Verbesserung der Merkmalsextraktion
  • Optimierte Halsstruktur: Verbesserung der multiskaligen Merkmalsfusion
  • Effizienter Erkennungskopf: Ausgewogenes Verhältnis von Geschwindigkeit und Genauigkeit

Kerntechnologien

  • Aufmerksamkeitsmechanismen: In YOLO12 eingeführtes aufmerksamkeitszentriertes Design
  • Merkmals-Pyramidennetzwerk: Multiskalige Merkmalsverarbeitung
  • Ankerbox-Optimierung: Adaptive Ankerbox-Generierung und -Optimierung

Installation und Verwendung

Schnellstart

# Installation
pip install ultralytics

# Python API Verwendung
from ultralytics import YOLO

# Modell laden
model = YOLO('yolo11n.pt')

# Training
model.train(data='coco8.yaml', epochs=100, imgsz=640)

# Inferenz
results = model('path/to/image.jpg')

# Export
model.export(format='onnx')

Befehlszeilenverwendung

# Training
yolo train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

# Inferenz
yolo predict model=yolo11n.pt source='path/to/image.jpg'

# Validierung
yolo val model=yolo11n.pt data=coco8.yaml

# Export
yolo export model=yolo11n.pt format=onnx

Leistungsmerkmale

Geschwindigkeitsvorteile

  • Echtzeitverarbeitungsfähigkeit, unterstützt Videos mit hoher Bildrate
  • Optimierte Inferenz-Engine
  • Unterstützung für parallele Verarbeitung mit mehreren GPUs

Genauigkeitsleistung

  • Erreicht modernste mAP-Metriken auf dem COCO-Datensatz
  • Ausgewogenes Verhältnis zwischen Geschwindigkeit und Genauigkeit
  • Unterstützt verschiedene Modellgrößen (nano, small, medium, large, extra-large)

Ressourceneffizienz

  • Optimierung der Speichernutzung
  • Effiziente Nutzung von Rechenressourcen
  • Unterstützung von Modellkomprimierungstechniken wie Quantisierung und Beschneidung

Zusammenfassung

Ultralytics YOLO ist eine der fortschrittlichsten und vollständigsten Computer-Vision-Lösungen, die derzeit verfügbar sind. Sie bietet nicht nur eine leistungsstarke Modellleistung, sondern auch eine vollständige Toolchain und ein Ökosystem. Ob akademische Forschung, industrielle Anwendungen oder persönliche Projekte, in diesem Framework finden Sie die passende Lösung. Die kontinuierlichen Aktualisierungen und Verbesserungen stellen sicher, dass Benutzer stets die neuesten technischen Fortschritte und die beste Benutzererfahrung erhalten.

Star History Chart