Home
Login

YOLOv5, un modèle de détection d'objets en temps réel de pointe basé sur PyTorch, prend en charge la détection d'objets, la segmentation d'images et les tâches de classification d'images.

AGPL-3.0Python 42.3kultralyticsultralytics Last Updated: 2025-06-24

Présentation détaillée du projet Ultralytics YOLO

Aperçu du projet

Ultralytics YOLO est un framework de vision par ordinateur avancé, axé sur la fourniture de fonctionnalités de pointe en matière de détection d'objets, de segmentation d'instances, d'estimation de pose, de suivi et de classification. Le projet est une collection de modèles YOLO de pointe, basés sur des années de recherche fondamentale en vision par ordinateur et en IA.

Adresse du projet: https://github.com/ultralytics/ultralytics

Caractéristiques principales

🎯 Prise en charge multi-tâches

  • Détection d'objets: Identification et localisation d'objets dans des images ou des vidéos
  • Segmentation d'instances: Segmentation d'images ou de vidéos en régions correspondant à différents objets ou catégories
  • Estimation de pose: Détection et analyse de la pose et des points clés du corps humain ou d'objets
  • Classification d'images: Classification et identification de l'image entière
  • Suivi d'objets: Suivi de plusieurs objets dans une séquence vidéo
  • Détection de boîtes englobantes orientées (OBB): Prise en charge de la détection d'objets en rotation

🚀 Dernière version du modèle

YOLO11

YOLO11 est le dernier modèle YOLO d'Ultralytics, offrant des performances de pointe dans plusieurs tâches, notamment la détection d'objets, la segmentation, l'estimation de pose, le suivi et la classification, avec des capacités d'extraction de caractéristiques améliorées.

Améliorations principales :

  • Extraction de caractéristiques améliorée: Architecture de backbone et de neck améliorée
  • Optimisation de la précision et de l'efficacité: Amélioration de la vitesse de traitement tout en conservant une précision élevée
  • Détection d'objets plus précise: Meilleures performances de détection grâce à une architecture améliorée

YOLO12

YOLO12 adopte une approche de détection d'objets centrée sur les mécanismes d'attention, excellant dans diverses tâches fondamentales de vision par ordinateur.

🔧 Avantages techniques

  1. Performance en temps réel: Modèles rapides, précis et faciles à utiliser, l'architecture optimisée garantit des performances à haute vitesse sans sacrifier la précision
  2. Mises à jour continues: Mises à jour constantes pour améliorer les performances et la flexibilité
  3. Facilité d'intégration: API Python simple et documentation riche
  4. Déploiement multiplateforme: Prise en charge du déploiement sur divers appareils tels que NVIDIA Jetson, NVIDIA GPU et les systèmes macOS

Principaux modules fonctionnels

Mode d'entraînement (Training)

  • Prise en charge de l'entraînement sur des ensembles de données personnalisés
  • Intégration de divers outils de suivi (tels que Comet, Weights & Biases, etc.)
  • Optimisation des hyperparamètres et gestion des expériences
  • Surveillance des indicateurs en temps réel

Mode d'inférence (Inference)

  • Traitement par lots et inférence d'images uniques
  • Traitement en temps réel des flux vidéo
  • Prise en charge de plusieurs backends d'inférence

Mode de validation (Validation)

  • Évaluation des performances du modèle
  • Calcul et visualisation des indicateurs
  • Outils de test de référence

Mode d'exportation (Export)

  • Prise en charge de l'exportation dans plusieurs formats (ONNX, TensorRT, CoreML, etc.)
  • Optimisation pour les appareils mobiles et embarqués

Scénarios d'application

Applications industrielles

  • Sécurité intelligente: Surveillance en temps réel et détection d'anomalies
  • Conduite autonome: Identification et suivi des objets sur la route
  • Contrôle qualité industriel: Détection et classification des défauts des produits
  • Imagerie médicale: Analyse d'images médicales et assistance au diagnostic
  • Commerce de détail: Analyse du flux de clients et identification des produits
  • Analyse sportive: Analyse des mouvements des athlètes et statistiques des compétitions

Intégration technique

  • Vision robotique: Perception de l'environnement et navigation
  • Réalité augmentée: Identification et suivi d'objets en temps réel
  • Maison intelligente: Détection de personnes et reconnaissance de comportement

Architecture technique

Caractéristiques de l'architecture du modèle

  • Backbone amélioré: Amélioration des capacités d'extraction de caractéristiques
  • Structure de neck optimisée: Amélioration de la fusion des caractéristiques multi-échelles
  • Tête de détection efficace: Équilibre entre vitesse et précision

Technologies clés

  • Mécanisme d'attention: Conception centrée sur l'attention introduite dans YOLO12
  • Réseau de pyramide de caractéristiques: Traitement des caractéristiques multi-échelles
  • Optimisation des boîtes d'ancrage: Génération et optimisation adaptatives des boîtes d'ancrage

Installation et utilisation

Démarrage rapide

# Installation
pip install ultralytics

# Utilisation de l'API Python
from ultralytics import YOLO

# Charger le modèle
model = YOLO('yolo11n.pt')

# Entraînement
model.train(data='coco8.yaml', epochs=100, imgsz=640)

# Inférence
results = model('path/to/image.jpg')

# Exporter
model.export(format='onnx')

Utilisation de la ligne de commande

# Entraînement
yolo train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

# Inférence
yolo predict model=yolo11n.pt source='path/to/image.jpg'

# Validation
yolo val model=yolo11n.pt data=coco8.yaml

# Exporter
yolo export model=yolo11n.pt format=onnx

Caractéristiques de performance

Avantages de vitesse

  • Capacité de traitement en temps réel, prise en charge des vidéos à haute fréquence d'images
  • Moteur d'inférence optimisé
  • Prise en charge du traitement parallèle multi-GPU

Performance de précision

  • Atteinte des indicateurs mAP de pointe sur l'ensemble de données COCO
  • Équilibre entre vitesse et précision
  • Prise en charge de plusieurs tailles de modèle (nano, small, medium, large, extra-large)

Efficacité des ressources

  • Optimisation de l'occupation de la mémoire
  • Utilisation efficace des ressources de calcul
  • Prise en charge des techniques de compression de modèles telles que la quantification et l'élagage

Conclusion

Ultralytics YOLO est l'une des solutions de vision par ordinateur les plus avancées et complètes actuellement disponibles. Il offre non seulement de puissantes performances de modèle, mais également une chaîne d'outils et un écosystème complets. Que ce soit pour la recherche académique, les applications industrielles ou les projets personnels, vous pouvez trouver une solution appropriée dans ce framework. Ses mises à jour et améliorations continues garantissent que les utilisateurs ont toujours accès aux dernières avancées technologiques et à la meilleure expérience utilisateur.

Star History Chart