deepspeedai/DeepSpeedView GitHub Homepage for Latest Official Releases

DeepSpeed est une bibliothèque d'optimisation pour l'apprentissage profond conçue pour rendre l'entraînement distribué simple, efficace et puissant. Il prend en charge l'entraînement de modèles à grande échelle et propose diverses techniques d'optimisation, telles que l'optimiseur ZeRO, le parallélisme pipeline et le parallélisme tenseur, afin d'améliorer la vitesse d'entraînement et de réduire l'empreinte mémoire.

Apache-2.0PythonDeepSpeeddeepspeedai 39.7k Last Updated: August 10, 2025

DeepSpeed

Aperçu du projet

DeepSpeed est une bibliothèque d'optimisation de l'apprentissage profond développée par Microsoft, conçue pour rendre l'entraînement à grande échelle de modèles d'apprentissage profond plus facile, plus efficace et plus économique. Elle se concentre sur la résolution des problèmes liés aux limitations de mémoire, à l'efficacité du calcul et aux coûts de communication rencontrés lors de l'entraînement de grands modèles. DeepSpeed propose une série de technologies innovantes qui peuvent considérablement améliorer la vitesse d'entraînement, réduire les coûts d'entraînement et prendre en charge l'entraînement de modèles à plus grande échelle.

Contexte

Avec l'augmentation constante de la taille des modèles d'apprentissage profond, les ressources de calcul nécessaires à l'entraînement de ces modèles augmentent également de manière exponentielle. Les méthodes d'entraînement traditionnelles sont confrontées à de nombreux défis lors du traitement de grands modèles, tels que :

Limitations de mémoire : Les grands modèles nécessitent une grande quantité de mémoire pour stocker les paramètres du modèle, les valeurs d'activation et les gradients. La capacité de mémoire d'un seul GPU est souvent insuffisante pour répondre à la demande.
Efficacité du calcul : L'entraînement de grands modèles nécessite une grande quantité de ressources de calcul, et le temps d'entraînement peut être très long.
Coûts de communication : Dans l'entraînement distribué, différents appareils doivent échanger des données fréquemment, et les coûts de communication peuvent devenir un goulot d'étranglement en termes de performances.

DeepSpeed a été créé précisément pour résoudre ces problèmes. Grâce à une série de techniques d'optimisation, il rend possible l'entraînement de grands modèles.

Caractéristiques principales

DeepSpeed offre les caractéristiques principales suivantes pour améliorer l'efficacité et l'évolutivité de l'entraînement de l'apprentissage profond :

ZeRO (Zero Redundancy Optimizer) : ZeRO est une technique d'optimisation de la mémoire qui réduit considérablement l'utilisation de la mémoire par appareil en fragmentant les paramètres du modèle, les gradients et l'état de l'optimiseur sur plusieurs appareils. DeepSpeed propose différents niveaux d'optimisation ZeRO, que les utilisateurs peuvent choisir en fonction de leurs besoins.
- ZeRO-Offload : Décharge une partie des calculs et de la charge de mémoire sur le CPU, réduisant ainsi davantage l'utilisation de la mémoire GPU.
Entraînement en précision mixte (Mixed Precision Training) : DeepSpeed prend en charge l'entraînement en utilisant FP16 (nombres à virgule flottante en demi-précision), ce qui peut réduire l'utilisation de la mémoire et augmenter la vitesse de calcul sans perte de précision.
Accumulation de gradients (Gradient Accumulation) : En accumulant les gradients de plusieurs petits lots, il est possible de simuler une taille de lot plus importante, ce qui améliore la stabilité de l'entraînement et la vitesse de convergence.
Communication efficace (Efficient Communication) : DeepSpeed optimise les opérations de communication dans l'entraînement distribué, telles que all-reduce et all-gather, réduisant ainsi les coûts de communication.
Mise à l'échelle dynamique de la perte (Dynamic Loss Scaling) : Dans l'entraînement en précision mixte, la mise à l'échelle dynamique de la perte peut empêcher le dépassement de capacité des gradients, améliorant ainsi la stabilité de l'entraînement.
Compatibilité DeepSpeed : DeepSpeed est facile à intégrer dans les modèles PyTorch existants, et seules quelques modifications de code sont nécessaires pour utiliser ses fonctions d'optimisation.
Prise en charge de plusieurs stratégies de parallélisation : DeepSpeed prend en charge plusieurs stratégies de parallélisation, telles que la parallélisation des données, la parallélisation des modèles et la parallélisation des pipelines. Les utilisateurs peuvent choisir la stratégie appropriée en fonction de leur modèle et de leur environnement matériel.
Réglage automatique : DeepSpeed fournit des outils de réglage automatique qui peuvent aider les utilisateurs à trouver la meilleure configuration d'entraînement.

Scénarios d'application

DeepSpeed est adapté aux scénarios d'application suivants :

Entraînement de modèles ultra-larges : DeepSpeed peut aider les utilisateurs à entraîner des modèles avec des centaines de milliards, voire des milliers de milliards de paramètres, tels que les grands modèles de langage (LLM).
Environnements à ressources limitées : DeepSpeed peut être utilisé pour l'entraînement dans des environnements à ressources limitées, par exemple pour l'entraînement de grands modèles sur un seul GPU.
Accélération du processus d'entraînement : DeepSpeed peut considérablement améliorer la vitesse d'entraînement et réduire le temps d'entraînement.
Réduction des coûts d'entraînement : DeepSpeed peut réduire les ressources de calcul nécessaires à l'entraînement, réduisant ainsi les coûts d'entraînement.
Exploration scientifique : DeepSpeed fournit aux chercheurs des outils puissants pour explorer des modèles à plus grande échelle et des méthodes d'entraînement plus complexes.

En résumé, DeepSpeed est une bibliothèque d'optimisation de l'apprentissage profond puissante qui peut aider les utilisateurs à entraîner des grands modèles plus facilement et plus efficacement. Elle a de larges perspectives d'application dans des domaines tels que le traitement du langage naturel et la vision par ordinateur.

DeepSpeed

Aperçu du projet

Contexte

Caractéristiques principales

Scénarios d'application

Pour tous les détails, veuillez vous référer au site officiel (https://github.com/deepspeedai/DeepSpeed)