dmlc/dglPlease refer to the latest official releases for information GitHub Homepage

DGL (Deep Graph Library) est un paquet Python pour implémenter des réseaux neuronaux graphiques au-dessus de frameworks d'apprentissage profond tels que PyTorch et MXNet.

Apache-2.0Python 13.9kdmlc Last Updated: 2025-02-11

DGL (Deep Graph Library)

Aperçu du projet

DGL (Deep Graph Library) est une bibliothèque Python open source développée par DMLC (Distributed Machine Learning Community), axée sur la recherche et l'application des réseaux de neurones graphiques (Graph Neural Networks, GNN). DGL fournit une riche collection de structures de données graphiques, de couches de réseaux de neurones graphiques et d'implémentations d'algorithmes graphiques, dans le but d'aider les chercheurs et les développeurs à effectuer efficacement l'apprentissage profond sur les données graphiques.

Contexte

Les structures graphiques sont omniprésentes dans le monde réel, par exemple les réseaux sociaux, les graphes de connaissances, les structures moléculaires, etc. Les méthodes d'apprentissage profond traditionnelles ont du mal à traiter directement les données graphiques, car la structure des graphes est irrégulière et les connexions entre les nœuds sont complexes. Les réseaux de neurones graphiques (GNN) sont des modèles d'apprentissage profond spécialement conçus pour traiter les données graphiques. Ils sont capables d'apprendre les représentations des nœuds et des arêtes, et d'effectuer des tâches telles que la classification des nœuds, la prédiction des liens et la classification des graphes.

Cependant, l'implémentation et l'optimisation des GNN sont difficiles. Différents modèles de GNN ont différents mécanismes de transmission de messages et fonctions d'agrégation, et l'implémentation manuelle de ces modèles nécessite beaucoup de code et d'expertise. De plus, la taille des données graphiques est généralement importante, ce qui nécessite des méthodes de calcul et de stockage efficaces.

L'émergence de DGL vise à résoudre ces problèmes. Il fournit un cadre unifié qui simplifie le développement et le déploiement des GNN, et offre des capacités de calcul haute performance.

Caractéristiques principales

Facilité d'utilisation : DGL fournit une API Python concise, permettant aux utilisateurs de définir facilement des structures de graphes, d'implémenter des modèles de GNN et d'entraîner des modèles.
Haute performance : DGL utilise des structures de données et des noyaux de calcul optimisés, capables de traiter efficacement des données graphiques à grande échelle. Il prend en charge l'accélération GPU et fournit diverses techniques d'optimisation, telles que la planification de la transmission de messages et le partitionnement de graphes.
Flexibilité : DGL prend en charge divers modèles de GNN, notamment GCN, GAT, GraphSAGE, etc. Les utilisateurs peuvent également personnaliser l'architecture des GNN et utiliser les opérateurs fournis par DGL pour construire leurs propres modèles de GNN.
Extensibilité : DGL peut être intégré à d'autres frameworks d'apprentissage profond (tels que PyTorch et TensorFlow), permettant aux utilisateurs d'utiliser DGL pour traiter les données graphiques et d'utiliser d'autres frameworks pour construire d'autres parties du modèle.
Prise en charge des graphes hétérogènes : DGL prend en charge les graphes hétérogènes, c'est-à-dire les graphes qui peuvent contenir différents types de nœuds et d'arêtes. Cela permet à DGL de traiter des données graphiques plus complexes, telles que les graphes de connaissances.
Différenciation automatique : DGL s'intègre de manière transparente aux principaux frameworks d'apprentissage profond, prenant en charge la différenciation automatique, ce qui facilite l'entraînement et l'optimisation des modèles.
Riches exemples et tutoriels : DGL fournit de nombreux exemples et tutoriels pour aider les utilisateurs à démarrer rapidement et à maîtriser l'utilisation de DGL.

Scénarios d'application

DGL peut être appliqué à diverses tâches liées aux graphes, notamment :

Classification des nœuds : Prédiction de la catégorie des nœuds dans un graphe. Par exemple, prédire les centres d'intérêt des utilisateurs dans un réseau social, ou prédire le type des entités dans un graphe de connaissances.
Prédiction des liens : Prédiction de l'existence d'une connexion entre les nœuds dans un graphe. Par exemple, recommander des amis dans un réseau social, ou compléter les relations dans un graphe de connaissances.
Classification des graphes : Prédiction de la catégorie d'un graphe entier. Par exemple, prédire les propriétés des molécules en chimio-informatique, ou identifier les communautés dans un réseau social.
Génération de graphes : Génération de nouvelles structures de graphes. Par exemple, générer de nouvelles structures moléculaires dans la découverte de médicaments.
Systèmes de recommandation : Recommandation basée sur le graphe d'interaction entre les utilisateurs et les articles.
Traitement du langage naturel : Traitement des graphes de dépendance ou des graphes de connaissances du texte, pour la traduction automatique, les questions-réponses, etc.
Vision par ordinateur : Traitement des graphes de scène ou des graphes de relations des images, pour la reconnaissance d'images, la détection d'objets, etc.
Bio-informatique : Analyse des réseaux d'interaction protéine-protéine, des réseaux de régulation génique, etc.
Analyse des réseaux sociaux : Utilisation de DGL pour analyser les relations entre les utilisateurs, la propagation de l'information, etc., dans les réseaux sociaux.

DGL est de plus en plus utilisé par les chercheurs et les ingénieurs, et a obtenu des résultats significatifs.