Home
Login

Un framework d'apprentissage automatique unifié pour le modèle en tant que service (MaaS), offrant une solution unique pour l'inférence, l'entraînement et l'évaluation des modèles.

Apache-2.0Python 8.0kmodelscope Last Updated: 2025-06-19

Présentation détaillée du projet ModelScope

Aperçu du projet

ModelScope est un framework d'apprentissage automatique unifié et open source développé par l'Académie Damo d'Alibaba, basé sur le concept de "Modèle en tant que Service" (Model-as-a-Service, MaaS). Ce projet vise à intégrer les modèles d'apprentissage automatique les plus avancés de la communauté de l'IA, simplifiant ainsi le processus d'utilisation des modèles d'IA dans les applications pratiques.

Adresse du projet : https://github.com/modelscope/modelscope

Concept clé

ModelScope est basé sur le concept clé de "Modèle en tant que Service" (MaaS), et s'engage à :

  • Intégrer les modèles d'apprentissage automatique les plus avancés de la communauté de l'IA
  • Simplifier le processus d'utilisation des modèles d'IA dans les applications pratiques
  • Fournir une interface d'accès aux modèles unifiée
  • Réduire la barrière à l'entrée pour l'utilisation de la technologie de l'IA

Principales caractéristiques

1. Interface API unifiée

  • Fournit des couches d'abstraction API riches
  • Une expérience unifiée pour explorer les derniers modèles dans divers domaines
  • Couvre des domaines tels que la vision par ordinateur (CV), le traitement du langage naturel (NLP), la parole, le multimodal et le calcul scientifique

2. Simple et facile à utiliser

  • Inférence de modèle : Seulement 3 lignes de code sont nécessaires pour réaliser l'inférence de modèle
  • Entraînement de modèle : Seulement 10 lignes de code sont nécessaires pour réaliser le fine-tuning de modèle
  • Expérience prête à l'emploi

3. Conception modulaire

  • Architecture de conception modulaire
  • Implémentation de modules fonctionnels riches
  • Facile pour les utilisateurs de personnaliser les processus d'inférence et d'entraînement de modèles

4. Support de l'entraînement distribué

  • Supporte le parallélisme des données
  • Supporte le parallélisme des modèles
  • Supporte diverses stratégies d'entraînement telles que le parallélisme hybride
  • Particulièrement adapté à l'entraînement de grands modèles

Domaines de modèles pris en charge

Grands modèles de langage (LLM)

  • Modèles de la série GPT
  • Modèles de génération de poésie chinoise
  • Modèles de génération de texte

Modèles multimodaux

  • Compréhension texte-image
  • Modèles vision-langage

Vision par ordinateur (CV)

  • Modèles de reconnaissance de texte
  • Modèles de détourage de portrait
  • Modèles de détection d'images

Traitement de la parole (Audio)

  • Reconnaissance vocale Paraformer
  • Détection de point final de la parole
  • Prédiction d'horodatage de la parole
  • Modèles de synthèse vocale

IA pour la science

  • Modèles de calcul scientifique
  • Applications d'IA axées sur la recherche

Architecture technique

Frameworks d'apprentissage profond pris en charge

  • PyTorch (1.8+)
  • TensorFlow (1.15+ ou 2.0+)
  • ONNX

Environnement d'exécution

  • Version Python : 3.7+
  • Système d'exploitation : Linux, Windows, macOS
  • Support matériel : CPU, GPU

Support Docker

Fournit des images Docker officielles, notamment :

  • Image de version CPU
  • Image de version GPU
  • Support de plusieurs versions de Python

Méthode d'installation

Installation de base

pip install modelscope

Installation de domaine professionnel

# Modèles multimodaux
pip install modelscope[multi-modal]

# Traitement du langage naturel
pip install modelscope[nlp]

# Vision par ordinateur
pip install modelscope[cv]

# Traitement de la parole
pip install modelscope[audio]

# Calcul scientifique
pip install modelscope[science]

Exemples d'utilisation

Exemple d'inférence de modèle

# Segmentation de mots chinois
from modelscope.pipelines import pipeline
word_segmentation = pipeline('word-segmentation',
                           model='damo/nlp_structbert_word-segmentation_chinese-base')
result = word_segmentation('今天天气不错,适合出去游玩')
print(result)  # {'output': '今天 天气 不错 , 适合 出去 游玩'}

# Détourage de portrait
import cv2
from modelscope.pipelines import pipeline
portrait_matting = pipeline('portrait-matting')
result = portrait_matting('image_url')
cv2.imwrite('result.png', result['output_img'])

Exemple d'entraînement de modèle

from modelscope.metainfo import Trainers
from modelscope.msdatasets import MsDataset
from modelscope.trainers import build_trainer

# Charger le jeu de données
train_dataset = MsDataset.load('chinese-poetry-collection', split='train')
eval_dataset = MsDataset.load('chinese-poetry-collection', split='test')

# Configurer les paramètres d'entraînement
kwargs = dict(
    model='damo/nlp_gpt3_text-generation_1.3B',
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    max_epochs=10,
    work_dir='./gpt3_poetry'
)

# Construire l'entraîneur et commencer l'entraînement
trainer = build_trainer(name=Trainers.gpt3_trainer, default_args=kwargs)
trainer.train()

Écosystème de modèles

Nombre de modèles

  • 700+ modèles disponibles publiquement
  • Bibliothèque de modèles en croissance continue
  • Couvre les derniers développements dans plusieurs domaines de l'IA

Qualité des modèles

  • De nombreux modèles représentent l'état de l'art (SOTA) dans leurs domaines respectifs
  • Plusieurs modèles ont été publiés en open source pour la première fois sur ModelScope
  • Testés et validés rigoureusement

Expérience en ligne

  • L'effet du modèle peut être expérimenté en ligne via le site Web ModelScope
  • Fournit un environnement de développement cloud ModelScope Notebook
  • Environnement de développement CPU/GPU en un clic

Intégration des services backend

Intégration Model-Hub

  • Recherche et découverte de modèles
  • Contrôle de version
  • Gestion du cache

Intégration Dataset-Hub

  • Gestion des jeux de données
  • Contrôle de version des données
  • Flux de traitement des données transparent

Avantages du développement

1. Réduire la barrière à l'entrée

  • Conception d'interface unifiée
  • Appel d'API simplifié
  • Documentation et exemples riches

2. Améliorer l'efficacité du développement

  • Modèles prêts à l'emploi
  • Processus d'entraînement standardisé
  • Configuration automatisée de l'environnement

3. Support de la personnalisation

  • Conception modulaire flexible
  • Support des composants personnalisés
  • Architecture extensible

4. Caractéristiques de niveau entreprise

  • Support MLOps complet
  • Capacité d'entraînement distribué
  • Support du déploiement en environnement de production

Conclusion

ModelScope est un framework d'apprentissage automatique unifié puissant et facile à utiliser qui, grâce au concept de "Modèle en tant que Service", fournit aux développeurs un écosystème complet de modèles d'IA. Que ce soit pour les débutants ou les développeurs professionnels, ils peuvent rapidement construire et déployer des applications d'IA grâce à ModelScope, favorisant ainsi la vulgarisation et l'application de la technologie de l'IA.