Quatrième étape : Apprentissage profond et réseaux de neurones
Un tutoriel pratique sur la programmation de grands modèles développé par l'Université Jiao Tong de Shanghai, couvrant des ressources d'apprentissage complètes sur 11 thèmes centraux, notamment le fine-tuning et le déploiement, l'ingénierie des prompts, l'édition de modèles et les technologies de sécurité.
Présentation détaillée du cours "Apprendre les grands modèles par la pratique"
Aperçu du cours
"Apprendre les grands modèles par la pratique" est un ensemble de tutoriels pratiques de programmation de grands modèles, développé par l'Université Jiao Tong de Shanghai. Issu du cours de printemps 2024 sur les "Technologies de sécurité de l'intelligence artificielle" (NIS3353), ce tutoriel est dirigé par l'enseignant Zhang Zhuosheng. Il vise à fournir aux apprenants une référence de programmation d'introduction aux grands modèles et constitue une ressource éducative open source, entièrement gratuite et à but non lucratif.
Caractéristiques du tutoriel
- Orienté pratique : Aide les apprenants à démarrer rapidement avec les grands modèles grâce à des exercices simples.
- Entièrement gratuit : À but non lucratif, sans aucun frais.
- Combinaison industrie-académie : Extension des supports de cours d'une université de premier plan.
- Mises à jour continues : Une mise à jour majeure a été effectuée en juin 2025, ajoutant de nouveaux thèmes et du contenu localisé.
Contenu pédagogique principal
Structure des chapitres principaux
Chapitre 1 : Finetuning et Déploiement
- Points clés du contenu : Guide de finetuning et de déploiement des modèles pré-entraînés.
- Objectifs d'apprentissage : Maîtriser le choix des modèles pré-entraînés appropriés, leur finetuning pour des tâches spécifiques et le déploiement des modèles finetunés sous forme de démos utilisables.
- Ressources fournies :
- Support de cours (format PDF)
- Documentation détaillée du tutoriel
- Scripts pratiques (Jupyter Notebook)
Chapitre 2 : Ingénierie des invites
- Ressources d'apprentissage :
- Support de cours
dive-into-prompting.pdf
- Documentation du tutoriel
README.md
- Scripts pratiques
dive-prompting.ipynb
- Support de cours
Chapitre 3 : Édition de modèles
- Ressources d'apprentissage :
- Support de cours
dive_edit_0410.pdf
- Documentation complète du tutoriel
- Scripts pratiques
dive_edit.ipynb
- Support de cours
Chapitre 4 : Raisonnement mathématique
- Ressources d'apprentissage :
- Support de cours
math.pdf
- Documentation du tutoriel
- Scripts pratiques de raisonnement mathématique
sft_math.ipynb
- Support de cours
Chapitre 5 : Techniques de filigrane
- Ressources d'apprentissage :
- Support de cours
watermark.pdf
- Documentation du tutoriel
- Scripts pratiques
watermark.ipynb
- Support de cours
Chapitre 6 : Attaques de Jailbreak
- Ressources d'apprentissage :
- Support de cours
dive-Jailbreak.pdf
- Documentation du tutoriel
- Scripts pratiques
dive-jailbreak.ipynb
- Support de cours
Chapitre 7 : Stéganographie
- Ressources d'apprentissage :
- Support de cours
stega.pdf
- Documentation du tutoriel
- Scripts pratiques
llm_stega.ipynb
- Support de cours
Chapitre 8 : Grands modèles multimodaux
- Ressources d'apprentissage :
- Support de cours
mllms.pdf
- Documentation du tutoriel
- Scripts pratiques
mllms.ipynb
- Support de cours
Chapitre 9 : Agent GUI
- Ressources d'apprentissage :
- Support de cours
GUIagent.pdf
- Documentation du tutoriel
- Scripts pratiques
GUIagent.ipynb
- Support de cours
Chapitre 10 : Sécurité de l'IA
- Ressources d'apprentissage :
- Support de cours
dive-into-safety.pdf
- Documentation du tutoriel
- Scripts pratiques
agent.ipynb
- Support de cours
Chapitre 11 : Alignement des grands modèles (RLHF)
- Ressources d'apprentissage :
- Support de cours
RLHF.pdf
- Documentation du tutoriel
- Scripts pratiques
RLHF.ipynb
- Support de cours
Points forts spéciaux
Série "Processus complet de développement des grands modèles" localisée
Dans la mise à jour de juin 2025, le tutoriel, en collaboration avec la communauté Huawei Ascend, a lancé une version localisée :
- Support technique : Développé sur la base du matériel et des logiciels de base Huawei Ascend.
- Format du tutoriel : Comprend des PPT, des manuels de laboratoire, des vidéos et d'autres formats.
- Niveaux de difficulté : Divisé en séries débutant, intermédiaire et avancé.
- Parcours d'apprentissage : Adapté aux différents besoins de pratique des grands modèles.
- Orienté pratique : Présente les technologies de pointe sous forme de pratiques de code.
Structure des ressources d'apprentissage
Chaque chapitre fournit trois types de ressources essentielles :
- Support de cours (PDF) : Explications des connaissances théoriques et des concepts.
- Documentation du tutoriel (README.md) : Instructions détaillées étape par étape.
- Scripts pratiques (Jupyter Notebook) : Exemples de code exécutables.
Public cible
- Débutants souhaitant s'initier aux grands modèles.
- Étudiants ayant besoin de concevoir des projets de cours.
- Chercheurs menant des études académiques.
- Développeurs intéressés par la pratique des grands modèles.
- Professionnels souhaitant comprendre les technologies de sécurité de l'IA.
Caractéristiques techniques
- Très pratique : Chaque chapitre est accompagné de code exécutable correspondant.
- Bien structuré : Progression systématique des concepts de base aux applications avancées.
- À la pointe de la technologie : Couvre les dernières technologies de grands modèles et les problèmes de sécurité.
- Facile à comprendre : Issu d'un cours universitaire, avec un système pédagogique complet.
Accès et utilisation
- Open source et gratuit : Le projet est entièrement open source, accessible gratuitement à tous.
- Mises à jour continues : L'équipe du projet maintient et met à jour le contenu en permanence.
- Soutien de la communauté : Les soumissions d'issues et de pull requests sont les bienvenues.
- Contexte académique : Développé sur la base d'un cours officiel de l'Université Jiao Tong de Shanghai.
Historique des mises à jour
- Juin 2025 : Mise à jour majeure, ajout de contenu localisé et de nouveaux thèmes.
- Maintenance continue : L'équipe du projet met à jour et améliore régulièrement le contenu.
Note : Tout le contenu de ce tutoriel est basé sur l'expérience personnelle des contributeurs, les données Internet et l'accumulation de travaux de recherche, et est fourni à titre de référence et d'apprentissage uniquement.