Deuxième étape : Apprentissage automatique classique
Notes complètes en chinois du cours d'apprentissage automatique de Stanford d'Andrew Ng, comprenant 18 chapitres couvrant le contenu de base aux applications, fournissant divers supports d'apprentissage.
Présentation du projet de notes de cours sur l'apprentissage automatique d'Andrew Ng
Aperçu du projet
Il s'agit d'un projet GitHub créé par (fengdu78), dédié à la collecte et à l'organisation des notes de cours en chinois du cours d'apprentissage automatique d'Andrew Ng de l'Université de Stanford en 2014. Ce projet vise à aider les apprenants sinophones à mieux comprendre et maîtriser les bases de l'apprentissage automatique.
Contexte du projet
- Source du cours: Cours d'apprentissage automatique d'Andrew Ng de l'Université de Stanford, 2014
- Adresse du cours: https://www.coursera.org/course/ml
- Date de création: Traduction commencée au second semestre 2014, finalisé le 26 mars 2018
- Objectif du projet: Fournir des ressources d'apprentissage de l'apprentissage automatique de haute qualité aux apprenants sinophones
Structure du contenu du projet
Description des dossiers
docx
: Version Word des notesmarkdown
: Version Markdown des noteshtml
: Version HTML des notesimages
: Matériel image des notesppt
: Diapositives PPT originales du courssrt
: Sous-titres chinois et anglais du courscode
: Implémentation du code Python du cours
Plan du contenu du cours
Première partie : Concepts fondamentaux
Introduction
- Qu'est-ce que l'apprentissage automatique ?
- Apprentissage supervisé
- Apprentissage non supervisé
Régression linéaire à une variable
- Représentation du modèle
- Fonction de coût
- Descente de gradient
Révision de l'algèbre linéaire
- Matrices et vecteurs
- Opérations matricielles
- Inverse, Transposée
Deuxième partie : Algorithmes classiques
Régression linéaire à plusieurs variables
- Caractéristiques multidimensionnelles
- Descente de gradient à plusieurs variables
- Équation normale
Tutoriel Octave
- Opérations de base
- Traitement des données
- Vectorisation
Régression logistique
- Problèmes de classification
- Représentation de l'hypothèse
- Optimisation avancée
Troisième partie : Techniques avancées
Régularisation
- Problème de surapprentissage (Overfitting)
- Régression linéaire régularisée
- Régression logistique régularisée
Réseaux de neurones : Représentation
- Hypothèses non linéaires
- Modèle de neurone
- Classification multiclasse
Réseaux de neurones : Apprentissage
- Algorithme de rétropropagation
- Vérification du gradient
- Initialisation aléatoire
Quatrième partie : Applications pratiques
Conseils pour l'application de l'apprentissage automatique
- Évaluation du modèle
- Validation croisée
- Biais et variance
Conception de systèmes d'apprentissage automatique
- Analyse des erreurs
- Précision et rappel
- Données pour l'apprentissage automatique
Machines à vecteurs de support (SVM)
- Objectif d'optimisation
- Fonctions noyau
- Utilisation des machines à vecteurs de support
Cinquième partie : Apprentissage non supervisé
Clustering (Regroupement)
- Algorithme K-means
- Objectif d'optimisation
- Choix du nombre de clusters
Réduction de dimensionnalité
- Analyse en composantes principales (ACP)
- Compression de données
- Visualisation de données
Détection d'anomalies
- Distribution gaussienne
- Algorithme de détection d'anomalies
- Distribution gaussienne multivariée
Sixième partie : Applications pratiques
Systèmes de recommandation
- Recommandation basée sur le contenu
- Filtrage collaboratif
- Décomposition matricielle
Apprentissage automatique à grande échelle
- Descente de gradient stochastique
- Apprentissage en ligne
- Map-Reduce
Exemple d'application : Reconnaissance optique de caractères (OCR) sur images
- Fenêtre glissante
- Acquisition de grandes quantités de données
- Analyse des plafonds (Ceiling analysis)
Caractéristiques du projet
1. Exhaustivité
- Couvre les théories fondamentales de l'apprentissage automatique jusqu'aux applications pratiques
- Comprend 18 chapitres, du niveau débutant au niveau avancé
- Fournit des vidéos de cours complètes, des PPT et du code
2. Prise en charge de plusieurs formats
- Propose plusieurs formats : Word, Markdown, HTML
- Permet la consultation en ligne et l'apprentissage hors ligne
- Formules mathématiques traitées en images pour un affichage facile en ligne
3. Localisation en chinois
- Spécialement traduit et organisé pour les apprenants sinophones
- Intègre les habitudes d'apprentissage et les modes de pensée chinois
- Fournit des sous-titres chinois et anglais pour comparaison
Ressources d'apprentissage
Ressources en ligne
- Dépôt GitHub: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
- Vidéos du cours: https://www.bilibili.com/video/BV1W34y1i7xK
- Ressources Baidu Cloud: Fournit des vidéos et du matériel de cours à télécharger
Public cible
- Débutants en apprentissage automatique
- Étudiants en informatique
- Professionnels de la science des données
- Passionnés d'intelligence artificielle
- Apprenants ayant besoin de matériel d'étude en chinois
Valeur du projet
- Valeur éducative: Fournit du matériel d'introduction à l'apprentissage automatique de haute qualité aux apprenants sinophones
- Valeur pratique: Contient des connaissances théoriques complètes et du code pratique
- Valeur sociale: Abaisse la barrière à l'apprentissage de l'apprentissage automatique et promeut la diffusion des connaissances
- Valeur open source: Incarné l'esprit open source, encourageant le partage des connaissances et la collaboration
Conclusion
Ce projet est une ressource importante dans le domaine de l'éducation à l'apprentissage automatique en chinois. Grâce à une traduction et une organisation systématiques, il fournit un matériel d'apprentissage de haute qualité aux nombreux apprenants sinophones. Le projet est non seulement complet en termes de contenu et diversifié en formats, mais il a également établi une communauté d'apprentissage, incarnant l'esprit open source de "donner une rose, laisser un parfum dans la main".