Deuxième étape : Apprentissage automatique classique

Notes complètes en chinois du cours d'apprentissage automatique de Stanford d'Andrew Ng, comprenant 18 chapitres couvrant le contenu de base aux applications, fournissant divers supports d'apprentissage.

MachineLearningAndrewNgCourseraGitHubTextFreeChinese

Présentation du projet de notes de cours sur l'apprentissage automatique d'Andrew Ng

Aperçu du projet

Il s'agit d'un projet GitHub créé par (fengdu78), dédié à la collecte et à l'organisation des notes de cours en chinois du cours d'apprentissage automatique d'Andrew Ng de l'Université de Stanford en 2014. Ce projet vise à aider les apprenants sinophones à mieux comprendre et maîtriser les bases de l'apprentissage automatique.

Contexte du projet

Source du cours: Cours d'apprentissage automatique d'Andrew Ng de l'Université de Stanford, 2014
Adresse du cours: https://www.coursera.org/course/ml
Date de création: Traduction commencée au second semestre 2014, finalisé le 26 mars 2018
Objectif du projet: Fournir des ressources d'apprentissage de l'apprentissage automatique de haute qualité aux apprenants sinophones

Structure du contenu du projet

Description des dossiers

docx: Version Word des notes
markdown: Version Markdown des notes
html: Version HTML des notes
images: Matériel image des notes
ppt: Diapositives PPT originales du cours
srt: Sous-titres chinois et anglais du cours
code: Implémentation du code Python du cours

Plan du contenu du cours

Première partie : Concepts fondamentaux

Introduction
- Qu'est-ce que l'apprentissage automatique ?
- Apprentissage supervisé
- Apprentissage non supervisé
Régression linéaire à une variable
- Représentation du modèle
- Fonction de coût
- Descente de gradient
Révision de l'algèbre linéaire
- Matrices et vecteurs
- Opérations matricielles
- Inverse, Transposée

Deuxième partie : Algorithmes classiques

Régression linéaire à plusieurs variables
- Caractéristiques multidimensionnelles
- Descente de gradient à plusieurs variables
- Équation normale
Tutoriel Octave
- Opérations de base
- Traitement des données
- Vectorisation
Régression logistique
- Problèmes de classification
- Représentation de l'hypothèse
- Optimisation avancée

Troisième partie : Techniques avancées

Régularisation
- Problème de surapprentissage (Overfitting)
- Régression linéaire régularisée
- Régression logistique régularisée
Réseaux de neurones : Représentation
- Hypothèses non linéaires
- Modèle de neurone
- Classification multiclasse
Réseaux de neurones : Apprentissage
- Algorithme de rétropropagation
- Vérification du gradient
- Initialisation aléatoire

Quatrième partie : Applications pratiques

Conseils pour l'application de l'apprentissage automatique
- Évaluation du modèle
- Validation croisée
- Biais et variance
Conception de systèmes d'apprentissage automatique
- Analyse des erreurs
- Précision et rappel
- Données pour l'apprentissage automatique
Machines à vecteurs de support (SVM)
- Objectif d'optimisation
- Fonctions noyau
- Utilisation des machines à vecteurs de support

Cinquième partie : Apprentissage non supervisé

Clustering (Regroupement)
- Algorithme K-means
- Objectif d'optimisation
- Choix du nombre de clusters
Réduction de dimensionnalité
- Analyse en composantes principales (ACP)
- Compression de données
- Visualisation de données
Détection d'anomalies
- Distribution gaussienne
- Algorithme de détection d'anomalies
- Distribution gaussienne multivariée

Sixième partie : Applications pratiques

Systèmes de recommandation
- Recommandation basée sur le contenu
- Filtrage collaboratif
- Décomposition matricielle
Apprentissage automatique à grande échelle
- Descente de gradient stochastique
- Apprentissage en ligne
- Map-Reduce
Exemple d'application : Reconnaissance optique de caractères (OCR) sur images
- Fenêtre glissante
- Acquisition de grandes quantités de données
- Analyse des plafonds (Ceiling analysis)

Caractéristiques du projet

1. Exhaustivité

Couvre les théories fondamentales de l'apprentissage automatique jusqu'aux applications pratiques
Comprend 18 chapitres, du niveau débutant au niveau avancé
Fournit des vidéos de cours complètes, des PPT et du code

2. Prise en charge de plusieurs formats

Propose plusieurs formats : Word, Markdown, HTML
Permet la consultation en ligne et l'apprentissage hors ligne
Formules mathématiques traitées en images pour un affichage facile en ligne

3. Localisation en chinois

Spécialement traduit et organisé pour les apprenants sinophones
Intègre les habitudes d'apprentissage et les modes de pensée chinois
Fournit des sous-titres chinois et anglais pour comparaison

Ressources d'apprentissage

Ressources en ligne

Dépôt GitHub: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
Vidéos du cours: https://www.bilibili.com/video/BV1W34y1i7xK
Ressources Baidu Cloud: Fournit des vidéos et du matériel de cours à télécharger

Public cible

Débutants en apprentissage automatique
Étudiants en informatique
Professionnels de la science des données
Passionnés d'intelligence artificielle
Apprenants ayant besoin de matériel d'étude en chinois

Valeur du projet

Valeur éducative: Fournit du matériel d'introduction à l'apprentissage automatique de haute qualité aux apprenants sinophones
Valeur pratique: Contient des connaissances théoriques complètes et du code pratique
Valeur sociale: Abaisse la barrière à l'apprentissage de l'apprentissage automatique et promeut la diffusion des connaissances
Valeur open source: Incarné l'esprit open source, encourageant le partage des connaissances et la collaboration

Conclusion

Ce projet est une ressource importante dans le domaine de l'éducation à l'apprentissage automatique en chinois. Grâce à une traduction et une organisation systématiques, il fournit un matériel d'apprentissage de haute qualité aux nombreux apprenants sinophones. Le projet est non seulement complet en termes de contenu et diversifié en formats, mais il a également établi une communauté d'apprentissage, incarnant l'esprit open source de "donner une rose, laisser un parfum dans la main".