Deuxième étape : Apprentissage automatique classique

Un guide pratique d'apprentissage automatique conçu pour les programmeurs, axé sur une explication approfondie et l'implémentation de code d'un petit nombre d'algorithmes puissants.

MLPythonKaggleWebSiteebookFreeEnglish

Les Mécanismes de l'Apprentissage Automatique - Présentation détaillée du cours

Informations de base

Titre du livre : The Mechanics of Machine Learning
Auteurs : Terence Parr et Jeremy Howard
Site web : https://mlbook.explained.ai/
Droits d'auteur : Copyright © 2018-2019 Terence Parr. Tous droits réservés
Langue : Anglais
Format : Version web en ligne (formats HTML et PDF)
Coût : Gratuit

Aperçu du cours

Ceci est un livre d'introduction à l'apprentissage automatique conçu spécifiquement pour les programmeurs, visant à aider les lecteurs à maîtriser rapidement les concepts fondamentaux et les applications pratiques de l'apprentissage automatique. Le livre adopte une approche unique, "se concentrant sur un petit nombre de modèles puissants", plutôt que d'explorer un large éventail d'algorithmes d'apprentissage automatique comme le font de nombreux manuels.

Caractéristiques principales

  • Orienté praticité : L'auteur avertit avec humour que "le contenu de ce livre est tellement pratique que vous pourrez l'utiliser dans votre travail réel".
  • Concentration sur les algorithmes clés : Se focalise sur un petit nombre de modèles puissants qui sont extrêmement efficaces pour résoudre des problèmes réels.
  • Crédibilité : Le co-auteur Jeremy Howard a utilisé les modèles présentés dans ce livre pour remporter la première place aux compétitions Kaggle.com pendant deux années consécutives.
  • Explication approfondie : Grâce à une approche étroite et approfondie, il y a amplement d'espace pour expliquer en détail les modèles, les processus d'entraînement et de test.
  • Implémentation de code : Fournit des descriptions intuitives et des implémentations de code complètes.

Contexte des auteurs

Terence Parr

  • Professeur au département d'informatique et de science des données de l'Université de San Francisco.
  • Ancien directeur fondateur du programme de maîtrise en analyse de l'Université de San Francisco (qui est devenu plus tard le programme de maîtrise en science des données).
  • Responsable technique chez Google, ancien professeur d'informatique/science des données.
  • Contributeur actif aux projets open source, spécialisé dans les outils de productivité de l'IA générative.

Jeremy Howard

  • Co-fondateur de fast.ai.
  • Légende des compétitions Kaggle, ayant remporté la première place pendant deux années consécutives.
  • Expert renommé dans le domaine de l'apprentissage profond.

Méthodes et caractéristiques pédagogiques

1. Conçu pour les programmeurs

  • Spécialement conçu pour les lecteurs ayant une expérience en programmation.
  • Fournit des implémentations de code complètes.
  • Combine théorie et pratique.

2. Axé sur des cas pratiques

  • Utilise des cas réels de compétitions Kaggle (comme la prédiction des ventes de bulldozers).
  • Processus détaillé d'analyse exploratoire des données (EDA).
  • Flux complet d'entraînement du modèle.

3. Apprentissage interactif

  • Le site web associé fournit des matériaux supplémentaires.
  • Jeux de données et dépôts de code pour une exploration plus approfondie.
  • Prend en charge les fonctionnalités d'annotation et de commentaires publics.

Pile technologique et outils

Ce livre utilise les outils et technologies suivants :

  • Langage de programmation : Python
  • Génération de documents : Utilise Bookish pour générer à partir de sources mark-up + markdown + python + latex.
  • Données réelles : Jeux de données des compétitions Kaggle.
  • Framework d'apprentissage automatique : scikit-learn et d'autres outils courants.

Objectifs d'apprentissage

En étudiant ce livre, les lecteurs seront capables de :

  1. Comprendre le fonctionnement de l'apprentissage automatique

    • Maîtriser les mécanismes internes des algorithmes fondamentaux.
    • Comprendre le processus détaillé d'entraînement et de test des modèles.
  2. Capacité d'application pratique

    • Appliquer l'apprentissage automatique à des problèmes réels.
    • Gérer le processus complet de traitement des jeux de données réels.
  3. Compétences de niveau compétition

    • Apprendre à utiliser des modèles efficaces et éprouvés en situation réelle.
    • Maîtriser le prétraitement des données et l'ingénierie des caractéristiques.

Public cible

  • Public principal : Programmeurs ayant une expérience en programmation.
  • Public secondaire : Débutants en science des données, praticiens de l'apprentissage automatique.
  • Prérequis : Posséder des connaissances de base en programmation, notamment en Python.
  • Prérequis mathématiques : Notions de base en statistiques et algèbre linéaire.

État du cours

  • Projet en cours : L'auteur indique qu'il continuera d'ajouter des chapitres et d'effectuer des modifications.
  • Dernière mise à jour : De nouveaux chapitres sur l'EDA et l'entraînement des modèles ont été publiés en 2019.
  • Soutien de la communauté : Prend en charge les retours et suggestions des lecteurs.

Modes d'accès

  • Site officiel : https://mlbook.explained.ai/
  • Format : Version HTML en ligne et téléchargement PDF.
  • Coût : Entièrement gratuit.
  • Restrictions : Veuillez ne pas copier ou redistribuer sur le web ou de quelque manière que ce soit.

Évaluations et impact

Ce livre a reçu des évaluations positives au sein de la communauté de l'apprentissage automatique, étant considéré comme :

  • Une excellente ressource pour les programmeurs souhaitant débuter rapidement en apprentissage automatique.
  • Un manuel typique combinant théorie et pratique.
  • Un guide d'apprentissage automatique axé sur la praticité.

Note : Le contenu de ce livre est "tellement peu excitant que vous pourrez l'utiliser dans votre travail réel" – il s'agit d'une expression humoristique de l'auteur, soulignant le caractère pratique du livre.