Home
Login

Troisième étape : Données et ingénierie des caractéristiques

Une liste triée sur le volet de ressources dédiées aux techniques d'ingénierie des caractéristiques pour l'apprentissage automatique, couvrant les méthodes et outils d'ingénierie des caractéristiques pour divers types de données tels que les données numériques, textuelles, d'image, catégorielles, de séries temporelles, etc.

FeatureEngineeringMachineLearningDataScienceGitHubTextFreeEnglish

Présentation du projet Awesome Feature Engineering

Aperçu du projet

Awesome Feature Engineering est une liste sélectionnée de ressources techniques dédiées à l'ingénierie des caractéristiques en apprentissage automatique. Le projet est maintenu par Andrei Khobnia et est sous licence Creative Commons Attribution-Noncommercial-ShareAlike 3.0 Unported License.

Il offre aux praticiens de l'apprentissage automatique une bibliothèque complète de ressources techniques d'ingénierie des caractéristiques, couvrant les méthodes et outils pour différents types de données.

Principales catégories de contenu

1. Données numériques (Numeric Data)

  • Transformation des données :

    • Transformation de Box-Cox : scipy.stats.boxcox
    • Transformation logarithmique : np.log (x + const)
  • Ingénierie des caractéristiques automatisée :

    • Featuretools : pour l'ingénierie des caractéristiques automatisée
  • Interaction des caractéristiques :

    • sklearn.preprocessing.PolynomialFeatures : génération de caractéristiques polynomiales
    • Opérations de division
    • Autres caractéristiques interactives

2. Données textuelles (Textual Data)

3. Données d'image (Image Data)

4. Données catégorielles (Categorical Data)

5. Données de séries temporelles (Time Series Data)

6. Données géospatiales (Geospatial Data)

  • Inclut les techniques d'ingénierie des caractéristiques liées à la géolocalisation.

Caractéristiques du projet

  1. Exhaustivité : couvre les principaux types de données et les techniques d'ingénierie des caractéristiques correspondantes en apprentissage automatique.
  2. Aspect pratique : fournit des bibliothèques d'outils et des implémentations de code concrètes.
  3. Caractère open source : utilise une licence open source et encourage les contributions de la communauté.
  4. Autorité : renvoie à des documentations, tutoriels et ressources académiques fiables.
  5. Aspect opérationnel : propose des bibliothèques Python spécifiques et des méthodes d'appel de fonctions.

Utilité

Ce projet est particulièrement utile pour les personnes suivantes :

  • Ingénieurs en apprentissage automatique
  • Scientifiques des données
  • Chercheurs en ingénierie des caractéristiques
  • Débutants en apprentissage automatique
  • Praticiens souhaitant améliorer les performances de leurs modèles

Comment contribuer

Le projet encourage les contributions de la communauté, en créant des pull requests pour ajouter de nouvelles ressources ou améliorer le contenu existant.

Résumé

Le projet Awesome Feature Engineering offre une bibliothèque de ressources complète et pratique pour l'ingénierie des caractéristiques en apprentissage automatique, constituant une référence essentielle pour l'apprentissage et l'application des techniques d'ingénierie des caractéristiques. Grâce à une classification systématique et à de nombreux liens vers des ressources, il aide les praticiens à trouver rapidement les méthodes d'ingénierie des caractéristiques adaptées à des types de données spécifiques.