Data Science & Machine Learning

Selon Andy

Data Engineering

Phenix

Qu’est ce que la Data Science ? 

La Data Science est la discipline qui permet à une entreprise d’explorer et d’analyser les données brutes pour les transformer en données activables, permettant de répondre aux problématiques business de l’entreprise. Ainsi, le data scientist explore une vaste base de données grâce à des algorithmes et des méthodes informatiques, comme le Machine Learning, et identifie ainsi des insights clés pour les enjeux business.

Qu’est ce que le Machine Learning ? 

Arthur Samuel, pionnier de lIntelligence Artificielle, définit le Machine Learning et le Deep Learning comme “le champ d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés à apprendre”.

Le Machine Learning est une branche de l’Intelligence Artificielle, et permet à des machines d’apprendre, à partir de large base de données, à résoudre des tâches sans avoir été programmées pour celles-ci spécifiquement.

Quelles sont les applications du Machine Learning  ? 

Les applications du Machine Learning dans notre quotidien sont de plus en plus nombreuses. Le Machine Learning est énormément utilisé par les géants technologiques, par exemple afin de maximiser la rétention des utilisateurs de leurs plateformes.

En effet, Spotify et Netflix utilisent les algorithmes de Machine Learning pour proposer un système de recommandations le plus efficace possible pour l’utilisateur. De même, Instagram et Facebook analysent les habitudes et centres d’intérêt des utilisateurs pour leur proposer le contenu qui répond le mieux à ces critères.

Quels sont les objectifs du Machine Learning ? 

L’objectif principal des algorithmes de Machine Learning est de comprendre une relation inconnue entre une variable et des paramètres, à partir d’un ensemble de données.

Les applications du Machine Learning sont de plusieurs types :

  • Prédiction : Détection de cancer à partir d’échantillons de sang, détection de fausses transactions bancaires…
  • Inférence : Quel est l’impact de la météo sur l’activité de la livraison à domicile ? Comment une campagne influence-t-elle l’évolution des ventes?

Quels sont les différents types de fonction d’apprentissage ? 

Il existe deux types d’apprentissage :

Le Machine Learning Supervisé : À partir d’un échantillon de données X, on essaye de prévoir une variable d’intérêt Y. On distingue deux sous-catégories dans le Machine Learning supervisé :

  • Prédiction (ou régression) : la variable d’intérêt est numérique
  • Classification : la variable d’intérêt est catégorique

Le Machine Learning Non-Supervisé : On prend simplement en compte des variables X, mais pas de variable d’intérêt correspondante. L’objectif est de comprendre la structure sous-jacente des données. On distingue également deux sous-catégories dans le Machine Learning non-supervisé :

  • Clustering : on fait des groupes de famille à partir des données
  • Association: on découvre des règles qui s’appliquent à une grande partie des données

Comment utiliser le Machine Learning pour répondre aux enjeux business de l’entreprise ? 

Lorsque l’on souhaite mettre en place un modèle de Machine Learning pour répondre à un besoin business, il est important de suivre un process particulier. Le principe est d’entraîner le modèle sur une partie des données (training dataset), puis de tester l’application du modèle sur l’autre partie des données (testing dataset). Ainsi, ce test simule le déploiement en production, et permet d’évaluer la performance du modèle. En général, on déploie le modèle selon le processus suivant : 

  1. Extraire les données sources
  2. Nettoyer et traiter les données sources
  3. Déterminer le modèle de Machine Learning que l’on souhaite appliquer
  4. Partitionner le dataset en deux parties distinctes
  5. Entrainer le modèle sur la première partie des données (training dataset)
  6. Tester le modèle sur la seconde partie des données (testing dataset)
  7. Revenir à l’étape 3 si le modèle n’est pas suffisamment performant
  8. Déployer le modèle en production

Les sujets associés à cette thématique :

Je construis mon programme sur-mesure

J’ai des fonctions RH ou formation

Je veux former mes équipes !

Je suis reponsable marketing, tech, ou sales

Je veux former mes équipes !

Je suis salarié ou indépendant

Je veux me former moi !