Data Modeling

Selon Andy

Data Engineer

Phenix

Qu’est-ce que le data modeling ?

Le data modeling, ou modélisation des données, est le processus qui consiste à représenter sous forme de diagramme descriptif les liens existants entre les différents éléments qui sont stockés dans une base de données.

L’objectif principal du data modeling est d’avoir une représentation claire, efficace, et universelle de tous les éléments présents dans la base de données, ainsi que des relations qui existent entre ces éléments. Cette représentation permet ainsi d’identifier la méthode la plus optimale de stockage des données.

Comment représenter les données le plus clairement possible ?

En général, on représente les différentes tables en faisant apparaître le nom de la table et l’ensemble des variables qui sont présentes dans la table.

Dans chaque table, on indique quelle est la clé primaire. La clé primaire est la variable  (ou groupe de variables) qui permet d’identifier de manière unique les lignes de la table. Une clé primaire peut être composée d’une ou de plusieurs colonnes de la table. La clé primaire est en général un identifiant unique. Les clés étrangères permettent de gérer les relations entre les différentes tables, et garantissent la cohérence des données entre les tables. 

Prenons l’exemple d’une entreprise e-commerce qui possède la base de données suivante :

  • Une table contenant les informations de ses clients (Clients)
  • Une table contenant les informations de l’ensemble de ses produits (Produits)
  • Une table contenant la liste des achats réalisés par les clients (Achats)

Dans cet exemple, la variable ClientId est la clé primaire de la table Clients. En effet, il y a une ligne par client, il ne peut donc pas y avoir plusieurs lignes avec la même valeur de Clientid. De même, la variable Productid est la clé primaire de la table Produits, car il y a une ligne pour chaque produit. En revanche, Clientid et Productid sont les clés étrangères de la table Achats, c’est-à-dire que toutes les valeurs de Clientid et Productid qui se trouvent dans la table Achats doivent aussi se trouver dans les tables Clients et Produits.

Quels outils utiliser pour faire une modélisation de données ?

Avant d’utiliser un outil de data modeling, il faut tout d’abord comprendre les flux existants entre votre environnement. Vous devez ainsi déterminer les relations qui relient chaque table entre elles. Une fois qu’un schéma a été préétabli, ces outils vous aideront à finaliser votre modèle:

  • EdrawMax est un outil gratuit, rapide et open source qui permet la construction d’un modèle facilement lisible
  • VisualParadigm permet d’exporter votre base de données grâce à l’Entity Relationship Diagram, et de créer des rapports personnalisés.
  • La simplicité et la gratuité de Draw.io est optimal pour des nouveaux utilisateurs. Cet outil est également compatible avec tous les navigateurs internet.
  • Enfin, PowerDesign est parfait pour modeler des données complexes. Il a la capacité d’effectuer des analyses d’impact et de gérer des documents multi-modèles.
660

Je construis mon programme sur-mesure

J’ai des fonctions RH ou formation

Je veux former mes équipes !

Je suis reponsable marketing, tech, ou sales

Je veux former mes équipes !

Je suis salarié ou indépendant

Je veux me former moi !