1.2 — Types de données et échelles de mesure - Statistiques & Mathématiques pour la Data | CoachData

Vous avez sûrement déjà entendu cette phrase : "On ne peut pas comparer des pommes et des oranges."

En statistique, c'est encore plus vrai. Vous ne pouvez pas additionner des noms de villes, calculer la moyenne d'un code postal, ou classer alphabétiquement des chiffres d'affaires. Cela paraît évident dit comme ça, non ?

Pourtant, c'est une erreur que même des professionnels expérimentés commettent régulièrement dans Excel ou Power BI. Ils tentent de faire des calculs sur des données qui ne s'y prêtent pas, et obtiennent des résultats absurdes.

Cette leçon peut sembler technique au premier abord, mais elle est absolument cruciale. Comprendre la nature de vos données, c'est savoir exactement ce que vous pouvez (ou ne pouvez pas) en faire. C'est la fondation de toute analyse sérieuse.

Imaginez : vous ne construiriez pas une maison sans connaître la différence entre du béton et du bois, n'est-ce pas ? C'est pareil avec les données.

Alors prenons le temps de bien comprendre ensemble. Vous allez voir, une fois que vous aurez saisi cette logique, tout deviendra limpide.

Qualitative vs quantitative : la grande distinction

Avant de rentrer dans les détails, commençons par la distinction la plus importante : qualitative ou quantitative ?

C'est la première question à vous poser face à n'importe quelle donnée.

Données qualitatives (catégorielles)

Définition simple :
Les données qualitatives décrivent une catégorie, un attribut, une caractéristique. Elles répondent aux questions : "Quel type ?", "Quelle catégorie ?", "Lequel ?"

Exemples concrets :

Le secteur d'activité d'une entreprise (commerce, santé, éducation...)
La ville de résidence d'un client (Douala, Yaoundé, Abidjan...)
Le statut d'un dossier (en cours, validé, rejeté)
Le mode de paiement (espèces, mobile money, virement)
Le sexe (homme, femme)

Ce qu'on NE peut PAS faire :
Vous ne pouvez pas les "mesurer" au sens mathématique. Impossible de calculer la moyenne de secteurs d'activité ou d'additionner des villes.

Ce qu'on PEUT faire :

Compter combien de fois chaque catégorie apparaît
Calculer des proportions ou pourcentages
Identifier la catégorie la plus fréquente (le mode)

Exemple d'analyse :
"Sur 500 clients, 45% paient en mobile money, 30% en espèces, et 25% par virement."

Données quantitatives (numériques)

Définition simple :
Les données quantitatives représentent une quantité, un nombre mesurable. Elles répondent aux questions : "Combien ?", "Quelle quantité ?", "Quelle mesure ?"

Exemples concrets :

Le chiffre d'affaires mensuel (2 500 000 FCFA)
Le nombre de commandes (47 commandes)
L'âge des clients (32 ans)
Le poids d'un colis (12,5 kg)
La durée d'un appel téléphonique (8 minutes)

Ce qu'on PEUT faire :
Tous les calculs mathématiques : addition, soustraction, moyenne, médiane, écart-type, etc.

Exemple d'analyse :
"Le chiffre d'affaires moyen par client est de 85 000 FCFA, avec un minimum de 15 000 FCFA et un maximum de 450 000 FCFA."

⚠️ ATTENTION — Le piège des "faux quantitatifs"

Voici une erreur classique : certaines données ressemblent à des chiffres, mais ne sont PAS quantitatives.

Exemples piégeux :

Un numéro de téléphone : 699123456 est un chiffre... mais vous n'allez jamais faire la moyenne des numéros de téléphone ! C'est une étiquette, donc qualitatif.
Un code postal : pareil. Additionner des codes postaux n'a aucun sens.
Un numéro de client : Client001, Client002... c'est juste un identifiant, pas une quantité.

Règle d'or :
Demandez-vous : "Est-ce que faire un calcul mathématique sur cette donnée a du sens ?" Si non, c'est qualitatif, même si ça ressemble à un chiffre.

Données qualitatives et quantitatives

Les 4 échelles de mesure (du plus simple au plus précis)

Maintenant que vous maîtrisez la distinction qualitative/quantitative, allons plus loin.

Toutes les données ne se valent pas. Certaines sont plus "riches" en information que d'autres. C'est ce qu'on appelle les échelles de mesure.

Il en existe quatre, classées de la plus simple à la plus complète. Plus l'échelle est élevée, plus vous pouvez faire de calculs sophistiqués.

Voyons-les ensemble, une par une.

Échelle nominale (la plus simple)

Caractéristique principale :
Des catégories sans aucun ordre logique entre elles.

Exemples :

Sexe : homme, femme
Couleur : rouge, bleu, vert
Type de produit : chaussures, vêtements, accessoires
Ville : Douala, Yaoundé, Cotonou
Mode de paiement : cash, mobile money, carte

Ce qu'on PEUT faire :

Compter le nombre d'observations dans chaque catégorie
Calculer des proportions et pourcentages
Identifier la catégorie la plus fréquente (le mode)

Ce qu'on NE PEUT PAS faire :

Les ordonner (il n'y a pas de "premier" ou "dernier")
Calculer une moyenne
Faire des opérations mathématiques

Exemple d'utilisation :
Un magasin analyse ses ventes par catégorie de produits. Il découvre que 40% des ventes viennent des chaussures, 35% des vêtements, 25% des accessoires. C'est tout ce qu'on peut dire. On ne peut pas "moyenner" ces catégories.

Échelle ordinale (avec un ordre)

Caractéristique principale :
Des catégories avec un ordre logique, mais où l'écart entre les catégories n'est pas forcément égal.

Exemples :

Niveau de satisfaction : très insatisfait, insatisfait, neutre, satisfait, très satisfait
Niveau d'études : primaire, secondaire, supérieur
Classement : 1er, 2ème, 3ème
Taille d'entreprise : TPE, PME, Grande entreprise
Niveau de risque : faible, moyen, élevé

Ce qu'on PEUT faire :

Tout ce qu'on fait avec le nominal (compter, pourcentages)
Trier ou ordonner les données
Identifier la médiane (la valeur du milieu)

Ce qu'on NE PEUT PAS faire :

Calculer une moyenne de façon rigoureuse (même si c'est souvent tenté)
Dire que l'écart entre "satisfait" et "très satisfait" est le même qu'entre "insatisfait" et "neutre"

Pourquoi cette limite ?
L'écart entre les niveaux n'est pas mesurable. Par exemple, la différence de satisfaction entre "neutre" et "satisfait" n'est pas forcément la même qu'entre "satisfait" et "très satisfait". C'est subjectif.

Exemple d'utilisation :
Une entreprise interroge ses clients sur leur satisfaction. Elle peut dire : "60% de nos clients sont satisfaits ou très satisfaits" et "la satisfaction médiane est 'satisfait'". Mais calculer une "moyenne" en donnant des points (1, 2, 3, 4, 5) est une approximation discutable.

📦 EN PRATIQUE — L'astuce du "test de l'écart"

Pour savoir si une donnée est ordinale ou supérieure, posez-vous cette question :

"L'écart entre chaque niveau est-il exactement le même et mesurable ?"

Si non → c'est ordinal (exemple : satisfaction)
Si oui → c'est une échelle supérieure (intervalle ou ratio)

Échelle d'intervalle (écarts égaux)

Caractéristique principale :
Une mesure avec des intervalles égaux entre les valeurs, mais sans zéro absolu (le zéro ne signifie pas "absence totale").

L'exemple classique :
La température en degrés Celsius (°C)

Pourquoi ? Parce que :

L'écart entre 10°C et 20°C est le même qu'entre 20°C et 30°C (10 degrés)
Mais 0°C ne signifie pas l'absence totale de chaleur (il fait juste froid)
Et vous ne pouvez pas dire que 20°C est "deux fois plus chaud" que 10°C (ce n'est pas un ratio)

Autres exemples possibles :

Année calendaire (2020, 2021, 2022... mais l'an 0 n'est qu'une convention)
Échelle de notation standardisée (ex : QI)

Ce qu'on PEUT faire :

Tout ce qu'on fait avec l'ordinal
Calculer des moyennes et des écarts
Faire des additions et soustractions (écarts de température)

Ce qu'on NE PEUT PAS faire :

Faire des ratios ou des divisions de façon significative
Dire "deux fois plus" ou "trois fois moins"

Exemple d'utilisation :
Vous analysez la température moyenne mensuelle. Vous pouvez dire : "La température moyenne en juillet est de 28°C, soit 5°C de plus qu'en juin." Mais vous ne pouvez pas dire "il fait deux fois plus chaud qu'en janvier".

Note importante :
En pratique, dans le monde de la data business, l'échelle d'intervalle est assez rare. La majorité de vos données seront nominales, ordinales, ou... de type ratio (la plus riche). C'est ce que nous voyons maintenant.

Échelle de ratio (la plus complète)

Caractéristique principale :
C'est le niveau le plus élevé. Vous avez des intervalles égaux ET un zéro absolu qui signifie "absence totale".

Exemples (les plus courants en data business) :

Chiffre d'affaires (0 FCFA = aucun revenu)
Nombre de clients (0 = aucun client)
Poids (0 kg = aucun poids)
Distance (0 km = aucune distance)
Âge (0 an = naissance)
Durée (0 minute = pas de temps écoulé)

Ce qu'on PEUT faire :

TOUS les calculs statistiques et mathématiques possibles
Moyennes, médianes, écarts-types
Additions, soustractions
Multiplications, divisions, ratios
Dire "deux fois plus", "trois fois moins", "50% de plus"

Pourquoi c'est si puissant ?
Parce que le zéro a un sens absolu. Si votre CA est de 2 millions de FCFA et celui de votre concurrent de 1 million, vous pouvez affirmer objectivement que votre CA est deux fois plus élevé.

Exemple d'utilisation :
Vous analysez vos ventes. Vous pouvez dire : "Notre CA moyen par client est de 75 000 FCFA. Le client le plus dépensier a acheté pour 500 000 FCFA, soit 6,7 fois la moyenne."

Les 4 échelles de mesure

✅ À RETENIR

Plus votre échelle est "élevée", plus vous avez de possibilités d'analyse.

Ratio > Intervalle > Ordinal > Nominal

La bonne nouvelle ? En data business, la majorité de vos indicateurs clés (CA, nombre de clients, quantités vendues, durées) sont de type ratio, donc exploitables à 100%.

Pourquoi ce choix impacte les calculs possibles

Maintenant que vous connaissez les 4 échelles, voyons concrètement pourquoi c'est si important pour votre travail quotidien.

Exemple concret fil rouge : base clients d'une PME

Imaginons que vous gérez une base de données clients pour une entreprise de distribution. Voici quelques colonnes typiques :

Nom du client	Ville	Segment	Montant dépensé (FCFA)	Date d'inscription
Kouassi Jean	Abidjan	Or	850 000	15/03/2023
Aminata Sow	Dakar	Bronze	120 000	22/08/2024
etc.	...	...	...	...

Analysons chaque colonne :

1. Nom du client

Type : Qualitatif
Échelle : Nominale
Calculs possibles : Compter combien de clients
Ce qu'on NE fait PAS : calculer une "moyenne des noms" (absurde !)

2. Ville

Type : Qualitatif
Échelle : Nominale
Calculs possibles : Compter combien de clients par ville, identifier la ville avec le plus de clients
Ce qu'on NE fait PAS : classer les villes dans un ordre (aucun sens)

3. Segment (Bronze / Argent / Or)

Type : Qualitatif
Échelle : Ordinale (il y a un ordre : Bronze < Argent < Or)
Calculs possibles : Trier les clients par segment, voir quel segment a le plus de clients, identifier le segment médian
Ce qu'on NE fait PAS : calculer la "moyenne" des segments (même si on est parfois tenté de coder Bronze=1, Argent=2, Or=3... c'est discutable)

4. Montant dépensé

Type : Quantitatif
Échelle : Ratio (0 FCFA = n'a rien acheté)
Calculs possibles : TOUT → moyenne, médiane, total, écart-type, minimum, maximum, ratios
Exemple : "Le montant moyen dépensé par client Or est de 750 000 FCFA, soit 6 fois plus que les clients Bronze"

5. Date d'inscription

Type : Quantitatif (on peut mesurer le temps)
Échelle : Intervalle ou Ratio selon l'usage
Calculs possibles : Calculer l'ancienneté moyenne des clients, identifier les nouveaux vs anciens clients

Erreurs fréquentes à éviter

Voici trois erreurs que je vois tout le temps dans Excel ou Power BI, même chez des professionnels :

❌ Erreur 1 : Calculer la "moyenne" d'une échelle ordinale

Exemple :
Vous codez vos niveaux de satisfaction : Très insatisfait=1, Insatisfait=2, Neutre=3, Satisfait=4, Très satisfait=5.

Puis vous calculez la "moyenne" : 3,7.

Problème :
Cette moyenne suppose que l'écart entre chaque niveau est identique. Mais "neutre → satisfait" n'a pas forcément la même "intensité" que "satisfait → très satisfait".

Solution :
Préférez des analyses en pourcentage : "65% de nos clients sont satisfaits ou très satisfaits" ou utilisez la médiane.

❌ Erreur 2 : Traiter du nominal comme du quantitatif

Exemple :
Vous avez codé vos secteurs d'activité : Commerce=1, Santé=2, Éducation=3.

Puis Excel affiche automatiquement une "somme" ou une "moyenne" de ces codes.

Problème :
Ces chiffres ne veulent absolument rien dire. Ce sont juste des étiquettes.

Solution :
Toujours bien paramétrer vos colonnes dans Excel/Power BI pour indiquer qu'il s'agit de catégories, pas de nombres.

❌ Erreur 3 : Faire des ratios sur des intervalles

Exemple :
Dire "Il fait 30°C aujourd'hui, c'est deux fois plus chaud qu'hier où il faisait 15°C".

Problème :
Non, ce n'est pas deux fois plus chaud. Si vous convertissez en Kelvin (échelle de ratio pour la température), 30°C = 303K et 15°C = 288K. Le ratio n'est plus du tout de 2.

Solution :
Sur une échelle d'intervalle, vous pouvez dire "il fait 15°C de plus", mais pas "deux fois plus chaud".

calculs sont autorisés selon le type de données

📦 EN PRATIQUE — Votre checklist avant toute analyse

Avant de lancer une analyse dans Excel, Power BI ou tout autre outil :

Étape 1 : Listez toutes vos colonnes de données

Étape 2 : Pour chaque colonne, demandez-vous :

Est-ce qualitatif ou quantitatif ?
Quelle est l'échelle de mesure ? (Nominale / Ordinale / Intervalle / Ratio)

Étape 3 : Déterminez quels calculs sont possibles

Nominale → compter, pourcentages
Ordinale → trier, médiane
Intervalle → moyenne, écart
Ratio → TOUT

Étape 4 : Configurez vos outils en conséquence

Dans Excel : utilisez des "listes" pour les nominales et ordinales
Dans Power BI : définissez correctement le type de colonne (texte, nombre, date)

Cette checklist vous évitera 90% des erreurs d'analyse.

Conclusion

Bravo ! Vous venez de franchir une étape cruciale dans votre apprentissage de la data.

Je sais que cette leçon peut sembler un peu dense. C'est normal. Vous venez d'apprendre à "lire" vos données comme un professionnel. Et croyez-moi, cette compétence va vous servir tous les jours.

Récapitulons ce que vous maîtrisez maintenant :

✅ La distinction fondamentale : qualitatif vs quantitatif
✅ Les 4 échelles de mesure : nominale, ordinale, intervalle, ratio
✅ Quels calculs sont autorisés pour chaque type de donnée
✅ Comment éviter les erreurs classiques d'interprétation

Pourquoi c'est si important ?

Parce que cette connaissance détermine :

Quel graphique vous pouvez créer
Quelle statistique vous pouvez calculer
Quelle conclusion vous pouvez tirer

Un analyste qui ne maîtrise pas cela ressemble à un cuisinier qui ne fait pas la différence entre du sel et du sucre. Il va obtenir des résultats... mais pas ceux attendus.

Et maintenant ?

Vous savez CE QUE vous mesurez (les types de données).

La prochaine étape logique est de comprendre SUR QUOI vous le mesurez.

Devez-vous analyser TOUS vos clients ou seulement un échantillon ? Comment être sûr que vos conclusions sont valides ? Quels sont les pièges à éviter ?

C'est précisément ce que nous allons voir dans la Leçon 1.3 : Population, échantillon et biais.

Vous allez découvrir comment collecter intelligemment vos données pour qu'elles soient représentatives et fiables.

Prêt à continuer ? Alors passons à la suite ! 🎯

À RETENIR

Toutes les données ne se ressemblent pas : qualitatives vs quantitatives
4 échelles de mesure : nominale < ordinale < intervalle < ratio
Plus l'échelle est "élevée", plus vous pouvez faire de calculs sophistiqués
Avant toute analyse : identifiez le type de chaque donnée
Un n° de téléphone ou code postal = qualitatif (piège classique !)
Type ratio = le plus puissant pour l'analyse business (CA, quantités, durées...)

Navigation

Domaines

Articles

1.2 — Types de données et échelles de mesure

Qualitative vs quantitative : la grande distinction

Données qualitatives (catégorielles)

Données quantitatives (numériques)

Les 4 échelles de mesure (du plus simple au plus précis)

Échelle nominale (la plus simple)

Échelle ordinale (avec un ordre)

Échelle d'intervalle (écarts égaux)

Échelle de ratio (la plus complète)

Pourquoi ce choix impacte les calculs possibles

Exemple concret fil rouge : base clients d'une PME

Erreurs fréquentes à éviter

Conclusion

Navigation

Domaines

Articles