Vous avez sûrement déjà entendu cette phrase : "On ne peut pas comparer des pommes et des oranges."
En statistique, c'est encore plus vrai. Vous ne pouvez pas additionner des noms de villes, calculer la moyenne d'un code postal, ou classer alphabétiquement des chiffres d'affaires. Cela paraît évident dit comme ça, non ?
Pourtant, c'est une erreur que même des professionnels expérimentés commettent régulièrement dans Excel ou Power BI. Ils tentent de faire des calculs sur des données qui ne s'y prêtent pas, et obtiennent des résultats absurdes.
Cette leçon peut sembler technique au premier abord, mais elle est absolument cruciale. Comprendre la nature de vos données, c'est savoir exactement ce que vous pouvez (ou ne pouvez pas) en faire. C'est la fondation de toute analyse sérieuse.
Imaginez : vous ne construiriez pas une maison sans connaître la différence entre du béton et du bois, n'est-ce pas ? C'est pareil avec les données.
Alors prenons le temps de bien comprendre ensemble. Vous allez voir, une fois que vous aurez saisi cette logique, tout deviendra limpide.
Qualitative vs quantitative : la grande distinction
Avant de rentrer dans les détails, commençons par la distinction la plus importante : qualitative ou quantitative ?
C'est la première question à vous poser face à n'importe quelle donnée.
Données qualitatives (catégorielles)
Définition simple :
Les données qualitatives décrivent une catégorie, un attribut, une caractéristique. Elles répondent aux questions : "Quel type ?", "Quelle catégorie ?", "Lequel ?"
Exemples concrets :
- Le secteur d'activité d'une entreprise (commerce, santé, éducation...)
- La ville de résidence d'un client (Douala, Yaoundé, Abidjan...)
- Le statut d'un dossier (en cours, validé, rejeté)
- Le mode de paiement (espèces, mobile money, virement)
- Le sexe (homme, femme)
Ce qu'on NE peut PAS faire :
Vous ne pouvez pas les "mesurer" au sens mathématique. Impossible de calculer la moyenne de secteurs d'activité ou d'additionner des villes.
Ce qu'on PEUT faire :
- Compter combien de fois chaque catégorie apparaît
- Calculer des proportions ou pourcentages
- Identifier la catégorie la plus fréquente (le mode)
Exemple d'analyse :
"Sur 500 clients, 45% paient en mobile money, 30% en espèces, et 25% par virement."
Données quantitatives (numériques)
Définition simple :
Les données quantitatives représentent une quantité, un nombre mesurable. Elles répondent aux questions : "Combien ?", "Quelle quantité ?", "Quelle mesure ?"
Exemples concrets :
- Le chiffre d'affaires mensuel (2 500 000 FCFA)
- Le nombre de commandes (47 commandes)
- L'âge des clients (32 ans)
- Le poids d'un colis (12,5 kg)
- La durée d'un appel téléphonique (8 minutes)
Ce qu'on PEUT faire :
Tous les calculs mathématiques : addition, soustraction, moyenne, médiane, écart-type, etc.
Exemple d'analyse :
"Le chiffre d'affaires moyen par client est de 85 000 FCFA, avec un minimum de 15 000 FCFA et un maximum de 450 000 FCFA."
⚠️ ATTENTION — Le piège des "faux quantitatifs"
Voici une erreur classique : certaines données ressemblent à des chiffres, mais ne sont PAS quantitatives.
Exemples piégeux :
- Un numéro de téléphone : 699123456 est un chiffre... mais vous n'allez jamais faire la moyenne des numéros de téléphone ! C'est une étiquette, donc qualitatif.
- Un code postal : pareil. Additionner des codes postaux n'a aucun sens.
- Un numéro de client : Client001, Client002... c'est juste un identifiant, pas une quantité.
Règle d'or :
Demandez-vous : "Est-ce que faire un calcul mathématique sur cette donnée a du sens ?" Si non, c'est qualitatif, même si ça ressemble à un chiffre.

Les 4 échelles de mesure (du plus simple au plus précis)
Maintenant que vous maîtrisez la distinction qualitative/quantitative, allons plus loin.
Toutes les données ne se valent pas. Certaines sont plus "riches" en information que d'autres. C'est ce qu'on appelle les échelles de mesure.
Il en existe quatre, classées de la plus simple à la plus complète. Plus l'échelle est élevée, plus vous pouvez faire de calculs sophistiqués.
Voyons-les ensemble, une par une.
Échelle nominale (la plus simple)
Caractéristique principale :
Des catégories sans aucun ordre logique entre elles.
Exemples :
- Sexe : homme, femme
- Couleur : rouge, bleu, vert
- Type de produit : chaussures, vêtements, accessoires
- Ville : Douala, Yaoundé, Cotonou
- Mode de paiement : cash, mobile money, carte
Ce qu'on PEUT faire :
- Compter le nombre d'observations dans chaque catégorie
- Calculer des proportions et pourcentages
- Identifier la catégorie la plus fréquente (le mode)
Ce qu'on NE PEUT PAS faire :
- Les ordonner (il n'y a pas de "premier" ou "dernier")
- Calculer une moyenne
- Faire des opérations mathématiques
Exemple d'utilisation :
Un magasin analyse ses ventes par catégorie de produits. Il découvre que 40% des ventes viennent des chaussures, 35% des vêtements, 25% des accessoires. C'est tout ce qu'on peut dire. On ne peut pas "moyenner" ces catégories.
Échelle ordinale (avec un ordre)
Caractéristique principale :
Des catégories avec un ordre logique, mais où l'écart entre les catégories n'est pas forcément égal.
Exemples :
- Niveau de satisfaction : très insatisfait, insatisfait, neutre, satisfait, très satisfait
- Niveau d'études : primaire, secondaire, supérieur
- Classement : 1er, 2ème, 3ème
- Taille d'entreprise : TPE, PME, Grande entreprise
- Niveau de risque : faible, moyen, élevé
Ce qu'on PEUT faire :
- Tout ce qu'on fait avec le nominal (compter, pourcentages)
- Trier ou ordonner les données
- Identifier la médiane (la valeur du milieu)
Ce qu'on NE PEUT PAS faire :
- Calculer une moyenne de façon rigoureuse (même si c'est souvent tenté)
- Dire que l'écart entre "satisfait" et "très satisfait" est le même qu'entre "insatisfait" et "neutre"
Pourquoi cette limite ?
L'écart entre les niveaux n'est pas mesurable. Par exemple, la différence de satisfaction entre "neutre" et "satisfait" n'est pas forcément la même qu'entre "satisfait" et "très satisfait". C'est subjectif.
Exemple d'utilisation :
Une entreprise interroge ses clients sur leur satisfaction. Elle peut dire : "60% de nos clients sont satisfaits ou très satisfaits" et "la satisfaction médiane est 'satisfait'". Mais calculer une "moyenne" en donnant des points (1, 2, 3, 4, 5) est une approximation discutable.
📦 EN PRATIQUE — L'astuce du "test de l'écart"
Pour savoir si une donnée est ordinale ou supérieure, posez-vous cette question :
"L'écart entre chaque niveau est-il exactement le même et mesurable ?"
- Si non → c'est ordinal (exemple : satisfaction)
- Si oui → c'est une échelle supérieure (intervalle ou ratio)
Échelle d'intervalle (écarts égaux)
Caractéristique principale :
Une mesure avec des intervalles égaux entre les valeurs, mais sans zéro absolu (le zéro ne signifie pas "absence totale").
L'exemple classique :
La température en degrés Celsius (°C)
Pourquoi ? Parce que :
- L'écart entre 10°C et 20°C est le même qu'entre 20°C et 30°C (10 degrés)
- Mais 0°C ne signifie pas l'absence totale de chaleur (il fait juste froid)
- Et vous ne pouvez pas dire que 20°C est "deux fois plus chaud" que 10°C (ce n'est pas un ratio)
Autres exemples possibles :
- Année calendaire (2020, 2021, 2022... mais l'an 0 n'est qu'une convention)
- Échelle de notation standardisée (ex : QI)
Ce qu'on PEUT faire :
- Tout ce qu'on fait avec l'ordinal
- Calculer des moyennes et des écarts
- Faire des additions et soustractions (écarts de température)
Ce qu'on NE PEUT PAS faire :
- Faire des ratios ou des divisions de façon significative
- Dire "deux fois plus" ou "trois fois moins"
Exemple d'utilisation :
Vous analysez la température moyenne mensuelle. Vous pouvez dire : "La température moyenne en juillet est de 28°C, soit 5°C de plus qu'en juin." Mais vous ne pouvez pas dire "il fait deux fois plus chaud qu'en janvier".
Note importante :
En pratique, dans le monde de la data business, l'échelle d'intervalle est assez rare. La majorité de vos données seront nominales, ordinales, ou... de type ratio (la plus riche). C'est ce que nous voyons maintenant.
Échelle de ratio (la plus complète)
Caractéristique principale :
C'est le niveau le plus élevé. Vous avez des intervalles égaux ET un zéro absolu qui signifie "absence totale".
Exemples (les plus courants en data business) :
- Chiffre d'affaires (0 FCFA = aucun revenu)
- Nombre de clients (0 = aucun client)
- Poids (0 kg = aucun poids)
- Distance (0 km = aucune distance)
- Âge (0 an = naissance)
- Durée (0 minute = pas de temps écoulé)
Ce qu'on PEUT faire :
- TOUS les calculs statistiques et mathématiques possibles
- Moyennes, médianes, écarts-types
- Additions, soustractions
- Multiplications, divisions, ratios
- Dire "deux fois plus", "trois fois moins", "50% de plus"
Pourquoi c'est si puissant ?
Parce que le zéro a un sens absolu. Si votre CA est de 2 millions de FCFA et celui de votre concurrent de 1 million, vous pouvez affirmer objectivement que votre CA est deux fois plus élevé.
Exemple d'utilisation :
Vous analysez vos ventes. Vous pouvez dire : "Notre CA moyen par client est de 75 000 FCFA. Le client le plus dépensier a acheté pour 500 000 FCFA, soit 6,7 fois la moyenne."

✅ À RETENIR
Plus votre échelle est "élevée", plus vous avez de possibilités d'analyse.
Ratio > Intervalle > Ordinal > Nominal
La bonne nouvelle ? En data business, la majorité de vos indicateurs clés (CA, nombre de clients, quantités vendues, durées) sont de type ratio, donc exploitables à 100%.
Pourquoi ce choix impacte les calculs possibles
Maintenant que vous connaissez les 4 échelles, voyons concrètement pourquoi c'est si important pour votre travail quotidien.
Exemple concret fil rouge : base clients d'une PME
Imaginons que vous gérez une base de données clients pour une entreprise de distribution. Voici quelques colonnes typiques :
| Nom du client | Ville | Segment | Montant dépensé (FCFA) | Date d'inscription |
|---|---|---|---|---|
| Kouassi Jean | Abidjan | Or | 850 000 | 15/03/2023 |
| Aminata Sow | Dakar | Bronze | 120 000 | 22/08/2024 |
| etc. | ... | ... | ... | ... |
Analysons chaque colonne :
1. Nom du client
- Type : Qualitatif
- Échelle : Nominale
- Calculs possibles : Compter combien de clients
- Ce qu'on NE fait PAS : calculer une "moyenne des noms" (absurde !)
2. Ville
- Type : Qualitatif
- Échelle : Nominale
- Calculs possibles : Compter combien de clients par ville, identifier la ville avec le plus de clients
- Ce qu'on NE fait PAS : classer les villes dans un ordre (aucun sens)
3. Segment (Bronze / Argent / Or)
- Type : Qualitatif
- Échelle : Ordinale (il y a un ordre : Bronze < Argent < Or)
- Calculs possibles : Trier les clients par segment, voir quel segment a le plus de clients, identifier le segment médian
- Ce qu'on NE fait PAS : calculer la "moyenne" des segments (même si on est parfois tenté de coder Bronze=1, Argent=2, Or=3... c'est discutable)
4. Montant dépensé
- Type : Quantitatif
- Échelle : Ratio (0 FCFA = n'a rien acheté)
- Calculs possibles : TOUT → moyenne, médiane, total, écart-type, minimum, maximum, ratios
- Exemple : "Le montant moyen dépensé par client Or est de 750 000 FCFA, soit 6 fois plus que les clients Bronze"
5. Date d'inscription
- Type : Quantitatif (on peut mesurer le temps)
- Échelle : Intervalle ou Ratio selon l'usage
- Calculs possibles : Calculer l'ancienneté moyenne des clients, identifier les nouveaux vs anciens clients
Erreurs fréquentes à éviter
Voici trois erreurs que je vois tout le temps dans Excel ou Power BI, même chez des professionnels :
❌ Erreur 1 : Calculer la "moyenne" d'une échelle ordinale
Exemple :
Vous codez vos niveaux de satisfaction : Très insatisfait=1, Insatisfait=2, Neutre=3, Satisfait=4, Très satisfait=5.
Puis vous calculez la "moyenne" : 3,7.
Problème :
Cette moyenne suppose que l'écart entre chaque niveau est identique. Mais "neutre → satisfait" n'a pas forcément la même "intensité" que "satisfait → très satisfait".
Solution :
Préférez des analyses en pourcentage : "65% de nos clients sont satisfaits ou très satisfaits" ou utilisez la médiane.
❌ Erreur 2 : Traiter du nominal comme du quantitatif
Exemple :
Vous avez codé vos secteurs d'activité : Commerce=1, Santé=2, Éducation=3.
Puis Excel affiche automatiquement une "somme" ou une "moyenne" de ces codes.
Problème :
Ces chiffres ne veulent absolument rien dire. Ce sont juste des étiquettes.
Solution :
Toujours bien paramétrer vos colonnes dans Excel/Power BI pour indiquer qu'il s'agit de catégories, pas de nombres.
❌ Erreur 3 : Faire des ratios sur des intervalles
Exemple :
Dire "Il fait 30°C aujourd'hui, c'est deux fois plus chaud qu'hier où il faisait 15°C".
Problème :
Non, ce n'est pas deux fois plus chaud. Si vous convertissez en Kelvin (échelle de ratio pour la température), 30°C = 303K et 15°C = 288K. Le ratio n'est plus du tout de 2.
Solution :
Sur une échelle d'intervalle, vous pouvez dire "il fait 15°C de plus", mais pas "deux fois plus chaud".

📦 EN PRATIQUE — Votre checklist avant toute analyse
Avant de lancer une analyse dans Excel, Power BI ou tout autre outil :
Étape 1 : Listez toutes vos colonnes de données
Étape 2 : Pour chaque colonne, demandez-vous :
- Est-ce qualitatif ou quantitatif ?
- Quelle est l'échelle de mesure ? (Nominale / Ordinale / Intervalle / Ratio)
Étape 3 : Déterminez quels calculs sont possibles
- Nominale → compter, pourcentages
- Ordinale → trier, médiane
- Intervalle → moyenne, écart
- Ratio → TOUT
Étape 4 : Configurez vos outils en conséquence
- Dans Excel : utilisez des "listes" pour les nominales et ordinales
- Dans Power BI : définissez correctement le type de colonne (texte, nombre, date)
Cette checklist vous évitera 90% des erreurs d'analyse.
Conclusion
Bravo ! Vous venez de franchir une étape cruciale dans votre apprentissage de la data.
Je sais que cette leçon peut sembler un peu dense. C'est normal. Vous venez d'apprendre à "lire" vos données comme un professionnel. Et croyez-moi, cette compétence va vous servir tous les jours.
Récapitulons ce que vous maîtrisez maintenant :
✅ La distinction fondamentale : qualitatif vs quantitatif
✅ Les 4 échelles de mesure : nominale, ordinale, intervalle, ratio
✅ Quels calculs sont autorisés pour chaque type de donnée
✅ Comment éviter les erreurs classiques d'interprétation
Pourquoi c'est si important ?
Parce que cette connaissance détermine :
- Quel graphique vous pouvez créer
- Quelle statistique vous pouvez calculer
- Quelle conclusion vous pouvez tirer
Un analyste qui ne maîtrise pas cela ressemble à un cuisinier qui ne fait pas la différence entre du sel et du sucre. Il va obtenir des résultats... mais pas ceux attendus.
Et maintenant ?
Vous savez CE QUE vous mesurez (les types de données).
La prochaine étape logique est de comprendre SUR QUOI vous le mesurez.
Devez-vous analyser TOUS vos clients ou seulement un échantillon ? Comment être sûr que vos conclusions sont valides ? Quels sont les pièges à éviter ?
C'est précisément ce que nous allons voir dans la Leçon 1.3 : Population, échantillon et biais.
Vous allez découvrir comment collecter intelligemment vos données pour qu'elles soient représentatives et fiables.
Prêt à continuer ? Alors passons à la suite ! 🎯
À RETENIR
- Toutes les données ne se ressemblent pas : qualitatives vs quantitatives
- 4 échelles de mesure : nominale < ordinale < intervalle < ratio
- Plus l'échelle est "élevée", plus vous pouvez faire de calculs sophistiqués
- Avant toute analyse : identifiez le type de chaque donnée
- Un n° de téléphone ou code postal = qualitatif (piège classique !)
- Type ratio = le plus puissant pour l'analyse business (CA, quantités, durées...)
