Des données représentatives.
La moyenne ou la médiane pour représenter des données? Découvrez pourquoi nous avons choisi la médiane pour mesurer les performances de nos sites Web.
Jusqu'à récemment, la mesure de choix pour évaluer les performances des sites Web que nous concevions était la moyenne. Cependant, nous étions conscients que la moyenne pouvait s'avérer trompeuse, notamment en présence de valeurs aberrantes ou extrêmes. 🥶
Nous avions connaissance d'autres indicateurs statistiques pouvant offrir une perspective plus équilibrée, parmi lesquels la médiane. La médiane est un indicateur couramment utilisé certains rapports, tels que ceux produits par le projet HTTP Archive.
Toutefois, en raison de notre moindre familiarité avec cet indicateur, nous avons entrepris des recherches et des expériences pour déterminer lequel des deux privilégier.
Définitions
Voici ci-dessous les définitions de ces indicateurs, tirées de la Vitrine linguistique de l'Office québécois de la langue française :
[La moyenne est la] valeur variable correspondant à la somme de N termes d'une série statistique divisée par leur nombre N. – OQLF
[La médiane est], dans une série de données classées par ordre de grandeur, [la] donnée située au milieu de la série, de sorte qu'elle sépare cette série en deux parties égales. – OQLF
En d'autres mots, la moyenne est la somme des termes d'une liste, divisée par le nombre de termes qu'elle contient. Alors que la médiane est la valeur centrale d'une liste ordonnée.
Éclaircissons le tout avec un exemple.
Exemple
Pour illustrer la différence entre ces deux indicateurs, prenons un exemple concret : la taille totale de certaines de nos pages Web, mesurée en kilooctets.
[25, 30, 30, 30, 1079]
Une simple recherche sur le moteur de recherche Wolfram|Alpha révèle que :
- la moyenne est de 238,8 Ko;
- et la médiane est de 30 Ko.
La différence est significative, n'est-ce pas ? 🙈
Quel indicateur vous semble le plus représentatif de ces données? 😅
Avantages et inconvénients
Moyenne
Avantages :
- Est simple à comprendre et à calculer.
- Fournit rapidement une vue d'ensemble.
Désavantage :
- Sensible aux valeurs aberrantes.
Médiane
Avantages :
- Insensible aux valeurs extrêmes ou aberrantes.
- Représentation plus robuste des données.
Désavantages :
- Moins connue.
- Calcul plus complexe.
Conclusion
Après avoir analysé les résultats de nos comparaisons, nous avons décidé d'utiliser la médiane comme indicateur de choix pour représenter les performances des sites Web que nous concevons. Nous avons constaté que la médiane offre une meilleure représentation des données de performance que nous surveillons.
En comparaison, la taille médiane d'une page Web typique s'élève à 2 484 Ko! Nous sommes vraiment fiers de cette mesure qui démontre notre engagement envers l'optimisation des performances Web. 😎