Mesures de variabilité

4686
David Holt
Figure 1.- Les mesures de variabilité les plus connues. Source: F. Zapata.

Que sont les mesures de la variabilité?

le mesures de variabilité, Aussi appelées mesures de dispersion, ce sont des indicateurs statistiques qui indiquent à quel point les données sont proches ou éloignées de leur moyenne arithmétique. Si les données sont proches de la moyenne, la distribution est concentrée, et si elles sont éloignées, il s'agit d'une distribution clairsemée..

Il existe de nombreuses mesures de la variabilité, parmi les plus connues:

  • Rang
  • Écart moyen
  • Variance
  • Écart-type

Ces mesures complètent les mesures de tendance centrale et sont nécessaires pour comprendre la distribution des données obtenues et en extraire le plus d'informations possible..

Rang

La plage ou l'étendue mesure la largeur d'un ensemble de données. Pour déterminer sa valeur, la différence entre les données avec la valeur la plus élevée xmax et celui avec la valeur x la plus faiblemin:

R = xmax - Xmin

Si les données ne sont pas lâches mais regroupées par intervalle, la plage est calculée par la différence entre la limite supérieure du dernier intervalle et la limite inférieure du premier intervalle.

Lorsque la plage est une petite valeur, cela signifie que toutes les données sont assez proches les unes des autres, mais une plage large indique qu'il y a beaucoup de variabilité. Il est clair que, mis à part la limite supérieure et la limite inférieure des données, la plage ne prend pas en compte les valeurs entre elles, il n'est donc pas recommandé de l'utiliser lorsque le nombre de données est important.

Cependant, il s'agit d'une mesure immédiate à calculer et a les mêmes unités de données, il est donc facile à interpréter.

Exemple de plage

Voici la liste avec le nombre de buts marqués pendant le week-end, dans les ligues de football de neuf pays:

40, 32, 35, 36, 37, 31, 37, 29, 39

Il s'agit d'un ensemble de données non groupé. Pour trouver la gamme, nous procédons à leur ordre du plus bas au plus élevé:

29, 31, 32, 35, 36, 37, 37, 39, 40

Les données avec la valeur la plus élevée sont 40 buts et celle avec la valeur la plus basse est 29 buts, donc la plage est:

R = 40−29 = 11 buts.

On peut considérer que la plage est petite par rapport aux données de valeur minimale, qui est de 29 buts, on peut donc supposer que les données n'ont pas une grande variabilité.

Écart moyen

Cette mesure de la variabilité est calculée par la moyenne des valeurs absolues des écarts par rapport à la moyenne.. Dénotant l'écart moyen par DM, Pour les données non groupées, l'écart moyen est calculé à l'aide de la formule suivante:

Où n est le nombre de données disponibles, xje représente chaque donnée et x̄ est la moyenne, qui est déterminée en ajoutant toutes les données et en divisant par n:

L'écart moyen permet de savoir, en moyenne, en combien d'unités les données s'écartent de la moyenne arithmétique et présente l'avantage d'avoir les mêmes unités que les données avec lesquelles nous travaillons.

Exemple d'écart moyen

Sur la base des données de l'exemple de plage, le nombre de buts marqués est:

40, 32, 35, 36, 37, 31, 37, 29, 39

Si vous voulez trouver l'écart moyen DM A partir de ces données, il faut d'abord calculer la moyenne arithmétique x̄:

Et maintenant que la valeur de x̄ est connue, nous procédons à la recherche de l'écart moyen DM:

= 2,99 ≈ 3 buts

Par conséquent, on peut affirmer qu'en moyenne, les données sont éloignées d'environ 3 buts de la moyenne, qui est de 35 buts, et comme indiqué, il s'agit d'une mesure beaucoup plus précise que la fourchette..

Variance

L'écart moyen est une mesure de la variabilité beaucoup plus fine que l'intervalle, mais comme il est calculé par la valeur absolue des différences entre chaque donnée et la moyenne, il n'offre pas une plus grande polyvalence d'un point de vue algébrique..

Pour cette raison, la variance est préférée, qui correspond à la moyenne de la différence quadratique de chaque donnée avec la moyenne et est calculée à l'aide de la formule:

Dans cette expression, sdeux désigne la variance, et comme toujours xje représente chacune des données, x̄ est la moyenne et n est le total des données.

Lorsque vous travaillez avec un échantillon au lieu de la population, il est préférable de calculer la variance comme ceci:

Dans tous les cas, la variance se caractérise par le fait qu'elle est toujours une quantité positive, mais comme c'est la moyenne des différences quadratiques, il est important de noter qu'elle n'a pas les mêmes unités que celles des données..

Exemple de variance

Pour calculer la variance des données dans les exemples de plage et d'écart moyen, nous procédons à la substitution des valeurs correspondantes et effectuons la sommation indiquée. Dans ce cas, nous choisissons de diviser par n-1:

= 13,86

Écart-type

La variance n'a pas la même unité que celle de la variable à l'étude, par exemple, si les données sont en mètres, la variance se traduit en mètres carrés. Ou dans l'exemple des buts, ce serait en buts au carré, ce qui n'a aucun sens.

Par conséquent, l'écart type est défini, également appelé déviation typique, comme racine carrée de la variance:

s = √sdeux

De cette manière, une mesure de la variabilité des données est obtenue dans les mêmes unités que celles-ci, et plus la valeur de s est faible, plus les données sont regroupées autour de la moyenne..

La variance et l'écart type sont les mesures de variabilité à choisir lorsque la moyenne arithmétique est la mesure de la tendance centrale qui décrit le mieux le comportement des données..

Et c'est que l'écart-type a une propriété importante, connue sous le nom de théorème de Chebyshev: au moins 75% des observations sont dans l'intervalle défini par X ± 2 s. En d'autres termes, 75% des données sont au plus à 2 secondes de la moyenne..

De même, au moins 89% des valeurs sont à une distance de 3s de la moyenne, un pourcentage qui peut être augmenté, tant qu'il y a beaucoup de données disponibles et qu'elles suivent une distribution normale..

Figure 2.- Si les données suivent une distribution normale, 95,4 d'entre elles sont à moins de deux écarts-types des deux côtés de la moyenne. Source: Wikimedia Commons.

Exemple d'écart type

L'écart type des données présentées dans les exemples précédents est:

s = √sdeux = √13.86 = 3.7 ≈ 4 buts


Personne n'a encore commenté ce post.