Page d'accueil
Statistiques
Mesures de position, de tendance centrale et de dispersion

Mesures de position, de tendance centrale et de dispersion

1926

264

Sherman Hoover

le mesures de la tendance centrale, de la dispersion et de la position, sont des valeurs utilisées pour interpréter correctement un ensemble de données statistiques. Ceux-ci peuvent être travaillés directement, comme ils sont obtenus à partir de l'étude statistique, ou ils peuvent être organisés en groupes de fréquence égale, ce qui facilite l'analyse..

Les trois mesures les plus connues de la tendance centrale et certaines de leurs propriétés. Source: F. Zapata.

Mesures de tendance centrale

Ils permettent de savoir autour de quelles valeurs les données statistiques sont regroupées.

Moyenne arithmétique

Elle est également connue sous le nom de moyenne des valeurs d'une variable et s'obtient en additionnant toutes les valeurs et en divisant le résultat par le nombre total de données.

Moyenne arithmétique des données non groupées

Soit une variable x dont nous avons n données sans organisation ni regroupement, sa moyenne arithmétique se calcule comme suit:

Et en notation sommative:

Exemple

Les propriétaires d'une auberge de tourisme de montagne ont l'intention de savoir combien de jours en moyenne les visiteurs séjournent dans les installations. Pour cela, un registre des jours de permanence de 20 groupes de touristes a été conservé, obtenant les données suivantes:

1; 1; deux; deux; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; deux; deux; 3; 4; 1

Le nombre moyen de jours de séjour des touristes est de:

Moyenne arithmétique des données groupées

Si les données de la variable sont organisées dans un tableau de fréquences absolues f_je et les centres de classe sont x₁, X_deux,..., X_n, la moyenne est calculée par:

En notation sommative:

Médian

La médiane d'un groupe de n valeurs de la variable x est la valeur centrale du groupe, à condition que les valeurs soient ordonnées par ordre croissant. De cette manière, la moitié de toutes les valeurs sont inférieures au mode et l'autre moitié est supérieure..

Médiane des données non groupées

Les cas suivants peuvent survenir:

-Nombre n de valeurs de la variable x impair: la médiane est la valeur qui se trouve juste au milieu du groupe de valeurs:

-Nombre n de valeurs de la variable x paire: dans ce cas, la médiane est calculée comme la moyenne des deux valeurs centrales du groupe de données:

Exemple

Pour trouver la médiane des données de l'auberge de tourisme, elles sont d'abord classées du plus bas au plus élevé:

1; 1; 1; 1; 1; 1; 1; deux; deux; deux; deux; 3; 3; 3; 4; 4; 4; 4; 5; 5

Le nombre de données est pair, il y a donc deux données centrales: X_dix et X_Onze et comme les deux valent 2, leur moyenne est aussi.

Médiane = 2

Médiane des données regroupées

La formule suivante est utilisée:

Les symboles dans la formule signifient:

-c: largeur de l'intervalle contenant la médiane

-B_M: borne inférieure du même intervalle

-F_m: nombre d'observations contenues dans l'intervalle auquel appartient la médiane.

-n: données totales.

-F_BM: nombre d'observations avant que de l'intervalle contenant la médiane.

mode

Le mode pour les données non groupées est la valeur avec la fréquence la plus élevée, tandis que pour les données groupées, c'est la classe avec la fréquence la plus élevée. La mode est considérée comme la donnée ou la classe la plus représentative de la distribution.

Deux caractéristiques importantes de cette mesure sont qu'un ensemble de données peut avoir plus d'un mode, et le mode peut être déterminé pour des données quantitatives et qualitatives..

Exemple

En continuant avec les données du parador touristique, celui qui se répète le plus est 1, par conséquent, la chose la plus courante est que les touristes restent 1 jour dans le parador.

Mesures de dispersion

Les mesures de dispersion décrivent le degré de regroupement des données autour des mesures centrales.

Rang

Il est calculé en soustrayant les plus grandes données et les plus petites données. Si cette différence est grande, c'est le signe que les données sont dispersées, tandis que de petites valeurs indiquent que les données sont proches de la moyenne..

Exemple

La fourchette des données du parador touristique est:

Plage = 5−1 = 4

Variance

Variance pour les données non groupées

Pour trouver la variance s^deux Il faut d'abord connaître la moyenne arithmétique, puis la différence au carré entre chaque donnée et la moyenne est calculée, toutes sont additionnées et divisées par le nombre total d'observations. Ces différences sont connues sous le nom de écarts.

La variance, toujours positive (ou nulle), indique à quel point les observations sont éloignées de la moyenne: si la variance est élevée, les valeurs sont plus dispersées que lorsque la variance est faible.

Exemple

L'écart pour les données de l'auberge de tourisme est:

1; 1; deux; deux; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; deux; deux; 3; 4; 1

Variance pour les données groupées

Pour trouver la variance d'un ensemble de données groupées, les éléments suivants sont nécessaires: i) la moyenne, ii) la fréquence f_je qui est le total des données dans chaque classe et iii) x_je ou valeur de classe:

La desviación estándar es la raíz cuadrada positiva de la varianza, por lo que tiene una ventaja sobre la varianza: viene en las mismas unidades que la variable bajo estudio y así se tiene una idea más directa de lo cerca o lejos que está la variable de La moyenne.

Écart type pour les données non groupées

Il est déterminé simplement en trouvant la racine carrée de la variance pour les données non groupées:

L'écart type des données de l'auberge de tourisme est:

s = √ (s^deux) = √1,95 = 1,40

Écart type pour les données groupées

Il est calculé en trouvant la racine carrée de la variance pour les données groupées:

Mesures de position

Les mesures de position divisent un ensemble ordonné de données en éléments de taille égale. La médiane, en plus d'être une mesure de la tendance centrale, est aussi une mesure de la position, puisqu'elle divise le tout en deux parties égales. Mais des pièces plus petites peuvent être obtenues avec des quartiles, des déciles et des centiles.

Quartiles

Les quartiles divisent l'ensemble en quatre parties égales, chacune contenant 25% des données. Ils sont notés Q₁, Q_deux et alors₃ et la médiane est le quartile Q_deux. De cette façon, 25% des données sont inférieures au quartile Q.₁, 50% sous le quartile Q_deux ou médiane et 75% sous le quartile Q₃.

Quartiles pour les données non groupées

Les données sont classées et le total est divisé en 4 groupes avec le même nombre de données chacun. La position du premier quartile est trouvée par:

Q₁ = (n + 1) / 4

Où n est le total des données. Si le résultat est un entier, les données correspondant à cette position sont localisées, mais si elle est décimale, les données correspondant à la partie entière sont moyennées avec la suivante, ou pour plus de précision, elles sont interpolées linéairement entre lesdites données.

Exemple

La position du premier quartile Q₁ pour les données du parador touristique est:

Q₁ = (n + 1) / 4 = (20 + 1) / 4 = 5,25

Il s'agit de la position du quartile 1 et comme le résultat est décimal, les données X sont recherchées₅ et X_6, qui sont respectivement X₅ = 1 et X₆ = 1 et sont moyennés, ce qui donne:

Premier quartile = 1

1; 1; 1; 1; 1; 1; 1; deux; deux; deux; deux; 3; 3; 3; 4; 4; 4; 4; 5; 5.

La position du deuxième quartile Q_deux c'est:

Q_deux = 2 (n + 1) / 4 = 10,5

Quelle est la moyenne entre X_dix et X_Onzeet correspond à la médiane:

Deuxième quartile = Médiane = 2

La position du troisième quartile est calculée par:

Q₃ = 3 (n + 1) / 4 = 3 (20 + 1) / 4 = 15,75

Il est également décimal, donc X est en moyenne_quinze et X₁₆:

1; 1; 1; 1; 1; 1; 1; deux; deux; deux; deux; 3; 3; 3; 4; 4; 4; 4; 5; 5.

Mais puisque les deux valent 4:

Troisième quartile = 4

La formule générale pour la position des quartiles dans les données non groupées est:

Q_k = k (n + 1) / 4

Avec k = 1,2,3.

Quartiles pour les données groupées

Ils sont calculés de manière similaire à la médiane:

L'explication des symboles est:

-B_Q: limite inférieure de l'intervalle contenant le quartile

-c: largeur de cet intervalle

-F_quelle: nombre d'observations contenues dans l'intervalle quartile.

-n: données totales.

-F_BQ: nombre de données avant que de l'intervalle contenant le quartile.

Déciles et centiles

Les déciles et les centiles divisent l'ensemble de données en 10 parties égales et 100 parties égales respectivement, et leur calcul est effectué de la même manière que celui des quartiles..

Déciles et centiles pour les données non groupées

Les formules sont utilisées respectivement:

ré_k = k (n + 1) / 10

Avec k = 1,2,3… 9.

Décile D₅doit être égal à la médiane.

P_k = k (n + 1) / 100

Avec k = 1,2,3… 99.

Le percentile P_cinquantedoit être égal à la médiane.

Exemple

Dans l'exemple de l'auberge touristique, la position du D₃ c'est:

ré₃ = 3 (20 + 1) / 10 = 6,3

Puisqu'il s'agit d'un nombre décimal, X est en moyenne₆ et X_7,tous deux égaux à 1:

1; 1; 1; 1; 1; 1; 1; deux; deux; deux; deux; 3; 3; 3; 4; 4; 4; 4; 5; 5

Cela signifie que 3 dixièmes des données sont inférieures à X₇ = 1 et les autres ci-dessus.

Déciles et centiles pour les données groupées

Les formules sont analogues à celles des quartiles. D est utilisé pour désigner les déciles et P pour les percentiles, et les symboles sont interprétés de la même manière:

La règle empirique

Lorsque les données sont distribuées symétriquement et que la distribution est unimodale, il existe une règle appelée règle empirique ou alors règle 68 - 95 - 99, qui les regroupe dans les intervalles suivants:

68% des données sont dans la plage:

95% des données se trouvent dans la plage:

99% des données se trouvent dans la plage:

Exemple

Dans quel intervalle se trouvent 95% des données du parador touristique?

Ils sont dans l'intervalle: [2,5−1,40; 2,5 + 1,40] = [1,1; 3.9].

Les références

Berenson, M. 1985. Statistiques de gestion et d'économie. Interamericana S.A.
Devore, J. 2012. Probabilité et statistiques pour l'ingénierie et la science. 8ème. Édition. Cengage.
Levin, R. 1988. Statistiques pour les administrateurs. 2ème. Édition. Prentice Hall.
Spiegel, M. 2009. Statistiques. Série Schaum. 4e Édition. Mcgraw Hill.
Walpole, R. 2007. Probabilité et statistiques pour l'ingénierie et les sciences. Pearson.

Prénom

Texte

Personne n'a encore commenté ce post.

Les 5 facteurs de pollution les plus importants

Environnement

4220

1206

Robert Johnston

10 produits de l'Amazonie équatorienne

Environnement

5088

193

Charles McCarthy

Origine de l'écodéveloppement, obstacles et exemples

Environnement

4252

1194

Egbert Haynes

Mesures de position, de tendance centrale et de dispersion

Mesures de tendance centrale

Moyenne arithmétique

Moyenne arithmétique des données non groupées

Exemple

Moyenne arithmétique des données groupées

Médian

Médiane des données non groupées

Exemple

Médiane des données regroupées

mode

Exemple

Mesures de dispersion

Rang

Exemple

Variance

Variance pour les données non groupées

Exemple

Variance pour les données groupées

Écart type pour les données non groupées

Écart type pour les données groupées

Mesures de position

Quartiles

Quartiles pour les données non groupées

Exemple

Quartiles pour les données groupées

Déciles et centiles

Déciles et centiles pour les données non groupées

Exemple

Déciles et centiles pour les données groupées

La règle empirique

Exemple

Les références

Les 5 facteurs de pollution les plus importants

10 produits de l'Amazonie équatorienne

Origine de l'écodéveloppement, obstacles et exemples