Les données non groupées sont ceux qui, issus d'une étude, ne sont pas encore organisés par classes. Lorsqu'il s'agit d'un nombre gérable de données, généralement 20 ou moins, et qu'il y a peu de données différentes, il peut être traité comme des informations non groupées et précieuses extraites de celui-ci..
Les données non groupées proviennent en l'état de l'enquête ou de l'étude réalisée pour les obtenir et manquent donc de traitement. Regardons quelques exemples:
-Résultats d'un test de QI sur 20 étudiants aléatoires d'une université. Les données obtenues étaient les suivantes:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106
-Âges de 20 employés d'un certain café populaire:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
-La moyenne des notes finales de 10 élèves dans une classe de mathématiques:
3.2; 3,1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4.2; 4,9
Index des articles
Il existe trois propriétés importantes qui caractérisent un ensemble de données statistiques, qu'elles soient groupées ou non, à savoir:
-Positionner, qui est la tendance des données à se regrouper autour de certaines valeurs.
-Dispersion, une indication de la dispersion ou de la dispersion des données autour d'une valeur donnée.
-Façonner, Il se réfère à la manière dont les données sont distribuées, ce qui est apprécié lorsqu'un graphique de la même chose est construit. Il y a des courbes très symétriques et également biaisées, soit à gauche soit à droite d'une certaine valeur centrale.
Pour chacune de ces propriétés, il existe une série de mesures qui les décrivent. Une fois obtenus, ils nous donnent un aperçu du comportement des données:
-Les mesures de position les plus utilisées sont la moyenne arithmétique ou simplement la moyenne, la médiane et le mode.
-La gamme, la variance et l'écart type sont fréquemment utilisés dans la dispersion, mais ce ne sont pas les seules mesures de la dispersion..
-Et pour déterminer la forme, la moyenne et la médiane sont comparées par biais, comme vous le verrez sous peu.
-La moyenne arithmétique, également connu sous le nom de moyenne et noté X, il est calculé comme suit:
X = (x1 + Xdeux + X3 +… Xn) / n
Où x1, Xdeux,…. Xn, sont les données et n est le total d'entre elles. En notation sommative, nous avons:
-Médian est la valeur qui apparaît au milieu d'une séquence ordonnée de données, donc pour l'obtenir, il faut tout d'abord ordonner les données.
Si le nombre d'observations est impair, il n'y a pas de problème pour trouver le point médian de l'ensemble, mais si nous avons un nombre pair de données, les deux données centrales sont recherchées et moyennées.
-Mode est la valeur la plus courante observée dans l'ensemble de données. Elle n'existe pas toujours, car il est possible qu'aucune valeur ne soit répétée plus fréquemment qu'une autre. Il pourrait aussi y avoir deux données à fréquence égale, auquel cas on parle d'une distribution bimodale.
Contrairement aux deux mesures précédentes, le mode peut être utilisé avec des données qualitatives.
Voyons comment ces mesures de position sont calculées avec un exemple:
Supposons que l'on veuille déterminer la moyenne arithmétique, la médiane et le mode dans l'exemple proposé au début: les âges de 20 employés d'une cafétéria:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
La moitié il est calculé simplement en additionnant toutes les valeurs et en divisant par n = 20, qui est le nombre total de données. De cette manière:
X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =
= 22,3 ans.
Pour trouver le médian vous devez d'abord trier l'ensemble de données:
18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29
Comme il s'agit d'un nombre pair de données, les deux données centrales, mises en évidence en gras, sont prises et moyennées. Parce qu'ils ont tous les deux 22 ans, la médiane est de 22 ans.
Finalement, le mode Ce sont les données qui se répètent le plus ou celles dont la fréquence est la plus élevée, soit 22 ans.
La plage est simplement la différence entre la plus grande et la plus petite des données et vous permet d'apprécier rapidement la variabilité des données. Mais mis à part, il existe d'autres mesures de dispersion qui offrent plus d'informations sur la distribution des données..
La variance est notée s et est calculée par l'expression:
Donc pour interpréter correctement les résultats, l'écart type est défini comme la racine carrée de la variance, ou encore l'écart quasi-type, qui est la racine carrée de la quasi-variance:
C'est la comparaison entre la moyenne X et la médiane Med:
-Si Med = moyenne X: les données sont symétriques.
-Lorsque X> Med: inclinaison vers la droite.
-Et si X < Med: los datos sesgan hacia la izquierda.
Trouvez la moyenne, la médiane, le mode, la plage, la variance, l'écart type et le biais pour les résultats d'un test de QI réalisé sur 20 étudiants d'une université:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106
Nous commanderons les données, car il faudra trouver la médiane.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124
Et nous allons les mettre dans un tableau comme suit, pour faciliter les calculs. La deuxième colonne intitulée «Accumulé» est la somme des données correspondantes plus la précédente..
Cette colonne vous aidera à trouver facilement la moyenne, en divisant le dernier accumulé par le nombre total de données, comme on le voit à la fin de la colonne «Accumulé»:
X = 112,9
La médiane est la moyenne des données centrales surlignées en rouge: le nombre 10 et le nombre 11. Comme ils sont identiques, la médiane est 112.
Enfin, le mode est la valeur la plus répétée et est de 112, avec 7 répétitions..
En ce qui concerne les mesures de dispersion, la gamme est:
124-106 = 18.
La variance est obtenue en divisant le résultat final dans la colonne de droite par n:
s = 668,6 / 20 = 33,42
Dans ce cas, l'écart type est la racine carrée de la variance: √33,42 = 5,8.
En revanche, les valeurs de la quasi-variance et du quasi-écart-type sont:
sc= 668,6 / 19 = 35,2
Écart quasi-type = √35,2 = 5,9
Enfin, le biais est légèrement à droite, puisque la moyenne de 112,9 est supérieure à la médiane de 112.
Personne n'a encore commenté ce post.