Classez à quoi cela sert, comment l'obtenir et des exemples

2140
Abraham McLaughlin

La marque de classe, Aussi connu sous le nom de point médian, il s'agit de la valeur qui se trouve au centre d'une classe, qui représente toutes les valeurs de cette catégorie. Fondamentalement, la note de classe est utilisée pour calculer certains paramètres, tels que la moyenne arithmétique ou l'écart type..

Ainsi, la marque de classe est le point médian de n'importe quel intervalle. Cette valeur est également très utile pour trouver la variance d'un ensemble de données déjà regroupées en classes, ce qui nous permet à son tour de comprendre à quelle distance du centre ces données spécifiques sont situées.

Index des articles

  • 1 Distribution de fréquence
    • 1.1 Combien de classes considérer?
  • 2 Comment obtenez-vous?
    • 2.1 Exemple
  • 3 À quoi ça sert?
    • 3.1 Exemple
  • 4 Références

Distribution de fréquence

Pour comprendre ce qu'est une marque de classe, le concept de distribution de fréquence est nécessaire. Étant donné un ensemble de données, une distribution de fréquence est un tableau qui divise les données en un certain nombre de catégories appelées classes..

Ledit tableau montre la quantité d'éléments appartenant à chaque classe; ce dernier est connu sous le nom de fréquence.

Dans ce tableau, une partie des informations que nous obtenons à partir des données est sacrifiée, car au lieu d'avoir la valeur individuelle de chaque élément, nous savons seulement qu'il appartient à cette classe.

D'autre part, nous acquérons une meilleure compréhension de l'ensemble de données, car de cette manière il est plus facile d'apprécier les modèles établis, ce qui facilite la manipulation desdites données..

Combien de classes à considérer?

Pour faire une distribution de fréquence, nous devons d'abord déterminer le nombre de classes que nous voulons prendre et choisir leurs limites de classe..

Le choix du nombre de classes à prendre devrait être pratique, en tenant compte du fait qu'un petit nombre de classes peut masquer des informations sur les données que nous voulons étudier et qu'une très grande peut générer trop de détails qui ne sont pas nécessairement utiles.

Les facteurs dont nous devons tenir compte lors du choix du nombre de classes à prendre sont plusieurs, mais parmi ces deux se démarquent: le premier est de prendre en compte la quantité de données à prendre en compte; la seconde est de savoir quelle est l'étendue de la plage de distribution (c'est-à-dire la différence entre la plus grande et la plus petite observation).

Après avoir déjà défini les classes, nous procédons à compter la quantité de données existant dans chaque classe. Ce nombre est appelé la fréquence des classes et est noté fi.

Comme nous l'avons dit précédemment, nous avons qu'une distribution de fréquence perd les informations qui proviennent individuellement de chaque donnée ou observation. Pour cette raison, une valeur est recherchée qui représente la classe entière à laquelle elle appartient; cette valeur est la marque de classe.

Comment est-il obtenu?

La marque de classe est la valeur fondamentale qu'une classe représente. Il s'obtient en additionnant les limites de l'intervalle et en divisant cette valeur par deux. Nous pourrions l'exprimer mathématiquement comme suit:

Xje= (Limite inférieure + limite supérieure) / 2.

Dans cette expression xje désigne la marque de la i-ème classe.

Exemple

Compte tenu de l'ensemble de données suivant, donnez une distribution de fréquence représentative et obtenez la note des classes correspondantes.

Puisque les données avec la valeur numérique la plus élevée sont 391 et la plus basse est 221, nous avons que la plage est 391-221 = 170.

Nous choisirons 5 classes, toutes de même taille. Une façon de choisir les classes est la suivante:

Notez que chaque donnée est dans une classe, celles-ci sont disjointes et ont la même valeur. Une autre façon de choisir les classes consiste à considérer les données comme faisant partie d'une variable continue, qui pourrait atteindre n'importe quelle valeur réelle. Dans ce cas, nous pouvons considérer des classes de la forme:

205-245, 245-285, 285-325, 325-365, 365-405

Cependant, cette façon de regrouper les données peut présenter des ambiguïtés limites. Par exemple, dans le cas de 245, la question se pose: à quelle classe appartient-il, la première ou la seconde?

Pour éviter cette confusion, une convention de point de terminaison est établie. De cette façon, la première classe sera l'intervalle (205,245], la seconde (245,285], et ainsi de suite.

Une fois les classes définies, nous procédons au calcul de la fréquence et nous avons le tableau suivant:

Après avoir obtenu la distribution de fréquence des données, nous procédons à la recherche des marques de classe de chaque intervalle. En effet, nous devons:

X1= (205+ 245) / 2 = 225

Xdeux= (245+ 285) / 2 = 265          

X3= (285+ 325) / 2 = 305

X4= (325+ 365) / 2 = 345

X5= (365+ 405) / 2 = 385

Nous pouvons représenter cela par le graphique suivant:

Pourquoi est-ce?

Comme mentionné précédemment, la note de classe est très fonctionnelle pour trouver la moyenne arithmétique et la variance d'un groupe de données qui ont déjà été regroupées en différentes classes..

Nous pouvons définir la moyenne arithmétique comme la somme des observations obtenues entre la taille de l'échantillon. D'un point de vue physique, son interprétation est comme le point d'équilibre d'un ensemble de données.

Identifier un ensemble de données entier par un seul numéro peut être risqué, donc la différence entre ce seuil de rentabilité et les données réelles doit également être prise en compte. Ces valeurs sont connues sous le nom d'écart par rapport à la moyenne arithmétique, et avec celles-ci, nous cherchons à déterminer dans quelle mesure la moyenne arithmétique des données varie..

La façon la plus courante de trouver cette valeur est par la variance, qui est la moyenne des carrés des écarts par rapport à la moyenne arithmétique.

Pour calculer la moyenne arithmétique et la variance d'un ensemble de données regroupées dans une classe, nous utilisons respectivement les formules suivantes:

Dans ces expressions xje  est la i-ème marque de classe, fje représente la fréquence correspondante et k le nombre de classes dans lesquelles les données ont été regroupées.

Exemple

En utilisant les données données dans l'exemple précédent, nous avons que nous pouvons élargir un peu plus les données de la table de distribution de fréquence. Vous obtenez ce qui suit:

Ensuite, en substituant les données dans la formule, il nous reste que la moyenne arithmétique est:

Sa variance et son écart type sont:

De cela, nous pouvons conclure que les données originales ont une moyenne arithmétique de 306,6 et un écart type de 39,56..

Les références

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Statistiques descriptives. Éditorial Esic.
  2. Johnson Richard A. Miller et Freund Probability and Statesmen for Engineers, Pearson Education.
  3. Miller I & Freund J. Probability and Statesmen for Engineers. REVENIR.
  4. Sarabia A. Jose Maria, Pascual Marta. Cours de statistiques de base pour les entreprises
  5. Llinás S. Humberto, Rojas A. Carlos Statistiques descriptives et distributions de probabilité, Universidad del Norte Editorial

Personne n'a encore commenté ce post.