Méthodologie d'échantillonnage aléatoire, avantages, inconvénients, exemples

5092
Abraham McLaughlin

le échantillonnage aléatoire c'est la manière de sélectionner un échantillon statistiquement représentatif d'une population donnée. Une partie du principe selon lequel chaque élément de l'échantillon doit avoir la même probabilité d'être sélectionné.

Un tirage au sort est un exemple d'échantillonnage aléatoire, dans lequel chaque membre de la population de participants se voit attribuer un numéro. Pour choisir les numéros correspondant aux prix de tombola (l'échantillon) une technique aléatoire est utilisée, par exemple extraire d'une boîte aux lettres les numéros qui ont été enregistrés sur des cartes identiques.

Figure 1. Dans l'échantillonnage aléatoire, l'échantillon est tiré de la population au hasard au moyen d'une technique qui garantit que tous les éléments ont la même probabilité d'être choisis. Source: netquest.com.

Dans l'échantillonnage aléatoire, il est essentiel de bien choisir la taille de l'échantillon, car un échantillon non représentatif de la population peut conduire à de fausses conclusions, en raison de fluctuations statistiques..

Index des articles

  • 1 La taille de l'échantillon
    • 1.1 Cas 1: la taille de la population est inconnue
    • 1.2 Cas 2: la taille de la population est connue
  • 2 exemples
    • 2.1 Enquêtes et questionnaires
    • 2.2 Contrôle de la qualité
  • 3 avantages
  • 4 Inconvénients
  • 5 Exercice résolu
  • 6 Références

La taille de l'échantillon

Il existe des formules pour déterminer la taille appropriée d'un échantillon. Le facteur le plus important à considérer est de savoir si la taille de la population est connue ou non. Regardons les formules pour déterminer la taille de l'échantillon:

Cas 1: la taille de la population est inconnue

Lorsque la taille de la population N est inconnue, il est possible de sélectionner un échantillon de taille adéquate n, pour déterminer si une certaine hypothèse est vraie ou fausse.

Pour cela, la formule suivante est utilisée:

n = (Zdeux p q) / (Edeux)

Où:

-p est la probabilité que l'hypothèse soit vraie.

-q est la probabilité que ce ne soit pas le cas, donc q = 1 - p.

-E est la marge d'erreur relative, par exemple une erreur de 5% a une marge E = 0,05. 

-Z a à voir avec le niveau de confiance requis par l'étude.

Dans une distribution normale normalisée (ou normalisée), un niveau de confiance de 90% a Z = 1,645, car la probabilité que le résultat soit compris entre -1,645σ et + 1,645σ est de 90%, où σ est l'écart type.

Niveaux de confiance et leurs valeurs Z correspondantes 

1.- Le niveau de confiance de 50% correspond à Z = 0,675.

2.- Un niveau de confiance de 68,3% correspond à Z = 1.

3.- Un niveau de confiance de 90% équivaut à Z = 1645.

4.- Le niveau de confiance de 95% correspond à Z = 1,96

5.- Le niveau de confiance de 95,5% correspond à Z = 2.

6.- Le niveau de confiance de 99,7% équivaut à Z = 3.

Un exemple où cette formule peut être appliquée serait dans une étude pour déterminer le poids moyen des galets sur une plage.

De toute évidence, il n'est pas possible d'étudier et de peser tous les galets sur la plage, il est donc conseillé d'en extraire un échantillon le plus aléatoire possible et avec le nombre approprié d'éléments..

Figure 2. Pour étudier les caractéristiques des galets sur une plage, il est nécessaire de choisir un échantillon aléatoire avec un nombre représentatif d'entre eux. (Paquet source: pixabay)

Cas 2: la taille de la population est connue

Lorsque le nombre N d'éléments qui composent une certaine population (ou univers) est connu, si vous souhaitez sélectionner un échantillon statistiquement significatif de taille n par simple échantillonnage aléatoire, voici la formule: 

n = (Zdeuxp q N) / (N Edeux + Zdeuxp q)

Où:

-Z est le coefficient associé au niveau de confiance.

-p est la probabilité de succès de l'hypothèse.

-q est la probabilité d'échec dans l'hypothèse, p + q = 1.

-N est la taille de la population totale.

-E est l'erreur relative du résultat de l'étude.

Exemples

La méthodologie pour extraire les échantillons dépend beaucoup du type d'étude à réaliser. Par conséquent, l'échantillonnage aléatoire a un nombre infini d'applications:

Enquêtes et questionnaires

Par exemple, dans les enquêtes téléphoniques, les personnes à consulter sont choisies à l'aide d'un générateur de nombres aléatoires, applicable à la région étudiée..

Si vous souhaitez appliquer un questionnaire aux employés d'une grande entreprise, vous pouvez alors recourir à la sélection des répondants via leur numéro d'employé, ou numéro de carte d'identité..

Ce nombre doit également être choisi au hasard, en utilisant par exemple un générateur de nombres aléatoires.

Figure 3. Un questionnaire peut être appliqué en sélectionnant au hasard les participants. Source: Pixabay.

Contrôle de qualité

Dans le cas où l'étude porte sur des pièces fabriquées par une machine, les pièces doivent être choisies au hasard, mais à partir de lots fabriqués à des moments différents de la journée, ou à des jours ou semaines différents..

avantage

Échantillonnage aléatoire simple:

- Il permet de réduire les coûts d'une étude statistique, puisqu'il n'est pas nécessaire d'étudier la population totale pour obtenir des résultats statistiquement fiables, avec les niveaux de confiance souhaités et le niveau d'erreur requis dans l'étude..

- Eviter les biais: le choix des éléments à étudier étant totalement aléatoire, l'étude reflète fidèlement les caractéristiques de la population, même si seule une partie de celle-ci a été étudiée.

Désavantages

- La méthode n'est pas adéquate dans les cas où vous souhaitez connaître les préférences dans différents groupes ou strates de population.

Dans ce cas, il est préférable de déterminer au préalable les groupes ou segments sur lesquels l'étude doit être menée. Une fois que les strates ou les groupes ont été définis, alors s'il y a lieu d'appliquer un échantillonnage aléatoire à chacun d'eux..

- Il est très peu probable que des informations soient obtenues sur les secteurs minoritaires, dont il est parfois nécessaire de connaître leurs caractéristiques.

Par exemple, s'il s'agit de faire une campagne sur un produit cher, il faut connaître les préférences des secteurs minoritaires les plus riches.

Exercice résolu

Nous voulons étudier la préférence de la population pour une certaine boisson au cola, mais il n'y a pas d'étude antérieure dans cette population, dont la taille est inconnue..

D'autre part, l'échantillon doit être représentatif avec un niveau de confiance minimum de 90% et les conclusions doivent avoir un pourcentage d'erreur de 2%..

-Comment déterminer la taille de l'échantillon n?

-Quelle serait la taille de l'échantillon si la marge d'erreur était assouplie à 5%??

Solution

La taille de la population étant inconnue, la formule donnée ci-dessus est utilisée pour déterminer la taille de l'échantillon:

n = (Zdeuxp q) / (Edeux)

Nous supposons qu'il y a une probabilité égale de préférence (p) pour notre marque de boisson gazeuse à partir de non-préférence (q), alors p = q = 0,5.

D'autre part, comme le résultat de l'étude doit avoir un pourcentage d'erreur inférieur à 2%, l'erreur relative E sera alors de 0,02.

Enfin, une valeur Z = 1645 produit un niveau de confiance de 90%.

En résumé, nous avons les valeurs suivantes:

Z = 1 645

p = 0,5

q = 0,5

E = 0,02

Avec ces données, la taille minimale de l'échantillon est calculée:

n = (1 645deux 0,5 0,5) / (0,02deux) = 1691,3

Cela signifie que l'étude avec la marge d'erreur requise et avec le niveau de confiance choisi, doit avoir un échantillon de répondants d'au moins 1692 individus, choisis par échantillonnage aléatoire simple..

Si vous passez d'une marge d'erreur de 2% à 5%, la nouvelle taille de l'échantillon est:

n = (1 645deux 0,5 0,5) / (0,05deux) = 271

Ce qui représente un nombre d'individus nettement inférieur. En conclusion, la taille de l'échantillon est très sensible à la marge d'erreur souhaitée dans l'étude..

Les références

  1. Berenson, M. 1985. Statistiques de gestion et d'économie, concepts et applications. Éditorial Interamericana.
  2. Statistiques. Échantillonnage aléatoire. Tiré de: encyclopediaeconomica.com.
  3. Statistiques. Échantillonnage. Récupéré de: Estadistica.mat.uson.mx.
  4. Explorable. Échantillonnage aléatoire. Récupéré de: explorable.com.
  5. Moore, D. 2005. Statistiques de base appliquées. 2ème. Édition.
  6. Netquest. Échantillonnage aléatoire. Récupéré de: netquest.com.
  7. Wikipédia. Échantillonnage statistique. Récupéré de: en.wikipedia.org

Personne n'a encore commenté ce post.