Formules de distribution de Poisson, équations, modèle, propriétés

808
Sherman Hoover

La Distribution de Poisson est une distribution de probabilité discrète, à travers laquelle il est possible de connaître la probabilité que, dans un échantillon de grande taille et pendant un certain intervalle, se produise un événement dont la probabilité est faible.

Souvent, la distribution de Poisson peut être utilisée à la place de la distribution binomiale, à condition que les conditions suivantes soient remplies: grand échantillon et faible probabilité.

Figure 1. Graphique de la distribution de Poisson pour différents paramètres. Source: Wikimedia Commons.

Siméon-Denis Poisson (1781-1840) a créé cette distribution qui porte son nom, très utile lorsqu'il s'agit d'événements imprévisibles. Poisson a publié ses résultats en 1837, un travail de recherche sur la probabilité d'occurrence de condamnations pénales erronées.

Plus tard, d'autres chercheurs ont adapté la distribution dans d'autres domaines, par exemple, le nombre d'étoiles qui pourraient être trouvées dans un certain volume d'espace, ou la probabilité qu'un soldat meure d'un coup de pied de cheval..

Index des articles

  • 1 Formule et équations
  • 2 Modèle et propriétés
    • 2.1 Différences avec la distribution binomiale
  • 3 exemples
    • 3.1 Applications pratiques
    • 3.2 Approximation de la distribution binomiale avec la distribution de Poisson
  • 4 exercices résolus
    • 4.1 Exercice 1
    • 4.2 Exercice 2
  • 5 Références

Formule et équations

La forme mathématique de la distribution de Poisson est la suivante:

- μ (parfois également désigné par λ) est la moyenne ou le paramètre de la distribution

- Numéro d'Euler: e = 2,71828

- La probabilité d'obtenir y = k est P

- k est le nombre de succès 0, 1,2,3 ...

- n est le nombre de tests ou d'événements (la taille de l'échantillon)

Les variables aléatoires discrètes, comme leur nom l'indique, dépendent du hasard et ne prennent que des valeurs discrètes: 0, 1, 2, 3, 4 ..., k.

La moyenne de la distribution est donnée par:

La variance σ, qui mesure la dispersion des données, est un autre paramètre important. Pour la distribution de Poisson, c'est:

σ = μ

Poisson a déterminé que lorsque n → ∞, et p → 0, la moyenne μ -aussi appelée valeur attendue- tend vers une constante:

μ → constante

Important: p est la probabilité d'occurrence de l'événement en tenant compte de la population totale, tandis que P (y) est la prédiction de Poisson sur l'échantillon.

Modèle et propriétés

La distribution de Poisson a les propriétés suivantes:

-La taille de l'échantillon est grande: n → ∞.

-Les événements ou événements considérés sont indépendants les uns des autres et se produisent de manière aléatoire.

-Probabilité P ce certain événement Oui se produit pendant une période de temps spécifique est très petite: P → 0.

-La probabilité que plusieurs événements se produisent dans l'intervalle de temps est de 0.

-La valeur moyenne se rapproche d'une constante donnée par: μ = n.p (n est la taille de l'échantillon)

-Puisque la dispersion σ est égale à μ, car elle adopte des valeurs plus grandes, la variabilité devient également plus grande.

-Les événements doivent être uniformément répartis dans l'intervalle de temps utilisé.

-L'ensemble des valeurs d'événement possibles Oui est: 0,1,2,3,4 ... .

-La somme de je variables qui suivent une distribution de Poisson, est également une autre variable de Poisson. Sa valeur moyenne est la somme des valeurs moyennes de ces variables.

Différences avec la distribution binomiale

La distribution de Poisson diffère de la distribution binomiale des manières importantes suivantes:

-La distribution binomiale est affectée à la fois par la taille de l'échantillon n et la probabilité P, mais la distribution de Poisson n'est affectée que par la moyenne μ.

-Dans une distribution binomiale, les valeurs possibles de la variable aléatoire Oui sont 0,1,2,…, N, par contre dans la distribution de Poisson il n'y a pas de limite supérieure pour ces valeurs.

Exemples

Poisson a d'abord appliqué sa célèbre distribution aux affaires juridiques, mais au niveau industriel, l'une de ses premières utilisations était la fabrication de la bière. Dans ce processus, des cultures de levure sont utilisées pour la fermentation.

La levure est constituée de cellules vivantes dont la population est variable dans le temps. Dans la fabrication de la bière, il est nécessaire d'ajouter la quantité nécessaire, il est donc nécessaire de connaître la quantité de cellules qu'il y a par unité de volume.

Pendant la Seconde Guerre mondiale, la distribution de Poisson a été utilisée pour savoir si les Allemands visaient réellement Londres depuis Calais, ou tiraient simplement au hasard. C'était important pour les Alliés de déterminer dans quelle mesure la technologie était disponible pour les nazis..

Applications pratiques

Les applications de la distribution de Poisson se réfèrent toujours aux comptages dans le temps ou aux comptages dans l'espace. Et comme la probabilité d'occurrence est faible, elle est également connue sous le nom de «loi des événements rares».

Voici une liste d'événements qui entrent dans l'une de ces catégories:

-L'enregistrement des particules dans une désintégration radioactive, qui comme la croissance des cellules de levure, est une fonction exponentielle.

-Nombre de visites sur un certain site Web.

-Arrivée de personnes en ligne pour payer ou être assisté (théorie de la file d'attente).

-Nombre de voitures qui passent un certain point sur une route, pendant un intervalle de temps donné.

Figure 2. Le nombre de voitures passant par un point suit à peu près une distribution de Poisson. Source: Pixabay.

-Mutations dans un certain brin d'ADN après avoir été exposé aux rayonnements.

-Nombre de météorites d'un diamètre supérieur à 1 m tombées en un an.

-Défauts par mètre carré de tissu.

-Nombre de cellules sanguines dans 1 centimètre cube.

-Appels par minute vers un central téléphonique.

-Pépites de chocolat présentes dans 1 kg de pâte à gâteau.

-Nombre d'arbres infectés par un certain parasite dans 1 hectare de forêt.

Notez que ces variables aléatoires représentent le nombre de fois qu'un événement se produit pendant une période de temps fixe (appels par minute au central téléphonique), ou une région donnée de l'espace (défauts d'un tissu au mètre carré).

Ces événements, comme cela a déjà été établi, sont indépendants du temps écoulé depuis la dernière occurrence..

Approximation de la distribution binomiale avec la distribution de Poisson

La distribution de Poisson est une bonne approximation de la distribution binomiale tant que:

-La taille de l'échantillon est grande: n ≥ 100

-Probabilité p est petite: p ≤ 0,1

- μ est de l'ordre de: np ≤ 10

Dans de tels cas, la distribution de Poisson est un excellent outil, car la distribution binomiale peut être difficile à appliquer dans ces cas..

Exercices résolus

Exercice 1

Une étude sismologique a déterminé qu'au cours des 100 dernières années, il y a eu 93 grands tremblements de terre dans le monde, au moins 6,0 sur l'échelle de Richter -logarithmique-. Supposons que la distribution de Poisson soit un modèle approprié dans ce cas. Trouve:

a) L'occurrence moyenne de grands tremblements de terre par an.

b) Oui P (y) est la probabilité d'occurrence Oui tremblements de terre au cours d'une année choisie au hasard, trouvez les probabilités suivantes:

P(0), P(1), P (deux), P (3), P (4), P (5), P (6) et P (7).

c) Les vrais résultats de l'étude sont les suivants:

- 47 ans (0 tremblement de terre)

- 31 ans (1 tremblement de terre)

- 13 ans (2 tremblements de terre)

- 5 ans (3 tremblements de terre)

- 2 ans (4 tremblements de terre)

-  0 ans (5 tremblements de terre)

- 1 an (6 tremblements de terre)

- 1 an (7 tremblements de terre)

Comment ces résultats se comparent-ils à ceux obtenus dans la partie b? La distribution de Poisson est-elle un bon choix pour modéliser ces événements?

Solution à)

a) Les tremblements de terre sont des événements dont la probabilité p il est petit et nous envisageons une période limitée, d'un an. Le nombre moyen de tremblements de terre est:

μ = 93/100 séismes / an = 0,93 séisme par an.

Solution b)

b) Pour calculer les probabilités demandées, des valeurs sont substituées dans la formule donnée au début:

y = 2

μ = 0,93

e = 2,71828

C'est bien moins que P (2).

Les résultats sont listés ci-dessous:

P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.

Par exemple, nous pourrions dire qu'il existe une probabilité de 39,5% qu'aucun séisme majeur ne se produise au cours d'une année donnée. Ou qu'il y a 5,29% des 3 grands tremblements de terre qui se produisent cette année-là.

Solution c)

c) Les fréquences sont analysées en multipliant par n = 100 ans:

39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 et 0,00471.

Par exemple:

- Une fréquence de 39,5 indique que, en 39,5 sur 100 ans, 0 grand tremblement de terre se produit, on pourrait dire que c'est assez proche du résultat réel de 47 ans sans tremblement de terre majeur..

Comparons un autre résultat de Poisson avec les résultats réels:

- La valeur obtenue de 36,7 signifie que sur une période de 37 ans, il y a 1 grand tremblement de terre. Le résultat réel est qu'en 31 ans il y a eu 1 tremblement de terre majeur, une bonne correspondance avec le modèle.

- 17,1 ans sont attendus avec 2 grands tremblements de terre et on sait qu'en 13 ans, ce qui est une valeur proche, il y a en effet eu 2 grands tremblements de terre.

Par conséquent, le modèle de Poisson est acceptable pour ce cas.

Exercice 2

Une entreprise estime que le nombre de composants qui échouent avant d'atteindre 100 heures de fonctionnement suit une distribution de Poisson. Si le nombre moyen d'échecs est de 8 pendant cette période, recherchez les probabilités suivantes:

a) Qu'un composant tombe en panne dans 25 heures.

b) Panne de moins de deux composants, en 50 heures.

c) Panne d'au moins trois composants en 125 heures.

Solution à)

a) On sait que la moyenne des pannes en 100 heures est de 8, donc en 25 heures on s'attend à un quart de pannes, soit 2 pannes. Ce sera le paramètre μ.

La probabilité qu'un composant échoue est demandée, la variable aléatoire est «composants qui échouent avant 25 heures» et sa valeur est y = 1. En substituant dans la fonction de probabilité:

Cependant, la question est de savoir quelle est la probabilité qu'ils échouent moins de deux composants en 50 heures, pas que exactement 2 composants tombent en panne en 50 heures, il faut donc ajouter les probabilités que:

-Aucun échoue

-Échec seulement 1

P (moins de 2 composants échouent) = P (0) + P (1)

P (moins de 2 composants échouent) = 0,0183 + 0,0732 = 0.0915

c) Qu'ils échouent au moins 3 composants en 125 heures, cela signifie que 3, 4, 5 ou plus peuvent tomber en panne pendant ce temps.

La probabilité que cela se produise au moins l'un de plusieurs événements est égal à 1, moins la probabilité qu'aucun des événements ne se produise.

-L'événement souhaité est que 3 composants ou plus tombent en panne en 125 heures

-Si l'événement ne se produit pas, cela signifie que moins de 3 composants échouent, dont la probabilité est: P (0) + P (1) + P (2)

Le paramètre μ de la distribution dans ce cas est:

 μ = 8 + 2 = 10 pannes en 125 heures.

P (échec de 3 composants ou plus) = 1- P (0) - P (1) - P (2) =

Les références

  1. MathWorks. Distribution de Poisson. Récupéré de: es.mathworks.com
  2. Mendenhall, W. 1981. Statistiques de gestion et d'économie. 3e. édition. Grupo Editorial Iberoamérica.
  3. Stat Trek. Enseignez-vous les statistiques. Distribution de Poisson. Récupéré de: stattrek.com,
  4. Triola, M. 2012. Statistiques élémentaires. 11ème. Éd. Pearson Education.
  5. Wikipédia. Distribution de Poisson. Récupéré de: en.wikipedia.org

Personne n'a encore commenté ce post.