Biostat_P2_4_loi_binomiale

Download Report

Transcript Biostat_P2_4_loi_binomiale

Etudes des principales lois de probabilité
Loi Binomiale
• probabilité d’une variable aléatoire discrète
• modèle : urne avec deux types de boules
• effectuer n tirages équiprobables avec remise.
• l’urne contient (N1+N2) boules dont N1 sont
blanches et N2 sont noires.
• probabilité de tirer une boule blanche B est
N1
p
N1  N2
Etudes des principales lois de probabilité
• La probabilité de tirer une boule noire N est
q
N2
 1 p
N1  N2
• L’univers des éventualités comprend uniquement
deux éventualités :  = {B, N}
• on peut alors construire une V.A.
Loi binomiale : tirage d’une boule
• L’univers des éventualités est  = {B, N}.
On a :
• telle que X(B) = 1 avec une probabilité
Pr{X = 1} = p
• et X(N) = 0 avec une probabilité
Pr{X = 0} = q
Loi binomiale : tirage de deux boules avec
remise
• L’univers des éventualités est
 = {BB, BN, NB, NN}
• X(BB) = 2 avec une probabilité Pr{X = 2} = p²
• X(BN) = 1 et X(NB) = 1 avec une probabilité
Pr{X = 1} = 2pq
• X(NN) = 0 avec une probabilité Pr{X = 0} = q²
• Les valeurs des probabilités sont obtenues par le
développement de (p + q)² = 1
Loi binomiale : tirage de trois boules avec remise
• L’univers des éventualités est
 = {BBB, BBN, BNB, NBB, BNN, NBN, NNB, NNN}
• X(BBB) = 3 avec une probabilité Pr{X = 3} = p3
• X(BBN) = 2, X(BNB) = 2, X(NBB) = 2 avec une
probabilité Pr{X = 2} = 3p²q
• X(BNN) = 1, X(NBN) = 1, X(NNB) = 1, avec une
probabilité Pr{X = 1} = 3pq²
• X(NNN) = 0 avec une probabilité Pr{X = 0} = q3
Loi binomiale : tirage de quatre boules avec
remise
• Pour quatre tirages avec remise, les probabilités
s’obtiennent par le développement de :
• (p+q)4 = p4 + 4p3q + 6p²q² + 4pq3 + q4 = 1
Généralisation
• on effectue n tirages avec remise (tirage non
exhaustif). Les probabilités Pr(X = x), d’obtenir x
boules blanches en effectuant n tirages avec
remise s’obtiennent par le développement de :
•
(p+q)n
n
n
0
Cn p q
=
n-1 n-1 1
+ Cn p q + ...
x x n-x
+ Cn p q
+ ...
0 0 n
+ Cn p q
=1
n!
Cn  x!(n  x)!
x
Loi binomiale
• La probabilité Pr{X = x}, d’obtenir x boules
blanches lors de n tirages
x
px qn-x
• avec remise est : Pr {X = x} =
n
• = loi binomiale
• Propriétés n:
C
E(X) = np= x.Pr(X  x)
x 0
n
2
. Pr(X  x)
npq=
(x-E(X))
Var(X) =

x 0
x-1
Pr(Xx)
F(X) = Pr(Xx) = 
x 0
Histogramme et fonction de répartition de
la loi binomiale n = 6, p=q=0,5
x
Pr(X=x)
0 : 1(0,5)0 (0,5)6 = 1/64 = 0,016
1 : 6(0,5)1 (0,5)5 = 6/64 = 0,094
2 : 15(0,5)2 (0,5)4 = 15/64 = 0,234
3 : 20(0,5)3 (0,5)3 = 20/64 = 0,312
4 : 15(0,5)4 (0,5)2 = 15/64 = 0,234
5 : 6(0,5)5 (0,5)1 = 6/64 = 0,094
6 : 1(0,5)6 (0,5)0 = 1/64 = 0,016
Fonction de répartition
x
F(x) = Pr(Xx)
x=0
x=1
x= 2
x= 3
x= 4
x= 5
x= 6
: 1/64 = 0,016
: 7/64 = 0,110
: 22/64 = 0,344
: 42/64 = 0,656
: 57/64 = 0,890
: 63/64 = 0,984
: 64/64 = 1,000
0
1
2
3
4
5
F(X) = Pr(X  x)
6
Exemple
• On considère un test constitué de QCM pour
lesquelles cinq réponses sont présentées dont
une seule est correcte. Le test comprend n = 6
questions.
Quelle est :
• - la probabilité d’avoir au moins 4 bonnes réponses
en répondant au hasard, soit Pr(X  4)
• - la probabilité d’avoir moins de 4 bonnes réponses
en répondant au hasard, soit Pr(X < 4)
• - l’espérance mathématique E(X)
• - la variance Var(X)
Exercice
• Solution : En répondant au hasard à chaque
question on a 1 chance sur 5 de répondre
correctement à la question et 4 chances sur 5 de
donner une réponse fausse.
• p = 0,2 d’avoir une réponse juste et une
probabilité q = 0,8 d’avoir une réponse fausse.
• Le nombre de tirage est n = 6, le tirage peut être
considéré avec remise puisqu’à chaque tirage les
probabilités p et q ne changent pas.
Exercice
• Donc loi binomiale : avec n = 6, p = 0,2, q= 0,8.
• X ; Formule de calcul
•
•
•
•
•
•
•
0:
1:
2:
3:
4:
5:
6:
; Pr(X=x)
1(0,2)0 (0,8)6 = 0,262
6(0,2)1 (0,8)5 = 0,393
15(0,2)2 (0,8)4 = 0,245
20(0,2)3(0,8)3 = 0,082
15(0,2)4 (0,8)2 = 0,015
6(0,2)5 (0,8)1 = 0,001
1(0,2)6 (0,8)0 = 0,00006
exercice
• La probabilité Pr(X  4) est obtenue en faisant la
somme des probabilités suivantes
• Pr(X  4) = Pr(X=4) + Pr(X=5) + Pr(X=6) = 0,015 +
0,001 + 0,000006  0,017
• La probabilité Pr(X < 4) est obtenue en faisant la
somme des probabilités suivantes
• Pr(X < 4) = Pr(X=0) + Pr(X=1) + Pr(X=2) +
Pr(X=3) = 1- Pr(X  4) = 0,983
exercice
• Espérance mathématique : E(X) = np = 6 * 0,2
= 1,2
• Variance : Var(X) = npq = 6 * 0,2 * 0,8 = 0,96
Exercice 2
• Epidémie de méningite à méningocoque
• 7 sujets atteints
• Purpura Fulminans dans 21% des cas en
général
• Probabilité d’avoir au moins 1 cas ?
• Probabilité d’avoir plus de 3 cas ?
Exercice 2
•
•
•
•
•
•
Soit X le nombre de PF
Pr(X = 0) = 1 * 0,210 * 0,797 = 0,192
Pr(X = 1) = 7 * 0,211 * 0,796 = 0,357
Pr(X = 2) = 21 * 0,212 * 0,795 = 0,285
Pr(X = 3) = 35 * 0,213 * 0,794 = 0,126
Pr(X = 4) = 35 * 0,214 * 0,793 = 0,034
Exercice 2
• Pr(X = 5) = 21 * 0,215 * 0,792 = 0,005
• Pr(X = 6) = 7 * 0,216 * 0,791 = 0,0005
• Pr(X = 7) = 1 * 0,217 * 0,790 = 0,00002
• Donc Pr(X >0) = 1-0,192 = 0,808
• Pr(X>2) = 0,166
Exemple : Essai Th. phase II
• Développement médicaments : 4 phases
Phase : I / II / III / IV
• Phase II : Étudie l’efficacité thérapeutique
(relation effet dose)
• Efficacité « pharmacologique » (critère de
substitution) : pharmacodynamie
• médicament n ’a pas encore fait ses preuves :
sécurité max et minimiser nombre de sujets
Exemple : Essai Th. phase II
• Principe :
• inclusion de n1 sujets dans la première étape,
• puis selon les résultats, ajout ou non d ’une
seconde étape avec n2 sujets.
• On considère ici uniquement la première étape
qui consiste à arrêter l’étude lorsque le nombre
de succès du traitement est insuffisant.
• Drogue jugée inefficace si série « longue » de
patients sans succès thérapeutique ou sans effet
pharmacologique.
Exemple : Essai Th. phase II
• Habituellement, rejet d’une molécule si moins de
20% de succès. Donc : urne, p = 0,2
• rejet de la molècule si n sujets consécutifs sans
succès : si n « grand » : indicateur d ’un taux de
succès insuffisant (d ’une efficacité insuffisante)
• d ’où calcul du nombre de sujets n devant ne pas
répondre au traitement justifiant l ’arrêt du
développement de la molécule
• Choisir un risque de rejeter à tort la molécule : 5%.
Exemple : Essai Th. phase II
•
•
•
•
•
On sait que : Pr{X = x} = Cxn pxqn-x
Pr{X = 0} = C00p0qn = 0,8n < 0,05
d ’où : n = ln(0,05)/ln(0,8) = 13.42
et Pr(X=0|p=0,2) = 0,044.
Donc, si 14 sujets sans efficacité, on rejete la
molécule, considéré comme ayant un taux de
succès inférieur à 0,20.
Exemple : Essai Th. phase II
• Quelques autres valeurs du risque si n<14 :
–
–
–
–
n=13,
n=12,
n=11,
n=10,
p=0,055
p=0,069
p=0,086
p=0,107
• Si, parmi 14 sujets, un ou plusieurs sujets
répondent, on passe à la deuxième étape de
l’étude (non étudiée ici).
Loi de Poisson
• C’est la loi des événements rares (événements
se produisant peu souvent).
• Ceci se traduit par une probabilité p faible
(correspond à quelques boules blanches et un
grand nombre de boules noires dans une urne).
• Cette loi peut se déduire de la loi binomiale.
• Définition : une loi de probabilité suit une loi de
Poisson si Pr(X=x) = e  x
x!
Loi de Poisson
• x est entier,
• Exemple :
Pr(X=1) =
E(X) = Var(X) = np = 
X=1
 = 0,6
 0,6
0,6
e
= 0,33
1!
• On peut montrer que la loi Binomiale tend vers
une loi de Poisson dans certaines conditions
lorsque n   et p  0
 x
x x n- x
e 
p
q
Pr{X = x} =

n
x!
C
Densité de probabilité d ’une loi de Poisson
L oi de P ois s on : n = 6 00
p= 0, 00 1
P r (X =x )
P r(X= x )
0, 6
0, 4
0, 2
0
0
1
2
3
X
4
5
6
Loi de Poisson
• Soit n = 600
• x
•
•
•
•
•
0
1
2
3
4
p = 0,001 ( np = 0,6 et nq = 0,4 )
Poisson
Binomiale
Pr{X = x} =
Pr{X = x} =
0,5488
0,3292
0,0987
0,0197
0,00296
0,5486
0,3295
0,0988
0,0197
0,00295
Loi de Poisson
• Applications :
• calcul du nombre de patients consultant aux
urgences entre 22 et 23 h.
• Soit 100 plages horaires
• Objectif de plannification
Loi de Poisson
•
•
•
•
•
•
•
•
•
Si moyenne =  = 3
Pr(X = 0) = 0,0498  5% des tranches horaires
Pr(X = 1) = 0,1494
Pr(X = 2) = 0,2240
Pr(X = 3) = 0,2240
Pr(X = 4) = 0,1680
Pr(X = 5) = 0,1008
Pr(X = 6) = 0,0504
Pr(X > 6) = 0,0335
Exercice 2 (J. Bouyer)
• Dpt Calvados : 600 000 h. et 15 cas par an
de K thyroïde.
• Proba d’observer 10 nouveaux cas en une
année : Pr(X=10) = e-15 1510/10!
• Plus long à calculer avec Binomiale