Les Tests Statistiques

Download Report

Transcript Les Tests Statistiques

Les TESTS STATISTIQUES
Professeur Pascale FRIANT-MICHEL
> Faculté de Pharmacie
[email protected]
Les TESTS STATISTIQUES
• Finalité d’une étude statistique :
tirer des conclusions sur la population à partir de l’étude d’un
échantillon issu de cette population
• Obtention du résultat :
par les tests statistiques qui sont des tests d’hypothèse
l’hypothèse étant imposée par construction du test
1. Définitions (1)
Test statistique :
procédure qui permet , avec un risque d’erreur connu,
d’effectuer un choix entre deux hypothèses complémentaires
(Ho et H1) au vu des observations réalisées sur un échantillon
1. Définitions (2)
Deux séries de tests différents :
- tests non paramétriques
- tests paramétriques
Un test non paramétrique compare globalement la répartition des
observations et n’exige aucune connaissance sur la loi de
probabilité décrivant la variable étudiée
avantage de ces tests non paramétriques : ne nécessite pas
d’hypothèse sur la distribution
Un test est dit paramétrique si les hypothèses sont relatives à un
paramètre statistique (m, s, …) associé à la loi de probabilité
décrivant la variable étudiée
il nécessite généralement des conditions de validité (en
particulier, une distribution gaussienne de la variable)
1. Définitions (3)
Remarque :
Si toutes les hypothèses nécessaires à un test paramétrique sont
vérifiées, on perd de l’information en utilisant un test non
paramétrique, c’est-à-dire qu’il faudra un échantillon plus grand pour
obtenir la même significativité
Les résultats fournis par une étude statistique présentent de
l’intérêt dans la mesure où ils sont accompagnés d’indications
quantitatives fixant le degré de confiance qui peut leur être
accordé
2. Etapes de l’analyse statistique
a) Choix du test statistique en fonction des données du
problème et de la (ou des) variable(s) étudiée(s)
. nature de la (ou des) variable(s)
(qualitative ou quantitative)
. nombre d’échantillons d’observations
. si plus d’un échantillon, sont-ils indépendants ?
. taille des échantillons
grands (n ≥ 30) ou petits (n < 30)
b) Formulation littérale puis statistique des hypothèses
 Ho (hypothèse nulle)
 H1 (hypothèse alternative)
Définir les hypothèses à tester à partir des observations
2. Etapes de l’analyse statistique (suite)
c) Vérification des conditions de validité (ou d’application)
du test
d) Calcul de la valeur expérimentale de la statistique de
test à partir des observations
e) Choix du risque a ou risque de première espèce
f ) Conclusion de signification du test
3. Aspects généraux des problèmes du jugement sur échantillons (1)
• Etude statistique porte généralement sur un échantillon
• But de l’étude statistique : formuler des lois générales relatives à
la population à laquelle appartient l’échantillon
3. Aspects généraux des problèmes du jugement sur échantillons (2)
a) Problèmes d’estimation
=>
1er objectif du statisticien :
constituer un échantillon aussi représentatif que possible
de la population
2ème objectif :
tirer le maximum d’informations des résultats que lui a
fourni l’échantillon
3ème objectif :
déterminer quel est le degré de sécurité de ses conclusions
=>
On fixe, à priori,
le coefficient de sécurité (1 - a) ou
le coefficient de risque a
(valeurs complémentaires)
3. Aspects généraux des problèmes du jugement sur échantillons (3)
En pratique, on adopte généralement pour
coefficient de sécurité :
la valeur 95 %
(coefficient de risque de 5 %) ou
la valeur 99 %
(soit 1 % de risque)
• Dans l’estimation d’un paramètre de la population, pour tout
coefficient de sécurité, on associe un intervalle  x1 ; x 2 
appelé intervalle de confiance
En pratique, on détermine les intervalles de confiance pour un

coefficient de sécurité :
1 - a= 0,95 ou 0,99
3. Aspects généraux des problèmes du jugement sur échantillons (4)
b) Problèmes de conformité
Confronter des résultats d’expériences avec une théorie
supposée être valable pour l’ensemble de la population
c) Problèmes d’homogénéité
Deux ou plusieurs échantillons peuvent-ils être considérés
comme provenant d’une même population ?
c) Problèmes de corrélation
Lors de l’étude de plusieurs caractères, le problème qui se
pose est : existe-t-il une liaison ou une corrélation entre les
valeurs des caractères ?
L1 SANTE