Transcript lecture_5

Outliers
• Силно отличаващи
се резултати;
• Грешка при
измерването или
отклонение от ср.
стойност в рамките
на норм.
разпределение?
Критерий на Grubb
за откриване на outliers
X  x1 , x 2 , ... x n
H0 :
x i  outlier
H1 :
x i  outlier
G calc 
" outlier "  x
s
Критерий на Grubb
Пример (1)
Критерий на Grubb
Пример (2)
Статистически тестове (1)
•
Определяне на статистически хипотези
Има ли статистически значима разлика,
при ниво на статистическа сигурност 95%,
между средните стойности ...?
H0 : y  
H1 : y  
Едностранен или двустранен критерий ???
H0 : y  
Статистически по-ниска (по-висока) ли е
средната стойност на ....... от ...,
при ниво на статистическа сигурност 95%?
H1 : y  
H1 : y  
Статистически тестове (2)
• Изчисляване на експерименталните
(наблюдавани) стойности на
разпределенията (t- , F-, G-);
• Определяне на табличните стойности;
• Сравнение на ескп. и табл. стойности;
• Определяне на валидната хипотеза;
• Отговор на поставения въпрос.
Статистически тестове
Параметрични Непараметрични
тестове
тестове
Цел
Нормално
разпределени
резултати
Описание на
резултатите
Средна стойност,
Станд. отклонение
Сравняване на две
независими групи
t-тест
te x p 
x x
1
t-тест
Медиана,
Размах
Mann-Whitney U test
2
s n1  n1
1
Сравняване на две
зависими групи
Резултати с
разпределение
≠ нормалното
texp 
2
d
s / n
d
Wilcoxon pair rank
test
Кога използваме
непараметрични тестове?
• Данни с разпределение различно от
нормалното;
• Данни, в които имаме екстремни
стойности;
• Данни с голяма дисперсия;
• Качествени променливи измервани в
ординална скала.
Сравняване на две групи
независими резултати
(Mann-Whitney U test)
• Най-разпространения непараметричен тест
за сравнение на две независими групи от
резултати;
• Сравняване на медианите на двете групи от
резултати;
• Използва ранга на резултатите, а не тяхната
стойност;
• Има по-слаба предсказваща способност от
съответния параметричен тест.
H : Me  Me
0
1
2
1
1
2
H : Me  Me
Mann-Whitney U test
n1 – броя на наблюденията в по-малката
група от резултати
n2 – броя на наблюденията в по-голямата
група от резултати.
2. Образуване на обща извадка (възходящ
ред) и определяне ранга на всеки резултат.
1.
n1 ( n1  1)
U 1  n1n 2 
 R1
2
n 2 ( n 2  1)
U 2  n1n 2 
 R2
2
R1 – сумата от ранговете за извадката
с обем n1.
R2 – сумата от ранговете за извадката
с обем n2.
Mann-Whitney U test
U  m in(U ,U )
1
U tabl ( n1 , n 2 , )
2
U  U tabl  H : M e  M e
0
1
2
1
1
2
U  U tabl  H : M e  M e
Mann-Whitney U test
Mann-Whitney U test
U  m in(9,7)  7
Mann-Whitney U test
U  m in(19,6)  6
Mann-Whitney U test
U 6
U tabl  2
U  U tabl  H : M e  M e
0
A
B
Сравняване на две групи
зависими резултати
(Wilcoxon pair rank test)
• Изчислява се разликата между всяка двойка
резултати;
• Определя се ранга на разликите по абсолютна
стойност (при две едн. ст-ти се взема средния
ранг: 2 (3+4)/2=3.5, 3.5);
• Разлики = 0 се отстраняват, като се коригира n;
• Ранговете се събират според техния знак R(+)
и R(-);
H : Me  Me
0
1
2
1
1
2
H : Me  Me
Wilcoxon pair rank test
W  m in ( R (  ) , R (  ))
W ta b l ( n , )
W  W ta b l  H : M e  M e
0
1
2
1
1
2
W  W ta b l  H : M e  M e
Wilcoxon pair rank test
R ( )  7 1
R ( )  7
W 7
Wilcoxon pair rank test
W 7
W tabl (12,0.05)  ?
W  W tabl  H : M e  M e
1
1
2