Transcript lecture_5
Outliers
• Силно отличаващи
се резултати;
• Грешка при
измерването или
отклонение от ср.
стойност в рамките
на норм.
разпределение?
Критерий на Grubb
за откриване на outliers
X x1 , x 2 , ... x n
H0 :
x i outlier
H1 :
x i outlier
G calc
" outlier " x
s
Критерий на Grubb
Пример (1)
Критерий на Grubb
Пример (2)
Статистически тестове (1)
•
Определяне на статистически хипотези
Има ли статистически значима разлика,
при ниво на статистическа сигурност 95%,
между средните стойности ...?
H0 : y
H1 : y
Едностранен или двустранен критерий ???
H0 : y
Статистически по-ниска (по-висока) ли е
средната стойност на ....... от ...,
при ниво на статистическа сигурност 95%?
H1 : y
H1 : y
Статистически тестове (2)
• Изчисляване на експерименталните
(наблюдавани) стойности на
разпределенията (t- , F-, G-);
• Определяне на табличните стойности;
• Сравнение на ескп. и табл. стойности;
• Определяне на валидната хипотеза;
• Отговор на поставения въпрос.
Статистически тестове
Параметрични Непараметрични
тестове
тестове
Цел
Нормално
разпределени
резултати
Описание на
резултатите
Средна стойност,
Станд. отклонение
Сравняване на две
независими групи
t-тест
te x p
x x
1
t-тест
Медиана,
Размах
Mann-Whitney U test
2
s n1 n1
1
Сравняване на две
зависими групи
Резултати с
разпределение
≠ нормалното
texp
2
d
s / n
d
Wilcoxon pair rank
test
Кога използваме
непараметрични тестове?
• Данни с разпределение различно от
нормалното;
• Данни, в които имаме екстремни
стойности;
• Данни с голяма дисперсия;
• Качествени променливи измервани в
ординална скала.
Сравняване на две групи
независими резултати
(Mann-Whitney U test)
• Най-разпространения непараметричен тест
за сравнение на две независими групи от
резултати;
• Сравняване на медианите на двете групи от
резултати;
• Използва ранга на резултатите, а не тяхната
стойност;
• Има по-слаба предсказваща способност от
съответния параметричен тест.
H : Me Me
0
1
2
1
1
2
H : Me Me
Mann-Whitney U test
n1 – броя на наблюденията в по-малката
група от резултати
n2 – броя на наблюденията в по-голямата
група от резултати.
2. Образуване на обща извадка (възходящ
ред) и определяне ранга на всеки резултат.
1.
n1 ( n1 1)
U 1 n1n 2
R1
2
n 2 ( n 2 1)
U 2 n1n 2
R2
2
R1 – сумата от ранговете за извадката
с обем n1.
R2 – сумата от ранговете за извадката
с обем n2.
Mann-Whitney U test
U m in(U ,U )
1
U tabl ( n1 , n 2 , )
2
U U tabl H : M e M e
0
1
2
1
1
2
U U tabl H : M e M e
Mann-Whitney U test
Mann-Whitney U test
U m in(9,7) 7
Mann-Whitney U test
U m in(19,6) 6
Mann-Whitney U test
U 6
U tabl 2
U U tabl H : M e M e
0
A
B
Сравняване на две групи
зависими резултати
(Wilcoxon pair rank test)
• Изчислява се разликата между всяка двойка
резултати;
• Определя се ранга на разликите по абсолютна
стойност (при две едн. ст-ти се взема средния
ранг: 2 (3+4)/2=3.5, 3.5);
• Разлики = 0 се отстраняват, като се коригира n;
• Ранговете се събират според техния знак R(+)
и R(-);
H : Me Me
0
1
2
1
1
2
H : Me Me
Wilcoxon pair rank test
W m in ( R ( ) , R ( ))
W ta b l ( n , )
W W ta b l H : M e M e
0
1
2
1
1
2
W W ta b l H : M e M e
Wilcoxon pair rank test
R ( ) 7 1
R ( ) 7
W 7
Wilcoxon pair rank test
W 7
W tabl (12,0.05) ?
W W tabl H : M e M e
1
1
2