Transcript lecture_5
Outliers • Силно отличаващи се резултати; • Грешка при измерването или отклонение от ср. стойност в рамките на норм. разпределение? Критерий на Grubb за откриване на outliers X x1 , x 2 , ... x n H0 : x i outlier H1 : x i outlier G calc " outlier " x s Критерий на Grubb Пример (1) Критерий на Grubb Пример (2) Статистически тестове (1) • Определяне на статистически хипотези Има ли статистически значима разлика, при ниво на статистическа сигурност 95%, между средните стойности ...? H0 : y H1 : y Едностранен или двустранен критерий ??? H0 : y Статистически по-ниска (по-висока) ли е средната стойност на ....... от ..., при ниво на статистическа сигурност 95%? H1 : y H1 : y Статистически тестове (2) • Изчисляване на експерименталните (наблюдавани) стойности на разпределенията (t- , F-, G-); • Определяне на табличните стойности; • Сравнение на ескп. и табл. стойности; • Определяне на валидната хипотеза; • Отговор на поставения въпрос. Статистически тестове Параметрични Непараметрични тестове тестове Цел Нормално разпределени резултати Описание на резултатите Средна стойност, Станд. отклонение Сравняване на две независими групи t-тест te x p x x 1 t-тест Медиана, Размах Mann-Whitney U test 2 s n1 n1 1 Сравняване на две зависими групи Резултати с разпределение ≠ нормалното texp 2 d s / n d Wilcoxon pair rank test Кога използваме непараметрични тестове? • Данни с разпределение различно от нормалното; • Данни, в които имаме екстремни стойности; • Данни с голяма дисперсия; • Качествени променливи измервани в ординална скала. Сравняване на две групи независими резултати (Mann-Whitney U test) • Най-разпространения непараметричен тест за сравнение на две независими групи от резултати; • Сравняване на медианите на двете групи от резултати; • Използва ранга на резултатите, а не тяхната стойност; • Има по-слаба предсказваща способност от съответния параметричен тест. H : Me Me 0 1 2 1 1 2 H : Me Me Mann-Whitney U test n1 – броя на наблюденията в по-малката група от резултати n2 – броя на наблюденията в по-голямата група от резултати. 2. Образуване на обща извадка (възходящ ред) и определяне ранга на всеки резултат. 1. n1 ( n1 1) U 1 n1n 2 R1 2 n 2 ( n 2 1) U 2 n1n 2 R2 2 R1 – сумата от ранговете за извадката с обем n1. R2 – сумата от ранговете за извадката с обем n2. Mann-Whitney U test U m in(U ,U ) 1 U tabl ( n1 , n 2 , ) 2 U U tabl H : M e M e 0 1 2 1 1 2 U U tabl H : M e M e Mann-Whitney U test Mann-Whitney U test U m in(9,7) 7 Mann-Whitney U test U m in(19,6) 6 Mann-Whitney U test U 6 U tabl 2 U U tabl H : M e M e 0 A B Сравняване на две групи зависими резултати (Wilcoxon pair rank test) • Изчислява се разликата между всяка двойка резултати; • Определя се ранга на разликите по абсолютна стойност (при две едн. ст-ти се взема средния ранг: 2 (3+4)/2=3.5, 3.5); • Разлики = 0 се отстраняват, като се коригира n; • Ранговете се събират според техния знак R(+) и R(-); H : Me Me 0 1 2 1 1 2 H : Me Me Wilcoxon pair rank test W m in ( R ( ) , R ( )) W ta b l ( n , ) W W ta b l H : M e M e 0 1 2 1 1 2 W W ta b l H : M e M e Wilcoxon pair rank test R ( ) 7 1 R ( ) 7 W 7 Wilcoxon pair rank test W 7 W tabl (12,0.05) ? W W tabl H : M e M e 1 1 2