Лекция 1 - Факультет прикладной математики и информатики

Download Report

Transcript Лекция 1 - Факультет прикладной математики и информатики

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ
ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.
КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ
ПРАВДОПОДОБИЯ
Книга Бытие, глава 8
Воды убывали; ворон; выпуск голубя (1-14)
…
8 Потом выпустил от себя голубя, чтобы видеть, сошла ли вода с
лица земли,
9 но голубь не нашел места покоя для ног своих и возвратился к
нему в ковчег, ибо вода была еще на поверхности всей земли; и он
простер руку свою, и взял его, и принял к себе в ковчег.
10 И помедлил еще семь дней других и опять выпустил голубя из
ковчега.
11 Голубь возвратился к нему в вечернее время, и вот, свежий
масличный лист во рту у него, и Ной узнал, что вода сошла с земли.
12 Он помедлил еще семь дней других и выпустил голубя; и он уже
не возвратился к нему.
13 Шестьсот первого года к первому дню первого месяца иссякла
вода на земле; и открыл Ной кровлю ковчега и посмотрел, и вот,
обсохла поверхность земли.
14 И во втором месяце, к двадцать седьмому дню месяца, земля
высохла.
2
Проверка гипотезы о виде распределения
Пусть x1, x2, x3,… - последовательность независимых наблюдений
случайной величины ξ.
Гипотезы о виде распределения ξ:
H 0 : f ( x)  f0 ( x, 0 )
H 1 : f ( x )  f1 ( x ,  1 )
• Критерий Неймана-Пирсона (1933)
• Критерий Вальда (1947)
• Проблема Кифера-Вейсса (1957)
• Критерий Айвазяна (1965)
• Критерий Лордена (1976)
3
Критерий Вальда (SPRT)
n
H1
c1
H0
c0
1
2
3
4
5
n
6
Абрахам Вальд (1902-1950)
Статистика критерия:
f1 ( x )
i
  ln
f0 ( x )
i 1
i
n

(n)
Области принятия проверяемых гипотез и область неопределенности:

H0
n
  : 
(n)
 n 0   : 
H
(n)
  
 c 0  , c 0  ln 

1  
1  
 c1  , c1  ln 

  
 n   : c0  
*
(n)
 c1 
4
Оптимальность критерия Вальда
Теорема 1. (А. Вальд, Дж. Вольфовиц, 1948)
Пусть T – последовательный критерий отношения вероятностей с
критическими границами - < c0 < 0 < c1 < + , с вероятностями
ошибок первого и второго рода  и , а Т- другой критерий с
вероятностями ошибок первого и второго рода  и .
Если
  и  и
E[n|H0]<  и E[n|H1]< 
Тогда
E[n|H0]  E[n|H0] и E[n|H1]  E[n|H1]
(1)
(2)
(3)
Г. Саймонс (1976) доказал возможность заменить условие (1) на (4)
+ +
(4)
5
Потеря оптимальности критерия Вальда
1. Проверка сложной гипотезы
J. Kiefer and L. Weiss. Some properties of Generalized
Sequential Probability Ratio Tests.Ann. Math. Stat.,
28(1):57–75, March 1957.
2. Нарушение предположений об независимости наблюдений
Matthew Finkelman (2008): The Wald–Wolfowitz Theorem Is
Violated in Sequential Mastery Testing, Sequential Analysis:
Design Methods and Applications, 27:3, 293-303
6
Средний объем выборки в критерии Вальда
Теорема 2. (Вальда, 1947)
Оценка снизу среднего числа наблюдений для любого
последовательного критерия с вероятностями ошибок α и β имеет вид:
E H 0 n ( ,  )  
 ( ,  )
 (H 0 )

1 x
 ( x , y )   (1  x ) ln 
 y

E H 1 n ( ,  ) 
 ( , )
 (H1)

 x 
  x ln 
  ,  (H i ) 

1 y 


f i ( x ) ln

f1 ( x )
dx
f0 ( x)
Теорема 3. (С.А. Айвазян, 1959).
Если f0(x)=f1(x) и 1 0, то при выполнении ряда условий
E H 0 n ( ,  ) 
2  ( ,  )
 (H 0 , H1)

 (H 0, H1) 
 (f

1
 f 0 ) ln
E H 1 n ( ,  ) 
f1
f0
2 (  ,  )
 (H 0 , H1)
dx   ( H 1 )   ( H 0 )
7
Распределение объема выборки в критерии Вальда
при проверке гипотез «нормальное-логистическое»
 ( H 0 )   0.010496503
 ( H 1 )  0.01436227472
 ( H 0 , H 1 )  0.0248587772
    0.05
 ( ,  )   (  ,  )  2,649995
E H 0 n ( ,  )  2 5 2
E H 1 n ( ,  )  1 8 4
E H i n ( ,  )  2 1 3
Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)
8
Усечение последовательного критерия отношения
правдоподобия
1. Потеря оптимальности
2. Нестатистические причины прекращения эксперимента

Высокая стоимость экспериментов

Этические причины в клинических испытаниях

…
9
Обобщенный последовательный критерий отношения
правдоподобия (GSPRT)
L. Weiss. Testing one simple hypothesis against another // Ann. Math. Stat.,
24(1953): pp. 273-281.
Области принятия проверяемых гипотез и область неопределенности:
 n 0   : 
H
(n)
 n 0   : 
H
(n)
 c 0 ( n )
 c1 ( n )
 n   : c0 ( n )  
*
(n)
 c1 ( n )
10
Armitage, P. (1957). Restricted sequential procedures. Biometrika, 44, 9–56.
11
Hemanta K. Baruah & G.P. Bhattacharjee (1980): A generalization of
anderson's modified sequential probability ratio test, Journal of Statistical
Computation and Simulation, 11:3-4, 197-208
12
Jennison C., Turnbull B.W.: Group sequential methods with applications to
clinical trials. Boca Raton, Chapman & Hall, 2000.
13
Критерий Айвазяна
n
c1

n 
H1
H0
c0
1
2
3
4
5
6
 8 ln(m in(  ,  ))
( H 0 , H 1)
- граница усечения
n*
n

 (H 0 , H1) 

( f1  f 0 ) ln

Айвазян С.А.
f1
dx
f0
Области принятия проверяемых гипотез и область неопределенности:


H
(n)
 n 0    :   c0   1 




H
(n)
 n 1    :   c1   1 



n 

*
 n    : c0   1    
n 


n 
1
,
c


2
ln

0

n * 

n 
1
,
c

2
ln
 1
n * 

n 

(n)
  c1   1    
n 

Anderson, T.W. (1960). A modification of the sequential probability ratio test to reduce the sample
size. Ann. Math. Statist., 31, 165–197.
Айвазян С.А. Различение близких гипотез о виде распределения в схеме обобщенного
последовательного критерия // Теория вероятностей и ее применения Том X, №4 (1965) с.
713-725
14
Критерий Лордена (2-SPRT)
H 0 | H 2,
H 2 | H1
H 2 : f 2   f 0  (1   ) f 1
 :  ( f 2 , f 0 )   ( f 2 , f1 )
f2 ( x )
i ,  (n) 
  ln
1
f
(
x
)
i 1
0
i
n
Статистики критерия:

(n)
0
Гарри Лорден
f1 ( x )
 ln f ( xi )
i 1
2
i
n
Области принятия проверяемых гипотез и область неопределенности:



(n)
 1 : 1
H0
n
H1
n
  
 c 0  , c 0  ln 

1  
1  
  0 :  0  c1  , c1  ln 

  

(n)
 n    0 :  0  c1 ,  1 :  1
*
(n)
(n)
 c0 
15
Оценивание точных критических границ методом
Монте-Карло
В работе Canner, P.L. (1977). Monitoring treatment differences in long-term
clinical trials. Biometrics, 33, 603–615. применялся метод Монте-Карло для
нахождения точных критических границ в последовательном критерии для
биномиального закона распределения.
В работах Гродзенской И.С. (2004) применялся метод Монте-Карло для
сравнения критериев Вальда, Айвазяна, Лордена и Павлова.
Постовалов С. Н. Проверка простых и сложных гипотез с использованием
последовательного критерия Вальда// ДОКЛАДЫ АН ВШ РФ. - 2011. - №
2(17). - С.140-150.
Постовалов С. Н. Проверка простых и сложных гипотез с использованием
последовательных критериев Лордена и Айвазяна / С. Н. Постовалов, М. Р.
Шахмаметова // Научный вестник НГТУ. - Новосибирск, 2011. - № 3 (44). - C.
17-28.
16
Вычисление вероятностей ошибок первого и второго
рода для критерия Вальда
Если нам нужно найти точные границы, мы должны вычислить
вероятности ошибок первого и второго рода:
i 1


1    P  H 0 | H 0    P   i  с 0  j   с 0 , с1  H 0 
i 1
j 1


i 1



1    P  H 1 | H 1    P   i  с1  j   с 0 , с1  | H 1 
i 1
j 1



Но это представляет собой сложную задачу, т.к.  i зависит от  j если i>j.
17
Вычисление вероятностей ошибок первого и второго
рода для критерия Вальда методом Монте-Карло
1. Выбирается область моделирования.
2. Строится сетка с маленьким шагом на выбранной области.
3. Моделируется случайная величина по H0 .
4. Вычисляется статистика критерия.
5. Проверяется условие выхода для каждой точки сетки
(с0,с1).
6. Если для какой-то точки сетки условие выхода не
выполнено, то перейти на шаг 3.
7. Шаги 3-6 повторяются N раз.
8. Для каждой точки сетки вероятность ошибки вычисляется
по формуле
 ( c 0 , c1 ) 
число ош ибок
N
18
Выбор числа повторений N
Какое число повторений надо взять, чтобы отклонение
эмпирической вероятности ошибки первого рода от истинного
значения не превосходило заданного уровня ?
Согласно центральной предельной теореме
 m

P
      2 Ф ( )  1   , N  
 N

где m – количество ошибок первого рода в серии из N повторов.
Отсюда
N  t
2
 (1   )

2
,
t  
1 


  1
2


Например, если   0.99,   0.01,   0.15 тогда N  8 460
19
Проверяемые гипотезы
Нормальный закон распределения:
H 0 : f ( x) 
 ( x   )2 
exp  
 ,  0
2
2


1
Логистический закон распределения:
H 1 : f ( x) 



e
x
3
x
3 

3
1  e






2
20
Расчет параметров критериев Лордена и Айвазяна
H 0 : f ( x) 
H 1 : f ( x) 
 ( x   )2 
exp  
 ,  0
2
2


1



x
e
3
x
3 

3
1  e






2
Критерий Лордена
 :  ( f 2 , f 0 )   ( f 2 , f 1 ), f 2   f 0  (1   ) f 1


   0 .5 5 2 6 1 4 9 4 4 5
f1

dx
  ( H 0 , H 1 )   ( f 1  f 0 ) ln
f0


Критерий Айвазяна
 ( H 0 , H 1 )  0.0248587772
min(α,β)
0.05
0.1
0.15
n*
964
741
610
21
H0 :
N (0,1)
H1 : 
L og  0,1 
(с0, с1)
22
(с0, с1)
H0 :
N (0,1)
H1 : 
L og  0,1 
23
Вычисление точных критических границ для
критерия Вальда
24
Вычисление точных критических границ для
критерия Вальда
α
β
0.15
0.10
0.05
0.01
0.15
0.10
0.05
0.01
-1.67, 1.42
-2.07, 1.47
-2.74, 1.52
-4.33, 1.56
-1.72, 1.81
-2.12, 1.86
-2.80, 1.91
-4.39, 1.95
-1.78, 2.48
-2.18, 2.54
-2.85, 2.59
-4.45, 2.63
-1.82, 4.11
-2.22, 4.17
-2.89, 4.23
-4.48, 4.26
25
Вычисление точных критических границ для
критерия Лордена
26
Вычисление точных критических границ для
критерия Лордена
α
β
0.15
0.10
0.05
0.01
0.15
0.10
0.05
0.01
-1,18;0,95
-1,47; 1,02
-2,00; 1,14
-3,24; 1,29
-1,25; 1,23
-1,56; 1,31
-2,10; 1,44
-3,36; 1,62
-1,36; 1,75
-1,68; 1,86
-2,23; 1,98
-3,53; 2,21
-1,50; 2,98
-1,85; 3,11
-2,43; 3,29
-3,77; 3,55
27
Вычисление точных критических границ для
критерия Айвазяна, n*=964
28
Вычисление точных критических границ для
критерия Айвазяна, n*=964
α
β
0.15
0.10
0.05
0.01
0.15
0.10
0.05
0.01
-1,9; 1,59
-2,48; 1,68
-3,69; 1,81
----
-2,02; 2,11
-2,61; 2,20
-3,89; 2,35
----
-2,15; 3,12
-2,82;
-4,14;3,48
----
---
---
----
----
29
Распределение объема выборки в критерии Вальда
при использовании приближенных границ
 ( H 0 )   0.010496503
 ( H 1 )  0.01436227472
 ( H 0 , H 1 )  0.0248587772
    0.05
 ( ,  )   (  ,  )  2,649995
E H 0 n ( ,  )  2 5 2
E H 1 n ( ,  )  1 8 4
E H i n ( ,  )  2 1 3
Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)
30
Распределение объема выборки в критерии Вальда
при использовании оценок точных границ
  0, 05006
  0, 03467
  0, 05089
  0, 04712
Средний объем выборки по 100000 реализаций равен 251 (при H0) и 206 (при H1)
31
Сокращение среднего объема выборки на 6% (при H0) и на 11% (при H1)
Распределение объема выборки в критерии Лордена
при использовании оценок точных границ
  0, 05038
  0, 01776
  0, 04986
  0, 02469
Ср. объем выборки по 100000 реализаций равен 367 (при H0) и 318 (при H1) – приб.
Ср. объем выборки по 100000 реализаций равен 268 (при H0) и 223 (при H1) –точн.
32
Сокращение среднего объема выборки на 27% (при H0) и на 30% (при H1)
Распределение объема выборки в критерии Айвазяна
при использовании оценок точных границ (n*=964)
  0, 0513
  0, 02044
  0, 04999
  0, 03026
Ср. объем выборки по 100000 реализаций равен 355 (при H0) и 312 (при H1) – приб.
Ср. объем выборки по 100000 реализаций равен 265 (при H0) и 214 (при H1) –точн.
33
Сокращение среднего объема выборки на 25% (при H0) и на 31% (при H1)
Сравнение среднего объема выборки для разных
критериев (при H0, вероятности ошибок первого и
второго рода равны 0.05)
400
367
355
Средний объем выборки
350
300
267
251
265
268
250
СОВ, приближенные границы
200
СОВ точные границы
150
100
50
0
Критерий Вальда
Критерий Айвазяна
Критерий Лордена
34
Сравнение распределений объема выборки для разных
критериев (при H0, вероятности ошибок первого и
второго рода равны 0.05) – приближенные границы
35
Сравнение распределений объема выборки для разных
критериев (при H0, вероятности ошибок первого и
второго рода равны 0.05) – точные границы
36
Сравнение среднего объема выборки для разных
критериев (при H1, вероятности ошибок первого и
второго рода равны 0.05)
350
318
312
Средний объем выборки
300
250
232
206
214
223
200
СОВ, приближенные границы
СОВ точные границы
150
100
50
0
Критерий Вальда
Критерий Айвазяна
Критерий Лордена
37
Пусть x1, x2, x3,… - последовательность независимых
наблюдений случайной величины ξ, подчиненной
нормальному закону распределения N(,).
У. Госсет
Гипотезы о параметрах распределения ξ:
H 0 :    0 ,  0
H 1 :   1   0 ,   0
Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна)
Статистика критерия имеет вид:
t
1
n
Гипотеза H0 не отвергается, если
  0
S
t 
1  1  
Fn 1 

2



где Fn-1 – функция распределения Стьюдента с (n-1) степенью свободы
38
Гипотезы о параметрах распределения ξ:
H0 :
  0

H 1 :   1 :
  ,  0
  0

 ,  0
Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна)
Статистика критерия имеет вид:
p1 n
p0 n


1 
1

exp


n 
2 0  
 2
1
n
2
  x i   0   
2
i 1

1

0
n
1

exp  
 2
1



exp




 2
n
2

i 1
n
2
  x i   0   
i 1
2

 d

2 
x


 i 0   d

39
;
Гипотезы Н0 принимается, если
p1 n
 A
1 
p0n

Гипотезы Н1 принимается, если
p1 n
 B 
p0n

1
Производятся дополнительные наблюдения до тех пор, пока
выполняются неравенства
B
p1 n
 A
p0 n
40
Вычисление оценок точных критических границ
41
Вычисление оценок точных критических границ при H 0 :   0
Таблица 1. Приближенные критические границы (B,A)
α
β
0,01
0,05
0,1
0,15
0,1
0.01, 9.9
0.06, 9.5
0.11, 9
0.17, 8.5
0,15
0.01, 6.6
0.06, 6.33
0.12, 6
0.18, 5.66
Таблица 2. Оценки точных критических границ
α
β
0,01
0,05
0,1
0,15
0,1
0.15, 5.44
0.32, 4.68
0.44, 4.14
0.52, 3.72
0,15
0.15, 3.65
0.32, 3.14
0.44, 2.77
0.53, 2.50
H 1 :   1.
Проблемы при оценивании точных границ
последовательного t-критерия

Есть зависимость от расстояния между гипотезами

Есть зависимость от ,
Границы [B,A]
 H 1  0.7
Границы
[B,A]
0.02, 6.18
  0.5
  0.6
  0.7
0.39, 4.95
0.25, 5.34
0.15, 5.44
 H 1  0.75
0.15, 5.40
H1  1
0.15, 5.44
H1  2
 H 1  15
0.65, 3.01
0.78, 1.65
43
План выступления

Обзор последовательных критериев проверки гипотез

Алгоритм построения оценок точных критических границ
методом Монте-Карло

Сравнение среднего объема выборки

Проверка сложных гипотез. Последовательный t-критерий
Стьюдента

Группированные и цензурированные наблюдения

Применение последовательных критериев
44
Использование последовательных критериев по
случайно цензурированным наблюдениям
• Для всех наблюдений известно время начала наблюдения;
• Для всех наблюдений известно время окончания наблюдения,
либо время выбытия из-под наблюдения;
• Выбор выбывших наблюдений производится случайно.
45
Модификация критерия Вальда по случайно
цензурированным наблюдениям
Введем обозначение:
f j ( x ), x-не цензурированное наблю дение

p j (x)  
 P j {  x }  1  F j ( x ), x-цензурированное наблю дение
, j=0,1.
тогда статистика критерия
k

k 
i 1
p1 ( x i )
p 0 ( xi )
или
k
k 

i 1
 p (x ) 
ln  1 i 
 p 0 ( xi ) 
46
Актуальные области применения процедуры
последовательной проверки гипотез о виде
распределения
• Задачи приемочного контроля качества
Вальд А. Последовательный анализ. //М.: Физматгиз, 1960. - 325 с.
Page E.S. Continuous inspection schemes // Biometrika, 1954, v. 41, p. 100-114.
• Задачи статистического управления технологическими
операциями
Бендерский А.М. Статистическое регулирование технологических процессов
методом кумулятивных сумм. – М.: Знание, 1973 – 70 c.
47
Актуальные области применения процедуры
последовательной проверки гипотез о виде
распределения
• Задачи построения рациональных планов испытаний на
надежность
Гродзенская И. С., Гродзенский С. Я., Томилин Н. А. Рационализация
контроля надежности элементов и систем // Наукоемкие технологии, 2003,
№ 2, с. 85-87.
• Клинические
испытания
Armitage P. Sequential medical trials. Oxford: Blackwell, 1961. 105 p.
48
Актуальные области применения процедуры
последовательной проверки гипотез о виде
распределения
• Радиолокационные задачи различения сигнала при
наличии помех в системах, основанных на накоплении
полезного сигнала
Гродзенская И. С. Разработка и исследование методов обнаружения
радиосигналов при наличии помех на основе оптимальных статистических
последовательных критериев // Тезисы докладов Научно-технической
конференции студентов, аспирантов и молодых специалистов МИЭМ. – М.:
МИЭМ, 2006, с. 257.
49
Заключение
1. Использование оценок точных критических границ
дает ощутимый выигрыш в среднем числе
наблюдений, особенно для модификаций критерия
Вальда – критериев Айвазяна и Лордена.
2. В рассмотренном примере в случае использования
приближенных критических границ несколько лучше
работает критерий Айвазяна, однако при
использовании оценок точных критических границ
критерии Айвазяна и Лордена становятся практически
эквивалентными.
3. Вычисление оценок точных критических границ
требует определенных вычислительных затрат, а
также разработки программного обеспечения, поэтому
применять этот метод имеет смысл в случае
проведения дорогостоящих, трудоемких и длительных
экспериментов.
4. Нахождение оценок точных критических границ
возможно и в более сложных случаях: при проверке
сложных гипотез, при цензурировании и при
50
группировании наблюдений.