Статистические гипотезы Лекция 2 1. Общее представление о статистических гипотезах. Статистика и параметры. 2. Гипотезы о среднем.

Transcript Статистические гипотезы Лекция 2 1. Общее представление о статистических гипотезах. Статистика и параметры. 2. Гипотезы о среднем.

Slide 1

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 2

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 3

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 4

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 5

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 6

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 7

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 8

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 9

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 10

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 11

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 12

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 13

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 14

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 15

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 16

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 17

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 18

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 19

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 20

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 21

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 22

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 23

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 24

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 25

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 26

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 27

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Slide 28

Статистические
гипотезы
Лекция 2

1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.

Вопросы для
обсуждения

ВОПРОС №1
Общее представление о статистических
гипотезах.

• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.

Статистическая
гипотеза

Параметры

Статистика

• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна

• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента

Параметры и
статистика

•

Примеры гипотез

Нулевая (H0)

Альтернативная (H1)

• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики

• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы

Виды гипотез

P (x )

H 1 :  

0 .5 0

H 0 :  

С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5

0
-3

0

X exp

Проверка гипотез

3

X

Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)

H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)

H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).

Матрица исходов

• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.

Статистическая
надежность

P>0,10

Н0 принимается

P<0,05

H1, как правило, принимается.
Статистический вывод при
этом признается надежным

P<0,01

H1 принимается.
Статистический вывод
считается высоко надежным

0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)

Уровни статистической
надежности

ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.

• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A

Гипотезы о среднем

z

x

 /

n

Случай №1: σ известна

t ( n  1) 

x  
s
n

Случай №2: σ неизвестна

• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.

Статистика Стьюдента

P (X )
0 ,4

0 ,3

0 ,2

0 ,1

0

t
-3

-2

-1

0

1

t-распределение

2

3

ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY

Сравнение двух выборок

•

Структурная модель

x  x  x
y  y  y

x  y  x  y  x  y
( x  y)  (  x   y )   x   y

Тогда…

• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
 



2
pooled

Допустим…

1
1
  
n m

2

s

2
pooled











x

x

y

y








n  1  m  1

2

t n  m  2  

 x  y   
s

Отсюда…

2
pooled

x

 y

1 
1
 

n m

ВОПРОС №4
Сравнение дисперсий. F-распределение

• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY

Сравнение дисперсий

F  n  1, m  1 

F-статистика

s

2
x

s

2
y

P (F )

0 .8

0 .6

0 .4

0 .2

0
0

1

2

3
F

F-распределение

4

5

www.ebbinghaus.ru

Статистические гипотезы Лекция 2 1. Общее представление о статистических гипотезах. Статистика и параметры. 2. Гипотезы о среднем.

Transcript Статистические гипотезы Лекция 2 1. Общее представление о статистических гипотезах. Статистика и параметры. 2. Гипотезы о среднем.

Directory