Статистические гипотезы Лекция 2 1. Общее представление о статистических гипотезах. Статистика и параметры. 2. Гипотезы о среднем.
Download ReportTranscript Статистические гипотезы Лекция 2 1. Общее представление о статистических гипотезах. Статистика и параметры. 2. Гипотезы о среднем.
Slide 1
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 2
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 3
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 4
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 5
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 6
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 7
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 8
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 9
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 10
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 11
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 12
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 13
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 14
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 15
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 16
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 17
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 18
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 19
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 20
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 21
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 22
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 23
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 24
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 25
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 26
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 27
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 28
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 2
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 3
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 4
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 5
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 6
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 7
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 8
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 9
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 10
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 11
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 12
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 13
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 14
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 15
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 16
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 17
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 18
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 19
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 20
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 21
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 22
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 23
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 24
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 25
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 26
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 27
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru
Slide 28
Статистические
гипотезы
Лекция 2
1. Общее представление о статистических гипотезах.
Статистика и параметры.
2. Гипотезы о среднем. Распределение Стьюдента.
3. Сравнение двух выборок. Структурная модель
Стьюдента.
4. Сравнение дисперсий. F-распределение.
Вопросы для
обсуждения
ВОПРОС №1
Общее представление о статистических
гипотезах.
• Статистическая гипотеза – это предположение по
поводу параметров распределения случайной
величины.
• Проверка статистических гипотез осуществляется
путем сбора статистики.
Статистическая
гипотеза
Параметры
Статистика
• Теоретическая величина
характеризующая
распределение случайной
величины
• Имеет отношение к
генеральной совокупности
• Практически никогда не
известна
• Эмпирическая
характеристика, оценка
параметра распределения
случайной величины
• Имеет отношение к
выборке
• Измеряется в ходе
эксперимента
Параметры и
статистика
•
Примеры гипотез
Нулевая (H0)
Альтернативная (H1)
• Утверждает что-то
конкретное о
параметрах
распределения
• Истинность
определяется на основе
оценки статистики
• Утверждает что-то
противоречащее
нулевой гипотезе, менее
конкретна
• Истинность
определяется на основе
рассмотрения нулевой
гипотезы
Виды гипотез
P (x )
H 1 :
0 .5 0
H 0 :
С т а т и ст и ч еск а я
зн а ч и м о ст ь X e x p
(p -зн а ч ен и е)
0 .2 5
0
-3
0
X exp
Проверка гипотез
3
X
Гипотезы
H0 верна (H1
неверна)
H0 неверна (H1
верна)
H0 принимается
(H1 отвергается)
Правильное
принятие H0
(правильное
отвержение H1)
Ошибка второго
рода (β-ошибка)
H0 отвергается (H1
принимается)
Ошибка первого
рода (α-ошибка)
Правильное
отвержение H0
(правильное
принятие H1).
Матрица исходов
• Теоретически не существует возможности со 100%
вероятностью выбрать истинную гипотезу. Вне
зависимости от установленного критерия всегда
остается вероятность ошибки первого или второго
рода.
• Уменьшая вероятность ошибки первого рода, мы
увеличиваем вероятность ошибки второго рода и
наоборот.
Статистическая
надежность
P>0,10
Н0 принимается
P<0,05
H1, как правило, принимается.
Статистический вывод при
этом признается надежным
P<0,01
H1 принимается.
Статистический вывод
считается высоко надежным
0,05
Не представляется возможным
принять ни H0, ни H1. Результат
находится на границе уровней
значимости (маргинально
значим)
Уровни статистической
надежности
ВОПРОС №2
Гипотезы о среднем. Распределение
Стьюдента.
• Пусть есть вектор данных X
• Допустим, что X извлечены из нормальной
совокупности с параметрами μ и σ2
• Предположим: H0: μ=А
• Тогда: H1: ≠ A
Гипотезы о среднем
z
x
/
n
Случай №1: σ известна
t ( n 1)
x
s
n
Случай №2: σ неизвестна
• Распределение t-статистики отличается от нормального.
• Это распределение принято называть распределением
Стьюдента, или просто t-распределением.
• Распределение Стьюдента симметрично относительно
среднего и имеет небольшой положительный эксцесс.
• Оно характеризуется степенями свободы (обозначается df,
от англ. degrees of freedom).
• Для данного случая число степеней свободы t-статистики
на одну меньше объема выборки, т.е. равно n-1.
Статистика Стьюдента
P (X )
0 ,4
0 ,3
0 ,2
0 ,1
0
t
-3
-2
-1
0
1
t-распределение
2
3
ВОПРОС №3
Сравнение двух выборок. Структурная
модель Стьюдента.
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: μX = μY
• Тогда: H1: μX ≠ μY
Сравнение двух выборок
•
Структурная модель
x x x
y y y
x y x y x y
( x y) ( x y ) x y
Тогда…
• Сделаем неочевидное, но правдоподобное
допущение, что дисперсии X и Y одинаковы.
• Поскольку дисперсии X и Y определяются дисперсией
статистической ошибки ε, то
2
pooled
Допустим…
1
1
n m
2
s
2
pooled
x
x
y
y
n 1 m 1
2
t n m 2
x y
s
Отсюда…
2
pooled
x
y
1
1
n m
ВОПРОС №4
Сравнение дисперсий. F-распределение
• Пусть есть два вектора данных – X и Y
• Допустим, что X и Y извлечены из нормальной
совокупности с параметрами соответственно μX и σX
и μY и σY
• Предположим: H0: σX = σY
• Тогда: H1: σX ≠ σY
Сравнение дисперсий
F n 1, m 1
F-статистика
s
2
x
s
2
y
P (F )
0 .8
0 .6
0 .4
0 .2
0
0
1
2
3
F
F-распределение
4
5
www.ebbinghaus.ru