Презентация

Download Report

Transcript Презентация

Курс математической
статистики
Лекционный материал
Преподаватель – В.Н. Бондаренко
Содержание
Тема 4. Статистическая проверка гипотез (продолжение)
6.
Сравнение двух дисперсий нормальных генеральных
совокупностей
7.
Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
8.
Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны (независимые
выборки)
9.
Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Задача сравнения дисперсий необходима для определения точности
результатов измерений и выбора того метода, который обеспечивает
наименьшее рассеяние результатов (наименьшую дисперсию)
Пусть генеральные совокупности X и Y распределены нормально и по
выборкам из них найдены исправленные дисперсии s2X и s2Y .
Требуется по данным выборочных дисперсий проверить гипотезу, что
генеральные дисперсии генеральных совокупностей равны между собой:
H0: D (X) = D (Y)
Поскольку исправленные дисперсии являются несмещенными оценками
генеральных дисперсий, то нулевую гипотезу можно записать:
H0: М [s2X] = М [s2Y]
т.е. надо проверить, что математические ожидания исправленных
выборочных дисперсий равны между собой
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
В качестве критерия проверки нулевой гипотезы о равенстве генеральных
дисперсий примем отношение большей исправленной дисперсии к
меньшей, т.е. случайную величину:
F = s2б / s2м
где величина F имеет распределение Фишера-Снедекора со степенями
свободы k1 = n1 – 1, k2 = n2 – 1,
n1 – объем выборки, по которыми вычислена большая исправленная
дисперсия,
n2 – объем выборки, по которыми вычислена меньшая исправленная
дисперсия
Критическая область строится в зависимости от вида конкурирующей
гипотезы
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Первый случай. Нулевая гипотеза H0: D (X) = D (Y). Конкурирующая гипотеза
H1: D (X) > D (Y).
В этом случае строят правостороннюю критическую область, чтобы при
справедливости нулевой гипотезы вероятность попадания критерия F в эту
область была равна принятому уровню значимости:
P [ F > Fкр (α; k1; k2)] = α
Критическую точку находят по таблице критических точек распределения
Фишера-Снедекора, и тогда
 правосторонняя критическая область определяется неравенством F > Fкр
 область принятия нулевой гипотезы – неравенством F < Fкр
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Обозначим отношение большей исправленной дисперсии к меньшей,
вычисленное по данным наблюдений, через Fнабл и сформируем правило
проверки нулевой гипотезы.
Правило 1. Для того, чтобы проверить нулевую гипотезу H0: D (X) = D (Y) о
равенстве генеральных дисперсий нормальных совокупностей при
конкурирующей гипотезе H1: D (X) > D (Y) , надо вычислить отношение
большей исправленной дисперсии к меньшей, т.е.
Fнабл = s2б / s2м
и по таблице критических точек распределения Фишера-Снедекора по
заданному уровню значимости α и числам степеней свободы k1 и k2
находим критическую точку Fкр (α; k1; k2)
Если Fнабл < Fкр – нет оснований отвергать нулевую гипотезу
Если Fнабл > Fкр – нулевую гипотезу отвергают
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Пример. По двум независимым выборкам объемов n1 = 12 и n2 = 15,
извлеченным из нормальных генеральных совокупностей X и Y, найдены
исправленные выборочные дисперсии s2X = 11,41 и s2Y = 6,52. Требуется при
уровне значимости 0,05 проверить нулевую гипотезу H0: D (X) = D (Y) при
конкурирующей гипотезе H1: D (X) > D (Y).
Решение: Найдем отношение большей исправленной дисперсии к меньшей:
Fнабл = 11,41 / 6,52 = 1,75
Поскольку H1: D (X) > D (Y), то критическая область – правосторонняя.
По таблице критических точек распределения Фишера-Снедекора
по заданному уровню значимости α = 0,05 и числам степеней свободы
k1 = 12 – 1 = 11 и k2 = 15 – 1 = 14
находим критическую точку Fкр (α; k1; k2) = Fкр (0,05; 11; 14) = 2,56
Так как Fнабл < Fкр – нет оснований отвергать нулевую гипотезу
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Второй случай. Нулевая гипотеза H0: D (X) = D (Y). Конкурирующая
гипотеза H1: D (X) ≠ D (Y).
В этом случае строят двустороннюю критическую область, чтобы при
справедливости нулевой гипотезы вероятность попадания критерия F в
эту область была равна принятому уровню значимости:
P ( F < F1 ) + P ( F > F2 ) = α
Наибольшая вероятность попадания критерия при справедливости
конкурирующей гипотезы достигается, когда вероятность попадания
критерия в каждый из двух интервалов критической области равна α/2:
P ( F < F1) = α/2, P ( F > F2) = α/2
В случае конкурирующей гипотезы H1: D (X) ≠ D (Y) достаточно найти
правую критическую точку F2 = Fкр (α/2; k1; k2) по таблице критических
точек распределения Фишера-Снедекора
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Правило 2. Для того, чтобы при заданном уровне значимости α проверить
нулевую гипотезу H0: D (X) = D (Y) о равенстве генеральных дисперсий
нормальных совокупностей при конкурирующей гипотезе H1: D (X) ≠ D (Y) ,
надо вычислить отношение большей исправленной дисперсии к
меньшей, т.е.
Fнабл = s2б / s2м
и по таблице критических точек распределения Фишера-Снедекора по
заданному уровню значимости α/2 и числам степеней свободы k1 и k2
находим критическую точку Fкр (α /2; k1; k2)
Если Fнабл < Fкр – нет оснований отвергать нулевую гипотезу, если Fнабл > Fкр
– нулевую гипотезу отвергают
4.6 Сравнение двух дисперсий нормальных генеральных
совокупностей
Пример. По двум независимым выборкам объемов n1 = 10 и n2 = 18,
извлеченным из нормальных генеральных совокупностей X и Y, найдены
исправленные выборочные дисперсии s2X = 1,23 и s2Y = 0,41. Требуется при
уровне значимости α = 0,1 проверить нулевую гипотезу H0: D (X) = D (Y) при
конкурирующей гипотезе H1: D (X) ≠ D (Y).
Решение: Найдем отношение большей исправленной дисперсии к меньшей:
Fнабл = 1,23 / 0,41 = 3
Поскольку H1: D (X) ≠ D (Y), то критическая область – двусторонняя
По таблице критических точек распределения Фишера-Снедекора
по заданному уровню значимости, вдвое меньше заданного, то есть
α/2 = 0,1/2 = 0,05, и числам степеней свободы k1 = 10 – 1 = 9 и k2 = 18 – 1 = 17
находим критическую точку Fкр (α/2; k1; k2) = Fнабл (0,05; 9; 17) = 2,50
Fнабл > Fкр – нулевую гипотезу о равенстве генеральных дисперсий отвергаем
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Пусть из генеральной совокупности извлечена выборка объема n и по ней
найдена исправленная выборочная дисперсия S2 с k = n – 1 степенями
свободы.
Требуется по исправленной дисперсии при заданном уровне значимости
проверить нулевую гипотезу, состоящую в том, что генеральная
дисперсия рассматриваемой совокупности равна гипотетическому
значению σ20 (σ20 устанавливается на основании предшествующего опыта
или теоретически).
Учитывая, что S2 является несмещенной оценкой генеральной дисперсии,
нулевую гипотезу можно записать так:
H0: М (S2) = σ20
Итак, требуется установить, значимо или незначимо различаются
исправленная выборочная и гипотетическая генеральная дисперсии,
чтобы, например, оценить точность различных методов исследования.
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
В качестве критерия проверки нулевой гипотезы примем случайную
величину, которая имеет распределение χ2 с k = n – 1 степенями свободы:
χ2 = (n – 1) S2 / σ20
Критическая область строится в зависимости от вида конкурирующей
гипотезы:
1) H1: σ2 > σ20
2) H1: σ2 ≠ σ20
3) H1: σ2 < σ20
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Первый случай. Нулевая гипотеза H0: σ2 = σ20 .
Конкурирующая гипотеза H1: σ2 > σ20
В этом случае строят правостороннюю критическую область, чтобы при
справедливости нулевой гипотезы вероятность попадания критерия F в
эту область была равна принятому уровню значимости:
P [χ2 > χ2 кр (α, k)] = α
Критическую точку χ2 кр (α, k) находят по таблице критических точек
распределения χ2, и тогда правостороння критическая область
определяется неравенством χ2 > χ2 кр, а область принятия нулевой
гипотезы – неравенством χ2 < χ2 кр
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Обозначим отношение большей исправленной дисперсии к меньшей,
вычисленное по данным наблюдений, через χ2 набл и сформируем
правило проверки нулевой гипотезы.
Правило 1. Для того, чтобы проверить нулевую гипотезу H0: σ2 = σ20 о
равенстве неизвестной генеральной дисперсии нормальной
совокупности при конкурирующей гипотезе H0: σ2 > σ20 , надо вычислить
наблюдаемое значение критерия χ2 набл = (n – 1) S2 / σ20
и по таблице критических точек распределения χ2 по заданному уровню
значимости α и числу степеней свободы k = n – 1 найти критическую точку
χ2 кр (α; k)
Если χ2 набл < χ2 кр – нет оснований отвергать нулевую гипотезу, если χ2 набл >
> χ2 кр – нулевую гипотезу отвергают
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Пример. Из нормальной генеральной совокупности извлечена выборка
объема n = 13 и по ней найдена исправленная выборочная дисперсия s2 =
= 14,6. Требуется при уровне значимости 0,01 проверить нулевую гипотезу
H0: σ2 = σ20 при конкурирующей гипотезе H1: σ2 > 12.
Решение: Найдем наблюдавшееся значение критерия:
χ2 набл = (n – 1) S2 / σ20 = ((13 – 1) ∙ 14,6) / 12 = 14,6
Поскольку H1: σ2 > σ20, то критическая область – правосторонняя.
По таблице критических точек распределения χ2 по заданному уровню
значимости α = 0,01 и числу степеней свободы k = 13 – 1 = 12
находим критическую точку χ2 кр (α; k) = χ2 кр (0,01; 12) = 26,2
Так как χ2 набл < χ2 кр – нет оснований отвергать нулевую гипотезу
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Второй случай. Нулевая гипотеза H0: σ2 = σ20 .
Конкурирующая гипотеза H1: σ2 ≠ σ20
В этом случае строят двустороннюю критическую область, чтобы при
справедливости нулевой гипотезы вероятность попадания критерия χ2 в эту
область была равна принятому уровню значимости.
Критические точки находят, требуя, чтобы вероятность попадания критерия
в каждый из двух интервалов критической области была равна α/2:
P [χ2 < χ2 лев.кр (α/2;k)] = α/2, P [χ2 > χ2 прав.кр (α/2;k)] = α/2
Правая критическая точка находится по таблице критических точек
распределения χ2
Левая критическая точка также может быть найдена как правая из
соотношения: P (χ2 > χ2 лев.кр) = 1 – P (χ2 < χ2 лев.кр) = 1 – (α/2)
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Правило 2. Для того, чтобы проверить нулевую гипотезу H0: σ2 = σ20 о
равенстве неизвестной генеральной дисперсии нормальной совокупности
при конкурирующей гипотезе H0: σ2 ≠ σ20 , надо вычислить наблюдаемое
значение критерия χ2 набл = (n – 1) S2 / σ20
и по таблице критических точек распределения χ2 найти левую критическую
точку χ2 кр (1 – α/2; k) и правую критическую точку χ2 кр (α/2; k)
Если χ2 лев.кр < χ2 набл < χ2 прав.кр – нет оснований отвергать нулевую гипотезу
Если χ2 набл < χ2 лев.кр или χ2 набл > χ2 прав.кр – нулевую гипотезу отвергают
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Пример. Из нормальной генеральной совокупности извлечена выборка
объема n = 13 и по ней найдена исправленная выборочная дисперсия s2 =
= 0,13. Требуется при уровне значимости 0,02 проверить нулевую гипотезу
H0: σ2 = σ20 при конкурирующей гипотезе H1: σ2 ≠ 12.
Решение: Найдем наблюдавшееся значение критерия:
χ2 набл = (n – 1) S2 / σ20 = ((13 – 1) ∙ 10,3) / 12 = 10,3
Поскольку H1: σ2 ≠ σ20, то критическая область – двусторонняя.
По таблице распределения χ2 находим критические точки:
 Левую – χ2 кр (1 – α/2; k) = χ2 кр (1 – 0,02/2; 12) = χ2 кр (0,99; 12) =3,57
 Правую – χ2 кр (α/2; k) = χ2 кр (0,02/2; 12) = χ2 кр (0,01; 12) =26,2
Так как наблюдавшееся значение критерия принадлежит области принятия
гипотезы (3,57 < 10,3 < 26,2) – нет оснований ее отвергнуть
4.7 Сравнение исправленной выборочной дисперсии с
гипотетической генеральной дисперсией нормальной
совокупности
Третий случай. Конкурирующая гипотеза H1: σ2 < σ20
Правило 3. При конкурирующей гипотезе H1: σ2 < σ20 находят критическую
точку χ2 кр (1 – α; k)
Если χ2 набл > χ2 кр (1 – α; k) – нет оснований отвергать нулевую гипотезу
Если χ2 набл < χ2 кр (1 – α; k) – нулевую гипотезу отвергают
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Пусть из нормальных генеральных совокупностей X и Y извлечены
выборки объемами n и m, и по ним найдены выборочные средние 𝑥 и 𝑦 .
Требуется по выборочным средним при заданном уровне значимости α
проверить нулевую гипотезу, состоящую в том, что генеральные средние
(математические ожидания) рассматриваемых совокупностей равны
между собой, т.е.:
H0: М (X) = М (Y)
Учитывая, что выборочные средние являются несмещенными оценками
генеральных средних, нулевую гипотезу можно записать так:
H0: М (𝑋) = М (𝑌)
Итак, требуется установить, значимо или незначимо различаются
выборочные средние.
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
В качестве критерия проверки нулевой гипотезы примем случайную
величину:
Z=
𝑋−𝑌
=
𝜎 𝑋−𝑌
𝑋−𝑌
𝐷 𝑋 𝑛+𝐷 𝑌 𝑚
Критерий Z – нормированная нормальная случайная величина
Критическая область строится в зависимости от вида конкурирующей
гипотезы:
1) H1: M (X) ≠ M (Y)
2) H1: M (X) > M (Y)
3) H1: M (X) < M (Y)
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Первый случай. Нулевая гипотеза H0: M (X) = M (Y)
Конкурирующая гипотеза H1: M (X) ≠ M (Y)
В этом случае строят двустороннюю критическую область, чтобы при
справедливости нулевой гипотезы вероятность попадания критерия Z в эту
область была равна принятому уровню значимости.
Наибольшая мощность критерия достигается, когда левая и правая
критические точки выбраны так, что вероятность попадания критерия в
каждый из интервалов критической области равна α/2:
P (Z < z лев.кр ) = α/2, P (χ2 > χ2 прав.кр ) = α/2
Поскольку распределение критерия Z симметрично относительно нуля, то
критические точки также симметричны относительно нуля. Таким образом,
достаточно найти правую границу, чтобы найти двустороннюю критическую
область Z < -z кр , Z > z кр и область принятия нулевой гипотезы (-z кр , z кр )
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Для того, чтобы найти правую границу двусторонней критической области
(zкр), достаточно найти значение аргумента функции Лапласа, которому
соответствует значение функции, равное 1 − 𝛼 2
Обозначим отношение большей исправленной дисперсии к меньшей,
вычисленное по данным наблюдений, через Z набл и сформируем правило
проверки нулевой гипотезы.
Правило 1. Для того, чтобы проверить нулевую гипотезу H0: M (X) = M (Y)
о равенстве математических ожиданий двух нормальных генеральных
совокупностей с известными дисперсиями при конкурирующей гипотезе
H0: M (X) ≠ M (Y) , надо вычислить наблюдавшееся значение критерия
𝑍набл =
𝑋−𝑌
𝐷 𝑋 𝑛+𝐷 𝑌 𝑚
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Правило 1. (Продолжение)
… и по таблице функции Лапласа найти критическую точку по равенству
Ф 𝑧кр = 1 − 𝛼 2
Если 𝑍набл < 𝑧кр – нет оснований отвергать нулевую гипотезу
Если 𝑍набл > 𝑧кр – нулевую гипотезу отвергают
Пример. По двум независимым выборкам объемов n = 60 и m = 50,
извлеченным из нормальных генеральных совокупностей, найдены
выборочные средние 𝑥 = 1250 и 𝑦 = 1275. Генеральные дисперсии известны:
D (X) = 120 и D (Y) = 100. Требуется при уровне значимости α = 0,01
проверить нулевую гипотезу H0: M (X) = M (Y) при конкурирующей гипотезе
H1: M (X) ≠ M (Y).
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Решение: Найдем наблюдаемое значение критерия:
𝑍набл =
𝑋−𝑌
𝐷 𝑋 𝑛+𝐷 𝑌 𝑚
=
1250 − 1275
120 60 + 100 50
= −12,5
Поскольку H1: M (X) ≠ M (Y), то критическая область – двусторонняя
Найдем правую критическую точку:
Ф 𝑧кр = 1 − 𝛼 2 = 1 − 0,01 2 = 0,495
По таблице функции Лапласа находим zкр = 2,58
Так как 𝑍набл > 𝑧кр – нулевую гипотезу отвергаем, выборочные средние
отличаются значимо
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Второй случай. Нулевая гипотеза H0: M (X) = M (Y)
Конкурирующая гипотеза H1: M (X) > M (Y)
В этом случае строят правостороннюю критическую область, чтобы при
справедливости нулевой гипотезы вероятность попадания критерия Z в
эту область была равна принятому уровню значимости:
P (Z > z кр) = α
Критическую точку z кр находят по формуле:
Ф 𝑧кр = 1 − 2𝛼 2
Тогда правостороння критическая область определяется неравенством
Z > z кр, а область принятия нулевой гипотезы – неравенством Z < z кр
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Правило 2. Для того, чтобы при заданном уровне значимости α проверить
нулевую гипотезу H0: M (X) = M (Y) о равенстве математических ожиданий
нормальных генеральных совокупностей с известными дисперсиями при
конкурирующей гипотезе H1: M (X) > M (Y) , надо вычислить
наблюдавшееся значение критерия
𝑍набл =
𝑋−𝑌
𝐷 𝑋 𝑛+𝐷 𝑌 𝑚
и по таблице функции Лапласа найти критическую точку из равенства
Ф 𝑧кр = 1 − 2𝛼 2
Если Z набл < z кр – нет оснований отвергать нулевую гипотезу
Если Z набл > z кр – нулевую гипотезу отвергают
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Пример. По двум независимым выборкам объемов n = 10 и m = 10,
извлеченным из нормальных генеральных совокупностей, найдены
выборочные средние 𝑥 = 14,3 и 𝑦 = 12,2. Генеральные дисперсии известны:
D (X) = 22 и D (Y) = 18.
Требуется при уровне значимости α = 0,05 проверить нулевую гипотезу H0: M
(X) = M (Y) при конкурирующей гипотезе H1: M (X) > M (Y).
Решение: Найдем наблюдаемое значение критерия:
𝑍набл =
14,3 − 12,2
22 10 + 18 10
= 1,05
Поскольку H1: M (X) > M (Y), то критическая область – правосторонняя.
По таблице функции Лапласа находим z кр = 1,64
Так как Z набл < z кр – нет оснований отвергать нулевую гипотезу
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Третий случай. Конкурирующая гипотеза H1: M (X) < M (Y)
Правило 3. При конкурирующей гипотезе H1: M (X) < M (Y) надо вычислить
Z набл и сначала по таблице функции Лапласа найти «вспомогательную» точку
z кр по равенству
Ф 𝑧кр = 1 − 2𝛼
2
а затем положить z’ набл = – z’кр
Если z набл > – z кр – нет оснований отвергать нулевую гипотезу
Если z набл < – z кр – нулевую гипотезу отвергают
4.8 Сравнение двух средних нормальных генеральных
совокупностей, дисперсии которых известны
(независимые выборки)
Пример. По двум независимым выборкам объемов n = 50 и m = 50,
извлеченным из нормальных генеральных совокупностей, найдены
выборочные средние 𝑥 = 142 и 𝑦 = 150. Генеральные дисперсии известны:
D (X) = 28,2 и D (Y) = 22,8
Требуется при уровне значимости α = 0,01 проверить нулевую гипотезу
H0: M (X) = M (Y) при конкурирующей гипотезе H1: M (X) < M (Y)
Решение: Найдем наблюдаемое значение критерия: 𝑍набл = −8
Поскольку H1: M (X) < M (Y), то критическая область – левосторонняя.
Найдем «вспомогательную» точку z кр : Ф 𝑧кр = 1 − 2 ∙ 0,01 2 = 0,49
По таблице функции Лапласа находим z кр = 2,33.
Следовательно, z’ набл = – z’кр = – 2,33
Так как Z набл < – z кр – нулевую гипотезу отвергаем
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
В предыдущих рассматриваемых случаях закон распределения
генеральной совокупности предполагался известным.
Если закон распределения неизвестен, но есть основания предположить,
что он имеет определенный вид (например, A), то проверяют нулевую
гипотезу, что генеральная совокупность распределена по закону А.
Проверка гипотезы о предполагаемом законе неизвестного
распределения производится при помощи специально подобранной
случайной величины – критерия согласия.
Критерием согласия называют критерий проверки гипотезы о
предполагаемом законе неизвестного распределения.
Известны критерии согласия χ2 Пирсона, Колмогорова, Смирнова, др.
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
В качестве примера рассмотрим применение критерия согласия Пирсона
для проверки гипотезы о нормальном распределении генеральной
совокупности.
Пусть по выборке объема n получено эмпирическое распределение:
Варианты
xi
x1
x2
…
xs
Эмпирические частоты
ni
n1
n2
…
ns
При уровне значимости α требуется проверить нулевую гипотез:
генеральная совокупность распределена нормально
В качестве критерия проверки нулевой гипотезы примем случайную
величину:
χ2
=
𝑛𝑖 −
𝑛′
2
𝑖
𝑛′ 𝑖
(∗)
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
Доказано, что при 𝑛 → ∞ закон распределения случайной величины (*)
независимо от того, какому закону распределения подчинена генеральная
совокупность, стремится к закону распределения χ2 с k степенями свободы.
Число степеней свободы находят по равенству: k = s – 1 – r,
где
s – число групп (частичных интервалов) выборки
r – число параметров предполагаемого распределения, которые
оценены по данным выборки
Для нормального распределения оценивают два параметра
(математическое ожидание и среднее квадратическое отклонение), поэтому
r = 2 и число степеней свободы r = s – 1 – r = s – 1 – 2 = s – 3
Случайная величина (*) является критерием согласия «хи квадрат».
Очевидно, что чем меньше различаются эмпирические и теоретические
частоты, тем меньше значение критерия.
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
Построим правостороннюю критическую область, исходя из требования,
чтобы вероятность попадания критерия в эту область в предположении
справедливости нулевой гипотезы была равна принятому уровню
значимости α:
P [χ2 > χ2 кр (α; k)] = α
Таким образом, правосторонняя критическая область определяется неравенством χ2 > χ2 кр (α; k), а область принятия нулевой гипотезы χ2 < χ2 кр (α; k)
Обозначим значение критерия, вычисленное по данным наблюдений, через
χ2 набл и сформируем правило проверки нулевой гипотезы.
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
Правило. Для того, чтобы при заданном уровне значимости проверить
нулевую гипотезу H0: генеральная совокупность распределена
нормально, надо сначала вычислить теоретические частоты, а затем
наблюдаемое значение критерия:
χ2
набл
=
𝑛𝑖 −
𝑛′
2
𝑖
𝑛′ 𝑖
и по таблице критических точек распределения χ2 , по заданному уровню
значимости α и числу степеней свободы k = s – 3 найти критическую точку
χ2 кр (α; k)
Если χ2набл < χ2кр – нет оснований отвергать нулевую гипотезу
Если χ2набл > χ2кр – нулевую гипотезу отвергают
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
Замечание 1
Объем выборки должен быть достаточно велик, во всяком случае не
менее 50. Каждая группа должна содержать не менее 5-8 вариант;
малочисленные группы следует объединять в одну, суммируя частоты.
Замечание 2
Для контроля вычислений формулу расчета наблюдаемого значения
критерия преобразуют к виду:
χ2набл =
𝑛𝑖 2 𝑛𝑖 ′
−𝑛
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
Пример. При уровне значимости 0,05 требуется проверить гипотезу о
нормальном распределении генеральной совокупности, если известны
эмпирические и теоретические частоты:
Эмпирические частоты
Теоретические частоты
6
3
13
14
38
42
74
82
106
99
85
76
30
37
14
13
Решение: Найдем χ2набл , для чего составим расчетную таблицу (см. далее)
Контроль: χ2набл =
𝑛𝑖 2 𝑛𝑖 ′ − 𝑛 = 373,19 − 366 = 7,19
Вычисление произведены правильно. Найдем число степеней свободы,
учитывая, что число групп выборки (различных вариант) s = 8, k = 8 – 3 = 5
По таблице критических точек распределения χ2 по уровню значимости α =
0,05 и числу степеней свободы k = 5 находим χ2 кр (0,05; 5) = 11,1
Так как χ2набл < χ2кр – нет оснований отвергнуть нулевую гипотезу
4.9 Проверка гипотезы о нормальном распределении
генеральной совокупности. Критерий согласия Пирсона
1
2
3
4
𝑖
𝑛𝑖
𝑛𝑖 ′
𝑛𝑖 − 𝑛𝑖 ′
1
2
3
4
5
6
7
8
6
13
38
74
106
85
30
14
3
14
42
82
99
76
37
13
3
-1
-4
-8
7
9
-7
1
∑
366
366
5
𝑛𝑖 − 𝑛𝑖 ′
9
1
16
64
49
81
49
1
6
2
𝑛𝑖 − 𝑛𝑖 ′
2
𝑛𝑖 ′
3
0,07
0,38
0,78
0,49
1,07
1,32
0,08
χ2набл = 7,19
7
8
𝑛𝑖 2
𝑛𝑖 2 𝑛𝑖 ′
36
169
1444
5476
11236
7225
900
196
12
12,07
34,38
66,78
113,49
95,07
24,32
15,08
373,19