Раздел 1

Download Report

Transcript Раздел 1

Курс математической
статистики
Лекционный материал
Преподаватель – В.Н. Бондаренко
Содержание
Тема 1. Статистическая совокупность и выборочный метод
Тема 2. Статистические оценки параметров распределения
Тема 1. Статистическая совокупность
и выборочный метод
1.
Задачи математической статистики
2.
Генеральная и выборочная совокупности
3.
Повторная, бесповторная, репрезентативная выборки
4.
Способы отбора объектов наблюдения
5.
Статистическое распределение выборки
6.
Эмпирическая и теоретическая функции распределения
7.
Полигон и гистограмма частот
1.1 Задачи математической статистики
Математическая статистика определяется как наука о принятии решений в
условиях неопределенности.
Задачами математической статистики являются:
1.
Разработка способов определения числа испытаний до начала
исследования (планирование эксперимента)
2.
Определение способов сбора и группировки статистических
сведений, полученных в результате эксперимента
3.
Создание методов анализа статистических данных в зависимости от
целей исследования
1.2 Генеральная и выборочная совокупности
Для проведения статистического исследования отбирают некоторое
количество однородных статистических объектов, которые образуют
статистическую совокупность.
Выборочной совокупностью или просто выборкой называют
совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из
которых производится выборка.
Объемом совокупности (выборочной или генеральной) называют число
объектов этой совокупности.
Пример: Если из 1000 деталей отобрано для обследования 100 деталей,
то объем генеральной совокупности N=1000, а объем выборки n=100.
1.3 Повторная, бесповторная, репрезентативная выборки
Если при составлении выборки отобранный и исследованный объект
возвращается в генеральную совокупность, то такая выборка называется
повторной, если нет – бесповторной.
Статистическая совокупность изучается относительно некоторого
качественного или количественного признака совокупности.
Для достоверного вывода о признаке совокупности необходимо
обеспечить репрезентативность (представительность) выборки, то
есть она должна правильно представлять пропорции генеральной
совокупности.
1.3 Повторная, бесповторная, репрезентативная выборки
Критериями репрезентативности являются:
1. Случайный отбор объектов наблюдений, т.е. все объекты должны
иметь одинаковую вероятность попадания в выборку
2. Большая величина генеральной совокупности и незначительная
величина выборки (N >> n)
1.4 Способы отбора объектов наблюдения
Классификация способов отбора:
1.
2.
Отбор без разделения генеральной совокупности на части
a.
Простой случайный бесповторный отбор
b.
Простой случайный повторный отбор
Отбор, при котором генеральная совокупность делится на части
a.
Типический отбор
b.
Механический отбор
c.
Серийный отбор
1.4 Способы отбора объектов наблюдения
Простой случайный отбор
Объект извлекают по одному из Генеральной совокупности с помощью
генератора случайных чисел
• Бесповторный – исключать из рассмотрения объекты, которые уже
попали в статистическую выборку
• Повторный – допускать возможность повторения объектов в
статистической выборке
1.4 Способы отбора объектов наблюдения
Типический отбор
Объекты отбирают из каждой «типической» части генеральной
совокупности.
Используется, если обследуемый признак заметно колеблется в
различных частях генеральной совокупности.
Пример:
Продукция изготавливается на нескольких машинах с различной
степенью изношенности. Тогда отбор следует производить из
продукции, выпущенной машинами определенного типа
1.4 Способы отбора объектов наблюдения
Механический отбор
Генеральную совокупность «механически» делят на группы, их количество
равно объему выборки, затем из каждой группы отбирают по одному
объекту наблюдения.
Пример:
Если необходимо выбрать 20% изготавливаемых деталей, то
отбирают каждую 5-ю деталь, если 5% деталей, то отбирают
каждую 20-ю деталь
1.4 Способы отбора объектов наблюдения
Серийный отбор
Объекты отбирают «сериями», которые обследуются полностью.
Используется, когда обследуемый признак колеблется незначительно
между сериями.
Пример: Если все детали производятся на одинаковых станкахавтоматах, то достаточно выбрать несколько станков для сплошного
обследования произведенных деталей.
Комбинированный отбор
Часто используется сочетание нескольких способов отбора объектов
наблюдения: генеральная совокупность разделяется на серии, серии на
группы, из групп отбираются объекты.
1.5 Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка, причем значение
x1 наблюдалось n1 раз, x2 – n2 раз, xk – nk раз и ∑ ni = n – объем выборки.
Наблюдаемые значения xi называют вариантами, а последовательность
вариант, записанных в возрастающем порядке, – вариационным рядом.
Числа наблюдений называют частотами, а их отношения к объем
выборки ni /n = Wi – относительными частотами.
Статистическим распределением выборки называют перечень вариант
и соответствующих им частота или относительных частот.
1.5 Статистическое распределение выборки
Пример. Задано распределение частот выборки объема n = 20:
xi
2
6
12
ni
3
10
7
Требуется найти распределение относительных частот.
Решение.
Разделим частоты на объем выборки и найдем относительные частоты:
W1 = 3/20 = 0,15, W1 = 10/20 = 0,50, W1 = 7/20 = 0,35
Тогда распределение относительных частот выглядит так:
xi
2
6
12
Wi
0,15
0,50
0,35
1.6 Эмпирическая и теоретическая функции
распределения
Эмпирической функцией распределения (функцией распределения
выборки) называют функцию F*(x), определяющую для каждого значения
x относительную частоту события X < x:
F*(x) = nx /n,
где nx – число вариант, меньших x; n – объем выборки
Теоретической функцией распределения называют функцию
распределения F(x) генеральной совокупности. При больших n числа F*(x)
и F(x) мало отличаются друг от друга:
Эмпирическая функция распределения выборки служит для оценки
теоретической функции распределения генеральной совокупности
1.6 Эмпирическая и теоретическая функции
распределения
Пример.
Построить эмпирическую функцию по данному распределению выборки:
xi
2
6
10
ni
12
18
30
Требуется найти распределение относительных частот.
Решение.
1) Найдем объем выборки: 12 + 18 + 30 = 60
2) Наименьшая варианта равна 2, следовательно,
F*(x) = 0 при x ≤ 2
1.6 Эмпирическая и теоретическая функции
распределения
3) Значение X < 6, а именно x1 = 2 наблюдалось 12 раз, следовательно
F*(x) = 12/60 = 0,2 при 2 < x ≤ 6
4) Значения X < 10, а именно x1=2 и x2 = 6, наблюдались 12 + 18 = 30 раз,
следовательно,
F*(x) = 30/60 = 0,5 при 6 < x ≤ 10
5) Так как x = 10 – наибольшая варианта, то
F*(x) = 1 при x > 10
1.6 Эмпирическая и теоретическая функции
распределения
График функции распределения
Искомая эмпирическая функция
1.7 Полигон и гистограмма частот
Полигон и гистограмма частот разновидности графиков статистического
распределения. Полигон используется для дискретного распределения,
гистограмма – для непрерывного распределения.
Полигон частот – ломаная, отрезки которой соединяют точки ( x1 ; n1 ) ,
( x2 ; n2 ) , …, ( xk ; nk ) , где xi – варианты, ni – частоты
Полигон относительных
частот –
ломаная, отрезки которой
соединяют точки
( x1 ; W1 ) , ( x2 ; W2 ) , …, ( xk ; Wk ) ,
где xi – варианты, Wi –
относительные частоты
1.7 Полигон и гистограмма частот
Гистограмма частот – ступенчатая фигура, состоящая из прямоугольников,
основаниями которых являются частичные интервалы длиною h, а высоты
равны отношению ni|h – плотность частоты
Гистограмма относительных
частот –
ступенчатая фигура, состоящая из
прямоугольников, основаниями
которых являются частичные
интервалы длиною h, а высоты
равны отношению Wi|h – плотность
относительной частоты
Площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
Площадь гистограммы относительных частот равна 1.
Тема 2. Статистические оценки
параметров распределения
1.
Статистические оценки параметров распределения
2.
Несмещенные, эффективные и состоятельные оценки
3.
Генеральная и выборочная средние
4.
Отклонение от средней и ее свойства
5.
Генеральная и выборочная дисперсии
6.
Формула для вычисления дисперсии
7.
Оценка генеральной дисперсии по исправленной выборочной
2.1 Статистические оценки параметров распределения
Различные виды распределений характеризуются своими параметрами.
Например, параметрами нормального распределения являются
математическое ожидание и среднее квадратическое отклонение.
Чтобы построить распределение случайной величины, для этого
необходимо оценить неизвестные параметры распределения, основываясь
на данных выборки.
Найти статистическую оценку неизвестного параметра распределения – это
значит найти функцию от наблюдаемых случайных величин, которая и дает
приближенное значение оцениваемого параметра.
2.2 Несмещенные, эффективные и состоятельные оценки
Несмещенная оценка – статистическая оценка ϴ*, математическое
ожидание которой равно оцениваемому параметру ϴ при любом объеме
выборки, т.е.
М ( ϴ* ) = ϴ
Смещенная оценка – статистическая оценка, математическое ожидание
которой не равно оцениваемому параметру
Эффективная оценка – статистическая оценка, которая при заданном
объеме выборки n имеет наименьшую возможную дисперсию
Состоятельная оценка – статистическая оценка, которая при
стремится по вероятности к оцениваемому параметру. Если дисперсия
несмещенной оценки при
стремится к нулю, такая оценка будет
состоятельной.
2.3 Генеральная и выборочная средние
Генеральная (выборочная) средняя – среднее арифметическое значений
признака генеральной (выборочной) совокупности.
Если все значения x различны, тогда:
Если значения признака x имеют частоты N, тогда:
Если генеральная совокупность и выборка имеют одинаковое
распределение, генеральная и выборочная средние будут одинаковыми.
Свойство устойчивости выборочных средних
Если имеются несколько выборок большого объема из одной генеральной
совокупности, их средние будут приближенно равны между собой.
2.4 Отклонение от средней и ее свойства
Отклонением от средней называют разность
признака и средней.
между значением
Свойства отклонения от средней
1) Сумма произведений отклонений на соответствующие частоты
равна нулю:
2) Среднее значение отклонения равно нулю
2.5 Генеральная и выборочная дисперсии
Дисперсия характеризует рассеяние значений признака совокупности
вокруг среднего значения.
Генеральной (выборочной) дисперсией D называют среднее
арифметическое квадратов отклонений значений признака генеральной
(выборочной) совокупности от их среднего значения.
Если все значения x различны, тогда:
Если значения признака x имеют частоты N, тогда:
Средним квадратическим отклонением (стандартным отклонением)
называют квадратный корень из дисперсии:
2.5 Генеральная и выборочная дисперсии
Пример.
Найти дисперсию по заданному распределению:
xi
2
4
5
6
Ni
8
9
10
3
Решение.
1) Найдем среднюю:
2) Найдем дисперсию:
2.6 Формула для вычисления дисперсии
В упрощенной форме дисперсия равна среднему квадратов значений
признака x минус квадрат среднего значения:
Пример. Найти дисперсию по заданному распределению:
xi
ni
1
20
Решение.
1) Найдем среднюю:
2) Найдем дисперсию:
3) Искомая дисперсия:
2
15
3
10
4
5
2.7 Оценка генеральной дисперсии по исправленной
выборочной
Если требуется по данным выборки оценить неизвестную генеральную
дисперсию, то следует учитывать, что выборочная дисперсия является
смещенной оценкой групповой дисперсии.
Для получения несмещенной оценки выборочную дисперсию требуется
«исправить», умножив на дробь n / (n – 1).
В качестве оценки генеральной дисперсии принимают «исправленную»
дисперсию:
«Исправленное» стандартное отклонение:
При большом объеме выборки выборочная и исправленная дисперсии
различаются мало. Исправленной дисперсией пользуются при n < 30