Навчальна презентація до вивчення теми

Download Report

Transcript Навчальна презентація до вивчення теми

Спецкурс «Microsoft Excel у
профільному навчанні»
План вивчення теми
У цьому розділі буде розглянуто:
 завдання математичної статистики;
 поняття вибірки та генеральної сукупності;
 статистичні характеристики вибірки;
 статистичні функції табличного процесора та їх
використання.
Основні поняття математичної
статистики
Статистичні методи обробки даних вже давно застосовуються у
найрізноманітніших видах людської діяльності і насамперед там, де
досліджуються закономірності, властиві великим сукупностям об'єктів: в
економіці, соціології, серійному виробництві тощо. Велику множину
об'єктів, що є предметом статистичного дослідження, називають
генеральною сукупністю. Наприклад, якщо досліджуються передвиборчі
вподобання, генеральною сукупністю може бути населення країни.
Проте дослідник, як правило, не має змоги оперувати усією
генеральною сукупністю. Наприклад, опитати кожного громадянина
країни нереально. Натомість досліджують вибірку — деяку множину
об'єктів, вибраних з генеральної сукупності, і, проаналізувавши її, роблять
висновки щодо властивостей генеральної сукупності в цілому. Так,
дослідивши вподобання 10 000 виборців, можна зробити достатньо точні
висновки щодо вподобань виборців усієї країни. У заміні дослідження
великої множини об'єктів дослідженням значно меншої її частини та
подальшому «поширенні» результатів дослідження на всю множину
полягає сутність статистичного підходу до обробки даних.
Статистичне дослідження складається з трьох
етапів:
статистичне спостереження;
групування первинних статистичних
даних;
аналіз статистичної інформації.
Етапи статистичного дослідження
 На першому етапі формують статистичну вибірку. Її складають за результатами
опитування груп людей, спостереження за природними явищами, проведення
серії експериментів тощо. Слід зазначити, що вибірку можна ефективно
використовувати для вивчення певної ознаки генеральної сукупності тільки
тоді, коли вона є репрезентативною, або представницькою. Для цього об'єкти
мають вибиратися випадково, тобто всі об'єкти генеральної сукупності повинні
мати однакову ймовірність потрапити до вибірки, а обсяг вибірки має бути
достатньо великий.
 На другому етапі зібрані відомості певним чином групуються. Наприклад, під час
групування результатів опитування до однієї групи можуть бути віднесені
відповіді респондентів однієї вікової категорії. За результатами групування
будують статистичний ряд розподілу. Коли вибірка невелика та досліджується
лише одна ознака вибраних об'єктів, групування можна не виконувати.
 На третьому етапі обчислюються узагальнюючі показники та проводиться
аналіз статистичної інформації. Метою цього етапу, як і статистичного
дослідження в цілому, є встановлення закономірностей, властивих генеральній
сукупності.
Розділ математики, присвячений методам збору, аналізу та обробки
статистичних даних з науковою або практичною метою, називають
математичною статистикою.
Основні статистичні характеристики вибірки
У математичній статистиці вивчають числові
характеристики вибірок, які узагальнюють об'єкти
вибірки за певною ознакою. Наприклад, якщо вибірка
складається зі 100 учнів, узагальнюючою
характеристикою може бути середня успішність учня
або, скажімо, максимальний зріст.
У разі обчислення статистичних характеристик
вибіркою найчастіше називають набір значень певного
параметра вибраних об'єктів, наприклад набір річних
оцінок учнів з математики. Кожен елемент вибірки в
цьому випадку називають варіантою.
До основних числових характеристик належать:
середнє значення,
медіана,
мода (показники центру вибірки),
стандартне відхилення, асиметрія,
варіаційний розмах вибірки (показники варіації).
Показники центру дозволяють знайти значення, яке у певному розумінні є
найбільш типовим, «центральним» для всієї вибірки, а показники варіації дають
змогу оцінити, наскільки вибірка згуртована навколо центрального значення,
наскільки вона є широкою, симетричною тощо, інакше кажучи, як елементи
вибірки розсіюються, або варіюються.
Означення статистичних показників вибірки.
Показники центру
Найпростішим показником, який характеризує центр
вибірки, є мода — елемент вибірки, що зустрічається
найчастіше. Якщо таких елементів кілька, вибірка має
кілька мод.
Середнє значення вибірки х — це середнє арифметичне
усіх варіант вибірки:
де п — об'єм вибірки (тобто кількість варіант у ній);
х1 , х2, ..., хп — всі варіанти вибірки.
Медіана вибірки — це число, що є серединою вибірки:
половина варіант мають значення, більші за значення
медіани, а половина — менші.
Показники варіації
Основними показниками розсіювання варіант є варіаційний
розмах, стандартне відхилення, асиметрія.
Варіаційних розмах (інтервал, амплітуда) — це різниця між
максимальним та мінімальним значеннями елементів вибірки.
Стандартне відхилення а — це параметр, який характеризує
ступінь розкиду елементів вибірки відносно середнього значення:
де п — об'єм вибірки, х1 х2, хп — варіанти, х — середнє значення
вибірки.
Величина 2 називається дисперсією вибірки.
Асиметрія — величина, яка характеризує ступінь
несиметричності розподілу відносно його середнього значення.
Додатна асиметрія вказує на відхилення розподілу в бік додатних
значень. Від'ємна асиметрія вказує на відхилення розподілу в бік
від'ємних значень. Якщо розподіл варіант симетричний, то
асиметрія дорівнює 0.
Коли для вибірки обчислено узагальнюючі показники,
постає питання: як вони пов'язані з відповідними
показниками генеральної сукупності?
Найпростіше припустити, що генеральна сукупність має
приблизно ті самі значення цих показників, які має вибірка.
Визначити їх — означає знайти точкові оцінки числових
характеристик генеральної сукупності. Та чи інша
характеристика генеральної сукупності з певною
ймовірністю належить певному інтервалу навколо значення,
обчисленого за вибіркою. Визначити такий інтервал —
означає знайти інтервальну оцінку статистичного
показника.
Точковою оцінкою стандартного відхилення генеральної
сукупності є виправлене вибіркове стандартне відхилення,
яке обчислюється за формулою:
Ця ж формула реалізована у відповідній функції Microsoft
Excel.
Обчислення статистичних характеристик
Табличний процесор Microsoft Excel оснащений засобами
статистичної обробки даних, хоча й суттєво поступається
спеціалізованим статистичним програмним пакетам. У
табличному процесорі ці засоби представлені функціями,
зібраними в категорії Статистичні, та майже всі вони призначені
для обчислення узагальнюючих статистичних характеристик
вибірки.
Статистичні функції, що розглядаються нижче (крім функції
RANK), можуть мати до 30 аргументів, які повинні бути числами,
масивами або посиланнями на діапазони клітинок, що містять
числа. Якщо до діапазону-аргументу функції входять клітинки, які
містять текст чи логічні значення або є порожніми, то вони
ігноруються; але клітинки, що містять нульові значення,
враховуються. Коли потрібно обчислити певну статистичну
характеристику вибірки, діапазон, що містить елементи вибірки,
слід зробити аргументом функції.
Обчислення статистичних характеристик
AVERAGE(число1;
число2;...) (рос.
СРЗНАЧ) — обчислює
середнє значення;
МАХ(число1; число2;
…) (рос. МАКС) —
обчислює
максимальне
значення;
MIN (число1;
число2;...) (рос. МИН)
— обчислює
мінімальне значення;
MEDIANчисло1;
число2;...) (рос.
МЕДИАНА) —
повертає медіану;
MODE(число1;
число2;...) (рос.
МОДА) — повертає
моду;
VAR(число1;
число2;...) (рос.
ДИСП) — обчислює
дисперсію;
STDEVчисло1;
число2;...) (рос.
СТАНДОТКЛОН) —
обчислює стандартне
відхилення;
SKEWчисло1;
число2;...) (рос. СКОС)
— повертає
асиметрію розподілу;
Обчислення статистичних характеристик
RANK(число; посилання; порядок) (рос. РАНГ) — повертає
ранг числа у списку чисел, тобто його номер у впорядкованій
послідовності чисел із вказаного діапазону. Функція має такі
аргументи:
 число — це число, для якого визначається ранг;
 посилання — це масив або посилання на список чисел;
 порядок — аргумент, який визначає спосіб упорядкування.
Якщо цей аргумент відсутній або дорівнює нулю, то найбільше
число має ранг 1. Якщо цей аргумент дорівнює будь-якому
ненульовому числу, то ранг 1 має найменше число.
Функція RANK призначає повторюваним числам однаковий
ранг. Проте наявність повторюваних чисел впливає на ранги
наступних чисел. Наприклад, якщо у списку цілих чисел,
відсортованих за зростанням, двічі трапляється число 10 із рангом
5, число 11 матиме ранг 7 і жодне з чисел не матиме рангу 6.
Приклади використання статистичних функцій у
табличному процесорі Microsoft Excel.
Вправа 9.1. Порівняння двох вибірок
Туристична фірма, що реалізує путівки у семи
містах країни, провела рекламну кампанію.
У таблиці наведено дані про кількість путівок,
проданих протягом тижня до проведення
рекламної кампанії та протягом тижня після неї.
Потрібно, обчисливши характеристики центру та
варіації розподілу, порівняти дві вибірки та
зробити висновки щодо впливу рекламної
кампанії на обсяги продажу путівок.
Вправа 9.2. Ранжування вибірки
У таблиці, наведеній на рис., подано результати
змагань групи студентів з бігу на 100 м. Потрібно
ранжувати студентів за цими результатами,
присвоївши номер 1 студенту з найкращим
результатом, номер 2 — студенту з другим
результатом і т. д. Також необхідно визначити, до
яких результатів — високих чи низьких — тяжіє
основна маса студентів.