Transcript Y=f(X)
СТАТИСТИКА СИСТЕМИ ОТ СЛУЧАЙНИ ВЕЛИЧИНИ. КОРЕЛАЦИОНЕН АНАЛИЗ СТАТИСТИКА Общи сведения Разглежданите до тук случайни величини са едномерни, тъй като възможните им стойности се определят с едно число и се изобразяват върху една числова ос във вид на отделна точка. При провеждането на редица случайни експерименти получените резултати се описват не с една, а с две или повече случайни величини, които образуват система. Понятието зависимост означава връзка между две или повече случайни величини. Когато зависимостта е изразена математически, тя се нарича функция. Най-общият аналитичен вид на една зависимост е: Y=f(X), където X и Y са случайни величини. Основните характеристики на зависимостите са вид, форма и сила. СТАТИСТИКА СТАТИСТИКА В зависимост от броя на факторите, които се изследват: Обикновена - Изследва се влиянието на един фактор: Y=f(X). Множествена - Изследва се влиянието на два или повече фактора Y=f(X1, X2, …, Xn). В зависимост от математическия и графичен модел на зависимостта: Линейна - Промяната на фактора (X) води до пропорционална промяна на функцията (Y). Графиката е права линия. Криволинейна - Промяната на фактора (X), води до непропорционална промяна в Y. Графиката е крива линия. СТАТИСТИКА В зависимост от степента на съвпадение на фактическите стойности на Y с теоретичните Функционална - Пълна зависимост – в регресионния модел участват всички фактори, влияещи върху Y. Корелационна - Непълна зависимост - в регресионния модел не участват всички фактори, влияещи върху Y, а само част от тях. Основната задача на корелационния анализ е да опише количествено силата на корелационните зависимости. Статистическите показатели, които носят тази информация, се наричат коефициенти на корелация. Те приемат стойности от –1 до +1. Абсолютната стойност на коефициента носи информация за силата (степента) на зависимост между Х и Y. СТАТИСТИКА В случай, че става дума за линейна зависимост, на интерпретация се подлага и знакът на коефициента на корелация – той носи информация за посоката на зависимостта. СТАТИСТИКА Коефициентът формулата: на rˆ корелация r ˆ K X ;Y S X SY се , пресмята по СТАТИСТИКА където: ˆ K X ;Y n 1 ( xi X )( yi Y ) n 1 i 1 е корелационният момент между Х и Y, а Sx и Sy са оценките на средните квадратични отклонения на Х и Y. Значимостта на точковата оценка rˆ на коефициента на корелация се проверява с помощта на процедурата, включваща нулевата хиипотеза Ho : r 0 и съответен статистически критерий. Изчислява се величината: СТАТИСТИКА rˆ n 2 t 1 rˆ със степени на свобода: k n2 2 СТАТИСТИКА Ако t t или 2 ;k P(t; k ) H0 : не противоречи на опитните данни, т.е. коефициентът на корелация е незначим (между двата параметъра не съществува връзка). Ако t t ;k или P(t; k ) H 0 : се отхвърля, т.е. коефициен- тът на корелация е значим (между двата параметъра съществува връзка). Коефициентът на детерминация r2, който е равен на квадрата на коефициента на корелация, показва каква част от вариацията на Y се дължи на различията в стойностите на Х, т.е. на влиянието на изучавания фактор. Ако се умножи по 100, изразява силата на влияние на зависимата променлива в проценти. 2 СТАТИСТИКА Коефициентът на неопределеност K2 описва влиянието на невключените в изследването фактори, на които се дължи изменението на Y. K2 = 1 – r2. Очевидно е, че колкото по-силна е зависимостта между променливите величини, толкова r2 е по-голям, а K2 – по-малък. СТАТИСТИКА