Transcript Y=f(X)

СТАТИСТИКА
СИСТЕМИ ОТ СЛУЧАЙНИ
ВЕЛИЧИНИ. КОРЕЛАЦИОНЕН
АНАЛИЗ
СТАТИСТИКА
Общи сведения
Разглежданите до тук случайни величини са
едномерни, тъй като възможните им стойности се определят с
едно число и се изобразяват върху една числова ос във вид
на отделна точка. При провеждането на редица случайни
експерименти получените резултати се описват не с една, а с
две или повече случайни величини, които образуват система.
Понятието зависимост означава връзка между две или
повече случайни величини. Когато зависимостта е изразена
математически, тя се нарича функция. Най-общият
аналитичен вид на една зависимост е: Y=f(X), където X и Y
са случайни величини. Основните характеристики на
зависимостите са вид, форма и сила.
СТАТИСТИКА
СТАТИСТИКА
В зависимост от броя на факторите, които се
изследват:
Обикновена - Изследва се влиянието на един фактор:
Y=f(X).
Множествена - Изследва се влиянието на два или
повече фактора Y=f(X1, X2, …, Xn).
В зависимост от математическия и графичен
модел на зависимостта:
Линейна - Промяната на фактора (X) води до
пропорционална промяна на функцията (Y). Графиката е
права линия.
Криволинейна - Промяната на фактора (X), води до
непропорционална промяна в Y. Графиката е крива линия.
СТАТИСТИКА
В зависимост от степента на съвпадение на
фактическите стойности на Y с теоретичните
Функционална - Пълна зависимост – в регресионния
модел участват всички фактори, влияещи върху Y.
Корелационна - Непълна зависимост - в регресионния
модел не участват всички фактори, влияещи върху Y, а само
част от тях.
Основната задача на корелационния анализ е да опише
количествено силата на корелационните зависимости.
Статистическите показатели, които носят тази информация,
се наричат коефициенти на корелация. Те приемат стойности
от –1 до +1. Абсолютната стойност на коефициента носи
информация за силата (степента) на зависимост между Х и Y.
СТАТИСТИКА
В случай, че става дума за линейна зависимост, на
интерпретация се подлага и знакът на коефициента на
корелация – той носи информация за посоката на
зависимостта.
СТАТИСТИКА
Коефициентът
формулата:
на
rˆ 
корелация
r
ˆ
K X ;Y
S X SY
се
,
пресмята
по
СТАТИСТИКА
където:
ˆ
K X ;Y
n
1

( xi  X )( yi  Y )

n 1 i  1
е корелационният момент между Х и Y, а Sx и Sy са оценките
на средните квадратични отклонения на Х и Y. Значимостта
на точковата оценка rˆ на коефициента на корелация се
проверява с помощта на процедурата, включваща нулевата
хиипотеза Ho : r  0
и съответен статистически критерий.
Изчислява се величината:
СТАТИСТИКА
rˆ n  2
t
1  rˆ
със степени на свобода:
k n2
2
СТАТИСТИКА
Ако t  t или
2
;k
P(t; k )   H0 :
не противоречи на
опитните данни, т.е. коефициентът на корелация е незначим
(между двата параметъра не съществува връзка).
Ако t  t
;k
или P(t; k )    H 0 : се отхвърля, т.е. коефициен-
тът на корелация е значим (между двата параметъра
съществува връзка).
Коефициентът на детерминация r2, който е равен
на квадрата на коефициента на корелация, показва каква
част от вариацията на Y се дължи на различията в
стойностите на Х, т.е. на влиянието на изучавания фактор.
Ако се умножи по 100, изразява силата на влияние на
зависимата променлива в проценти.
2
СТАТИСТИКА
Коефициентът на неопределеност K2 описва
влиянието на невключените в изследването фактори, на
които се дължи изменението на Y. K2 = 1 – r2. Очевидно е, че
колкото по-силна е зависимостта между променливите
величини, толкова r2 е по-голям, а K2 – по-малък.
СТАТИСТИКА