Эконометрика_5

download report

Transcript Эконометрика_5

Анализ связи между атрибутивными признаками

Взаимосвязь между признаками анализируются посредством таблиц взаимной сопряженности. Они описывают комбинационные распределе ния совокупности по факторному признаку х и результативному у. атрибутивными

При наличии стохастической связи оценка его тесноты базируется на отклонениях фактических частот f

ij

от F

ij

, пропорцио нальных итоговым частотам: f где f 0j

io

- суммарные частоты по признаку х; - суммарные частоты по признаку y; n объем совокупности.

Очевидно, что где m x и m y – количество групп по x и y соответственно.

Абсолютную величину отклонений факти ческих частот f ij от пропорциональных F ij (f ij -F ij ) характеризуют статистическим кри терием χ 2 (хи-квадрат или критерий Пирсона)

При отсутствии стохастической связи

Для вывода о тесноте связи теоретическое значение критерия Пирсона по формуле слайда 5 сравнивается с табличным. Табличное значение критерия Пирсона находят по справочным математическим таблицам для критерия «хи»-квадрат в зависимости от принятого уровня значимости α (0,01 или 0,05), и степеней свободы к =

х - 1)(т y -1).

Относительной мерой тесноты стохастической связи между признаками служат также: •

коэффициент взаимной сопряженности Чупрова

Коэффициент взаимной сопряженности

Крамера (при т

х ≠ т y

) где т

min

или т

y

).

— минимальное число групп (т

x

Значение коэффициента С колеблется от 0 до 1 и теснота связи тем сильнее, чем более близко С к 1.

• Достаточно часто в практике статистичес ких исследований анализируются связи между альтернативными признаками, которые представлены группами с противоположными (взаимоисклю чающими) характеристиками.

Тесноту связи в этом случае можно оценивать посредством • коэффициента ассоциации Д. Юла • коэффициента контингенции К Пирсона.

Для расчета указанных коэффициентов измерения тесноты связи между альтернативными признаками используется таблица взаимной сопряженности в виде корреляционной таблицы, которая носит название «четырехклеточной таблицы»

а с

b

d a+b c+d а

+

с b + d a+b + c +d

• При использовании четырехклеточной таблицы с частотами а, Ь, с, d коэффициент

ассоциации (К а

) вычисляется по формуле: При

К а >

качественными

0,3

между признаками корреляционная связь.

изучаемыми существует

• В случаях, когда один из показателей четы рехклеточной таблицы отсутствует, величи на коэффициента ассоциации будет рав няться единице, что дает завышенную оценку тесноты связи между признаками. В этом случае необходимо рассчитывать

коэффициент контингенции (K k

):

• Коэффициент контингенции находится в диапазоне от -1 к +1. Чем более близко К

к

к (+1) или (-1), тем теснее связь между изучаемыми признаками. Коэффициент контингенции всегда меньше коэффициента ассоциации.

• Для определения связи как между количественными, так и качественными признаками при условии, что значения этих признаков упорядочены по степени уменьшения или увеличения (ранжи рованные), может быть использован

коэффициент корреляции рангов Спирмена.

• Рангами называют числа натурального ряда, которые представляются в баллах по определенным критериям элементов совокупности. При этом ранжирование проводится по каждому признаку отдельно: первый ранг предоставляется наименьшему значению признака, последний - наибольшему. Количество рангов равняется объему совокупности.

Преимуществом этого подхода является то, что при отсутствии требования нормального распределения ранговые оценки тесноты связи целесообразно использовать для совокупности небольшо го объема.

Показатель ранговой корреляции коэффициент корреляции рангов Спирмена — рассчитывается по формуле: где d

j

— разность между рангами по одному и другому признаку d j =R xj -R ii ; n - количество единиц в ряду.

• Если d

j

= 0 ρ=1 — существует тесная прямая связь. • Если первому рангу по размеру одного признака соответствует последний ранг по размеру второго признака, второму рангу предпоследний ранг второго признака и т. п., то ρ=-1 и существует тесная обратная связь. Если значение ρ близко к нулю, то связь слабая или ее вообще нет.

• Для предварительной оценки тесноты связи между атрибутивными признаками используются также такие характеристики, как коэффициенты конкордации Фехнера и Кендэла