Lecture 7-8 Variable.biostat .ppt

Download Report

Transcript Lecture 7-8 Variable.biostat .ppt

МОНГОЛЫН МЯНГАНЫ СОРИЛТЫН САН
ЭРҮҮЛ МЭНДИЙН ТӨСӨЛ
Хувьсуур ба мэдээ түүний төрөл,
судалгааны алдаа ба төөрөлдүүлэгчид
1
Мэдээллийн эх үүсвэр
(Data Sources)
Анхдагч
Хоёрдогч
Мэдээллийн эх
үүсвэр
Мэдээллийн эх
үүсвэр
Print or Electronic
Ажиглалт
Асуумж
Туршилт
2
Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШУИС
Мэдээллийг Тоймлох
(continued)
Frequency Polygon: Daily High Temperature
7
 Тоон мэдээлэл
Frequency
6
Тархалтын давтам,
өсөн нэмэгдэх
давтамж
4
3
2
1
0
5
Гистограмм
Polygon
Ogive
15
25
35
45
55
Ogive: Daily High Temperature
Cumulative Percentage
100
Мэдээллийг
эрэмбэлэх
Steam and leaf
80
60
40
20
0
10
Stem
21, 24, 24, 26,
27, 27, 30, 32,
38, 41
Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШИУС
5
3
20
30
40
50
Leaves
2
1 4 4 6 7 7
3
0 2 8
4
1
60
More
Мэдээллийг Тоймлох
• Чанарын
мэдээлэл
Investor's Portfolio
Savings
CD
Bonds
– Хүснэгт
Stocks
0
10
20
• Нийлбэр хүснэгт
30
40
50
Amount in $1000's
– График
• Баганан график
• Бялуун диаграмм
• Pareto diagram
45%
100%
40%
90%
80%
35%
70%
30%
60%
25%
50%
20%
40%
15%
30%
10%
20%
5%
Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШИУС
10%
0%
4
0%
Stocks
Bonds
Savings
CD
Тоо мэдээний ангилал
(бүртгэгдсэн цаг хугацаанаас нь
хамаатуулсан)
• Хөндлөн огтлолд буюу нэг цаг хугацаанд бүртгэгдсэн
тоо мэдээ (cross sectional)
• Цаг хугацааны цуваа (time series)
• Pooled cross section тоо мэдээ (Зарим тоо мэдээ цаг
хугацааны цуваа болон нэг цаг хугацаанд бүртгэгдсэн тоо
мэдээний аль алиных нь шинжийг давхар агуулж байдаг.
Жишээ нь 1999, 2004 онд өрхийн судалгааг санамсаргүй
түүврийн аргаар ижил асуулгын хуудас ашиглан явуулсан гэж
үзье. Энэ тохиолдолд түүврийн хэмжээг өсгөхийн тулд хоёр
оны өрхийн мэдээллийг нэгтгэж болдог.)
• Panel буюу longitudinal тоо мэдээ (Жишээ нь 1980, 1985,
1990 оны байдлаар 5 аймгийн хүн амын тоо, эрүүл мэндийн
зардлын орон нутгийн төсөвт эзлэх хэмжээний талаар тоо
мэдээ цуглуулах)
Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШИУС
5
Мэдээллийн төрөл (Types of Data)
Мэдээлэл (Data)
Чанарын
Тоон (Numerical)
(Categorical)
Жишээ:



Гэрлэлтийн байдал
Яс үндэс
Хүйс
(Категорт
ангилагдах)
Тасралтгүй
(Discrete)
(Continuous)
Жишээ:


Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШУИС
Тасралттай
Ам бүлийн тоо
Төрөлтийн
давтамж
(Тасралтай
тоо)
6
Жишээ:


БЖИ
Цусан дахь сахарын
хэмжээ
Тоон мэдээллийн ангилал
(хэмжилтийн түвшингээс хамаатуулсан)
Утгуудын
хооронд
харьцуулах
боломжтой байх
Харьцуулсан (Ratio)
Утгуудын
хооронд утга
төгөлдөр ялгаа
байдаг
Интервал (Interval)
Дараалсан категор
(дэс дараалуулах
боломжтой)
Дэс дараалсан (Ordinal)
Категор (зарим
тохиолдолд зөвхөн
ангилагдах
боломжтой)
Нэрлэсэн (Nominal)
7
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Хэмжилти
йн дээд
түвшин
Хэмжилтийн
доод
түвшин
Тоон мэдээллийн ерөнхий
үзүүлэлтүүд
Тоон мэдээлэл
Төвийн
үзүүлэлт
Квартил
Арифметик
дундаж
Голч утга
Хазайлт
Далайц
Завсарын
квартил
Дисперс
Моод
Геометр
дундаж
8
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Стандарт
хазайлт
Вариацийн
коэффициент
Хэлбэр
(Shape)
Тэгш хэм
СИСТЕМТЭЙ АЛДАА
• Системтэй алдаа (bias) - Судалгааны
загварыг боловсруулж байх явцад,
эсвэл судалгааны явцад болон
статистик боловсруулалт хийх явцад
гарч улмаар хүчин зүйл ба өвчний
хоорондын хамааарлыг гажуудуулж,
буруу тодорхойлоход хүргэдэг алдаа
СИСТЕМТЭЙ АЛДАА
• Сонголтын алдаа (Selection Bias)
– Тохиолдол-хяналтын судалгааны
хувьд: эмнэлэгт хэвтэж буй
өвчтөнүүдийг хяналтын бүлэгт
сонгон оруулах
– Кохорт судалгааны хувьд: сайн
дураар оролцогсод
СИСТЕМТЭЙ АЛДАА
• Сонголтын алдаа
– Судалгаанд хамрагдсан хүмүүсийн
дунд ажиглагдсан өвчин ба хүчин
зүйлийн хамаарал нийт хүн
амынхаас өөр
– Тохиолдол хяналтын судалгаа,
эргэмж кохорт судалгаанд элбэг
тохиолддог
– Кохорт судалгаанд ховор
СИСТЕМТЭЙ АЛДАА
• Мэдээллийн алдаа (Information
Bias)
– Илрүүлэлтийн алдаа
– Оношлогооны алдаа
– Эргэн санах алдаа
– Ангилалын алдаа
ГУРАВДАГЧ ХҮЧИН ЗҮЙЛИЙН НӨЛӨӨ
• Судалж буй хүчин зүйл ба өвчний
хоорондын бодит хамаарлыг
гажуудуулах нөлөө бүхий гуравдагч
хүчин зүйл (confounding)
Шалтгааны хамаарал
Хүчин зүйл
Өвчин
Гуравдагч хүчин зүйл
ГУРАВДАГЧ ХҮЧИН ЗҮЙЛ БОЛОХ НӨХЦӨЛ
• Тухайн хүчин зүйл судалж буй
өвчинтэй тодорхой хамааралтай
(өөр нэг шалтгаан нь ч байж болно)
• Судалж буй хүчин зүйлтэй тодорхой
хэмжээгээр холбоотой боловч
түүнээс шууд шалтгаалахгүй
ГУРАВДАГЧ ХҮЧИН ЗҮЙЛ: ЖИШЭЭ
• Судалж буй х.з
х.з
• Жирэмсэн үедээ
• кофе ихээр уух
• Эстероген
орлуулах
• Хар тугалга
бүлэг
• Агаарын бохирдол
Өвчин
Гуравдагч
Бага жинтэй
хүүхэд төрүүлэх
Тамхи
Хөхний хавдар
Оюуны хомсдол
Нас
Эмзэг
Уушгины хавдар
Тамхи
ГУРАВДАГЧ ХҮЧИН ЗҮЙЛ: ЖИШЭЭ
Кофе +
Кофе -
тохиолдол
хяналт
450
50
400
100
ГУРАВДАГЧ ХҮЧИН ЗҮЙЛ: ЖИШЭЭ
Тамхи татдаггүй
Кофе +
Кофе -
Тох
75
25
Хян
170
80
Тамхи татдаг
Тох
375
25
Хян
230
20
ГУРАВДАГЧ ХҮЧИН ЗҮЙЛИЙН НӨЛӨӨГ
ХЯНАХ НЬ
• Төлөвлөлтийн шатанд:
– Санамсаргүй хуваарилалт
– Хязгаарлалт
– Ижилсүүлэх
• Боловсруулалтын шатанд
– Бүлэглэн боловсруулалт хийх
– Тохируулга хийх
– Олон хүчин зүйлийн анализ (multivariate)
САНАМСАРГҮЙ ХУВААРИЛАЛТ
(төлөвлөлтийн шат)
• Бидэнд мэдэгдэж буй болон
мэдэгдэхгүй байгаа бүх хүчин зүйлийн
хувьд судалгааны бүлгүүд хоорондоо
төстэй болно
• Гэвч зөвхөн туршилтын судалгаанд
ашиглах боломжтой
ХЯЗГААРЛАЛТ (төлөвлөлтийн шат)
• Тохиолдол хяналтын судалгаа, кохорт
судалгаанд ашигладаг
• Судалгаанд орсон бүх хүн тухайн хүчин
зүйлийн нөлөөний хувьд ижил байх (дан
тамхи татдаггүй хүмүүс гм)
• Бэрхшээл:
– Судалгаанд хамрагдах хүний тоо цөөрнө
– Үр дүнг нийт хүн амд хамаатуулах боломжгүй
– Зөвхөн урьдчилан тодорхойлсон хүчин
зүйлүүдийг хянах боломжтой
– “Хавсарсан нөлөөлөл” үзэгдлийг ажиглах
боломжийг хязгаарладаг
ИЖИЛСҮҮЛЭХ АРГА
(төлөвлөлтийн шат)
• Тохиолдол хяналтын судалгаанд илүү
тохиромжтой
• Гуравдагч хүчин зүйлийн нөлөөллийн
хувьд тохиолдолтой яг ижил нэг ба
түүнээс дээшхи хяналтын хүнийг
сонгох арга
• Тохиолдлын тоо цөөн үед судалгааны
статистик ач холбогдлыг дээшлүүлнэ
• Ялгааг илрүүлэх чадварыг
нэмэгдүүлдэг
ИЖИЛСҮҮЛЭХ АРГА
• Боловсруулалт хийх нь:
– Ердийн 2 х 2 хүснэгтээс өөр
– a, b, c, d нүднүүдэд хувь хүмүүс бус
ижилсүүлсэн хосууд бичигднэ
– OR=b/c
ИЖИЛСҮҮЛЭХ АРГА
• Бэрхшээлүүд:
– Үнэтэй бөгөөд цаг хугацаа их
зарцуулагдна
– Ижилсүүлэх боломжтой хүчин зүйлийн
тоо хязгаарлагдмал
– Ижилсүүлсэн хүчин зүйл, өвчний
хоорондын хамаарлыг тогтоох
боломжгүй
– Хэт ижилсүүлэх аюултай
БҮЛЭГЛЭХ АРГА (боловсруулалтын шат)
• Статистик боловсруулалтыг гуравдагч
хүчин зүйлд өртсөн байдлаар нь тус
тусад нь тооцох
• Хэрэв:
– OR=OR1=OR2
нөлөөлөөгүй
– OR≠(OR1=OR2)
нөлөөлсөн
– OR≠OR1≠OR2
Гуравдагч хүчин зүйл
Гуравдагч хүчин зүйл
Хавсарсан нөлөөлөл
ХАВСАРСАН НӨЛӨӨЛӨЛ
• Гуравдагч хүчин зүйл нь судалж буй хүчин
зүйл ба өвчний хоорондын хамаарлын
хүчийг өөрчилж байвал хавсарсан
нөлөөлөл (effect modification) гэнэ.
• Өөрөөр хэлбэл судалж буй хүчин зүйл ба
өвчний хоорондын хамаарал гуравдагч
хүчин зүйл нөлөөлсөн эсэхээс хамааран
өөр байх
• Хавсарсан нөлөөллийг илрүүлэх нь чухал
ач холбогдолтой “нээлт” байж болно
ГАДААД БА ДОТООД ХҮЧИН ТӨГӨЛДӨР
БАЙДАЛ
Гадаад
• Сонгосон
хүн ам
• Нийт хүн ам
Судалгааны
хүн ам
Судалгааны
Дотоод
дүн
Төвийн хандлагийн үзүүлэлтүүд
(Measures of Central Tendency)
Төвийн үзүүлэлт
Арифметик
дундаж
Голч
утга
Моод
n
X 
X
X G  ( X1  X 2    Xn )
i
i 1
n
Геометр
дундаж
Тэнцүү
хуваах утга
Олон
давтагдах
утга
27
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
1/ n
Арифметик Дундаж (Arithmetic Mean)
• Арифметик дундаж нь төвийн
хандлагийн тодорхойлох нэг гол
үзүүлэлт юм
Дундажийг тооцох:
n
X 
X
i1
i

X1  X 2    Xn
n
Түүврийн хэмжээ
28
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
n
Ажиглалтын
утга
Арифметик Дундаж (Arithmetic Mean)
(continued)
• Төвийн хандлага хэмжих гол үзүүлэлт
• Дундаж = Утгуудын нийт нийлбэрийн тоонд нь
хуваана
• Алслагдсан утга нөлөөлдөг (extreme values)
0 1 2 3 4 5 6 7 8 9
10
0 1 2 3 4 5 6 7 8 9
10
Дундаж = 3
1 2  3  4  5
5

Дундаж = 4
15
3
5
29
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
1  2  3  4  10
5

20
5
 4
Голч Утга (Median)
• Судлагдаж буй утгуудыг 2 тэнцүү хэсэгт
хуваах утга (50% доош, 50% дээш)
0 1 2 3 4 5 6 7 8 9
10
Голч утга = 3
0 1 2 3 4 5 6 7 8 9
10
Голч утга = 3
• Алслагдсан утгын нөлөөг тооцдоггүй
30
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Моод (Mode)
•
•
•
•
•
•
Төвийн хандлагын үзүүлэлт
Ихэвчилэн тохиолддог
Алслагдсан утгууд тооцогдохгүй
Тоон болон чанарын мэдээнд ашиглаж болно
Огт моод байхгүй байж болно
Олон моод байж болно
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Моод = 9
31
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
0 1 2 3 4 5 6
No Mode
Жишээ: (Дундаж, Медиан, Моод)
• УБ хотын 5 баарны агаар дахь никотин тодорхойлжээ
$2,000
25.2 K
µg/mg
Никотин:
25.2 µg/mg
8.7 µg/mg
7.4 µg/mg
6.8 µg/mg
6.8 µg/mg
$500 K
8.7
$300 K
7.4
µg/mg
µg/mg
$100 K
6.8
µg/mg
32
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
$100
6.8 K
µg/mg
Үр дүнгийн статистик
Никотин:
25.2
8.7
7.4
6.8
6.8
 Дундаж: (54.9/5) = 10.98 µg/mg
 Медиан: тэнцүү хуваах = 7.4 µg/mg
 Моод: олон давтагдах = 6.8 µg/mg
Аль үзүүлэлт нь илүү тодорхойлж чадах вэ?
Нийлбэр 54.9


Дундажийг ихэвчлэн ашигладаг ч алслагдсан утгат
мэдрэмж өндөртэй байдаг. (outliers?)
Медиан алслагдсан утгат мэдрэмжгүй.
 Жишээ: Моод, дунджаас илүү медиан нь 5 баарны
агаар дахь никотиний хэмжээг
тодорхойлж байна
33
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Судалгааны үр дүнг хэмжих үндсэн
хэмжигдэхүүн
• Харьцаа - Ratio
• Пропорц - Proportion
• Түвшин/коэффициент /100, 1000,
10000-д .../ - Rate
Судалгааны үр дүнг хэмжих
Харьцангуй хэмжигдэхүүн
Багтана
Хуваарьт хүртвэр
багтсан байх уу?
Багтаагүй
Хуваарь нь цаг хугацаатай
холбоотой байх
Тийм
Түвшин/коэффициент
Жишээ
Тохиолдол
Үгүй
Пропорц
Өвчлөл
Харьцаа
Эрэгтэйд харьцуулсан
эмэгтэй хүний тоо
Эхийн эндэгдэл
Өвчлөлийн тархалт, эрсдлийн
үнэлгээний үзүүлэлтүүд
• Prevalence - Өвчлөл
• Incidence - Шинэ тохиолдол
• Хамаарлын хэмжүүр
Өвчлөлийн хэмжүүрүүд
Хэмжигдэхүүн
Хүртвэр-Numerator (x)
ХуваарьDenominator (y)
стандартчилсан
тоо(10n)
Шинэ өвчлөл
тодорхой хугацаанд тухайн
тухайн хугацааны
хүн ам дотор бүртгэгдсэн хүн амын дундаж
шинэ тохиолдлын тоо
тоо
Дэгдэлтийн
тухайн халдварт өвчний
үеийн анхдагч
дэгдэлтийн үед бүртгэгдсэн
халдварлалтын
шинэ тохиолдлын тоо
Түвшин
халдварт өвчний
дэгдэлт эхлэх үеийн
хүн амын тоо
Дэгдэлтийн үеийн
Хоёрдогч
бүртгэгдсэн тохиолдлын
эрсдэлд өртсөн буюу
Халдварлалтын хавьтлын дотроос илэрсэн
Түвшин
шинэ халдварын тоо
хавьтал болсон хүний
тоо
Өвчлөл
Point
prevalence
Period
prevalence
тодорхой нэг агшин дахь
тухайн тодорхой агшин
шинэ ба архаг өвчний нийлбэр дахь нийт хүн амын тоо
хугацааны тодорхой
үедэх шинэ ба архаг өвчний
нийлбэр
тухайн хугацааны
дундаж хүн ам
10n
n = 2,3,4,5,6
10n
n = 2,3,4,5,6
10n
n = 2,3,4,5,6
10n
n = 2,3,4,5,6
10n
n = 2,3,4,5,6
Зарим хэмжигдэхүүнүүд
Нөхцөл
Өвчлөл
(Disease)
Харьцаа
Пропорц
Attributable
proportion
Point prevalence
Period prevalence
Шинэ өвчлөл
Халдварлалтын түвшин
Хоёрдогч халдварлалтын
түвшин
Нас баралт Нас баралтанд
харьцуулсан харьцаа
(Death)
Эхийн эндэгдэл
хүйсээр
Үхлийн түвшин
Нас баралтын түвшин
Төрөлт
Нярайн нас
баралтын түвшин
(Birth)
Харьцангуй риск
Odds ratio
Түвшин-Коэффициент
Бага жинтэй төрсөн
хүүхдийн харьцаа
Шалтгаан, насаар,
тооцсон нас баралтын
түвшин
Нярайн нийт нас
баралт
Тоон мэдээллийн ерөнхий
үзүүлэлтүүд
Тоон мэдээлэл
Төвийн
үзүүлэлт
Квартил
Арифметик
дундаж
Голч утга
Моод
Геометр
дундаж
39
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Хазайлт
Далайц
Завсарын
квартил
Дисперс
Стандарт
хазайлт
Вариацийн
коэффициент
Хэлбэр
(Shape)
Тэгш хэм
Төвийн хандлагийн үзүүлэлтүүд
(Measures of Central Tendency)
Төвийн үзүүлэлт
Арифметик
дундаж
Голч
утга
Моод
n
X 
X
X G  ( X1  X 2    Xn )
i
i 1
n
Геометр
дундаж
Тэнцүү
хуваах утга
Олон
давтагдах
утга
40
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
1/ n
Арифметик Дундаж (Arithmetic Mean)
• Арифметик дундаж нь төвийн
хандлагийн тодорхойлох нэг гол
үзүүлэлт юм
– Дундажийг тооцох:
n
X 
X
i1
i

X1  X 2    Xn
n
Түүврийн хэмжээ
41
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
n
Ажиглалтын
утга
Арифметик Дундаж (Arithmetic Mean)
(continued)
• Төвийн хандлага хэмжих гол үзүүлэлт
• Дундаж = Утгуудын нийт нийлбэрийн тоонд нь
хуваана
• Алслагдсан утга нөлөөлдөг (extreme values)
0 1 2 3 4 5 6 7 8
9 10
Дундаж = 3
1 2  3  4  5
5

0 1 2 3 4 5 6 7 8
9 10
Дундаж = 4
15
3
5
42
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
1  2  3  4  10
5

20
5
 4
Голч Утга (Median)
• Судлагдаж буй утгуудыг 2 тэнцүү хэсэгт
хуваах утга (50% доош, 50% дээш)
0 1 2 3 4 5 6 7 8
9 10
0 1 2 3 4 5 6 7 8
9 10
Голч утга = 3
Голч утга = 3
• Алслагдсан утгын нөлөөг тооцдоггүй
43
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Моод
(Mode)
•
•
•
•
Төвийн хандлагын үзүүлэлт
Ихэвчилэн тохиолддог
Алслагдсан утгууд тооцогдохгүй
Тоон болон чанарын мэдээнд ашиглаж
болно
• Огт моод байхгүй байж болно
• Олон моод байж болно
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Моод = 9
44
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
0 1 2 3 4 5
6
No Mode
Жишээ: (Дундаж, Медиан, Моод)
• УБ хотын 5 баарны агаар дахь никотин тодорхойлжээ
$2,000
K
25.2
µg/mg
Никотин:
25.2 µg/mg
8.7 µg/mg
7.4 µg/mg
6.8 µg/mg
6.8 µg/mg
$500 K
8.7
µg/mg
$300 K
7.4
µg/mg
$100 K
6.8
µg/mg
45
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
$100
K
6.8
µg/mg
Үр дүнгийн статистик
Никотин:
25.2
8.7
7.4
6.8
6.8
 Дундаж: (54.9/5) = 10.98 µg/mg
 Медиан: тэнцүү хуваах = 7.4 µg/mg
 Моод: олон давтагдах = 6.8 µg/mg
Аль үзүүлэлт нь илүү тодорхойлж чадах вэ?
Нийлбэр 54.9


Дундажийг ихэвчлэн ашигладаг ч алслагдсан утгат
мэдрэмж өндөртэй байдаг. (outliers?)
Медиан алслагдсан утгат мэдрэмжгүй.
 Жишээ: Моод, дунджаас илүү медиан нь 5 баарны
агаар дахь никотиний хэмжээг
тодорхойлж байна
46
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Геометр Дундаж (Geometric Mean)
Геометр дундаж
Хазайлт өндөртэй үзүүлэлтийн хувьд
геометр дундаж тооцох тохиромжтой
X G  ( X1  X 2    Xn )
1/ n
Өсөлтийн дундаж хурд тооцох геометр
дундаж
Цаг хугацаанд гарсан өөрчлөлт
R G  [( 1  R 1 )  (1  R 2 )    (1  R n )]
47
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
1/ n
1
Квартил
(Quartiles)
• Квартил нь судлагдаж буй үзүүлэлтүүдийг
дөрвөн ижил тэнцүү хэсэгт хуваах утгыг
харуулна
25%
25%
Q1



25%
Q2
25%
Q3
Q1 = (n+1)/4, Q1 -аас 25% бага, 75% нь их байхаар
хуваах утга
Q2 = (n+1)/2, Q2 нь медиантай тэнцүү (50% бага, 50%
их байхаар хуваах утга)
Q3 = 3(n+1)/4, гуравдугаар квартил нь ажиглалтын
утгуудын 25% нь их байх утга
48
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Байршилын үзүүлэлт
• Децил
Ажиглалтын утгуудыг 10 тэнцүү хэсэгт хувааж
байхаар тасалсан цэгүүд
– D1; D2; D3… D8; D9 гэсэн есөн децил бий
– I децил (D1) нь нийт ажиглалтын утгуудын 10% ийнх нь
дээр, 90% ийнх нь доор орших цэг
– V квартил (D5) нь медиантай давхцана.
• Персинтил
Ажиглалтын утгуудыг 100 тэнцүү хэсэгт хувааж
байхаар тасалсан цэгүүд
– Р1;...Р99 гэсэн 99 персинтил бий
– I персинтил (Р1) нь нийт ажиглалтын утгуудын 1% ийнх
нь дээр, 99% ийнх нь доор орших цэг
– 50-р персинтил (Р50) нь медиантай давхцана.
Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШИУС
49
Тойм статистик: Нэг л тоогоор багц мэдээллийн
чухал талыг (тархалтын түвшин, цар хүрээ)
харуулах
ТОЙМ СТАТИСТИК ҮЗҮҮЛЭЛТҮҮД: Дундаж, медиан, моод
Анхаарах зүйл:
Эрс ялгаатай утга байгаа эсэх нь дунджид харьцангуй бага нөлөөлдөг.
Медиан нь түүвэр болон эх олонлогийн хэмжээ маш олон, эсвэл хэт цөөн үед
дундажтай харьцуулахад илүү мэдрэмж багатай үзүүлэлт учраас
тархалтын хэлбэрийн талаар илүү нарийвчилсан мэдээллийг өгдөг. Бусад
үед дундажтай харьцуулахад дисперс өндөртэй байх тул үр ашиг
тааруутай үзүүлэлт болдог.
Моод нь чанарын тоо мэдээг судалж буй нөхцөлд илүү зохимжтой
хэмжигдэхүүн. Тоон үзүүлэлтүүдийн хувьд нэгээс олон моод тодорхойлогдох,
эсвэл огт моод байхгүй байх явдал бий учраас төдийлөн зохимжтой
хэмжигдэхүүн болж чаддаггүй.
Тэгш хэмт график дүрслэлтэй тархалтуудын хувьд төвийн эдгээр гурван
үзүүлэлт нэг цэгт оршдог. Ийм тархалтанд хэвийн тархалт, t тархалт
багтана.
Зүүн салааны суналттай тархалтын хувьд: дундаж<медиан<моод
Баруун салааны суналттай тархалтын хувьд: моод<медиан<дундаж
Эпидемиологи
Биостатистикийн
Тэнхим, НЭМС, ЭМШИУС
50
Хазайлтын үзүүлэлт (Measures of Variation)
Хазайлт
Далайц

Завсарын
квартил
Дисперс
(Variance)
Стандарт
хазайлт
Вариацийн
коэффициент
Хазайлтын үзүүлэлтүүд
нь мэдээллийн тархалт
болон дундажийн
талаарх үр дүнг
тодруулдаг.
51
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Ижил дундаж,
Ялгаатай хазайлт
Далайц (Range)
• Хамгийн энгийн хазайлтын үзүүлэлт
• Далайц нь хамгийн их хамгийн бага
утгын ялгавар:
Далайц = Xmax– Xmin
Жишээ:
0 1 2 3 4 5 6 7 8 9 10 11 12
Далайц = 14 - 1 = 13
52
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
13 14
Завсарын Квартил
(Interquartile Range)
Завсарын квартил = 3rd quartile – 1st quartile
= Q3 – Q1
Жишээ:
X
minimum
25%
12
Голч утга
X
Q1
Q3
maximum
(Q2)
25%
25%
25%
30
45
Завсарын квартил
= 57 – 30 = 27 53
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
57
70
Дисперс
(Variance)
• Дундажаас хазайх хазайлтуудын
квадратын хувьд тооцсон дундаж
хэмжигдэхүүн
n
– Түүврийн дисперс:
S
2

 (X
i
 X)
i1
n -1
Үүнд:
X = арифметик дундаж
n = түүврийн хэмжээ
54
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
2
Стандарт Хазайлт (Standard Deviation)
• Хазайлтын гол үзүүлэлт
• Дундажаасаа хазайх хазайлтуудын хувьд
тооцсон квадрат дундаж
– Түүврийн стандарт хазайлт:
Бага стандарт
хазайлт
Их стандарт хазайлт
n
S 
 (X
i
 X)
i1
n -1
55
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
2
Вариацийн коэффициент
(Coefficient of Variation)
• Нэг төрлийн байдал
• Дундажийн төлөөлөх чадвар
• Тухайн үзүүлэлтийн жигд байдалыг
үнэлэх шалгуур үзүүлэлт болно
– “33%-иас багагүй байх”
 S 
 100%
CV  
 X 


56
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Тархалтын хэлбэр (Shape of a Distribution)
• Нормал тархалт (ихэнх тохиолдолд)
• Тархалтын хэлбэр
– Тэгш хэмт эсвэл тэгш хэм хазайлттай
Зүүн-хазайлт
Дундаж < Медиан
Тэгш хэмт
Баруун-хазайлт
Дундаж = Медиан
Медиан < Дундаж
57
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
• Анхаарал тавьсанд баярлалаа.
58