آمار - سمينار نرم افزار همودياليز شهريور ماه 1393

Download Report

Transcript آمار - سمينار نرم افزار همودياليز شهريور ماه 1393

From Data To Decision
Dr. Alireza Mirahmadizadeh, epidemiologist



Shiraz University of Medical Sciences
Spring, 2010
[email protected]
‫جهان سوم كجاست؟‬
•Dr. Alireza Mirahmadizadeh, Epidemiologist
•[email protected]
•Spring 2010
‫جهان سوم كجاست؟‬
‫مفهوم جهان سوم كشورهایی را تعریف میكند كه‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫از مرگومیر باالی نوزادان‪،‬‬
‫رشد اقتصادی پایین و فقر باال‪،‬‬
‫استفاده ضعیف از منابع طبیعی‬
‫اینها كشورهای درحال توسعه و از نظر تکنولوژیکی كمتر پیشرفته آسیا‪ ،‬افریقا‪،‬‬
‫اقیانوسیه و امریکای التین هستند‪.‬‬
‫معموالً از نظر اقتصادی به كشورهای پیشرفته یا توسعهیافته متکی هستند‬
‫عموماً بعنوان دولتهایی فقیر و بیثبات كه رشد جمعیت‪ ،‬بیسوادی و مرگومیر‬
‫باال دارند شناخته میشوند‪.‬‬
‫یک عامل مهم نبود طبقه متوسط است‪( .‬میلیونها نفر در طبقه اقتصادی پایین و‬
‫یک جمعیت بسیار كم از طبقه باال كه كنترل ثروت و منابع كشور به دست‬
‫آنهاست‪.‬‬
‫اكثر كشورهای جهان سوم بدهیهای خارجی بسیار باالیی نیز دارند‪.‬‬
‫‪•Dr. Alireza Mirahmadizadeh, Epidemiologist‬‬
‫‪•[email protected]‬‬
‫‪•Spring 2010‬‬
‫جهان سوم كجاست؟‬
‫جهان سوم جایی است كه هر‬
‫كس بخواهد مملکتش را‬
‫آباد كند‪ ،‬خانهاش خراب‬
‫میشود و هر كس كه‬
‫بخواهد خانهاش آباد‬
‫باشد باید در تخریب‬
‫مملکتش بکوشد‪.‬‬
‫‪•Dr. Alireza Mirahmadizadeh, Epidemiologist‬‬
‫‪•[email protected]‬‬
‫‪•Spring 2010‬‬
‫جهان سوم كجاست؟‬
‫جهان سوم جایی است كه‪:‬‬
‫‪ .1‬آمار ندارند‪( ،‬نمیدانند از‬
‫كجا آمدهاند‪ ،‬در كجا‬
‫هستند و به كجا میروند)‬
‫‪ .2‬نمیتوانند با هم كار كنند‪.‬‬
‫‪•Dr. Alireza Mirahmadizadeh, Epidemiologist‬‬
‫‪•[email protected]‬‬
‫‪•Spring 2010‬‬
Definitions
1.
2.
3.
4.
5.
6.
7.
Noise
Data
Information
Knowledge
Understanding
Wisdom
decision
•Dr. Alireza Mirahmadizadeh, Epidemiologist
•[email protected]
•Spring 2010
decision
‫از داده تا تصمیم‬
‫‪ ‬نشانهها و اخطار‬
‫‪‬‬
‫پایش دایمی و روزمره نظام سالمت‬
‫‪‬‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪‬‬
‫‪‬‬
‫بحرانها و گزارشهای محلی‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪7‬‬
‫شامل‪:‬‬
‫ورودی‬
‫فرایند‬
‫خروجی‬
‫باز خورد‬
‫مرگ كودكان یا مادران‬
‫اپیدمی انفلوانزا‬
‫مسمویت غذایی‬
‫و ‪...‬‬
‫‪•Dr. Alireza Mirahmadizadeh, Epidemiologist‬‬
‫‪•[email protected]‬‬
‫‪•Spring 2010‬‬
Definitions
 Data
 data is raw.
 It simply exists and has
no significance beyond
its existence (in and of
itself).
 It does not have
meaning of itself
 On spreadsheet
•Dr. Alireza Mirahmadizadeh, Epidemiologist
•[email protected]
•Spring 2010
Definitions
1.
2.
3.
4.
5.
6.
Data
Information
Knowledge
Understanding
Wisdom
decision
•Dr. Alireza Mirahmadizadeh, Epidemiologist
•[email protected]
•Spring 2010
Definitions
1.
2.
3.
4.
5.
6.
Data
Information
Knowledge
Understanding
Wisdom
decision
•Dr. Alireza Mirahmadizadeh, Epidemiologist
•[email protected]
•Spring 2010
‫آمار‬
‫‪Statistics‬‬
‫علمی است كه به سازماندهی و خالصه كردن‬
‫و استنباط و نتیجه گیری در باره مجموعه ای‬
‫از داده ها وقتی كه تنها بخشی ازآنها‬
‫مشاهده شده اند‪ ،‬مربوط می شود‪.‬‬
‫فعالیتهای آماری‬
‫فرآیند آماده سازی آمار شامل سه مرحله زیر می باشد‪:‬‬
‫‪ ‬جمع آوری‬
‫‪Gathering‬‬
‫‪ ‬تجزیه و تحلیل یا سازماندهی‬
‫‪Analysis‬‬
‫• طبقه بندی‬
‫• مرتب کردن‬
‫‪ ‬ارائه‬
‫‪Presentation‬‬
‫‪Classification‬‬
‫‪Sorting‬‬
‫جدول توزیع فراوانی‬
‫‪Frequency Distribution Tables‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪Absolute F.‬‬
‫فراوانی مطلق‬
‫تعداد دفعات تکرار هریک از مقادیر(وضعیتهای) مربوط به‬
‫یک متغیر‬
‫‪Relative F.‬‬
‫فراوانی نسبی(درصد)‬
‫فراوانی مطلق هرمقدار(وضعیت) نسبت به تعداد كل‬
‫اعضای جامعه یا نمونه‬
‫‪Cumulative F.‬‬
‫فراوانی تجمعی (تراكمی)‬
‫فراوانی مطلق هرگروه (مقدار یا وضعیت) به اضافه‬
‫فراوانی مطلق گروه های (مقدار یا وضعیت) قبل‬
‫جدول توزیع فراوانی‬
Frequency Distribution Tables
Progesterone Receptor Status
Valid
Frequency
Neg ative
389
Positive
462
Unknown
356
Total
1207
Percent Valid Percent
32.2
32.2
38.3
38.3
29.5
29.5
100.0
100.0
Cumulative
Percent
32.2
70.5
100.0
‫شاخص‬
‫‪Index‬‬
‫نسبتی است كه ارزش یک كمیت داده شده را‬
‫نسبت به یک مبنا نشان می دهد‪.‬‬
‫انواع شاخصها در آمار توصیفی‪:‬‬
‫شاخصهای تمایل مركزی‬
‫‪Central tendency‬‬
‫شاخصهای‬
‫پراكندگی‬
‫‪Dispersion‬‬
‫شاخصهای تمایل مرکزی‬
‫‪‬‬
‫میانگین‬
‫‪ ‬میانه‬
‫‪ ‬مد‬
‫‪Mean‬‬
‫‪Median‬‬
‫‪Mode‬‬
‫میانگین‬
‫‪ ‬معدل و یا متوسط داده ها را نشان می دهد‪.‬‬
‫‪ ‬برای مجموعه ای از دادهها تنها یک میانگین حسابی‬
‫وجود دارد‪.‬‬
‫‪ ‬تمام مقادیر در محاسبه میانگین به كار می روند‪.‬‬
‫‪ ‬مقادیر خیلی كم و یا خیلی زیاد روی آن تأثیر می‬
‫گذارد و آن را منحرف می كند‪.‬‬
‫‪ ‬در اغلب محاسبات آماری نقش مهمی ایفا می نماید‪.‬‬
‫میانه‬
‫‪‬‬
‫شاخصی است كه داده ها به طور مساوی در دوطرف آن قرار دارند‪.‬‬
‫‪ ‬برای مجموعه ای از داده ها تنها یک میانه وجود دارد‪.‬‬
‫‪ ‬تمام مقادیر در محاسبه میانه به كار می روند‪.‬‬
‫‪ ‬مقادیر خیلی كم و یا خیلی زیاد روی آن تأثیر نمی گذارد‪.‬‬
‫‪ ‬در مواردی می تواند جایگزین مناسبی برای میانگین باشد‪.‬‬
‫‪ ‬بیشتر برای مواردی كاربرد دارد كه مقیاس اندازه گیری رتبهای‬
‫باشد‪.‬‬
‫مد یا نما‬
‫‪ o‬نما عبارت است از داده هایی كه بیشترین فراوانی را دارند‪.‬‬
‫‪ o‬اگر فراوانی همه داده ها برابر یک باشد‪ ،‬یعنی همه مقادیر‬
‫با هم متفاوت باشند‪ ،‬آن مجموعه مد ندارد‪.‬‬
‫‪ o‬ممکن است یک مجموعه بیش از یک نما داشته باشد‪.‬‬
‫‪ o‬در محاسبات آماری نقش مهمی ندارد و عمدتاً برای توصیف‬
‫داده ها زمانی كه مقیاس اندازه گیری اسمی باشد‪ ،‬استفاده‬
‫می شود‪.‬‬
‫چارکها‬
‫‪Quartiles‬‬
‫‪‬‬
‫نقاطی بر روی مقیاس اندازه گیری هستند كه كلیه‬
‫مشاهدات را به چهار قسمت مساوی تقسیم‬
‫میكنند‪.‬‬
‫‪ ‬چارک اول نقطه ‪ 25‬درصد است‪.‬‬
‫‪ ‬چارک دوم نقطه ‪ 50‬درصد و همان میانه است‪.‬‬
‫‪ ‬چارک سوم نقطه ‪ 75‬درصد است‪.‬‬
‫شاخصهای پراکندگی‬
‫‪‬‬
‫مشخص كننده پراكندگی یا فاصله داده ها از داده مركزی می باشند‪.‬‬
‫‪‬‬
‫هر چه داده ها به هم نزدیک تر باشند پراكندگی كمتر است و بالعکس‪.‬‬
‫‪ ‬دامنه‬
‫‪ ‬میانگین انحرافات‬
‫‪ ‬پراش‬
‫‪ ‬انحراف معیار‬
‫‪ ‬ضریب تغییرات‬
‫‪Range‬‬
‫‪Mean Deviation‬‬
‫‪Variance‬‬
‫‪Standard Deviation‬‬
‫‪Coefficient of Variation‬‬
‫دامنه‬
‫‪ ‬شاخصی است كه تفاوت بین كوچکترین و‬
‫بزرگترین داده را نشان میدهد‪.‬‬
‫‪ ‬در محاسبه آن فقط دو عدد نقش دارند‪.‬‬
‫‪ ‬به نحو مطلوب گویای پراكندگی صفت نیست‪.‬‬
‫انحراف معیار‬
‫‪ ‬مقدار انحراف معیار متناسب با تغییر در پراكندگی داده ها‬
‫تغییر می كند‪.‬‬
‫‪ ‬در صورتی كه توزیع داده ها‪ ،‬پراكندگی زیادی نسبت به‬
‫میانگین داشته باشد‪ ،‬انحراف معیار بزرگ خواهد شد‪.‬‬
‫‪ ‬چنانچه تمام داده ها در اطراف میانگین انباشته شده باشند‪،‬‬
‫مقدار انحراف معیار نیز كاهش می یابد‪.‬‬
‫منحنی توزیع نرمال‬
‫‪24‬‬
Reproducibility and Validity of a
Measurement
Consider having 5 replicates
Good
Reproducibility
Poor
Reproducibility
Good
Reproducibility
Poor
Reproducibility
Poor Validity
Good Validity ??
Good Validity
Poor Validity
Accuracy vs. Precision
Errors in epidemiological
studies
‫متغیر اسمي و رتبه اي‬:‫نمودار میله اي‬
Bar diagram
90
80
70
60
50
40
30
20
10
0
1st Qtr
2nd Qtr
3rd Qtr
4th Qtr
‫نمودار دایره اي ‪ :‬متغیر اسمي و رتبه اي‬
‫‪Pie Chart‬‬
‫نمودار هیستوگرام ‪ :‬داده كمي پیوسته‬
‫‪Histogram‬‬
Steps in a surveillance
system
•Dr. Alireza Mirahmadizadeh, epidemiologist
•Shiraz University of Medical Sciences
•[email protected]
31
Surveillance And Monitoring
Health surveillance
 Generally,
surveillance requires
three functions in
this sequence:
1. Data collection,
2. Analysis and
interpretations, and
3. Decision making.
•Dr. Alireza Mirahmadizadeh, epidemiologist
•Shiraz University of Medical Sciences
•[email protected]
‫جهان سوم كجاست؟‬
‫ تا ثریا می رود دیوار كج‬--- ‫خشت اول چون نهد معمار كج‬
•Dr. Alireza Mirahmadizadeh, Epidemiologist
•[email protected]
•Spring 2010
Avoid a boring presentation
•34