תרגיל כיתה 1

Download Report

Transcript תרגיל כיתה 1

‫ביוסטטיסטיקה לביולוגים‬
‫תרגיל כיתה ‪1‬‬
‫•‬
‫אתר הקורס‪:‬‬
‫•‬
‫‪SPSS‬‬
‫‪moodle.technion.ac.il‬‬
‫• מטלות‬
‫‪ ‬תרגילי בית שבועיים ‪8% -‬‬
‫‪ 2 ‬תרגילים גדולים ‪ 8% -‬כל תרגיל‬
‫‪ ‬מבחן מסכם ‪76% -‬‬
‫דיאגרמת מקלות (‪)Bar Diagram‬‬
‫משתנה קטגורי (איכותי) – מקבל ערכים שאין להם משמעות מספרית‬
‫דוגמא‪ :‬נלקח מדגם של ‪ 50‬אנשים ונבדק צבע שערם‪.‬‬
‫‪ .1‬בנה דיאגרמת מקלות על פי הנתונים הגולמיים (קובץ ‪:)Raw data‬‬
‫‪Graphs -> Legacy Dialog-> bars‬‬
‫דיאגרמת מקלות (‪)Bar Diagram‬‬
‫‪ .2‬בנה דיאגרמת מקלות על פי טבלת שכיחויות (קובץ ‪)Frequency‬‬
‫שכיחות של ערך => מספר הפעמים שמופיע הערך‪.‬‬
‫טבלת השכיחויות מתארת את הנתונים לפי ערכים ושכיחויות‪.‬‬
‫‪Relative frequency‬‬
‫‪Frequency‬‬
‫‪Hair color‬‬
‫‪0.58‬‬
‫‪29‬‬
‫‪Brown‬‬
‫‪0.16‬‬
‫‪8‬‬
‫‪Blond‬‬
‫‪0.20‬‬
‫‪10‬‬
‫‪Black‬‬
‫‪0.06‬‬
‫‪3‬‬
‫‪Red‬‬
)Bar Diagram( ‫דיאגרמת מקלות‬
Graphs -> Legacy Dialog-> bars
)Bar Diagram( ‫דיאגרמת מקלות‬
Graphs -> Legacy Dialog-> bars
‫היסטוגרמה עבור משתנה כמותי רציף‬
‫משתנה כמותי – מקבל ערכים שיש להם משמעות מספרית (בדיד או רציף)‬
‫דוגמא‪ :‬נתון קובץ ציונים של ‪ 30‬סטודנטים בקורס להסתברות (קובץ ‪)Grades‬‬
‫‪ .1‬בנה טבלת שכיחויות באמצעות ‪SPSS‬‬
‫‪Transform -> Visual Binning‬‬
‫”‪-> Define the Binning variable, for example “Intervals‬‬
‫…‪-> Make Cutpoints‬‬
‫…‪-> Make Labels‬‬
‫היסטוגרמה עבור משתנה כמותי רציף‬
Analyze -> Descriptive Statistics -> Frequencies -> choose the transformed variable
‫היסטוגרמה עבור משתנה כמותי רציף‬
‫‪ .2‬שרטט היסטוגרמה באמצעות ‪SPSS‬‬
‫דרך א'‪:‬‬
‫‪Graphs -> Chart Builder -> Histogram‬‬
‫יש לגרור את המשתנה ‪ Intervals‬לציר ה‪X-‬‬
‫היסטוגרמה עבור משתנה כמותי רציף‬
‫‪ .2‬שרטט היסטוגרמה באמצעות ‪SPSS‬‬
‫דרך ב'‪:‬‬
‫‪Graphs -> Legacy Dialogs -> Histogram‬‬
‫ממוצע‬
‫הממוצע‪ :‬סכום התצפיות מחולק במספרן (‪)n‬‬
‫‪n‬‬
‫‪x‬‬
‫‪x1  x2  ... xn i 1 i‬‬
‫‪X‬‬
‫‪‬‬
‫‪n‬‬
‫‪n‬‬
‫‪20, 25, 30, 32, 35, 35‬‬
‫‪20  25  30  32  35  35 177‬‬
‫‪‬‬
‫‪ 29.5‬‬
‫‪6‬‬
‫‪6‬‬
‫‪X‬‬
‫‪20, 25, 30, 32, 35, 350‬‬
‫הממוצע מושפע מתצפיות חריגות!‬
‫‪20  25  30  32  35  350 492‬‬
‫‪X ‬‬
‫‪‬‬
‫‪ 82‬‬
‫‪6‬‬
‫‪6‬‬
‫חציון‬
‫החציון‪ :‬הערך שחצי מהתצפיות קטנות או שוות לו וחצי מהתצפיות גדולות או שוות לו‬
‫בהינתן ‪ n‬תצפיות מסודרות בסדר עולה‪:‬‬
‫אם ‪ n‬אי זוגי‪ :‬החציון = התצפית במקום ה ‪(n+1)/2‬‬
‫‪n=7‬‬
‫‪5, 6 , 8, 9, 10, 14, 13‬‬
‫‪The 4th ordered point‬‬
‫‪Median=9‬‬
‫אם ‪ n‬זוגי‪ :‬החציון =ממוצע של התצפית במקום ה‪ n/2-‬והתצפית במקום ה‪.(n/2)+1-‬‬
‫לדוגמא‪:‬‬
‫‪20, 25, 30, 32, 35, 350‬‬
‫‪30  32‬‬
‫‪ 31‬‬
‫‪2‬‬
‫‪median ‬‬
‫החציון אינו מושפע מתצפיות חריגות!‬
‫‪20, 25, 30, 32, 35, 35‬‬
‫‪30  32‬‬
‫‪ 31‬‬
‫‪2‬‬
‫‪median ‬‬
‫התפלגות א‪-‬סימטרית‬
‫שלילית‬
‫‪50% 50%‬‬
‫‪median‬‬
‫‪average‬‬
‫ממוצע > חציון‬
‫התפלגות א‪-‬סימטרית‬
‫חיובית‬
‫‪50% 50%‬‬
‫‪median‬‬
‫‪average‬‬
‫ממוצע > חציון‬
‫התפלגות סימטרית‬
‫‪50% 50%‬‬
‫‪median‬‬
‫‪average‬‬
‫ממוצע=חציון‬
‫מדדי פיזור‬
R = X max  X min
:‫תחום‬
:)‫שונות (עבור מדגם‬
n
2
2
2






x

x

x

x

...

x

x
2
n
s2  1

2


x

x
 i
i 1
n 1
n 1
:)‫סטיית תקן (עבור מדגם‬
n
SD 
x  x 
i 1
i
n 1
n
2

x
i 1
2
i
 nX 2
n 1
‫שברונים‬
‫שברון ה‪ :P-‬הערך שפרופורציה ‪ P‬מהתצפיות קטנה או שווה לו‬
‫‪X p  X  np  1‬‬
‫‪ ‬‬
‫לדוגמא‪:‬‬
‫רבעונים‬
‫‪10,12,13,13,15,17,18,18,20‬‬
‫‪ X  9*0.3 1  X ( 2.7  1)  X (3)  13‬‬
‫‪‬‬
‫‪‬‬
‫‪ - Q1‬הרבעון הראשון – ‪ 25%‬התצפיות נמוכות ממנו‬
‫‪ - Q2‬הרבעון השני = החציון – ‪ 50%‬התצפיות נמוכות ממנו‬
‫‪ - Q3‬הרבעון השלישי – ‪ 75%‬התצפיות נמוכות ממנו‬
‫‪X 0.3‬‬
‫תחום בין רבעוני (‪)IQR‬‬
‫הטווח שבין ‪ Q1‬ל‪ .Q3-‬זהו הטווח שבו מרוכזות ‪ 50%‬מהתצפיות המרכזיות‬
‫‪IQR  Q3  Q1‬‬
‫חישוב שברונים ב‪:SPSS-‬‬
‫קובץ ‪Grades‬‬
Grades ‫קובץ‬