statistike ligjerata 3 statistik

Download Report

Transcript statistike ligjerata 3 statistik

Mostra, pyetesori
Hyrje
•
•
•
•
Sigurimi i të dhënave
Cilësia e të dhënave: kontrolli
Pyetësorët
Llojet dhe përpilimi i pyetësorëve
• Elementet
janë njësitë
të cilat themelore
Të dhënat
dhe për
kuptimet
grumbullohen të dhëna (për shtete, familje,
punëtorë)
• Variabla: karakteristikë e përbashkët e
elementeve për të cilat jemi të interesuar
(për punëtorë: gjinia, edukimi, paga, etj.)
• Vrojtim: Bashkësia e matjeve të grumbulluara
për një element quhet vrojtim: 12 vrojtime të
dhënat për 12 punëtorë.
3
Inferenca statistikore …
Të dhënat statistikore përshkruajnë të dhënat
që janë analizuar por nuk na mundësojnë të
nxjerrim konkluzion për të dhënat.
Statistika
inferenciale/nxjerrëse
nxjerr
përfundime për popullacionin në bazë të
mostrës.
4
Inferenca statistikore …
Popullacioni
Mostra
Inferenca
Statistika
Parametri
Cka mund të nxjerrim për parametrat e popullacionit bazuar në
statistikat e mostrës?
5
Inferenca statistikore
• Ne përdorim statistikat për të nxjerrë përfundime
për parametrat.
• Andaj, ne mund të vlerësojmë, parashohim
popullacionin bazuar në të dhënat nga mostra.
• Atëherë ne mund të aplikojmë atë që dijmë për
mostrën në popullacion nga i cili është nxjerrë
mostra!
6
Inferenca statistikore
Racionaliteti/arsyeshmëria:
• Popullacionet e mëdha e bëjnë hulumtimin jopraktikë dhe të shtrenjtë.
• Më lehtë të marrim mostër dhe bëjmë vlerësime
për popullacionin nga i cili është marrë mostra.
Megjithatë
– Konkluzionet nuk janë gjithnjë të sakta.
– Për këtë, në inferencën statistikore përdorim ‘matësit
e sigurisë’, niveli i besueshmërisë dhe niveli i
signifikancës.
7
Llojet e të dhënave
1. Të dhëna të serive kohore (time series): janë të dhëna të
grumbulluara rregulisht në intervale të rregullta kohore: ditore,
mujore, tremujore, … vjetore për të njejtin element vrojtues.
2. Të dhëna për njësi (cross-section): një ose më shumë të dhëna të
grumbulluara në një moment të caktuar.
3. Të dhëna pooled: (kombinim i të dhënave cross section dhe të
serive kohore) p.sh. të dhënat për papunësinë në 10 vende të
ndryshme përgjatë një periudhe 10 vjecare=100 të dhëna.
4. Të dhëna Panel: një firm ose familje intervistohet nëpër kohë (ditë,
muaj, vite, etj.) Të dhënat për papunësinë në 10 vende të njejta
përgjatë një periudhe 10 vjecare=100 të dhëna.
8
Të dhëna nëpër seri kohore (time series)
Paga minimale, papunësia dhe të dhena të tjera për Puerto Rico-n
9
Të dhëna për individ/firma/qytete etj (cross section)
Të dhëna për vende të ndryshme për një vit: rritja ekonomike; konsumi
qeveritar, pjesëmarrja e të rinjëve në popullsi)
10
Të dhënat pooled
Të dhëna për cmimin e shtëpive nëpër dy vite (shtëpi të ndryshme)
11
Të dhënat panel
Të dhëna për statistikat e krimit në dy vite për qytete të njejta
12
Rikujtoni…
Statistika është mjet për shëndrrimin e të
dhënave në informacione:
Të dhënat
Statistika
Informata
Por nga ku marrim të dhënat?
Si grumbullohen?
A janë të dhënat përfaqësuese të popullacionit nga i cili rrjedhin?
Si sigurohemi se janë të sakta?
A janë të dhënat e besueshme?
13
Burimet e të dhënave
Sekondare (etika me rëndësi)
Primare
14
Grumbullimi i të dhënave
- Mënyra ekspeditive: grumbullimi i të dhënave
nga ana e ekspertëve të institucioneve
statistikore: regjistrimi i popullsisë
- Përmes anketimit
15
Nevoja për mostër
• Jo praktike për të anketuar tërë popullacionin
(edhe pamundësi ngase jo të gjithë pranojnë të
anketohen/intervistohen)
• Kufizimet financiare
• Kufizimi në kohë
16
Mostra
1. Identifikimi i kornizës së mostrës (standardi
jetësor=familja)
2. Madhësia e mostrës
3. Mostrimi
Sigurohu se mostra është përfaqësuese e popullacionit
17
Identifikimi i kornizës së mostrës
Korniza e mostrës është lista e plotë e të gjitha rasteve në
popullacion nga i cili zgjidhet mostra.
Plotësia e mostrës dhe saktësia e kornizës së mostrës është
me rëndësi kritike.
Përmes definimit të kornizës së mostrës:definojmë
popullacionin për të cilin duam të gjeneralizojmë.
Lista jo e plotë dhe e pasaktë nënkupton se disa raste
mungojnë kështuqe nuk kanë gjasa për tu përfshi në mostër=
mostra jo-reprezentative.
18
Përcaktimi i madhësisë së mostrës
Sa më e madhe mostra më i vogël gabimi në
gjeneralizim për popullacion.
Mostra reprezentative është kompromis në mes
të:
- saktësisë së rezultateve, dhe
- kohës dhe shpenzimeve financiare që
investohen në grumbullimin, kontrollimin dhe
analizën e të dhënave.
19
Përcaktimi i madhësisë së mostrës
Faktorët në përkufizimin e madhësisë së
mostrës:
1. Besueshmërinë që kërkon nga të dhënat e
marra – niveli i sigurisë që karakteristikat e
të dhënave të grumbulluara të pasyrojnë
karakteristikat e popullacionit (niveli i
besueshmërisë)
2. Gabimi që lejohet-saktësia që kërkon për
vlerësimin e nxjerrë nga mostra (intervali i
besimit)
3. Popullacioni nga i cili duhet nxjerrë mostra
Përcaktimi i madhësisë së mostrës
95% niveli i besueshmërisë: nëse mostra
caktohet 100 herë atëherë 95 nga këto mostra
do të përfaqësonin karakteristikat e
popullacionit.
Gabimi: tregon precizitetin e vlerësimeve të
popullacionit: nëse 45% e mostrës janë në një
kategori atëherë vlerësimi për popullacionin në
atë këtogori do të jetë 45% plus minus gabimi
(p.sh. nëse mirret 3%), në mes të 42 dhe 48% do
të përgjigjeshin në atë kategori.
21
Mostra
http://www.surveysystem.com/sscalc.htm
Përzgjedhja e mostrës
Teknikat për caktimin e mostrës
1.Mostra reprezentative (gjasat/probabiliteti i
secilit rast për tu zgjedhur si pjesë e mostrës
është i njejtë)
2. Mostra pa konsideruar probabilitetin
(studimet e rastit: qëllimore; snowball; selfselection (vet zgjedhje); e përshtatshme
(shembull me shokët, familjarët)
Llojet e mostrave: mostra e rastit e thjeshtë (simple
random sample)
Mostra e rastit: është mostër e zgjedhur në atë
mënyrë që secila mostër e mundshme e
madhësisë së njejtë ka gjasa për tu zgjedhur.
Tërheqja e tri emrave nga kapela që ka emrat e
gjithë klasës është shembull i mostrës së
rëndomtë: cdo grup me tre emra ka gjasë të
njejtë për tu nxjerrë nga kapela.
24
Llojet e mostrave pa marrë parasysh
probabilitetin
• Mostra qëllimore: varësisht nga qëllimi i studimit zgjedh
njësitë për ti vrojtuar
• Snoëball (orteku i borës): kur nuk posedojmë kornizë të
mostrës, së pari identifikojmë një vrojtim dhe ai na shpie tek
të tjerët (shembulli me narkoman; kontrabandist)
• Vet-zgjedhje (self selection): vet i anketuari zgjedh të plotësoj
një anketë; anketuesi nuk dërgon anketë tek i anketuari (në
faqe interneti plotësojnë anketa).
Stratifikimi i mostrës
Matja e standardit jetësor të familjeve kosovare
Popullacion: 330,000 familje në Kosovë
Mostra: 1,064
Stratifikuar në bazë të: 7 regjioneve; fshat qytet
Gjinor dhe mosha: në bazë të ditëlindjes me
datë më të afërt me ditën e anketimit.
Anketimi
Përdorimi i pyetësorëve
Kur të përdoren pyetësorët/anketat
• Për hulumtime përshkruese dhe shpjeguese
• Hulumtime analitike; ndërlidhja në mes të
variablave të ndryshme: inferenca statistikore,
analiza empirike.
Llojet e pyetësorëve
• Pyetësor të vet-administruar: zakonisht të
kompletuara nga të anketuarit: internetmediated-questionnaires, të dërguara me
postë ose të shpërndara tek secili i anketuar.
• Anketat me telefon
• Intervista të administruara nga anketuesi:
anketuesit personalisht anketojnë dhe
plotësojnë pyetësorët.
Dizajnimi i Pyetësorëve
Dizajnimi i pyetësorit ndikon në normën e përgjigjieve,
vlerën dhe besueshmërinë e të dhënave të
grumbulluara.
Faktorët me më rëndësi:
• Sqarim i qartë i qëllimit të pyetësorit: dizajnim i
kujdesshshëm i pyetjeve
• Pyetësor i faqosur mirë
• Anketimi pilot (testues)
• Administrim i planifikuar dhe ekzekutuar me kujdes
Dizajnimi i pyetësorëve:
• Rishqyrtimi i literaturës
• Diskutim i pyetjeve me ekspertë të fushës përkatëse
• Njohuria për vendin dhe kulturën
Dizajnimi i pyetësorëve:
• Përcaktohu nëse qëllimi i hulumtimit është përshkrues
ose hulumtues
• Ndaj cdo pyetje hulumtuese në pyetje më specifike për të
cilat nevojiten të dhëna
• Identifiko variablat të cilat duhet të grumbullohen për
t’iu përgjigjur pyetjeve hulumtuese
• Përcakto nivelin e detajeve të kërkuara nga të dhënat për
cdo variabël
• Zhvillo dhe përcakto njësinë matëse për secilën pyetje
Dizajnimi i pyetësorëve:
- Shfrytëzo nga pyetësor të natyrës së njejtë (përsëritje të
rezultateve)
- Përshtat pyetjet e huazuara nga pyetësorët egzistues
- Parashtro pyetje të reja
Kujdes: analizo mirë pyetësorët egzistues
Llojet e përgjigjieve:
Pyetje të hapura (open questions): të anketuarit përgjigjen vet.
Pyetjet e mbyllura/të ndikuara (closed-ended questions): ipet
numër i caktuar i përgjigjieve alternative nga të cilat duhet të
zgjidhet një ose më shumë përgjigjie (më lehtë për tu
plotësuar dhe krahasuar).
Dizajnimi i pyetësorëve:
Konsistenca në përgjigjiet në pyetësor (konsistenca nuk tregon
siguri/vlefshmëri: p.sh. të anektuarit mund ta kuptojnë të
gjithë një pyetje njejtë por që është ndryshe)
Forma alternative: krahasimi me pyetjet e njejta të parashtruara
në formë tjetër (rrallë ndodh të ketë pyetje te njejta).
Llojet e pyetjeve të mbyllura:
Vërejtje: numri i përgjigjieve të mundshme varet nga mënyra e
grumbullimit të të dhënave (telefon, intervistë direkte, internet)
Rendit përgjigjiet në bazë logjike
- Lista (lista e mundësive)
- Kategoria (kur vetëm një përgjigjie mund të zgjidhet; për të
grumbulluar të dhëna për tipare);
- Renditja (kur duhet radhitur, pët të matur rëndësinë relative të
të anketuarit; kujdes jo më shumë se 8 kategori (Kervin, 1999)
- Vlerësimi/klasifikimi: për grumbullimin e të dhënave lidhur me
opinionet e të anketuarve: qëndrimet pozitive dhe negative;
pajtohem, nuk pajtohem)
- Kuantitative: të ipet vlera (viti, paga, etj.)
- Matrica: për shembull të dhënat për familjarët në kolonë emrat
dhe në rreshta pyetjet për secilin anëtarë (të komplikuara).
Kodimi i pyetjeve/përgjigjieve: 1…..5 e jo 1,3,4,2,5.
Dizajnimi i pyetësorëve:
Pyetesoret jo shumë te gjatë por mos u pushtoni nga
gjatësia e pyetësorit; në dukje e mirë dhe qartë e
shënuar (4-8 faqe për anketim direkt; në telefon
rreth 30 minuta të mërzitshme).
Pyetje të filtruara (kalo në pyetjen___)
Pyetjet e lehta më në fillim; më të vështira në mes e ato
që mund ta iritojnë lexuesin në fund (edhe nëse nuk
përgjigjet ke të dhënat e mëparme)
Letra përcjellëse/njoftuese: sqaron qëllimin e anketës
(nese realizohet permes postes, internetit)
Llojet e pyetjeve
Variabla opinion (cka mendojnë të anketuarit
për dicka; nëse e saktë ose jo);
Variabla për sjelljen (eksperiencë konkrete; se
cka kanë bërë në të kaluarën; cka bëjnë sot,
dhe cka do të bëjnë në të ardhmen);
Variabla për atributet/tiparet (karakteristikat e
të anketuarve)
Testimi/anketa pilot
Për të përmirësuar pyetësorin dhe fituar informacion lidhur
1. Sa zgjat anketa
2. Qartësia e udhëzimeve
3. Cilat pyetje dhe përgjegjie të paqarta
4. Cilat të vështira
5. A ka munguar dicka
6. Nëse faqosja ka qenë atraktive dhe
7. Komente të tjera
Numri minimal 10 pyetësor. Varet nga mostra!
Gabimet e mostrimit dhe jo-mostrimit…
Gabimi në përcaktimin e mostrës referohen në
dallimet në mes të mostrës dhe popullacionit.
(sa më e madhe mostra ky gabim më i vogël)
39
Gabimet e mostrimit dhe jo-mostrimit…
Gabimet që nuk lidhen me përcaktimin e mostrës kanë të bëjnë
me gabimet në grumbullimin e të dhënave ose për shkak të
zgjedhjes së gabuara të vrojtimeve në mostër.
1. Gabimet në grumbullimin e të dhënave,
2. Mospërgjigjia, dhe
3. Selection bias/animi
Rritja e mostrës nuk zvogëlon këtë lloj të gabimit.
Gabimet gjatë grumbullimit të të dhënave
1. Gabimet e përfaqësimit
Mospërfaqësimi i dukurisë
2. Gabimet gjatë regjistrimit;
Të rastit/pa qëllim (gjatë plotësimit të
dokumentacionit, ndërrimit të numrave, etj);
Të qëllimta
41
Mospërgjigjia: norma e përgjigjieve
Arsyet për mospërgjigjie:
1. Refuzimi për tu përgjigjur
2. Paaftësia për tu përgjigjur
3. Pamundësia për të gjetur të anketuarit
4. Respondentët gjinden po pamundësia për ti
kontaktuar.
Nëse nuk përgjigjen atëherë duhet të gjinden të
tjerë të anketuar, gjë që kushton mjete
financiare.
42
Korigjimi i mostrës për mos përgjigjie
Madhësia aktuale e mostrës: =(439 (mostra)*100)/30
(norma e përgjigjieve)=1,463.
Bazuar nga ekperienca personale dhe të të tjerëve për
anketa të ngjashme.
Përgjigjia anketave prej 35% konsiderohet si e
arsyeshme (Baruch, 1999) por varet nga teknika e
grumbullimit të të dhënave.
Kontaminimi i përgjigjieve:
• Mungesa e njohurive nga anketuesit
• Mundësia për tu ndikuar nga të tjerët
• Mundësia për tu ndikuar nga i intervistuari
Kontrollimi i të dhënave
Kontrolli sasior: verifikimi i përfshirjes së numrit
të njësive statistikore të dukurisë së vrojtuar
dhe të të dhënave.
Kontrolli cilësor: saktësinë e të dhënave:
kontrolli logjik, aritmetik dhe fizik.
Ushtrim në grupe
Ushtrim:
• Përcakto një pyetje hulumtuese
• Në kapituj përcakto pyetjet si pjesë e
pyetësorit dhe arsyeto secilën pyetje
• Problemet dhe pengesat e mundshme
• Cilat përfundime pret