Transcript prezentacja


Pytanie o charakterystykę niewrażliwą to
pytanie, na którą z dużym
prawdopodobieństwem respondenci
udzielą odpowiedzi prawdziwej:

Przykład:
› Czy urodziłaś/eś się w styczniu?
› Czy umiesz pływać?

Pytanie o charakterystykę wrażliwą to
pytanie, na którą respondenci mogą nie
chcieć udzielić odpowiedzi lub udzieliliby
odpowiedzi fałszywej.

Przykład:
› Czy w Twoim zakładzie pracy
rozpowszechniane są narkotyki?
› Czy kiedykolwiek wręczyłaś/eś łapówkę?

Metoda mająca na celu uzyskanie
wiarygodnych wyników dotyczących
kwestii wrażliwych. Polega na
sformułowaniu pytań w taki sposób, aby
respondenci byli skłonni udzielać
prawdziwych odpowiedzi na pytania o
charakterystyce wrażliwej. Po
przeprowadzeniu badania ankietowego
zliczane są odpowiedzi w sposób, który
pozwala na wiarygodne oszacowanie
odsetka występowania charakterystyki
wrażliwej wśród respondentów.
Niech U  (1,..., i,..., N ) oznacza populację
o znanej liczebności N , oraz
› i  1 , jeśli i-ta osoba posiada wrażliwą
charakterystykę A , oraz
›  i  0 , jeśli i-ta osoba posiada
- dopełnienie
C
A
Problem stanowi estymacja frakcji
występowania charakterystyki wrażliwej
N
A 

i 1
N
i

Zastosowanie Metody Zliczania
Odpowiedzi wymaga stworzenia dwóch
list z pytaniami, na których znajduje się G
takich samych pytań niewrażliwych.
Niech:
› Fi  1 jeśli i-ta osoba posiada niewrażliwą
charakterystykę F , oraz F C
›
Fi  0 jeśli i-ta osoba posiada
- dopełnienie F
Pytanie G+1 na pierwszej liście
uwzględnia wrażliwą charakterystykę A,
niewrażliwą F oraz obydwie te
charakterystyki jednocześnie A  F
 Pytanie G+1 na drugiej liście zawiera
dopełnienie charakterystyki A,
dopełnienie charakterystyki F oraz
iloczyn dopełnień charakterystyk
wrażliwej i niewrażliwej AC  F C

Następnie dwie niezależne próby s1 i s 2 są
losowane z populacji U wykorzystując
plan losowania Ps . Respondenci z
pierwszej próby proszeni są o podanie
dotyczącej ich liczby zachowań
yi  i  1,2,..., N  z listy pierwszej.
Respondenci z drugiej próby proszeni są
o podanie dotyczącej ich liczby
zachowań xi z listy drugiej. Stąd w
populacji:
yU  xU   A   F   AF   1   AF 
 A  yU  xU  1   F
Estymator parametru ˆA  yˆU  xˆU  1  F
ˆA
Estymator frakcji charakterystyki wrażliwej
yˆU
Estymator średniej liczby zachowań w
pierwszej grupie respondentów
xˆU
Estymator średniej liczby zachowań w
drugiej grupie respondentów
F
Znana frakcja pytania dodatkowego G+1
Na jakim poziomie należy ustalić frakcję
charakterystyki F,
 Jak w przybliżeniu powinna kształtować
się frakcja odpowiedzi poszczególnych
pytań z zestawu G,
 Ile powinna wynosić liczba pytań G - tak,
aby błąd średniokwadratowy
estymatora był jak najmniejszy.


Symulacje badawcze przeprowadzone
zostały metodą Monte Carlo o liczbie
iteracji 10 000 w programie R. Liczebność
respondentów grupy 1. i 2. założona
została na poziomie 50. Obliczenia
wykonano dla frakcji 0.1, 0.2, 0,3 … 0.9.
RMSE (ˆA )
frakcja
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,1
0,108
0,120
0,128
0,134
0,134
0,132
0,128
0,121
0,107
0,2
0,120
0,130
0,139
0,140
0,145
0,142
0,140
0,131
0,120
0,3
0,128
0,139
0,147
0,150
0,150
0,151
0,147
0,138
0,129
0,4
0,132
0,142
0,150
0,155
0,156
0,155
0,149
0,142
0,132
0,5
0,133
0,142
0,150
0,157
0,157
0,155
0,151
0,146
0,135
0,6
0,134
0,143
0,151
0,154
0,154
0,154
0,150
0,141
0,133
0,7
0,127
0,137
0,146
0,149
0,150
0,150
0,145
0,140
0,128
0,8
0,119
0,131
0,138
0,143
0,145
0,143
0,138
0,130
0,120
0,9
0,107
0,118
0,130
0,132
0,133
0,134
0,126
0,122
0,106
RMSE (ˆA )
RMSE (ˆA )
 A  0,1  F  0, 2 Frakcja pytań dodatkowych =0,2
liczba pytań G
RMSE (ˆA )
przyrost bezwzględny RMSE
1
2
3
4
5
6
0,10431 0,13247 0,15421 0,17366 0,18973 0,20409
0,02816 0,02175 0,01945 0,01608 0,01436
 A  0,1  F  0,5 Frakcja pytań dodatkowych =0,5
liczba pytań G
RMSE (ˆA )
przyrost bezwzględny RMSE
1
2
3
4
5
6
0,12672 0,16228 0,18768 0,21439 0,23594 0,25810
0,03553 0,02539 0,02671 0,02155 0,02215

Dla grupy 1 i 2
Czy dojeżdżasz na uczelnię środkami komunikacji miejskiej?
› Czy obchodzisz urodziny w czwartym kwartale?
›

Tylko dla grupy 1
›

Tylko dla grupy 2
›

Czy korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium
socjalne) lub ostatnia cyfra twojego numeru albumu jest równa lub
większa od 2 lub jedno i drugie?
Czy nigdy nie korzystałeś/aś ze świadczeń socjalnych na uczelni (np.
stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest
mniejsza lub równa 1 lub jedno i drugie?
Frakcja pytania F (o numer albumu) jest znana i wynosi 0,205.









Cassel C.M., Särndal C.E., Wretman J.H., Foundations of Inference in Survey Sampling,
John Wiley & Sons, New York-London-Sydney-Toronto, 1977.
Chaudhuri A., Christofides T. C., Item Count Technique in estimating the proportion of
people with a sensitive feature, Journal of Statistical Planning and Inference, 137,
pp. 2007.
Fox J. P., Randomize Item Theory Response Models, Journal of Educational and
Behavioral Statistics, Vol. 30, No. 2, pp., 2005.
Kuk A. Y. C., Asking Sensitive Questions Indirectly, Biometrika, Vol. 77, No. 2 Jun., 1990.
Pal S., Estimating The Proportion Of People Bearing Sensitive Issue With an Option To Item
Count Lists And Randomized Response, Statistics In Transitions- new series, Vol. 8, No. 2,
pp., 2007.
R Development Core Team. R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL
http://www.R-project.org, 2012.
Rouse B. A., Kozel N. J., Louise G. Richards, Self Report Methods of Estimating Drug Use:
Meeting Current Challenges to Validity, NIDA Research Monograph 57, 1985.
Tsuchiya T., Domain Estimators for the Item Count Technique, Survey Methodology, Vol.
31, no. 1, pp., 2005.
Wywiał J. Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu
SPSS. Akademia Ekonomiczna w Katowicach, Katowice 1999.