Transcript prezentacja
Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej: Przykład: › Czy urodziłaś/eś się w styczniu? › Czy umiesz pływać? Pytanie o charakterystykę wrażliwą to pytanie, na którą respondenci mogą nie chcieć udzielić odpowiedzi lub udzieliliby odpowiedzi fałszywej. Przykład: › Czy w Twoim zakładzie pracy rozpowszechniane są narkotyki? › Czy kiedykolwiek wręczyłaś/eś łapówkę? Metoda mająca na celu uzyskanie wiarygodnych wyników dotyczących kwestii wrażliwych. Polega na sformułowaniu pytań w taki sposób, aby respondenci byli skłonni udzielać prawdziwych odpowiedzi na pytania o charakterystyce wrażliwej. Po przeprowadzeniu badania ankietowego zliczane są odpowiedzi w sposób, który pozwala na wiarygodne oszacowanie odsetka występowania charakterystyki wrażliwej wśród respondentów. Niech U (1,..., i,..., N ) oznacza populację o znanej liczebności N , oraz › i 1 , jeśli i-ta osoba posiada wrażliwą charakterystykę A , oraz › i 0 , jeśli i-ta osoba posiada - dopełnienie C A Problem stanowi estymacja frakcji występowania charakterystyki wrażliwej N A i 1 N i Zastosowanie Metody Zliczania Odpowiedzi wymaga stworzenia dwóch list z pytaniami, na których znajduje się G takich samych pytań niewrażliwych. Niech: › Fi 1 jeśli i-ta osoba posiada niewrażliwą charakterystykę F , oraz F C › Fi 0 jeśli i-ta osoba posiada - dopełnienie F Pytanie G+1 na pierwszej liście uwzględnia wrażliwą charakterystykę A, niewrażliwą F oraz obydwie te charakterystyki jednocześnie A F Pytanie G+1 na drugiej liście zawiera dopełnienie charakterystyki A, dopełnienie charakterystyki F oraz iloczyn dopełnień charakterystyk wrażliwej i niewrażliwej AC F C Następnie dwie niezależne próby s1 i s 2 są losowane z populacji U wykorzystując plan losowania Ps . Respondenci z pierwszej próby proszeni są o podanie dotyczącej ich liczby zachowań yi i 1,2,..., N z listy pierwszej. Respondenci z drugiej próby proszeni są o podanie dotyczącej ich liczby zachowań xi z listy drugiej. Stąd w populacji: yU xU A F AF 1 AF A yU xU 1 F Estymator parametru ˆA yˆU xˆU 1 F ˆA Estymator frakcji charakterystyki wrażliwej yˆU Estymator średniej liczby zachowań w pierwszej grupie respondentów xˆU Estymator średniej liczby zachowań w drugiej grupie respondentów F Znana frakcja pytania dodatkowego G+1 Na jakim poziomie należy ustalić frakcję charakterystyki F, Jak w przybliżeniu powinna kształtować się frakcja odpowiedzi poszczególnych pytań z zestawu G, Ile powinna wynosić liczba pytań G - tak, aby błąd średniokwadratowy estymatora był jak najmniejszy. Symulacje badawcze przeprowadzone zostały metodą Monte Carlo o liczbie iteracji 10 000 w programie R. Liczebność respondentów grupy 1. i 2. założona została na poziomie 50. Obliczenia wykonano dla frakcji 0.1, 0.2, 0,3 … 0.9. RMSE (ˆA ) frakcja 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,1 0,108 0,120 0,128 0,134 0,134 0,132 0,128 0,121 0,107 0,2 0,120 0,130 0,139 0,140 0,145 0,142 0,140 0,131 0,120 0,3 0,128 0,139 0,147 0,150 0,150 0,151 0,147 0,138 0,129 0,4 0,132 0,142 0,150 0,155 0,156 0,155 0,149 0,142 0,132 0,5 0,133 0,142 0,150 0,157 0,157 0,155 0,151 0,146 0,135 0,6 0,134 0,143 0,151 0,154 0,154 0,154 0,150 0,141 0,133 0,7 0,127 0,137 0,146 0,149 0,150 0,150 0,145 0,140 0,128 0,8 0,119 0,131 0,138 0,143 0,145 0,143 0,138 0,130 0,120 0,9 0,107 0,118 0,130 0,132 0,133 0,134 0,126 0,122 0,106 RMSE (ˆA ) RMSE (ˆA ) A 0,1 F 0, 2 Frakcja pytań dodatkowych =0,2 liczba pytań G RMSE (ˆA ) przyrost bezwzględny RMSE 1 2 3 4 5 6 0,10431 0,13247 0,15421 0,17366 0,18973 0,20409 0,02816 0,02175 0,01945 0,01608 0,01436 A 0,1 F 0,5 Frakcja pytań dodatkowych =0,5 liczba pytań G RMSE (ˆA ) przyrost bezwzględny RMSE 1 2 3 4 5 6 0,12672 0,16228 0,18768 0,21439 0,23594 0,25810 0,03553 0,02539 0,02671 0,02155 0,02215 Dla grupy 1 i 2 Czy dojeżdżasz na uczelnię środkami komunikacji miejskiej? › Czy obchodzisz urodziny w czwartym kwartale? › Tylko dla grupy 1 › Tylko dla grupy 2 › Czy korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest równa lub większa od 2 lub jedno i drugie? Czy nigdy nie korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest mniejsza lub równa 1 lub jedno i drugie? Frakcja pytania F (o numer albumu) jest znana i wynosi 0,205. Cassel C.M., Särndal C.E., Wretman J.H., Foundations of Inference in Survey Sampling, John Wiley & Sons, New York-London-Sydney-Toronto, 1977. Chaudhuri A., Christofides T. C., Item Count Technique in estimating the proportion of people with a sensitive feature, Journal of Statistical Planning and Inference, 137, pp. 2007. Fox J. P., Randomize Item Theory Response Models, Journal of Educational and Behavioral Statistics, Vol. 30, No. 2, pp., 2005. Kuk A. Y. C., Asking Sensitive Questions Indirectly, Biometrika, Vol. 77, No. 2 Jun., 1990. Pal S., Estimating The Proportion Of People Bearing Sensitive Issue With an Option To Item Count Lists And Randomized Response, Statistics In Transitions- new series, Vol. 8, No. 2, pp., 2007. R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org, 2012. Rouse B. A., Kozel N. J., Louise G. Richards, Self Report Methods of Estimating Drug Use: Meeting Current Challenges to Validity, NIDA Research Monograph 57, 1985. Tsuchiya T., Domain Estimators for the Item Count Technique, Survey Methodology, Vol. 31, no. 1, pp., 2005. Wywiał J. Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu SPSS. Akademia Ekonomiczna w Katowicach, Katowice 1999.