captura-recaptura - Departamento de Probabilidad y Estadística

Transcript captura-recaptura - Departamento de Probabilidad y Estadística

Universidad Nacional Autónoma de México
Muestreo
M. en C. Patricia I. Romero Mares
Captura y Recaptura
Alumnos:
Chávez Daniela
Mayoral Alexandro
Rosales Aldebarán
Vázquez Gerardo
Supongamos que queremos estimar el número de elementos de una
población poco participativa para ser encuestada
como puede ser el hecho de estimar el número de individuos de una población
de animales en proceso de extinción (sólo por citar un caso).
Para realizar tal estimación la literatura documenta la estimación por:
captura - recaptura
El tamaño de una población de animales puede ser estimado mediante la
captura y marcaje de individuos de esta población que son posteriormente
liberados , para volver a ser recapturados.
Esta metodología fue utilizada en 1662
por John Graunt para estimar el tamaño
de la población londinense y fue C. G. J.
Petersen quien en 1896 lo utilizó con fines
ecológicos para estimar el tamaño de la
población de peces y medir tasas de
mortalidad.
Este método y otros (relacionados), han
sido incorporados al estudio de patos,
insectos, mamíferos y de muchos otros
organismos en donde no es posible
realizar un censo por la alta movilidad de
los individuos y debido a que no son
completamente visibles.
MODELOS
El método más simple (Petersen) se basa en los siguientes supuestos:
• La población es cerrada: ningún individuo en cuestión entra o sale, es decir N es
la misma en los dos procesos.
• Cada muestra de individuos es una muestra aleatoria simple de la población, es
decir cada individuo tiene la misma probabilidad de inclusión en una muestra. No
ocurre, por ejemplo, que los animales más débiles o los más pequeños tengan
más posibilidades de ser capturados, además no existen individuos ocultos en la
población con probabilidad cero de ser capturados o recapturados.
• Las dos muestras son independientes, los animales marcados en la primera
captura, se vuelven a mezclar en el hábitat ( misma población), de tal forma que
el hecho de ser seleccionados (marcados) no está relacionado con la probabilidad
de ser seleccionado en la segunda muestra, la probabilidad de ser atrapado en la
segunda muestra no depende de su historia de captura.
• La marca o señal debe ser lo suficientemente resistente para soportar el tiempo
entre la captura y recaptura.
Procedimiento (modelo Petersen)
1) Obtener una muestra aleatoria de n1 individuos los cuales son
marcados.
2) Regresar los individuos marcados al medio para que se mezclen con los
no marcados.
3) Capturar una nueva muestra aleatoria de tamaño n2 y contar las
recapturas.
4) La proporción recapturada nos indicará el tamaño de la población
total.
Las fórmulas para estimar el tamaño de la población son:
Por proporcionalidad :
n1 m

N n2
por lo que :
~ nn
N 2 1
m
N = Tamaño de la población
n1 = Tamaño de la primera muestra y total de
elementos marcados en la población
n2 = Tamaño de la segunda muestra
m = Individuos marcados en la segunda muestra
m ≤ n2
n1  6
n2  9
~  18
N
N  19
"𝑵" 𝐞𝐬 𝐚 "𝒏𝟏 " 𝒄𝒐𝒎𝒐"𝒏𝟐 " 𝒆𝒔 𝒂 "𝒎"
Una representación en geométrica sería la siguiente:
Una aproximación del estimador de la varianza para el estimador de la
población es:
~ ~ n12 n2 (n2  m)
V (N ) 
m3
Y un intervalo aproximado del (1 - α)% de confianza para el tamaño de la
población es:
~
~ ~
N  z1 / 2 V ( N )
Chapman (1951) propone una estimación con menos sesgo :
𝑁=
𝑛1 +1) 𝑛2 +1)
𝑚+1
-1
En este caso una estimación para la varianza de 𝑁 (propuesta por Seber)
es:
𝑛1 + 1) 𝑛2 + 1) 𝑛1 − 𝑚) 𝑛2 − 𝑚
𝑉 𝑁 =
𝑚 + 1 2 𝑚 + 2)
Y un intervalo aproximado del (1 - α)% de confianza para el tamaño de
la población es:
~
~ ~
N  z1 / 2 V ( N )
Si el muestreo durante el segundo evento se hace con reemplazo o si en el
primer muestreo no se afecta a la fracción marcada en la población, Bailey
propone la siguiente modificación:
Con varianza estimada:
x
x
x
x
x
x
x
x
x
x
x
x
x
La estimación de Lincoln- Petersen toma
una muestra sin reemplazo por lo que
cada individuo sólo puede ser capturado
una vez por muestra
x
x
x
x
x
x
x
x x
x
x
x
x
x
x
x
x
En la modificación de Bayles como es con reemplazo
para la segunda muestra permite que el mismo
individuo a ser capturado varias veces dentro de cada
muestra.
Tablas de Contingencia para experimentos con captura y recaptura
Fienberg (1972) sugiere que los datos de captura y recaptura se observen en
una tabla de contingencia incompleta:
Para estimar los valores esperados usamos:
Si la primera muestra es independiente de la segunda entonces la
probabilidades de estar en la segunda muestra es son las mismas para las
especies marcadas y las que no, es decir:
Por lo que bajo el concepto de independencia el esperado de la celda
faltante es:
Por tanto :
Ejemplo:
Supongamos que deseamos estimar la población del “lobo mexicano” especie en
peligro de extinción, al respecto:
La Norma Oficial Mexicana, NOM-059-ECOL-2001, establece que una especie se encuentra en peligro de extinción cuando su área de
distribución o tamaño de sus poblaciones en el territorio nacional ha disminuido drásticamente poniendo en riesgo su viabilidad biológica
en todo su hábitat natural, debido entre otros a factores tales como la destrucción o modificación drástica del hábitat, aprovechamiento
no sustentable, enfermedades o depredación principalmente del “homo sapiens”
Recuperado de: http://www.biodiversidad.gob.mx/pdf/NOM-059-ECOL-2001.pdf
Supongamos que obtenemos estos valores:
n1= 120
m = 24
Pero lo que necesitamos encontrar un valor de
Tal qué:
La primera muestra vs. la segunda muestra sean independientes:
Pero sólo se observan tres de los cuatro necesarios, por lo que no se puede verificar
tal hecho.
Sin embargo podría generarse un programa que estableciera algunos valores plausibles
con la intervención de un experto que supiera de la especie en estudio.
El método de captura y recaptura se puede
aplicar a seres humanos.
Laplace (uno de los pioneros) lo utilizó para estimar la población de Francia a
principios de siglo XIX.
La adecuación para seres humanos se realiza con marcos de muestreo (por lo menos dos
listados extremadamente fidedignos) y tomar las muestras con el rigor de la aleatoriedad.
En lugar de capturar individuos, podemos usar listas de individuos.
Las hipótesis de esta estimación son como antes, pero ligeramente
distintas de cuando se trata de especies animales.
 La población es cerrada: en estudios de la vida salvaje, esta hipótesis
podría no cumplirse. Sin embargo al considerar listas como las muestras,
por lo general podemos actuar como sí la población fuese cerrada, sí las
listas son del mismo período.
 Cada muestra de individuos es una muestra aleatoria simple de la
población, es decir cada individuo tiene la misma probabilidad de
inclusión en una muestra.
 Las dos listas son independientes.
En España, Antonia Domingo Salvany et al,
investigadora en la Universidad Autónoma de
Barcelona han utilizado estos métodos para estimar el
número de adictos a la heroína.
Para ello utilizaron tres capturas, consistentes en tres
listas:
Ingreso de urgencias por el abuso a
la heroína, las solicitudes de
desintoxicación durante un primer
semestre, y los ingresos en prisión
en el segundo semestre, según
apareciera o no en cada una de
estas listas.
Ejemplo :
Suponga que se quiere estimar la
cantidad de Afinadores de pianos en una
ciudad.
Se obtiene la lista de miembros de la
Asociación de Afinadores Sindicalizados
de Pianos
(AASP)
y la lista del
Conglomerado de Afinadores de Pianos
(CAP).
(Hay
otra
organizaciones
importantes pero para simplificar sólo se
utilizan dos).
Entonces:
N = Población a estimar de Afinadores de Pianos
n1= Lista de los miembros de AASP
n2 = Lista de los miembros del CAP
m = Número de personas en ambas listas
Podemos estimar la población de afinadores mediante:
𝑛1 𝑛2
𝑁=
𝑚
¡Exactamente como si los afinadores
de pianos fueran lobos!
Modelo Simple:
• No hay muertes, nacimientos ni movimientos de
población.
• Solo se realizan dos capturas.
¿Si queremos tomar en cuenta la posibilidad de
muertes y nacimientos o migraciones?
¿O si no se consideran solo dos capturas?
Estimaciones con varias recapturas:
Se pueden ajustar modelos más complicados si se extraen más de 2 muestras
aleatorias y en particular si se utilizaron diferentes marcas para los individuos
(especies animales) atrapados en las diversas muestras, con los lobos por
ejemplo, se marcan, entonces un lobo capturado con un código 001 por
ejemplo, implican 3 muestras, no capturado en la primera, no capturado en la
segunda y capturado en la tercera.
Schnabel (1938) analizó una forma de estimar N al extraer K muestras y
determinó que la estimación de máxima verosímil de N es la solución de:
ni= tamaño de la muestra i
ri =cantidad de individuos recapturados en la
muestra i
Mi = es el número de individuos marcados
cuando se extrae la muestra i.
k
2
En un estudio con k ocasiones de muestreo, se tienen historias distintas de
capturas posibles . Hay distintas formas de analizarlas, una de ellas es
considerar las capturas como conteos en un modelo log-lineal.
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
Básicamente, los estimadores de Petersen en muestreo múltiple
Muestra i:
Se capturan ni individuos
Se registran ri recapturas
Se marcan ui individuos
no marcados
Se regresan los individuos
a la población
La relación que guardan es la siguiente:
Por lo que otra forma de ver el tamaño de muestra estimado es:
con:
Muestreo de gansos no voladores
atrapados por una red de “ojo de
cerradura
Conclusiones:
A través del empleo del método de captura y recaptura es posible estimar el total de la
población de interés
Los supuestos de los distintos modelos tienen que considerarse para que el estimador
sea insesgado
A pesar de lo que menciona la literatura, el tamaño de la muestra es factor
fundamental para que la estimación sea precisa, esto es, entre más grande sea, mejor
estimación
Referencias:
Sharon L. Lohr.Muestreo: Diseño y análisis. México; International Thomson Editores
(2000)
Pérez Cesar. Técnicas de Muestreo Estadístico. Teoría, práctica y aplicaciones
informáticas. México; Alfaomega(2000).
Wagemann Ernst. El número, detective. México; Fondo de Cultura Económica (1958).
McCallum, H. (2000) Population Parameters: Estimation for Ecological Models.
Blackwell Science, Oxford.