cl7bioestpreg - Departamento de Matemática Aplicada y

Download Report

Transcript cl7bioestpreg - Departamento de Matemática Aplicada y

Universidad de Chile
Facultad de Ciencias Químicas y Farmacéuticas
Curso de Elementos de Estadística
Prof. María Pilar Sánchez
Clase Nº7: Distribuciones Chi-cuadrado - F
de Fisher
Introducción a la inferencia.
Primavera, 2002
Distribución Chi-Cuadrado
Esta es una de las distribuciones más usadas en la
estadística, ya sea en:
• la estimación y
• pruebas de hipótesis para el cálculo de los
intervalos de confianza para la varianza de una
población y
• de probar hipótesis en las pruebas de asociación
(tablas de contingencia) y la bondad de ajuste.
Requisitos y características
• Es una distribución asimétrica.
• Sólo toma valores positivos y es asintótica con
respecto al eje de los x positivos (0 < X2 < ∞)
• Está caracterizada por el número de desviaciones
independientes, es decir, de los grados de libertad
que generalmente se designa por "n".
• Se ocupa principalmente en la bondad de ajuste,
independencia y homogeneidad.
• El área comprendida entre la curva y el eje de las x
es 1 o 100%
Ejemplo…
• Es
una prueba que se puede emplear en datos de
enumeración que resultan de un proceso de conteo,
por ejemplo, ser el fruto de una encuesta y en la
cual los valores son asignados en categorías
específicas y no toman cualquier valor como en el
caso de un dato de medición.
• La magnitud del valor de chi-cuadrado se
determina como la suma de los cuadrados de las
diferencias absolutas entre cada frecuencia
observada y su frecuencia asociada esperada,
dividida por la frecuencia esperada. Así se tiene :
2 =  [(Oi - Ei) 2/(E)]
chi-cuadrado
El valor 2 es una medida del grado con el
que los pares de frecuencias observadas y
esperadas concuerdan en una situación dada,
cuando hay una congruencia grande y estrecha, el
valor de chi cuadrado es muy pequeño y cuando la
congruencia es pobre el valor es muy grande (esto
nos indica que ya un valor grande causa rechazo).
La frecuencia observada O es aquella que se
obtiene de la frecuencia observada sobre el dato
experimental, la frecuencia esperada E es aquella
que se espera y se basa en una idea preconcebida o
hipótesis a priori (se le asigna o supone una
probabilidad conocida).
Chi-cuadrado…
• Diferencias grandes producirán un valor grande y
mayor de chi-cuadrado; diferencias más pequeñas
producirán valores menores de chi-cuadrado y si
no hay diferencias entonces chi-cuadrado tomará
el valor de cero .
Recordar…
• La
prueba chi-cuadrado se basa en una variable
discreta. Es importante recordar y tener siempre en
mente que:
• Sólo se pueden analizar datos provenientes de
frecuencias, no es posible aplicar esta técnica a
datos que existen en forma de porcentajes o
proporciones, sin embargo, en algunos casos se
puede efectuar un arreglo y convertir proporciones
en frecuencias y así entonces aplicar la prueba.
Ejemplo…
Distribución F de Fisher
• El nombre de esta distribución se debe a R. A.
Fisher, quién primero la desarrolló y describió. La
prueba f se utiliza principalmente para probar la
igualdad entre dos varianzas.
• Se puede observar, que esta prueba para la
igualdad de varianzas se utiliza generalmente para
probar la igualdad entre tres o más medias.
• Cuando se procede a realizar la inferencia
estadística para probar igualdad entre 3 o más
medias comúnmente se denomina análisis de
varianza. El que implica medir la variabilidad de las
medias de las muestras obtenidas a partir de las
poblaciones problema.
Distribución F de Fisher
• Cuando se tiene interés en comparar varianzas, se
puede recurrir a la variable aleatoria f, que es la
razón de los estimadores insesgados de dos
varianzas poblacionales esto es:
2
F 
s1
2
s2
• Por
ejemplo
se
pueden
dar
múltiples
problemáticas en que requiere de esta prueba;
comparar metodologías, o cualquier variable.
Distribución F de Fisher
• La distribución f tiene dos parámetros: los
•
•
números de grados de libertad que se denotan
con el símbolo 1 y 2 .
El parámetro 1 está asociado con el numerador
de la razón f; esto es s21, estimador insesgado de
la varianza 21 de la población 1.
La varianza s21 , se obtiene a partir de una
muestra
de
n1
observaciones
tomadas
aleatoriamente a partir de la población 1.
Distribución F de Fisher
• Puesto que la suma de las desviaciones a
partir de la media muestral, al cuadrado, para
s21 tiene (n-1) grados de libertad, el
parámetro 1 es igual a (n1 - 1), así también
el parámetro 2 es igual a (n2 - 1), de modo
semejante, 2 está asociado con el
denominador de la razón f; esto es, s22 ,
estimador insesgado para la varianza 22 de la
población 2.
Distribución F de Fisher
• La varianza s22 se obtiene a partir de una muestra
•
de n2 observaciones tomadas aleatoriamente a
partir de la población 2.
La distribución f se denota con dos subíndices, el
primero corresponde a 1 y el segundo a 2
Propiedades
• El estadístico de prueba toma solamente valores
•
no negativos, debido a que tanto numerador y
denominador de la razón f son varianzas, las que
NO pueden ser valores negativos.
El valor de F varía de cero a infinito, sin embargo
en la practica se considera a 1 como límite
inferior del valor F, debido a que siempre es
posible utilizar la mayor varianza muestral como
numerador de forma que la relación F no sea
menor que 1. El límite superior del valor F rara
vez es de más de unos cuantos dígitos en la
mayor parte de las situaciones. Ejemplo, una
f(0.05;20;24) = 2.03 con un alfa =0.05.
Propiedades
• La tabla f se construye en base a que el
numerador de la razón F es mayor que el
denominador, y luego los valores de f
generalmente son mayores que 1 y tienden a 1
cuando tanto 1 y 2 tienden a infinito.
• Bajo la Ho, de que las dos varianzas poblacionales
son iguales, se espera que las varianzas de dos
muestras cualesquiera tomadas respectivamente
a partir de las dos poblaciones sean iguales
también.
Propiedades
• Sin embargo, a pesar que si la hipótesis nula es
verdadera, debido a la naturaleza aleatoria del
muestreo las dos varianzas muestrales es muy
posible difieran una de otra.
• Mientras mayor sea la diferencia entre las dos
varianzas muestrales, mayor será la magnitud en
que el estadístico de prueba F esté por encima de 1.
• La hipótesis nula Ho, se rechaza solamente cuando
el valor del estadístico de prueba F es
suficientemente mayor que 1.
Ejemplo…
• Si se quiere determinar las diferencias entre dos
metodologías en la educación a pacientes: una
basada en la lectura de trípticos y otra basada en
el apoyo profesional complementada con
trípticos.
• Si asignamos la población 1 a todos aquellos
pacientes que aprenden empleando el método de
lectura con varianza 21 y la población 2 de los
pacientes que aprenden con el método “asistencia
profesional complementaria", con varianza, 22 .
• Ho: 21 = 22

• Nota: Cuando s21 es mayor que s22, no hay
dificultad en probar la hipótesis nula de Ho: 21 =
22 en contra de H1: 21 > 22 , pues sólo se divide
la mayor varianza entre la menor y después se
compara con el valor de tabla, sin embargo, la
practica de considerar a s21 como numerador de la
razón es solamente adecuada cuando es la mayor
de las dos varianzas muestrales en una prueba de
una cola. Cuando se desea probar la hipótesis de
igualdad de varianza en contra de que hay
diferencias entonces, se divide  entre dos, esto
es, se utiliza /2 como nivel de significación y se
realiza la prueba como si fuera de una cola.
Inferencia estadística
• A
•
continuación veremos algunos conceptos
relacionados con el proceso de la inferencia que
nos permitirán aplicar todas las distribuciones
vistas anteriormente.
Todo este ejercicio lo haremos a través de
conocer los que es la docimasia de una hipótesis,
una hipótesis, los tipos de hipótesis, y como nos
ordenamos para seguir una secuencia ordenada
en estos procedimientos.
Inferencia estadística
• Docimasia de Hipótesis
La docimasia de hipótesis es uno de los
recursos que emplea la estadística para
generalizar el conocimiento obtenido en la
muestra a toda la población. Su método consiste
en suponer valores de parámetros poblacionales
y formular normas de decisión que permitan
aceptar o rechazar tales valores
  
Hipótesis estadística
Los investigadores trabajan con dos tipos de
hipótesis, las hipótesis de investigación y las hipótesis
estadísticas:
• la hipótesis de investigación es la conjetura o
suposición que motiva la investigación y que conduce
en forma directa a la hipótesis estadística, que se
establece en forma tal que se puede evaluar a través
de diferentes pruebas especializadas.
Como procedimiento didáctico observemos la
siguiente secuencia a modo de establecer un
ordenamiento que nos sirva para entender mejor
estos conceptos:
Elementos de la inferencia
• Datos:
El tipo de dato u observación debe ser conocido y
establecida su naturaleza, ya que esto determina
la base del procedimiento de la prueba en
particular a usarse. Es posible establecer si fueron
frutos de conteos o bien de medidas (esto
diferencia entre una variable de tipo discreta de
una de tipo continua).
Elementos de la inferencia
• Suposiciones :
Las suposiciones tienen importancia tanto en la
estimación ya que conduce a modificaciones en el
cálculo de los intervalos de confianza como en las
pruebas de hipótesis ya que incluyen con gran
frecuencia suposiciones acerca de la normalidad
de la distribución de la población, la igualdad de
las varianzas e independencia de las muestras, lo
que determina el procedimiento a usar.
Elementos de la inferencia
• Hipótesis :
En todo tipo de prueba de hipótesis hay dos tipos
de hipótesis con las que se trabaja y las que
deben enunciarse en forma explícita; la primera
es la llamada :
hipótesis nula, designada por el símbolo Ho,
correspondiente a la hipótesis que debe probarse
y que propone diferencia o no respecto de la
población, Casi siempre se enuncia de tal forma
que tenga que ser rechazada, así el complemento
de la conclusión a la que el investigador quiere
llegar se transforma en el enunciado de la
hipótesis nula, la que podrá ser rechazada o
aceptada.
Elementos de la inferencia
Si la hipótesis nula no se rechaza, se dirá que
los datos disponibles no proporcionan
evidencia suficiente que provoque el
rechazo,
En cambio si la hipótesis nula se rechaza se
concluye que los datos disponibles no son
compatibles con la hipótesis nula pero que
se pueden apoyar en la llamada hipóteis
alternativa
Elementos de la inferencia
• hipótesis alternativa y que es el segundo tipo de
hipótesis, designándose como H1 o HA.
Es bueno considerar que cuando se acepta una
hipótesis nula, no debemos decir que es verdadera
sino que puede ser verdadera, puesto que lo que
probamos sencillamente es si los datos disponibles
apoyan o no a las hipótesis planteadas, luego
debemos tener siempre presente esta limitación.
Elementos de la inferencia
• Estadística de prueba :
La estadística de prueba es alguna estadística que se
pueda calcular a partir de los datos de la muestra. Por
ejemplo puede ser z, W* (de Wilcoxon), etc.
• Distribución de la estadística de prueba :
Es clave fundamental para la inferencia estadística es
decir es la base para las pruebas aplicadas.
• Regla de decisión :
La estadística de prueba puede tomar distintos
valores los que determinan puntos en el eje
horizontal de la gráfica y se dividen en dos áreas, una
de ellas se conoce como región de aceptación y la
otra como región de rechazo.