SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia MÓDULO 3: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES: MEDIA DESVÍO ESTÁNDAR Y DISTRIBUCIÓN.
Download ReportTranscript SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia MÓDULO 3: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES: MEDIA DESVÍO ESTÁNDAR Y DISTRIBUCIÓN.
SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia MÓDULO 3: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES: MEDIA DESVÍO ESTÁNDAR Y DISTRIBUCIÓN NORMAL MEDIDAS ESTADÍSTICAS • LA ESTADÍSTICA DESCRIPTIVA TIENE COMO FUNCIÓN BRINDAR UN CONJUNTO DE MEDIDAS QUE SINTETICEN LA INFORMACIÓN RELEVADA POR LOS DATOS. • ESTUDIA CARACTERES O ASPECTOS REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO O ELEMENTOS DE NATURALEZA ESPECÍFICA. • LA ESTADÍSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA DE HERRAMIENTAS PARA RESUMIR INFORMACIÓN QUE CONTIENE UNA MUESTRA O POBLACIÓN: TABLAS, GRÁFICOS, MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSIÓN, ETC. • LA EXTRAPOLACIÓN DE LOS RESULTADOS DE UNA MUESTRA A LA POBLACIÓN ES EL CONTENIDO DE LA ESTADÍSTICA INFERENCIAL, CUYA FUNCIÓN ES INFERIR CONCLUSIONES Y BRINDAR MEDIDAS QUE PERMITAN CUANTIFICAR LA CONFIANZA DE TALES CONCLUSIONES. EL EMPLEO DE UN DETERMINADO TIPO Y/O HERRAMIENTA ESTADÍSTICA DEPENDE DEL TIPO DE PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE MEDIÓN DE LOS VALORES DE LA VARIABLE A CONSIDERAR. HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA INFORMACIÓN RESUMEN DE VARIABLES ALEATORIAS DISTRIBUCIÓN DE FRECUENCIAS ESTADÍSTICOS DESCRIPTIVOS TENDENCIA CENTRAL HETEROGENEIDAD O DESVÍO DISTRIBUCIÓN NORMAL VALORES TIPIFICADOS Estadística Descriptiva Tabla de distribución de frecuencias Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos distribución de frecuencias, en la que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Por tanto, llamaremos distribución de frecuencias a un agrupamiento de datos en clases acompañada de sus frecuencias: frecuencias absolutas, frecuencias relativa o frecuencia acumuladas. La distribución de frecuencias como primer paso del análisis estadístico descriptivo Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo. Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias: a) frecuencias absolutas : es el número de veces que aparece dicho valor de la variable y se representa por fi. b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri c) frecuencias absoluta acumulada: es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓) d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N) y la denotaremos por fra. HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA ANÁLISIS ESTADÍSTICO PARA VARIABLES NOMINALES U ORDINALES DISTRIBUCIÓN DE FRECUENCIA MEDIDAS CENTRALES MEDIDAS DE DESVÍO HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA VARIABLES DESCRIPCIÓN ESTADISTICOS Y GRÁFICOS Cualitativas en escala nominal Valores no Distribución de frecuencias métricos con Moda, %, tasas, razones. ausencia de orden Diagrama de barras entre ellos Cualitativas en escala ordinal Valores no Mínimo métricos con Máximo presencia de orden Mediana entre ellos. Cuartiles Percentiles Rangos intercuartilicos Gráficos de caja y bigotes HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA ANÁLISIS ESTADÍSTICO PARA VARIABLES MÉTRICAS DISTRIBUCIÓN NORMAL MEDIA DESVÍO VALORES TIPIFICADOS HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA VARIABLES CUANTITATIVAS VARIABLES Cuantitativa en escala de intervalo o de razón DESCRIPCIÓN Cuantitativas: Discretas Continuas En escala de intervalo En escala de razón ESTADISTICOS Y GRÁFICOS Media Rango Varianza Desviación típica Coeficiente de variación Coef. de asimetría Coef. de curtosis Histograma ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL Muchas variables aleatorias continuas presentan una función de densidad que es simétrica y cuya gráfica tiene forma de campana. Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas como modelo o parámetro de comparación. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL La curva de distribución normal presenta una única moda, que coincide con la media y la mediana. La curva normal es asintótica al eje de abscisas y su función de densidad es simétrica. La distribución normal queda definida por dos parámetros: LA MEDIA DE LA DISTRIBUCIÓN Y EL DESVIACIÓN ESTÁNDAR ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL El uso extendido de la distribución normal en las aplicaciones estadísticas tiene diferentes razones. Muchos de los procedimientos estadísticos habitualmente utilizados asumen la normalidad de los datos observados (p. e. el muestreo). Si bien esta hipótesis puede obviarse cuando se dispone de un número suficiente de datos, resulta recomendable contrastar siempre si se puede asumir o no una distribución normal. La simple exploración visual de los datos puede sugerir la forma de su distribución. No obstante, existen medidas, gráficos y contrastes de hipótesis que pueden ayudarnos a decidir, de un modo más riguroso, si la muestra de la que se dispone procede o no de una distribución normal. Cuando los datos no sean normales, podremos o bien transformarlos o emplear otros métodos estadísticos que no exijan este tipo de restricciones (los llamados métodos no paramétricos). ESTADÍSTICA DESCRIPTIVA – MEDIA ARITMÉTICA La media aritmética o promedio aritmético es una medida estadística de tendencia central. De una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad. ESTADÍSTICA DESCRIPTIVA - DESVÍO ESTÁNDAR Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución. La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable. Para tal fin nos valemos la varianza y la desviación estándar. Ambas medidas están estrechamente relacionadas ya que definimos una a partir de la otra. Expresión de la varianza poblacional: Expresión de la desviación estándar: ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL , TIPIFICACIÓN DE LOS VALORES DE UNA VARIABLE ALEATORIA Cuando y , la distribución se conoce con el nombre de normal estándar. Dada una variable aleatoria normal X, con media y desviación típica , ,si definimos otra variable aleatoria entonces la variable aleatoria Z tendrá una distribución normal estándar , se dice que se ha tipificado la variable X. y Es posible estimar la probabilidad de que una variable aleatoria (que sigue una distribución normal) se encuentre entre dos valores determinados. Para ello, existen tablas de distribución normal tipificada a partir de la distribución Normal Tipificada. Característica de la distribución normal tipificada (estándar) •No depende de ningún parámetro •Su media es 0, su varianza es 1 y su desviación típica es 1. •La curva f(x) es simétrica respecto del eje OY •Tiene dos puntos de inflexión en z =1 y z = -1 USO DE TABLAS DE DISTRIBUCIÓN NORMAL TIPIFICADA Para calcular la probabilidad de que una variable aleatoria (que sigue una distribución normal) se encuentre entre dos valores determinados se busca en la tabal tipificada un valor de x (por ejemplo , ), y la tabla nos da la probabilidad de que En el caso de que la distribución no sea estándar, por ejemplo, con y , tendremos que tipificar la variable: Se obtiene una variable Z normal, que además está tipificada. Si ahora se consulta en la tabla, FUNCIÓN DE DISTRIBUCIÓN NORMAL En la distribución normal, también llamada distribución de Gauss, son más probables los valores cercanos a uno central que llamamos media m. Conforme nos separamos de ese valor m , la probabilidad va decreciendo de igual forma a derecha e izquierda (simétrica). Conforme nos separamos de ese valor m , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro s, que es la desviación típica (o la varianza), las cuales constituyen medidas de dispersión. La función de densidad de probabilidad se utiliza en estadística con el propósito de conocer cómo se distribuyen las probabilidades de un suceso o evento, en relación al resultado del suceso.