SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia MÓDULO 3: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES: MEDIA DESVÍO ESTÁNDAR Y DISTRIBUCIÓN.

Download Report

Transcript SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia MÓDULO 3: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES: MEDIA DESVÍO ESTÁNDAR Y DISTRIBUCIÓN.

SEMINARIO DE POSGRADO
METODOLOGÍA DE INVESTIGACIÓN
Titular: Agustín Salvia
MÓDULO 3: MÉTODOS DE INVESTIGACIÓN
BASADOS EN EL ANÁLISIS DE VARIABLES: MEDIA
DESVÍO ESTÁNDAR Y DISTRIBUCIÓN NORMAL
MEDIDAS ESTADÍSTICAS
• LA ESTADÍSTICA DESCRIPTIVA TIENE COMO FUNCIÓN BRINDAR UN CONJUNTO DE
MEDIDAS QUE SINTETICEN LA INFORMACIÓN RELEVADA POR LOS DATOS.
• ESTUDIA CARACTERES O ASPECTOS REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO
O ELEMENTOS DE NATURALEZA ESPECÍFICA.
• LA ESTADÍSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA DE HERRAMIENTAS PARA
RESUMIR INFORMACIÓN QUE CONTIENE UNA MUESTRA O POBLACIÓN: TABLAS,
GRÁFICOS, MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSIÓN, ETC.
• LA EXTRAPOLACIÓN DE LOS RESULTADOS DE UNA MUESTRA A LA POBLACIÓN ES EL
CONTENIDO DE LA ESTADÍSTICA INFERENCIAL, CUYA FUNCIÓN ES INFERIR CONCLUSIONES
Y BRINDAR MEDIDAS QUE PERMITAN CUANTIFICAR LA CONFIANZA
DE TALES
CONCLUSIONES.
EL EMPLEO DE UN DETERMINADO TIPO Y/O HERRAMIENTA ESTADÍSTICA
DEPENDE DEL TIPO DE PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE
MEDIÓN DE LOS VALORES DE LA VARIABLE A CONSIDERAR.
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
INFORMACIÓN RESUMEN DE
VARIABLES ALEATORIAS
DISTRIBUCIÓN DE FRECUENCIAS
ESTADÍSTICOS DESCRIPTIVOS
TENDENCIA CENTRAL
HETEROGENEIDAD O DESVÍO
DISTRIBUCIÓN NORMAL
VALORES TIPIFICADOS
Estadística Descriptiva
Tabla de distribución de frecuencias
Una de los primeros pasos que se realizan en cualquier
estudio estadístico es la tabulación de resultados, es
decir, recoger la información de la muestra resumida en
una tabla, que denominaremos distribución de
frecuencias, en la que cada valor de la variable se le
asocian determinados números que representan el
número de veces que ha aparecido, su proporción con
respecto a otros valores de la variable, etc.
Por tanto, llamaremos distribución de frecuencias a un
agrupamiento de datos en clases acompañada de sus
frecuencias: frecuencias absolutas, frecuencias relativa
o frecuencia acumuladas.
La distribución de frecuencias como primer paso del
análisis estadístico descriptivo
Definiremos como frecuencia de un dato el número de veces que este
aparece en el colectivo. Para efectos prácticos, asumiremos las siguientes
definiciones de frecuencias:
a) frecuencias absolutas : es el número de veces que aparece dicho valor
de la variable y se representa por fi.
b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el
tamaño de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por fa, se puede acumular, en la tabla estadística) en
orden ascendente (fa↑) o descendente (fa↓)
d) frecuencia relativa acumulada: al igual que en el caso anterior se
calcula como el cociente entre la frecuencia absoluta acumulada dividido por
el tamaño de la muestra (N) y la denotaremos por fra.
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
ANÁLISIS ESTADÍSTICO PARA
VARIABLES NOMINALES U
ORDINALES
DISTRIBUCIÓN DE FRECUENCIA
MEDIDAS CENTRALES
MEDIDAS DE DESVÍO
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
VARIABLES
DESCRIPCIÓN
ESTADISTICOS Y GRÁFICOS
Cualitativas en
escala nominal
 Valores no
 Distribución de frecuencias
métricos con
 Moda, %, tasas, razones.
ausencia de orden
 Diagrama de barras
entre ellos
Cualitativas en
escala ordinal
 Valores no
 Mínimo
métricos con
 Máximo
presencia de orden
 Mediana
entre ellos.
 Cuartiles
 Percentiles
 Rangos intercuartilicos
 Gráficos de caja y bigotes
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
ANÁLISIS ESTADÍSTICO PARA
VARIABLES MÉTRICAS
DISTRIBUCIÓN NORMAL
MEDIA
DESVÍO
VALORES TIPIFICADOS
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
VARIABLES CUANTITATIVAS
VARIABLES
Cuantitativa en
escala de
intervalo o de
razón
DESCRIPCIÓN
Cuantitativas:
 Discretas
 Continuas
 En escala de
intervalo
 En escala de
razón
ESTADISTICOS Y
GRÁFICOS
Media
Rango
Varianza
Desviación típica
Coeficiente de variación
Coef. de asimetría
Coef. de curtosis
Histograma
ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL
Muchas variables aleatorias continuas presentan
una función de densidad que es simétrica y cuya
gráfica tiene forma de campana. Esta distribución
es frecuentemente utilizada en las aplicaciones
estadísticas como modelo o parámetro de
comparación.
Su propio nombre indica su extendida utilización,
justificada por la frecuencia o normalidad con la
que ciertos fenómenos tienden a parecerse en su
comportamiento a esta distribución.
ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL
La curva de distribución normal presenta una única moda, que
coincide con la media y la mediana. La curva normal es asintótica
al eje de abscisas y su función de densidad es simétrica.
La distribución normal queda definida por dos parámetros:
LA MEDIA DE LA DISTRIBUCIÓN Y EL DESVIACIÓN ESTÁNDAR
ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL
El uso extendido de la distribución normal en las
aplicaciones estadísticas tiene diferentes razones.
Muchos de los procedimientos estadísticos habitualmente utilizados
asumen la normalidad de los datos observados (p. e. el muestreo). Si
bien esta hipótesis puede obviarse cuando se dispone de un número
suficiente de datos, resulta recomendable contrastar siempre si se
puede asumir o no una distribución normal.
La simple exploración visual de los datos puede sugerir la forma de
su distribución. No obstante, existen medidas, gráficos y contrastes
de hipótesis que pueden ayudarnos a decidir, de un modo más
riguroso, si la muestra de la que se dispone procede o no de una
distribución normal.
Cuando los datos no sean normales, podremos o bien transformarlos
o emplear otros métodos estadísticos que no exijan este tipo de
restricciones (los llamados métodos no paramétricos).
ESTADÍSTICA DESCRIPTIVA – MEDIA ARITMÉTICA
La media aritmética o promedio aritmético es una medida estadística de
tendencia central. De una cantidad finita de números, es igual a la suma de
todos ellos dividida entre el número de sumandos.
Expresada de forma más intuitiva, podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a partes iguales entre cada
observación. Es decir, la media es una forma de resumir la información de
una distribución (dinero en el bolsillo) suponiendo que cada observación
(persona) tendría la misma cantidad de la variable.
También la media aritmética puede ser denominada como centro de gravedad
de una distribución, el cual no es necesariamente la mitad.
ESTADÍSTICA DESCRIPTIVA - DESVÍO ESTÁNDAR
Para conocer con detalle un conjunto de datos, no basta con conocer las
medidas de tendencia central, sino que necesitamos conocer también la
desviación que representan los datos en su distribución respecto de la media
aritmética de dicha distribución.
La desviación estándar (o desviación típica) es una medida de dispersión para
variables de razón (ratio o cociente) y de intervalo. Es una medida (cuadrática) que
informa de la media de distancias que tienen los datos respecto de su media
aritmética, expresada en las mismas unidades que la variable. Para tal fin nos
valemos la varianza y la desviación estándar. Ambas medidas están
estrechamente relacionadas ya que definimos una a partir de la otra.
Expresión de la varianza poblacional:
Expresión de la desviación estándar:
ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL
,
TIPIFICACIÓN DE LOS VALORES DE UNA VARIABLE ALEATORIA
Cuando
y
, la distribución se conoce con el nombre de normal
estándar. Dada una variable aleatoria normal X, con media y desviación típica ,
,si definimos otra variable aleatoria
entonces la variable aleatoria Z tendrá una distribución normal estándar
, se dice que se ha tipificado la variable X.
y
Es posible estimar la probabilidad de que una variable aleatoria (que sigue
una distribución normal) se encuentre entre dos valores determinados. Para
ello, existen tablas de distribución normal tipificada a partir de la distribución
Normal Tipificada.
Característica de la distribución
normal tipificada (estándar)
•No depende de ningún parámetro
•Su media es 0, su varianza es 1 y
su desviación típica es 1.
•La curva f(x) es simétrica
respecto del eje OY
•Tiene dos puntos de inflexión
en z =1 y z = -1
USO DE TABLAS DE DISTRIBUCIÓN NORMAL TIPIFICADA
Para calcular la probabilidad de que una variable aleatoria (que sigue una
distribución normal) se encuentre entre dos valores determinados se
busca en la tabal tipificada un valor de x (por ejemplo ,
), y la tabla
nos da la probabilidad de que
En el caso de que la distribución no sea estándar, por ejemplo,
con
y
, tendremos que tipificar la variable:
Se obtiene una variable Z normal, que además está tipificada. Si ahora se
consulta en la tabla,
FUNCIÓN DE DISTRIBUCIÓN NORMAL
En la distribución normal, también llamada distribución de Gauss,
son más probables los valores cercanos a uno central que llamamos
media m. Conforme nos separamos de ese valor m , la probabilidad
va decreciendo de igual forma a derecha e izquierda (simétrica).
Conforme nos separamos de ese valor m , la probabilidad va
decreciendo de forma más o menos rápida dependiendo de un
parámetro s, que es la desviación típica (o la varianza), las cuales
constituyen medidas de dispersión.
La función de densidad de
probabilidad se utiliza en
estadística con el propósito de
conocer cómo se distribuyen las
probabilidades de un suceso o
evento, en relación al resultado
del suceso.