Probabilidad y estadística - CIAM

Download Report

Transcript Probabilidad y estadística - CIAM

UNIVERSIDAD DE COLIMA
Bachillerato Técnico No. 1
Programa Académico 2012
L.A.E Óscar Armando Cuevas López
PROBABILIDAD Y ESTADÍSTICA
UNIDAD I:
Calcula y aplica las medidas de tendencia central en el conjunto de datos ( no
agrupados y agrupados ) extraídos de una población o muestra para reconocer su
comportamiento en situaciones reales.
Unidad II:
Calcula y aplica las medidas de dispersión o variabilidad en el conjunto de datos (
no agrupados y agrupados ) extraidos de una población o muestra para reconocer
su comportamiento y la comparación entre ella, en situaciones reales.
Unidad III:
Aplica conceptos y leyes de la probabilidad para la toma de decisiones, cuando
prevalecen condiciones de incertidumbre, en el contexto de la resolución de
problemas de diversas áreas del conocimiento.
UNIDAD I:
Calcula y aplica las medidas de tendencia central en el conjunto de datos ( no
agrupados y agrupados ) extraídos de una población o muestra para reconocer su
comportamiento en situaciones reales.
1.1 Generalidades : Estadística moderna, el crecimiento de la Estadística.
1.2 Población y muestreo.
1.3 Clasificación de variables : cardinales, ordinales y nominales.
1.4 Teoría elemental del muestreo : Inferencias proporcionales.
1.5 Distribución de frecuencia : simple ( absoluta y relativa ) acumulada ( absoluta
y relativa ).
1.6 Elaboración de gráficas : Histograma, Polígonos y Ojivas.
1.7 Medidas de tendencia central : conceptos generales.
1.8 Media aritmética, mediana, moda, media ponderada, media geométrica, media
armónica.
1.9 Cálculo de datos individuales y agrupados.
1.10 Cálculo de cuantiles : cuartiles, deciles y percentiles
UNIDAD II:
Calcula y aplica las medidas de dispersión o variabilidad en el conjunto de datos (
no agrupados y agrupados ) extraídos de una población o muestra para reconocer
su comportamiento y la comparación entre ella, en situaciones reales.
2.1 Generalidades.
2.2 Rango.
2.3 Cuantiles.
2.4 Desviación Media .
2.5 Desviación Estándar.
2.6 Varianza.
2.7 Coeficiente de variación de Pearson.
UNIDAD III:
Aplica conceptos y leyes de la probabilidad para la toma de decisiones, cuando
prevalecen condiciones de incertidumbre, en el contexto de la resolución de
problemas de diversas áreas del conocimiento.
3.1 Probabilidad.
3.2 Evento.
3.3 Espacio muestral.
3.4 Eventos : mutuamente excluyentes, independientes y dependientes.
3.5 Conjuntos y sus operaciones.
3.6 Axiomas del cálculo de probabilidades.
3.7 Factorial.
3.8 Combinaciones.
3.9 Permutaciones.
3.10 Curva normal.
Es una ciencia que trata de la recopilación, organización, presentación, análisis e
interpretación de datos numéricos con el fin de realizar una toma de decisión más
efectiva.
Chacón: “La ciencia que tiene por objeto el estudio cuantitativo de los colectivos.”
Otros la definen como la expresión cuantitativa del conocimiento dispuesta en
forma adecuada para el escrutinio y análisis.
La más aceptada sin embargo es la de Mínguez, se define la estadística como “La
ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales
para medir su intensidad, deducir las leyes que los rigen y hacer su predicción
próxima.
INDUCTIVA Y DEDUCTIVA
Uno de los problemas fundamentales de la Estadística es el estudio de la
relación existente entre una población y sus muestras. Según la dirección de tal
relación la Estadística puede ser:
* DEDUCTIVA: Cuando a partir del conocimiento de la población de trata de
caracterizar cada muestra posible.
* INDUCTIVA: Cuando a partir del conocimiento derivado de una muestra se
pretende caracterizar la población.
* ESTADÍSTICA
DESCRIPTIVA: Se define como la ciencia que sistematiza,
recoge, ordena y presenta los datos referentes a un asunto, fenómeno o
problema de investigación, sin pretender extender las conclusiones que puedan
extraerse de los datos a otros grupos distintos o más amplios. Se calcula a partir
de una muestra o de una población.
* Su estudio incluye el de las técnicas de colectar, presentar, analizar e interpretar
datos. Emplea cuadros, gráficos y diagramas.
* Ejemplos:
* - El nivel promedio de inteligencia obtenido mediante la prueba Stanford Binet,
resulto ser de 104 para el grupo 2 de estudiantes de Psicología.
* - Durante los últimos dos días se han informado un total de ocho homicidios.
POBLACIÓN: Conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones.
•
Cuando una población es muy grande, es obvio que la observación de todos sus
elementos se
dificulte en cuanto al trabajo, tiempo y costos necesarios para
hacerlo.
•
Para solucionar este inconveniente se utiliza una muestra estadística.
MUESTRA: “Se llama muestra a una parte de la población a estudiar que sirve
para representarla.” Murria R. Spiegel (1991)
MUESTREO: Esto no es más que el procedimiento empleado para obtener una o
más muestras de una población; el muestreo es una técnica que sirve para obtener
una o más muestras de una población.
VARIABLE: Es una característica que puede tener diferentes valores en los
distintos elementos o individuos de un conjunto.
VARIABLES NOMINALES
* Estas escalas se utilizan para categorías de valores nominales, o sea aquellas que
se relacionan utilizando nombres, números, cifras u otros símbolos, su función es
clasificar. Ejemplo: Lugar de nacimiento.
* Si son cifras no tienen valor intrínseco, ni propiedades numéricas como en la
aritmética.
VARIABLES ORDINALES
* Cuando las categorías pueden ser ordenadas según algún criterio, se utiliza la
escala ordinal para medir las variables.
* La escala ordinal exige orden entre las categorías antes de indicar cualquier
medición. Ejemplo: Gravedad de las quemaduras.
* Estas variables tampoco tienen propiedades numéricas, aunque se representen
con números.
VARIABLES CARDINALES
* Posee un nivel científico mas alto, es el de la cuantificación, y a este nivel para
medir escalas asociadas, se emplean los números cardinales, con los cuales se
pueden efectuar operaciones aritméticas.
* Se clasifican en variables discretas y variables continuas.
- Si la variable puede tomar cualesquiera de los todos los valores, teóricamente
posibles, entre dos valores dados, la variable es continua. Ejemplo: Edad
-
En caso de que pueda tomar solo valores enteros se dice que la variable es
discreta. Ejemplo: Hijos de familia.
•
•
EJERCICIO 1
EJERCICIO 2
La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras extraídas
de la misma. Permite estimar cantidades desconocidas de la población como media poblacional y varianza,
por lo regular se llama parámetros poblacionales o simplemente parámetros, Tiene gran interés en muchos
aspectos de la estadística. La teoría de muestreo es también útil para determinar si la diferencias que se
puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son
solamente significativas.
En general, un estudio de inferencias, realizados sobre una población mediante muestras extraídas de la
misma, junto con las indicaciones de la exactitud de tales inferencias aplicadas a la teoría de la
probabilidad, se le conoce como inferencia estadística.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen
dos técnicas de muestreo estratificado:
Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la
población.
Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más
variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de
hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se
tomaría una muestra que contenga también esa misma proporción.
Es una descripción del numero de veces es decir de las frecuencias con que se presentan las
diversas categorías mutuamente excluyentes que corresponden a una variable.
Las distribuciones de frecuencias pueden ser:
CUANTITATIVAS
* Si las variables pertenecen a variables cardinales.
CUALITATIVAS
* Si las variables pertenecen a variable nominal u ordinal.
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NO AGRUPADOS
• Ejercicio 1
- Planteamiento
- Solución
• Ejercicio 2
- Planteamiento
- Solución
• Ejercicio 3
- Planteamiento
- Solución
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS
Para facilitar el manejo de datos cuando estos son muy abundantes, conviene resumirlos o condensarlos
en grupos, llamados clase, o categorías. Al hacerlo los diferentes valores o categorías se dividen en
intervalos o clases, y se determina el numero de casos pertenecientes a cada clase o sea la frecuencia de
clase.
EJEMPLO
•
•
•
La marca de clase se calcula obteniendo el promedio de los limites de cada intervalo y se representa con
la letra x.
Amplitud o ancho de clase: Distancia entre el limite o frontera inferior y el limite o frontera superior
Los puntos localizados a la mitad de todos los espacios aparentes de un conjunto de intervalos de clase
se llaman limites o fronteras reales de clase.
FÓRMULAS
-
Rango = Dato mayor- Dato menor
I. Clase = 1+ 3.3log(n)
Ancho de clase = (Amplitud)
C=
R
I. clase
• Ejercicio 1
- Planteamiento
- Solución
- Ojivas
• Ejercicio 2
- Planteamiento
- Solución
- Ojivas
Los gráficos son medios popularizados y a menudo los más convenientes para presentar
datos, se emplean para tener una representación visual de la totalidad de la información. Los
gráficos estadísticos presentan los datos en forma de dibujos de tal modo que se pueda
percibir fácilmente los hechos esenciales y compararlos con otros.
Requisitos para formar un gráfico:
*
*
*
- Evitar distorsiones por escalas exageradas
- Elección adecuada del tipo de gráfico
- Sencillez y auto explicación
Características:
*
- Debe tener un titulo y una explicación de que, donde y cuando se obtuvo la
información.
Tipos de gráficos:
*
*
*
*
*
- Gráficos de barras
- Grafico circular o de pastel
- Pictograma
- Grafico de líneas
- Ojivas, Polígonos de frecuencia, Histograma.
GRÁFICOS DE BARRAS
Cada categoría de la variable se representa por una barra, cuyo largo incluye la
frecuencia. Todas las barras deben ser igual de ancho y pueden estar espaciadas si
las variables son nominales u ordinales. Pueden ser:
• HORIZONTALES
• VERTICALES
• AGRUPADAS
• DIVIDIDAS O APILADAS
GRÁFICO DE PASTEL O CIRCULAR
Es útil para representar porcentajes. Se representan variables nominales y se construye en
una circunferencia que se divide en sectores tales que sus medidas angulares sean
proporcionales a los valores que representa.
EJEMPLO
PICTOGRAMA
Son una forma de representar la información mediante dibujos de los objetos que son
motivo de estudio, con un formato tal que de una idea rápida y visual, de la distribución
de frecuencias.
Son especialmente útiles para fines publicitarios por ser atractivos y de fácil comprensión.
EJEMPLO
GRÁFICA DE LINEAS
Un gráfico que usa puntos conectados por líneas para mostrar cómo cambia el valor de
algo (mientras pasa el tiempo o mientras algo más pasa).
EJEMPLO
OJIVAS
La ojiva es un gráfico asociado a la distribución de frecuencias, es decir, que en ella se
permite ver cuantas observaciones se encuentran por encima o debajo de ciertos valores, en
lugar de solo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el dato que se
esta comparando tendrá una pendiente negativa y en cambio la que se asigna a valores
menores, tendrá una pendiente positiva.
POLÍGONO DE FRECUENCIAS
Un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de
barras mediante segmentos. También se puede realizar trazando los puntos que representan
las frecuencias y uniéndolos mediante segmentos.
HISTOGRAMA DE FRECUENCIAS
Un histograma es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el
eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables.
Al descubrir grupos de observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse
hacia el centro de la distribución de datos se denomina «medidas o parámetro de
tendencia central o de centralización»
Medidas más conocidas:
a) Media aritmética
b) Mediana
c) Moda
d) Media ponderada
e) Media geométrica
f) Media armónica
* Promedio es otra forma de referirse a la media aritmética
a) Media aritmética
b) Mediana
c) Moda
d) Media ponderada
e) Media geométrica
f) Media armónica
Es el valor obtenido sumando todas las observaciones y dividiendo del total por el número de
observaciones que hay en un grupo.
Se obtiene sumando todos los datos y dividiéndolo por el número de ellos.
Ejemplo:
*usando el mismo modelo de automóvil, 5 conductores promediaron 9.95, 10.20, 9.57, 9.93 y 9.65 KM/L
de gasolina. Calcular el promedio de los conductores
R: 9.86
*El boletaje pagado para asistir a los juegos de futbol en una universidad fue de: 12305, 10984, 6850,
11733 y 10964.
R: 10567.2
*En 5 pruebas de biología un estudiante obtuvo calificación de: 46, 61, 74, 79 y 88.
R: 69.6
PARA DATOS AGRUPADOS:
La media aritmética de una muestra de datos organizados en una distribución de frecuencias se calcula:
Σ: sumatoria
Ƒ: frecuencia
n: número total de datos
x: marca de case
Propiedades de la media aritmética:
*
*
*
*
*puede ser calculada en distribuciones con escala relativa.
*todos los valores son incluidos en el cómputo de la media.
*una serie de datos solo tiene una media
*es una medida muy útil para comparar dos o más poblaciones.
Desventajas de la media aritmética:
*
*si alguno de los valores es extremadamente grande o extremadamente pequeña, la media no es el promedio apropiado
para representar la serie de datos.
*
*no se puede determinar si en una distribución de frecuencia hay intervalos de clase abiertos.
EJEMPLO:
Planteamiento
Solución
EJERCICIOS:
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética
no es representativa. El valor central en tales problemas puede ser llamada mediana.
Mediana para datos no agrupados:
*el contenido de 5 botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en
ML): 85.4, 85.3, 84.9, 85.4 y 84. ¿Cuál es la mediana de las observaciones muestreadas?
x: 85.3
**se ordena de mayor a menor o viceversa: (caso que sea impar)
*una muestra de los honorarios de paramédicos cargados por la clínica Baltimore revelos estás cantidades:
$35, $29, $30, $25, $32 y $35. ¿Cuál es la mediana?
x= 30+32 = 31
2
** cuando son pares se suman las cantidades de en medio y se divide entre 2
Mediana para datos agrupados:
Punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdos a su
magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos. Cuando los
datos se encuentran agrupados en una distribución de frecuencia no conoce más datos originales, por lo
tanto es necesario estimar la mediana mediante la siguiente fórmula.
Propiedades de la mediana:
1: hay solo una mediana en una serie de datos.
2: no es afectada por los valores extremos (altos y bajos)
3: puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se
encuentra el intervalo abierto.
4: puede ser calculada en distribuciones con escala relativa, intervalar y ordinal.
EJEMPLO:
Planteamiento mediana
Solución
EJERCICIOS:
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
La moda es la medida de tendencia central especialmente útil para describir mediciones de
tipo ordinal y nominal. La moda es el valor de la observación que aparece más
frecuentemente.
Propiedades de la moda:
*la moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar y
relativo)
*la moda tiene la ventaja de no ser afectada por valores extremos.
*al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda:
*en muchas series de datos no hay moda porque ningún valor aparece más de una vez.
EJEMPLO:
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de
producción son en (ml): 85.4, 85.3, 84.9, 85.4 y 80. ¿Cuál es la moda de las observaciones?
R= 85.4
EJEMPLO:
Planteamiento
Solución
EJERCICIOS:
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
En algunos casos cada una de las observaciones tiene una importancia relativa
(peso) respecto a los demás elementos.
Esta medida se llama media aritmética ponderada. Se utiliza la media ponderada
cuando no todos los elementos componentes de los que se pretende obtener la
media tiene la misma importancia
EJEMPLO:
Planteamiento
Solución
EJERCICIOS:
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
La ‘media geométrica’ de una cantidad finita de números (digamos ‘n’ números) es la raíz
n-ésima del producto de todos los números.
Por ejemplo, la media geométrica de 2 y 18 es
Otro ejemplo, la media de 1, 3 y 9 seria
Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es
0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos)
entonces la media geométrica es, o bien negativa o bien inexistente en los números reales.
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con
distribución no normal.
La media geométrica es relevante cuando varias cantidades son sumadas para producir un
total.
La media armónica , representada por H, de una cantidad finita de números es igual al
recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, … , an, la media armónica será igual a:
H = n / (1/a1 + 1/a2 ……+ 1/ an)
La media armónica resulta poco influida por la existencia de determinados valores mucho más
grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más
pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.
Otras medias estadísticas son la media geométrica, la media aritmética y la media ponderada.
La media armónica, que representaremos por H, se define como sigue:
Obsérvese que la inversa de la media armónica es la media aritmética de los inversos de los
valores de la variable. No es aconsejable en distribuciones de variables con valores pequeños.
Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos,
rendimientos, cambios, etc.
Ventajas e inconvenientes:
En su cálculo intervienen todos los valores de la distribución.
Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.
Es única.
1.9 Cálculo de datos individuales y agrupados.
Nota :
El cálculo de datos individuales u agrupados se desglosa en cada una de
las medidas de tendencia central y medidas de dispersión.
A fin de conocer los intervalos de los cuales quedan representados proporcionalmente los
términos de una distribución, se divide la distribución de frecuencias.
Se la distribución se divide en 4 partes iguales, cada uno contiene igual número de de
observaciones y se llama «cuartiles» el primer cuartil corresponde al 25% y se designa por
Q1 el segundo cuartil corresponde al 50% y corresponde a la mediana, el tercer cuartil
representa el 75%.
Si la distribución se divide en 10 partes iguales representa un «decil» en donde el primer
decil es el valor del 10% el segundo el 20% y así sucesivamente. Se representa por la letra D
Finalmente si los valores que dividen los datos lo hacen en 100 partes iguales se llama
«percentil». Se representa como P
EJEMPLO:
Planteamiento
Solución
EJERCICIOS:
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
*
* Planteamiento
solución
Al grado en que los datos numéricos tienden a extenderse alrededor de un valor medios se llama variación
o dispersión de datos.
Las medidas de dispersión más empleadas son:
*rango
*desviación media
*rango semiintercuartílico
*rango entre percentiles 10-90
*desviación típica.
Las medidas de dispersión también son conocidas como medidas de variabilidad, muestran la variabilidad
de una distribución, indicando por medio un número, si las diferentes puntuaciones de una variable están
muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será la media.
La dispersión es importante porque:
*proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central.
*quizá se desee comparar las dispersiones de diferentes muestras. (permite comparar las dispersiones de
diferentes muestras)
En estadística descriptiva se denomina rango estadístico (R) o recorrido estadístico al intervalo de menor tamaño que
contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello, comparte unidades con los
datos. Permite obtener una idea de la dispersión de los datos.
Por ejemplo, para una serie de datos de carácter cuantitativo como es la estatura tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155 es posible ordenar los datos como sigue:
x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185 donde la notación x(i) indica que se trata del elemento i-ésimo de la
serie de datos. De este modo, el rango sería la diferencia entre el valor máximo (k) y el mínimo; o, lo que es lo mismo:
R = x(k) − x(1) En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.
Algo que responde a la identificación de la dispersión de los datos de una muestra es el rango, el cual se define como la
diferencia entre el dato mayor menos el dato menor de un conjunto de datos. Su obtención es sumamente sencilla, sin
embargo se considera que no es una medida muy significativa, su aplicación es más útil en la llamada estadística no
parámetrica. Una expresión para el rango puede ser vista como:
Podemos retomar el ejemplo planteado en el se observaba que las muestras tienen diferente dispersión, aunque su media y
mediana eran iguales, por lo que una forma de marcar su diferencia es a través del rango.
Para la primera muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es 100, por lo que sus valores se
encuentran en un rango de:
Rango = 100 – 0 =100
Mientras que para la segunda muestra (47, 49.5, 50, 51.5, 52), el dato menor es 47 y el dato mayor es igual a 52 por lo que
su rango correspondiente es igual a:
Rango = 52 – 47= 5
Lo que indica que la segunda muestra es más homogénea ya que sus datos están dispersos en un menor rango.
Es también común identificar el rango como recorrido.
Sabemos que la mediana divide a los datos en dos partes iguales, también
tienen interés estudiar otros parámetros, llamados cuantiles, que dividen
los datos de la distribución en función de otras cantidades.
CUARTILES : Son tres valores que dividen la serie de datos en cuatro
partes iguales ( Q1,Q2 y Q3 )
QUINTILES : Son cuatro valores que dividen la serie de datos en cinco
partes iguales ( K1,K2,K3 y K4 )
DECILES : Son nueve valores que dividen la serie de datos en diez partes
iguales ( D1, D2, D3, D4……. D9 )
PERCENTILES : Son 99 valores que dividen la serie de datos en cien
partes iguales ( P1, P2, P3, P4…… P99 )
RELACIÓN GRÁFICA ENTRE LOS CUANTILES
Q1
Q2
K1
P1
K2
Q3
K3
K4
D1
D2
D3
D4
D5
D6
D7
D8
D9
P10
P20
P30
P40
P50
P60
P70
P80
P90
M
RELACIÓN ENTRE CUANTILES
P99
Puede definirse como la media aritmética, de las desviaciones de cada uno de los
valores con respecto a la media aritmética de la distribución, y se indica así:
DM: desviación media.
DM=
Ʃ|𝑋−𝑥|
𝑁
x: datos numéricos.
𝑥:media aritmética.
N: número total de datos.
EJEMPLO
Planteamiento
Solución
EJERCICIO:
Planteamiento ejercicio 1
Solucion ejercicio 1
Si X1, X2…..Xn se presenta con frecuencia F1, F2….Fn respectivamente la
desviación media puede escribirse como:
DM: desviación media
x: marca de clase
𝑥: media aritmética
F:frecuencia de clase
EJEMPLO:
Planteamiento
Solución
EJERCICIOS:
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
Es la medida de dispersión más importante, ya que además sirve como medida previa al
cálculo de otros valores estadísticos.
La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las
desviaciones con respecto a la medida de distribución. Se simboliza con un «S»
Desviación estándar para datos no agrupados : ( = a √
)
Desviación típica para datos agrupados:
S=
Ʃ𝒇(𝒙−𝒙 )𝟐
𝑵
s= desviación típica
F: frecuencia
x: Marca de clase
𝒙: 𝐦𝐞𝐝𝐢𝐚 𝐚𝐫𝐢𝐭𝐦é𝐭𝐢𝐜𝐚
EJEMPLO:
Planteamiento
N: número total de datos
Solución ejemplo
EJERCICIO:
Planteamiento ejercicio 1
Solución ejercicio 1
http://www.vitutor.com/estadistica/descriptiva/a_15.html
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media
de una distribución estadística.
La varianza se representa por .
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que
son equivalentes a las anteriores.
Varianza para datos agrupados
Ejercicios de varianza
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la varianza de la distribución de la tabla:
xi
fi
xi · fi
xi2 · fi
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250
42
1 820
88 050
Coeficiente de variación de Pearson
( CVx )
Indica la relación existente entre la desviación típica de una muestra y su media.
Al dividir la desviación típica por la media se convierte en un valor excento de unidad de medida. Si comparamos la
dispersión en varios conjuntos de observaciones tendrá menor dispersión aquella que tenga menor coeficiente de
variación.
El principal inconveniente, es que al ser un coeficiente inversamente proporcional a la media aritmética, cuando está
tome valores cercanos a cero, el coeficiente tenderá a infinito.
Ejemplo: Calcula la varianza, desviación típica y la dispersión relativa de esta distribución.
Sea x el número de habitaciones que tienen los 8 pisos que forman un bloque de vecinos
X
ni
2
2
3
2
5
1
6
3
N= 8
El calculo de probabilidades es un estudio teórico aplicable en situaciones azarosas o
aleatorias.
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de
resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados
posibles, bajo condiciones suficientemente estables.
El estudio científico de la probabilidad es un desarrollo moderno, los juegos de azar (dados,
cartas, ruletas) muestran que ha habido un interés en cuantificar las ideas de la probabilidad
durante milenios, pero las descripciones matemáticas exactas de utilidad en estos problemas
surgieron mucho después.
Probabilidad es el estudio de experimentos aleatorios o libres de determinación.
s= n° de maneras de que ocurra un suceso
P(A)=
𝑺
𝑵
N= n° total de maneras posibles.
S= [1, 2, 3, 4, 5, 6]
P(A)=
𝟏
𝟔
La probabilidad P de u evento A se define como sigue: A puede ocurrir de s maneras entre
un total de n igualmente posibles.
Imaginemos que se lanzan una moneda y un dado
•La probabilidad de un camino es la multiplicación de sus probabilidades.
•La probabilidad de sacar una cara y un tres será ---->
•La probabilidad de un suceso cualquiera es la suma de las probabilidades de los
caminos
•La probabilidad de sacar impar será ---->
Espacio Probabilístico Infinito Contable
Aquel cuyo espacio muestral es discreto infinito contable. Por ejemplo
•La probabilidad de que salga cara en la primera tirada ---->
•La probabilidad de que salga cara en la segunda tirada ---->
•La probabilidad de que salga cara en la tercera tirada ---->
Un evento es un subconjunto de un espacio muestral. Evento o Suceso. Se llama
evento o suceso a todo subconjunto de un espacio muestral. Por ejemplo en el
espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los siguientes
son eventos:
1. Obtener un número primo A = {2, 3, 5}
2. Obtener un número primo y par B = {2}
3. Obtener un número mayor o igual a 5 C = {5, 6}
En la teoría de probabilidades, el espacio muestral o espacio de muestreo (denotado E,
S, Ω o U) consiste en el conjunto de todos los posibles resultados individuales de un
experimento aleatorio.
Por ejemplo, si el experimento consiste en lanzar dos monedas, el espacio de muestreo es el
conjunto {(cara, cara), (cara, cruz), (cruz, cara) y (cruz, cruz)}. Un evento o suceso es
cualquier subconjunto del espacio muestral, llamándose a los sucesos que contengan un
único elemento sucesos elementales. En el ejemplo, el suceso "sacar cara en el primer
lanzamiento", o {(cara, cara), (cara, cruz)}, estaría formado por los sucesos elementales
{(cara, cara)} y {(cara, cruz)}.
Para algunos tipos de experimento puede haber dos o más espacios de muestreo posibles.
Por ejemplo, cuando se toma una carta de un mazo normal de 52 cartas, una posibilidad del
espacio de muestreo podría ser el número (del as al rey), mientras que otra posibilidad sería
el palo (diamantes, tréboles, corazones y picas). Una descripción completa de los resultados,
sin embargo, especificaría ambos valores, número y palo, y se podría construir un espacio de
muestreo que describiese cada carta individual como el producto cartesiano de los dos
espacios de muestreo descritos.
Los espacios de muestreo aparecen de forma natural en una aproximación elemental a la
probabilidad, pero son también importantes en espacios de probabilidad. Un espacio de
probabilidad (Ω, F, P) incorpora un espacio de muestreo de resultados, Ω, pero define un
conjunto de sucesos de interés, la σ-álgebra F, por la cuál se define la medida de probabilidad
P.
Eventos mutuamente excluyentes.- Dos eventos son mutuamente excluyentes si no
pueden ocurrir en forma simultánea, esto es, si y sólo si su intersección es vacía. Por ejemplo,
en el lanzamiento de un dado los eventos B = {2} y C = {5, 6} son mutuamente excluyentes
por cuanto B C =
Eventos Independientes
Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no
tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de
eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se
regresa de nuevo a la población donde se obtuvo. Ejemplo:
lanzar al aire dos veces una moneda son eventos independientes por que el resultado del
primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el
segundo lanzamiento
Eventos dependientes
Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de uno de ellos
afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso,
empleamos entonces, el concepto de probabilidad condicional para denominar la probabilidad
del evento relacionado. La expresión P(AB) indica la probabilidad de ocurrencia del evento A
sí el evento B ya ocurrió.
Se debe tener claro que AB no es una fracción.
P(AB) = P(A y B)/P(B) o P(BA) = P(A y B)/P(A)
http://es.scribd.com/doc/52812712/29/CONJUNTOS-Y-SUS-OPERACIONES
CONJUNTOS Y SUS OPERACIONES
El estudio de la Probabilidad se simplifica utilizando la Teoría de Conjuntos, por lo tanto,
analizaremos algunas ideas básicas de esta teoría. La Teoría de Conjuntos fue desarrollada
por Georg Cantor entre 1874 y 1895, es un instrumento básico que se utiliza en las distintas
ramas de la Matemática, como en la Teoría de Probabilidad, el Cálculo Infinitesimal,
Geometría, etc. Un Conjunto es un grupo de objetos dentro de un todo definido y bien
diferenciado; por ejemplo:* Un grupo de estudiantes de la materia de Biología.* Un juego de
cartas.* Las cuentas de un collar
A continuación definiremos algunas de las operaciones y símbolos que se utilizan en la Teoría
de Conjuntos. A los conjuntos los representamos con mayúsculas y a sus elementos con
minúsculas.*
Conjunto Universo o Universal
( U ):Es el conjunto que contiene a todos los elementos.*
Conjunto Vacío( ):Es un conjunto que no contiene a ningúnelemento.*
Pertenencia( ):Indica que un elemento pertenece a un conjunto.*
No Pertenencia( ):Indica que un elemento no pertenece a un conjunto determinado.*
Subconjunto( ):Se dice que un conjunto A es subconjunto de B, cuando todos los elementos
de A pertenecen a B.
Es la base para comprender algunos aspectos de la teoría de la probabilidad. Su origen se
debe al matemático Alemán George Cantor (1845-1918).
Podemos definir como la manera intuitiva a un conjunto, como una colección o listado de
objetos con características bien definidas que lo hace pertenecer a un grupo determinado.
Para que exista un conjunto debe basarse en lo siguiente:
*la colección de elementos debe estar bien definida.
*ningún elemento del conjunto se debe contar más de una vez, generalmente, estos
elementos deben ser diferentes, si uno de ellos se repite se contará una sola vez.
NOTACIÓN:
A los conjuntos se les representa con las letras mayúsculas A,B,C y a los elementos con letras
minúsculas a,b,c….
En base a la cantidad de elementos que tengan un conjunto, estos se pueden clasificar en
conjuntos finitos e infinitos.
Finitos: tienen un número conocido de elementos, es decir, se encuentran determinados por
su longitud o cantidad. El conjunto de días de la semana.
Infinitos: son aquellos con los cuales no podemos determinar su longitud. El conjunto de los
números reales.
UNIÓN DE CONJUNTOS: sea A y B dos subconjuntos cualesquiera del conjunto universal: la unión de A
y B, es el conjunto de todos los elementos que perteneces a A o pertenecen a B.
*
*
*
*
AUB= {x|XEA o XEB}
A={1, 2, 3, 4, 5}
B={1, 2, 6, 7}
AUB= [1, 2, 3, 4, 5, 6, 7]
INTERSECCIÓN DE CONJUNTOS: sea A y B dos conjuntos cualesquiera del conjunto universal. La
intersección de A y B, expresada por AпB, es el conjunto de todos los elementos que pertenecen a A y B
simultáneamente es decir:
*
*
AпB= {x|XEA Y XEB}
AпB= {1, 2}
DIFERENCIA DE CONJUNTOS O COMPLEMENTO RELATIVO: sea A y B dos conjuntos cualesquiera
del conjunto universal. La diferencia o complemento relativo de B con respecto a A, es el conjunto de los
elementos que pertenecen a A pero no pertenecen a B.
A-B= {X|XEA-XEB}
*
*
*
*
A{1, 3, 5, 7}
B{1, 7, 8, 9}
A-B= {3, 5} todos los elementos que no están en B
B-A { 8, 9} todos los elementos que no están en A
COMPLEMENTO ABSOLUTO Y SIMPLEMENTE COMPLEMENTO: sea A un subconjunto
cualesquiera del conjunto universal. El complemento de A es el conjunto de elementos que
perteneciendo al universo y no pertenece al conjunto A denotado por A´.
A= {X|XEA,
XEA}
PRODUCTO CARTESIANO: sea A y B dos conjuntos , el conjunto producto o producto
cartesiano expresado por AXB está formado por las parejas ordenadas (a,b) donde Aea Y
bEA
3
AXB={(a,b)|aEA y bEA}
2
dados: A= {1,2,3}
B={1,2}
1
AXB= (1,1) (1,2)
0
(2,1) (2,2)
(3,1) (3,2)
0
1
2
3
4
DIAGRAMA DE ÁRBOL: se emplea para obtener el producto de 3 o más conjuntos. Se
trazan tantas ramificaciones como elementos tengan los conjuntos involucrados.
A={a,b,c}
B={3,5}
C={1,2,3}
AXBXC=
DIAGRAMA DE VEEN: un diagrama de Veen es una representación pictórica de
conjuntos en el plano, el conjunto universal U se representa por un rectángulo, cualquier
otro conjunto se representa en un círculo. Una operación se representa mediante el
sombreado de elementos del conjunto.
Planteamiento ejercicio 1
Solución ejercicio 1
Planteamiento ejercicio 2
Solución ejercicio 2
Planteamiento ejercicio 3
Solución ejercicio 3
AXIOMAS:
Un axioma es el elemento básico de un sistema de lógica formal y junto con las reglas de
inferencia definen un sistema deductivo.
Primer axioma:
La probabilidad de un suceso A es un numero real entre 0 y 1.
Segundo axioma:
Un suceso de la muestra de todos los sucesos o espacio muestral ocurre con probabilidad 1.
Es decir la probabilidad del espacio muestral es igual a 1
Tercer axioma:
Si A1, A2… son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de
intersección vacía dos a dos), entonces:
Según este axioma se puede calcular la probabilidad de un suceso compuesto de varias
alternativas mutuamente excluyentes sumando las probabilidades de sus componentes.
Ejemplo
Lanzar un dado, y calcular la probabilidad del evento sale un numero cualesquiera.
Es el producto de los “n” factores consecutivos desde “n” hasta 1. El factorial de
un número se denota por n!.
Se impone 0! = 1, para que la relación n! = n × (n − 1)! sea también válida para n
= 1. Esta relación permite definir los factoriales por recursividad. La notación n! fue
popularizada por el matemático francés Christian Kramp.
Los primeros factoriales son:
1! = 1
2! = 2
3! = 6
4! = 24
5! = 120
6! = 720
7! = 5040
8! = 40320
Una combinación es un arreglo donde el orden NO es importante. La notación para
las combinaciones es C(n,r) que es la cantidad de combinaciones de “n” elementos
seleccionados, “r” a la vez. Es igual a la cantidad de permutaciones de “n”
elementos tomados “r” a la vez dividido por “r” factorial. Esto sería P(n,r)/r! en
notación matemática.
Ejemplo: Si se seleccionan cinco cartas de un grupo de nueve, ¿cuantas
combinaciones de cinco cartas habría?
La cantidad de combinaciones posibles sería: P(9,5)/5! =
(9*8*7*6*5)/(5*4*3*2*1) = 126 combinaciones posibles.
Hay dos tipos de Combinaciones:
Se permite repetir: como monedas en tu bolsillo ( 5,5,5,10,10 )
Sin repetición: Como números de lotería : ( 2,14,15,27,30 )
Digamos que tenemos cinco sabores de helado: banana, chocolate, limón, fresa y
vainilla. Puedes tomar 3 paladas. ¿Cuántas variaciones hay?
Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son
•
{c, c, c} (3 de chocolate)
•
{b, l, v} (uno de banana, uno de limón y uno de vainilla)
•
{b, v, v} (uno de banana, dos de vainilla)
(Y para dejarlo claro: hay n=5 cosas para elegir, y eliges r=3 de ellas.
El orden no importa, ¡y sí puedes repetir!)
Bien, no puedo decirte directamente cómo se calcula, pero te voy a enseñar una
técnica especial para que lo averigües tú mismo.
Imagina que el helado está en contenedores, podrías decir "sáltate el primero,
después 3 paladas, después sáltate los 3 contenedores siguientes" ¡y acabarás con
3 paladas de chocolate!
Entonces es como si ordenaras a un robot que te trajera helado, pero no cambia
nada, tendrás lo que quieres.
Ahora puedes escribirlo como
(la flecha es saltar, el círculo es tomar)
Entonces los tres ejemplos de arriba se pueden escribir así:
{c, c, c} (3 de chocolate):
{b, l, v} (uno de banana, uno de limón y uno de vainilla):
{b, v, v} (uno de banana, dos de vainilla):
OK, entonces ya no nos tenemos que preocupar por diferentes sabores, ahora
tenemos un problema más simple para resolver: "de cuántas maneras puedes
ordenar flechas y círculos"
Fíjate en que siempre hay 3 círculos (3 paladas de helado) y 4 flechas (tenemos
que movernos 4 veces para ir del contenedor 1º al 5º).
Así que (en general) hay r + (n-1) posiciones, y queremos que r de ellas tengan
círculos.
Esto es como decir "tenemos r + (n-1) bolas de billar y queremos elegir r de ellas".
Es decir, es como el problema de elegir bolas de billar, pero con números un poco
distintos. Lo podrías escribir así:
donde n es el número de cosas que puedes elegir, y eliges r de ellas
(Se puede repetir, el orden no importa)
Es interesante pensar que podríamos habernos fijado en flechas en vez de círculos,
y entonces habríamos dicho "tenemos r + (n-1) posiciones y queremos que (n-1)
tengan flechas", y la respuesta sería la misma...
¿Qué pasa con nuestro ejemplo, cuál es la respuesta?
(5+3-1)! =
3!(5-1)!
7!
3!×4!
=
5040
= 35
6×24
En conclusión
¡Uau, es un montón de cosas que absorber, quizás tendrías que leerlo otra vez
para entenderlo todo bien!
Pero saber cómo funcionan estas fórmulas es sólo la mitad del trabajo. Averiguar
cómo se interpreta una situación real puede ser bastante complicado.
Por lo menos ahora sabes cómo se calculan las 4 variantes de "el orden sí/no
importa" y "sí/no se puede repetir".
Así funciona la lotería. Los números se eligen de uno en uno, y si tienes los números de la
suerte (da igual el orden) ¡entonces has ganado!
La manera más fácil de explicarlo es:
•
imaginemos que el orden sí importa (permutaciones),
•
después lo cambiamos para que el orden no importe.
Volviendo a las bolas de billar, digamos que queremos saber qué 3 bolas se eligieron, no el
orden.
Ya sabemos que 3 de 16 dan 3360 permutaciones.
Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.
Por ejemplo, digamos que se tomaron las bolas 1, 2 y 3. Las posibilidades son:
El orden importa
El orden no importa
*123
*132
*213
123
*231
*312
*321
* Así que las permutaciones son 6 veces más posibilidades.
De hecho hay una manera fácil de saber de cuántas maneras "1 2 3" se pueden
ordenar, y ya la sabemos. La respuesta es:
3! = 3 × 2 × 1 = 6
(Otro ejemplo: 4 cosas se pueden ordenar de 4! = 4 × 3 × 2 × 1 = 24 maneras
distintas, ¡prueba tú mismo!)
Así que sólo tenemos que ajustar nuestra fórmula de permutaciones para reducir
por las maneras de ordenar los objetos elegidos (porque no nos interesa
ordenarlos):
Esta fórmula es tan importante que normalmente se la escribe con grandes
paréntesis, así:
donde n es el número de cosas que puedes elegir, y eliges r de ellas
(No se puede repetir, el orden no importa)
Y se la llama "coeficiente binomial".
Notación
Además de los "grandes paréntesis", la gente también usa estas notaciones:
Ejemplo
Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es:
16!
=
3!(16-3)!
16!
= 20,922,789,888,000
3!×13!
6×6,227,020,800
O lo puedes hacer así:
16×15×14
3×2×1
=
3360
6
= 560
= 560
Así que recuerda, haz las permutaciones, después reduce entre "r!"
... o mejor todavía...
¡Recuerda la fórmula!
Es interesante darse cuenta de que la fórmula es bonita y simétrica:
Con otras palabras, elegir 3 bolas de 16 da las mismas combinaciones que elegir
13 bolas de 16.
16!
3!(16-3)!
=
16!
13!(16-13)!
=
16!
3!×13!
= 560
Una permutación es una combinación en donde el orden es importante. La
notación para permutaciones es P(n,r) que es la cantidad de permutaciones de “n”
elementos si solamente se seleccionan “r”.
Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente
calificación, cualquier alumno podría alcanzar la calificación más alta. La segunda
calificación más alta podría ser obtenida por uno de los 8 restantes. La tercera
calificación podría ser obtenida por uno de los 7 restantes.
La cantidad de permutaciones posibles sería: P(9,3) = 9*8*7 = 504 combinaciones
posibles de las tres calificaciones más altas.
Normalmente usamos la palabra "combinación" descuidadamente, sin pensar en si el orden
de las cosas es importante. En otras palabras:
"Mi ensalada de frutas es una combinación de manzanas, uvas y bananas": no
importa en qué orden pusimos las frutas, podría ser "bananas, uvas y manzanas" o "uvas,
manzanas y bananas", es la misma ensalada.
"La combinación de la cerradura es 472": ahora sí importa el orden. "724" no
funcionaría, ni "247". Tiene que ser exactamente 4-7-2.
Así que en matemáticas usamos un lenguaje más preciso:
Si el orden no importa, es una combinación.
Si el orden sí importa es una permutación.
¡Así que lo de arriba se podría llamar "cerradura de permutación"!
* Con otras palabras:
* Una permutación es una combinación ordenada.
Hay dos tipos de permutaciones:
Se permite repetir: como la cerradura de arriba, podría ser "333".
Sin repetición: por ejemplo los tres primeros en una carrera. No puedes quedar primero y
segundo a la vez.
Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las
permutaciones posibles son:
n × n × ... (r veces) = nr
(Porque hay n posibilidades para la primera elección, DESPUÉS hay n posibilidades
para la segunda elección, y así.)
Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y
eliges 3 de ellos:
10 × 10 × ... (3 veces) = 103 = 1000 permutaciones
Así que la fórmula es simplemente:
nr
donde n es el número de cosas que puedes elegir, y eliges r de ellas
(Se puede repetir, el orden importa)
En este caso, se reduce el número de opciones en cada paso.
Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?
Después de elegir por ejemplo la "14" no puedes elegirla otra vez.
Así que tu primera elección tiene 16 posibilidades, y tu siguiente elección tiene 15
posibilidades, después 14, 13, etc. Y el total de permutaciones sería:
16 × 15 × 14 × 13 ... = 20,922,789,888,000
Pero a lo mejor no quieres elegirlas todas, sólo 3 de ellas, así que sería solamente:
16 × 15 × 14 = 3360
Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.
¿Pero cómo lo escribimos matemáticamente? Respuesta: usamos la "función factorial"
La función factorial (símbolo: !) significa que se multiplican números descendentes.
Ejemplos:
•
4! = 4 × 3 × 2 × 1 = 24
•
7! = 7 × 6 × 5 × 4 × 3 × 2 × 1 = 5040
•
1! = 1
Así que si quieres elegir todas las bolas de billar las permutaciones serían:
16! = 20,922,789,888,000
Pero si sólo quieres elegir 3, tienes que dejar de multiplicar después de 14. ¿Cómo
lo escribimos? Hay un buen truco... dividimos entre 13!...
16 × 15 × 14 × 13 × 12 ... = 16 × 15 × 14 = 3360
13 × 12 ...
¿Lo ves? 16! / 13! = 16 × 15 × 14
La fórmula se escribe:
donde n es el número de cosas que puedes elegir, y eliges r de ellas
(No se puede repetir, el orden importa)
COMBINACIONES
( Con repetición )
C ( n, r ) =
(n+r-1)!
n!
( n - r ) !r !
PERMUTACIONES
( Con repetición )
P ( n, r ) =
r !( n - 1 ) !
COMBINACIONES
( Sin repetición )
C ( n, r ) =
VS
VS
n^r
PERMUTACIONES
( Sin repetición )
P ( n, r ) =
n!
(n-r)!
La curva normal puede utilizarse para describir distribuciones de puntajes, para interpretar la desviación
estándar y para hacer un informe de probabilidades. Veremos que la curva normal es un ingrediente
esencial en la toma de decisiones en estadística, por medio de la cual el investigador social generaliza sus
resultados de muestras a poblaciones.
Características de la curva normal.
La curva normal es un tipo de curva uniforme y simétrica cuya forma recuerda a muchos una campana y
por tanto se le conoce como la “curva en forma de campana”. Tal vez el rasgo más sobresaliente de la
curva normal es su simetría: si doblamos la curva en su punto más alto al centro, crearíamos dos mitades
iguales, cada una fiel imagen de la otra.
Además, la curva normal es unimodal, ya que solo tiene un pico o punto de máxima frecuencia –aquel
punto en la mitad de la curva en el cual coinciden la media, la mediana y la moda– (el alumno recordara
que la media, la mediana y la moda ocurren en distintos puntos en una distribución sesgada).
Curvas normales: el modelo y el mundo real
Imaginemos, con fines ilustrativos, que todos los fenómenos sociales, psicológicos y físicos estuvieran
distribuidos normalmente, ¿Cómo sería este mundo hipotético?
En lo concerniente a las características físicas de los humanos, la mayoría de los adultos caería dentro del
campo de los 1.60 y 1.80 m de estatura, siendo muy pocos bajos (menos de 1.60 m) o muy altos (más de
1.90 m). El coeficiente intelectual (C.I.) sería igualmente predecible –la mayor proporción de puntajes de
C.I. caería entre el 90 y 110; veríamos una caída gradual de los puntajes en una y otra cola en unos pocos
“genios” que marcarían más de 140; igualmente, pocos marcarían menos de 60.de igual manera,
relativamente pocos individuos se catalogarían como extremistas políticos, ya sea de derecho o de
izquierda, mientras que la mayoría se les consideraría políticamente moderados o neutrales.
La distribución normal N (m, s) es un modelo matemático que rige muchos fenómenos.
La experiencia demuestra que las distribuciones de la mayoría de las muestras tomadas en el
campo de la industria se aproximan a la distribución normal si el tamaño de la muestra es
grande. Esta distribución queda definida por dos parámetros: la media m y la desviación
típica s. Se presenta mediante una curva simétrica conocida como campana de Gauss.
Esta distribución nos da la probabilidad de que al elegir un valor, éste tenga una medida
contenida en unos intervalos definidos. esto permitirá predecir de forma aproximada, el
comportamiento futuro de un proceso, conociendo los datos del presente.
La desviación típica es grande, el intervalo de
incertidumbre de la medida es grande, la precisión
es débil
La desviación típica es pequeña, el intervalo de
incertidumbre de la medida es pequeña, la precisión
es grande