Estatística - Professor Hubert Chamone Gesser, Dr.

Download Report

Transcript Estatística - Professor Hubert Chamone Gesser, Dr.

Faculdade Estácio de Sá de Santa Catarina Cursos de Graduação em Administração e TRH Prof. Hubert Chamone Gesser, Dr.

Graduação em Administração - ESAG/UDESC Doutorado e Mestrado em Engenharia de Produção - UFSC

SUMÁRIO -

Conceitos Básicos em Estatística Conhecendo os Dados Medidas de Tendência Central Medidas de Ordenamento Medidas de Dispersão Amostragem Tabelas e Gráficos Intervalo de Confiança Distribuição Normal Correlação Testes de Associação

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

ADMINISTRAÇÃO A administração é o processo de planejar, organizar, liderar e controlar os esforços realizados pelos membros da organização e o uso de todos os recursos organizacionais para alcançar os objetivos estabelecidos .

ESTATÍSTICA

Origem no latim status (estado) + isticum (contar) Informações referentes ao estado Coleta, Organização, Descrição, Análise e Interpretação de Dados

ESTATÍSTICA

O Que é Estatística?

Para Sir Ronald A. Fisher (1890-1962): Estatística é o estudo das populações, das variações e dos métodos de redução de dados.

ESTATÍSTICA

O Que é Estatística?

“Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados...” Jon Kettenring Presidente da American Statistical Association, 1997

ESTATÍSTICA

O Que é Estatística (definição)?

“Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.”

ESTATÍSTICA

LIVROS DE ESTATÍSTICA

ESTATÍSTICA

POR QUE A ESTATÍSTICA É IMPORTANTE?

 As diferenças são atribuídas a causas erradas;  As coincidências ocorrem frequentemente;  As pessoas têm dificuldades com probabilidades;  Acrescentam polimento às publicações;  Faz conhecer o “grau de confiança” das conclusões.

ESTATÍSTICA

ASSOCIAÇÃO ENTRE ESTATÍSTICA E ESTADO

Recenseamentos Como o surgimento dos Estados, aparece a necessidade de se contar o povo (produção) e o exército (poder).

Esforços dos governos para conhecer seus habitantes, sua condição socioeconômica, sua cultura, sua religião, etc.

ESTATÍSTICA

ASSOCIAÇÃO ENTRE ESTATÍSTICA E PESQUISAS

Pesquisas de Opinião Pública, Estudos Mercadológicos

Gráficos e médias publicados na mídia Análise de dados de processos com variabilidade

ESTATÍSTICA

As variabilidades mostram que existem diferenças 1 o Mundo 3 o Mundo Alta Expectativa de Vida Boas Condições Sanitárias Hábitos de Consumo Assistência em Saúde Doenças Infecciosas Alta Mortalidade Infantil Baixa Escolaridade Iniquidades em Saúde

Indicadores Sociais Diferentes

ESTATÍSTICA

EXPECTATIVA DE VIDA – Diferenças entre os países

ESTATÍSTICA

RENDA PER CAPITA NO BRASIL (PNUD, 2000)

ESTATÍSTICA

RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)

ESTATÍSTICA

ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)

ESTATÍSTICA

ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)

ESTATÍSTICA

GRÁFICO DE DISPERSÃO – RENDA x EDUCAÇÃO (PNUD, 2000)

ESTATÍSTICA

FONTES DEMOGRÁFICAS Bancos de Dados (OMS, OPAS, MS, IBGE, etc) Indicadores Sociais (IDH, GINI, QV) Pesquisas de Mercado ( Hábitos de Consumo ) Censos Demográficos Pesquisa Nacional por Amostra de Domicílios (PNAD) Programa das Nações Unidas para o Desenvolvimento (PNUD)

ESTATÍSTICA

POPULAÇÃO E AMOSTRA POPULAÇÃO: Conjunto de elementos que se deseja estudar AMOSTRA: Subconjunto da população Nem sempre o Censo é viável (questões econômicas) É mais barato coletar dados de amostras

ESTATÍSTICA

POPULAÇÃO: Também chamada de Universo AMOSTRA: Parte da população População Amostra

ESTATÍSTICA

POPULAÇÃO E AMOSTRA POPULAÇÃO (N): Todos os estudantes da FESSC Plano de Amostragem AMOSTRA (n): Parte dos estudantes da FESSC

ESTATÍSTICA

REQUISITOS DE UMA AMOSTRA 1) Ter um tamanho adequado (previamente calculado) Existem fórmulas para o cálculo do adequado tamanho da amostra 2) Constituintes selecionados ao acaso (sorteio)

ESTATÍSTICA

CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA Amostras Grandes: Amostras Médias: Amostras Pequenas: n > 100 n > 30 (30 < n < 100) n < 30 Amostras Muito Pequenas: n < 12 (12 < n < 30) Observação: As amostras com n > 30 geram melhores resultados.

O tamanho adequado deve ser pré-calculado.

ESTATÍSTICA

Áreas da Estatística Amostragem e Planejamento de Experimentos (coleta dos dados) Estatística Descritiva (organização, apresentação e sintetização dos dados) Estatística Inferencial (testes de hipóteses, estimativas, probabilidades)

ESTATÍSTICA

Amostragem e Planejamento de Experimentos (coleta dos dados) - É o processo de escolha da amostra - É o início de qualquer estudo estatístico

-

Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo Exemplos: Pesquisa sobre tendência de votação Cuidado: Perfil da Amostra = Perfil da População

ESTATÍSTICA

Estatística Descritiva (organização, apresentação e sintetização dos dados)

-

É a parte mais conhecida

-

Diariamente veiculada na mídia (jornais, televisão, rádio)

-

Distribuições de frequência, médias, tabelas, gráficos Exemplos: % de Analfabetos em uma comunidade Índice de Mortalidade Infantil (por mil nascimentos) Índice de Desenvolvimento Humano

ESTATÍSTICA

Estatística Descritiva – Distribuição Populacional de uma Região

ESTATÍSTICA

Estatística Descritiva – Volume de Vendas de um Produto por Região

ESTATÍSTICA

Estatística Inferencial, Indutiva ou Analítica (testes de hipóteses, estimativas)

-

Auxilia o processo de tomada de decisões

-

Responde uma dúvida, compara grupos

-

Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que uma delas será aceita mediante a aplicação de um teste estatístico baseado na teoria das probabilidades.

Exemplo: A venda de um produto esta associada a um outro?

Hipóteses: Nula (não há associação), Alternativa (há associação)

ESTATÍSTICA

EXERCÍCIO N o 1 Em uma cidade de 500.000 habitantes onde 45% das pessoas têm título de eleitor, realizou-se uma pesquisa eleitoral com 2000 pessoas. Qual o tamanho da população de estudo e da amostra?

ESTATÍSTICA

EXERCÍCIO N o 2 Uma amostra de apenas 3000 eleitores pode fornecer um perfil confiável sobre a preferência de todo o eleitorado, na véspera de uma eleição presidencial? Por que?

ESTATÍSTICA

EXERCÍCIO N o 3 Você considera a pesquisa proposta no exercício anterior como experimental ou de levantamento? Por quê?

ESTATÍSTICA

EXERCÍCIO N o 4 Elabore uma situação em que a estatística possa ser empregada em benefício de uma organização.

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

TIPOS DE DADOS

Dados Nominais (Sexo, Raça, Cor dos Olhos)

Dados Ordinais (Grau de Satisfação)

Dados Numéricos Contínuos

Dados Numéricos Discretos (Altura, Peso) (Número de Filiais)

“Estatísticas aplicadas em alguns tipos de dados não podem ser aplicadas a outros .”

ESTATÍSTICA

TIPOS DE DADOS

Dados Intervalares (Temperatura o C)

Quando se referem a valores obtidos mediante a aplicação de uma unidade de medida arbitrária, porém constante e onde o

zero é relativo

. Este tipo de dado tem restrições a cálculos.

30 o C não é três vezes mais quente que 10 o C Para cálculos se utiliza a escala Kelvin

ESTATÍSTICA

ARREDONDAMENTO DE DADOS CONTÍNUOS 1ª Regra: Arredondar para o número mais próximo 2ª Regra: Arredondar para o par mais próximo 5,0 5,5 6,0 6,0 6,5 7,0

ESTATÍSTICA

EXERCÍCIO N o 1 Faça os seguintes arredondamentos: 38,648 54,76 27,465 42,455 4,5 para o centésimo mais próximo para o décimo mais próximo para o centésimo mais próximo para o centésimo mais próximo para o inteiro mais próximo 38,65 54,8 27,46 42,46 4

ESTATÍSTICA

AGRUPAMENTO DE DADOS POR VALORES DISTINTOS

8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5 4 6 5 3 6 5 4 2 5 3 6

x 2 3 4 5 6 7 8 Total f (frequência) 3 3 4 9 6 2 1 28

ESTATÍSTICA

AGRUPAMENTO DE DADOS POR CLASSES Classes 39 50 50 61 61 72 72 83 83 94 f (frequência) 4 5 5 6 5 Ponto Médio 44,5 55,5 66,5 77,5 88,5

ESTATÍSTICA

x 2 3 4 5 6 7 8 Total 28 f 3 3 4 9 6 2 1 POLÍGONO DE FREQUÊNCIA f 10 8 6 4 2 2 3 4 5 6 7 8 x

ESTATÍSTICA

EXERCÍCIO N o 2 Em uma amostra de estudantes foram coletadas as seguintes alturas em metros: 1,70 1,58 1,67 1,72 1,70 1,71 1,75 1,58 1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77 1,76 1,75 1,73 1,65 1,64 1,63 1,62 1,66 1,71 1,68 1,69 1,70 1,59 1,61 1,64 1,76 1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70 1,67 1,71 1,72 1,63 1,70 a) Qual foi o tamanho da amostra (n)?

b) Qual é a altura do sujeito mais alto e a do mais baixo?

c) Faça o agrupamento de dados por valores distintos.

d) Faça o agrupamento por 6 classes.

e) Faça o polígono de frequência p/ o agrupamento por classes.

ESTATÍSTICA

CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Positiva (cauda direita) Simétrica Análise Vertical: Leptocúrtica Mesocúrtica Assimétrica Negativa (cauda esquerda) Platicúrtica (alta) (baixa) Análise Conjunta: Assimétrica Positiva Leptocúrtica Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”

ESTATÍSTICA

CURVAS DE FREQUÊNCIA

ESTATÍSTICA

ESTATÍSTICA

CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Positiva (cauda direita é mais longa) f x

ESTATÍSTICA

Análise Horizontal: Simétrica CURVAS DE FREQUÊNCIA f x

ESTATÍSTICA

CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Negativa (cauda esquerda é mais longa) f x

ESTATÍSTICA

Análise Vertical: Leptocúrtica (alta) CURVAS DE FREQUÊNCIA f x

ESTATÍSTICA

Análise Vertical: Mesocúrtica f CURVAS DE FREQUÊNCIA x

ESTATÍSTICA

CURVAS DE FREQUÊNCIA Análise Vertical: Platicúrtica (baixa) f x

ESTATÍSTICA

DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS

Apresentam-se os valores absolutos e as porcentagens Podem ser usadas tabelas ou gráficos

40 35 30 25 20 15 10 5 0 1° Trim.

2° Trim.

Gráfico de Barras 45,9 20,4 Gráfico Circular 30,6

ESTATÍSTICA

DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS 45 40 35 30 25 20 15 10 5 0 1° Trim.

2° Trim.

Gráfico de Linhas (não é usado; restrito a dados contínuos) 30,6 45,9 0 10 20 20,4 30 40 50 Gráfico de Barras Horizontal

ESTATÍSTICA

DESCRIÇÃO DOS DADOS CONTÍNUOS

Trazem informações que expressam a tendência central e a dispersão dos dados.

Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo ) Medidas de Dispersão: Desvio Padrão, Variância, Amplitude, Coeficiente de Variação, Valor Máximo, Valor Mínimo

ESTATÍSTICA

EXERCÍCIO N o 3 Em uma pesquisa com jogadoras de basquete foram coletados os seguintes pesos corporais em quilogramas: 65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63 64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68 69 70 a) Qual foi o tamanho da amostra (n)?

b) Qual é o maior peso e o menor?

c) Faça o agrupamento de dados por valores distintos.

d) Faça o agrupamento em 3 classes.

e) Faça o polígono de frequência p/ o agrupamento por classes.

f) A curva de frequência encontrada se assemelha a normal?

ESTATÍSTICA

EXERCÍCIO N o 4 Na pesquisa do exercício anterior faça a representação gráfica em barras e a circular para as 3 classes de jogadoras geradas.

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

MEDIDAS DE TENDÊNCIA CENTRAL Nos dão uma idéia de onde se localiza o centro, o ponto médio de um determinado conjunto de dados.

Medidas: Média, Moda e Mediana.

f x

ESTATÍSTICA

MÉDIA É um valor típico representativo de um conjunto de dados.

Fisicamente representa o ponto de equilíbrio da distribuição.

Modos de calcular 1) para dados simples 2) para valores distintos 3) para agrupamentos em classes

x =

S

x / n x =

S

fx / n x =

S

fx / n

ESTATÍSTICA

MÉDIA 1) Cálculo para dados simples

16 18 23 21 17 16 19 20 x =

S

x / n

S

x = Soma dos valores n = tamanho da amostra x = (16+18+23+21+17+16+19+20) 8 x = 18,75

ESTATÍSTICA

MÉDIA 2) Cálculo para valores distintos x f fx

2 3 4 5 3 3 4 9 6 9 16 45 6 7 6 2 36 14 8 1 8 Total 28 134

x =

S

fx / n

S

fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 134 28 x = 4,7857

ESTATÍSTICA

MÉDIA 3) Cálculo para agrupamentos em classes Classes

39 50 61 72 83 50 61 72 83 94 Total

f

4 5 5 6 5 25

x

-

fx

44,5 178 55,5 277,5 66,5 332,5 77,5 465 88,5 442,5 1695,5

x =

S

fx / n

S

fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 1695,5 25 x = 67,82

ESTATÍSTICA

MEDIANA É o valor que ocupa a posição central de um conjunto de dados ordenados.

Para um número par de termos a mediana é obtida através da média aritmética dos dois valores intermediários.

Interpretação: 50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana.

ESTATÍSTICA

MEDIANA 1) Cálculo da posição da mediana para dados simples

2 3 4 5 6 7 8 9 10

P Md =(n+1) / 2 P Md = (9+1) / 2 P Md = 5 o Termo Mediana (Md) = 6

ESTATÍSTICA

MEDIANA 2) Cálculo da posição da mediana para valores distintos x f fa

2 3 3 o 3 3 6 o 4 4 10 o 5 9 19 o 6 6 25 o 7 2 27 o 8 1 28 o Total 28 -

P P Md Md P =(n+1) / 2 = (28+1) / 2 Md x entre 14 o = 14,5 e 15 o Termo Mediana (Md) = 5

ESTATÍSTICA

MEDIANA 3) Cálculo da P Md para agrupamentos em classes Classes

39 50 61 72 83 50 61 72 83 94 Total

f

4 5 5 6 5 25

x

44,5 55,5 66,5 77,5 88,5 -

fa

4 o 9 o 14 o 20 o 25 o -

P Md =(n+1) / 2 P Md = (25+1) / 2 P Md = 13 o Termo Classe Mediana 61 72 Mediana (Md) = 66,5 (estimativa)

ESTATÍSTICA

MEDIANA 3) Cálculo da P Md para agrupamentos em classes

Pode-se fazer a interpolação da classe mediana

Classe Mediana 61 72 Md = Li + ((P Md - faa) / f ) . A Li = limite inferior da classe mediana PMd = posição da mediana faa = frequência acumulada da classe anterior f = frequência da classe mediana A = amplitude da classe mediana

ESTATÍSTICA

MEDIANA 3) Cálculo da P Md para agrupamentos em classes

Interpolação da classe mediana

Md = Li + ((P Md - faa) / f ) . A Classe Mediana 61 72 Md = 61 + ((13 - 9) / 5) . 11 Mediana (Md) = 69,8

ESTATÍSTICA

MODA É o valor que ocorre com maior frequência em um conjunto de dados. Símbolo = Mo 1) Moda para dados simples Exemplos: 2, 3, 4, 5, 6, 7, 8 2, 3 , 3 , 4, 5, 6 ,7 2, 3 , 3 , 4, 5 , 5 , 6 AMODAL MODA = 3 BIMODAL (Mo = 3 e Mo = 5)

ESTATÍSTICA

MODA 2) Moda para valores distintos x f

2 3 3 3 4 4

5 9

6 6 7 2 8 1 Total 28

O valor 5 tem o maior número de ocorrências (9) Mo = 5

ESTATÍSTICA

MODA 3) Moda para agrupamentos em classes Classes

39 50 61 72 83 50 61 72 83 94 Total

f

4 5 5 6 5 25

x

44,5 55,5 66,5 77,5 88,5 -

fa

4 o 9 o 14 o 20 o 25 o -

Moda Bruta Ponto médio da classe de maior frequência Mo = 77,5 É uma estimativa

ESTATÍSTICA

MODA 3) Moda para agrupamentos em classes Moda de King Mo = Li + (A . f2 / (f1 + f2)) Li = limite inferior da classe modal A = amplitude do intervalo da classe modal f1 = frequência da classe anterior a modal f2 = frequência da classe posterior a modal Mo = 72 + (11 . 5) 5 + 5 Mo = 77,5

ESTATÍSTICA

USO DAS MEDIDAS DE TENDÊNCIA CENTRAL MÉDIA: MODA: Dados Numéricos e Intervalares É a medida mais utilizada.

Dados Nominais MEDIANA: Dados Ordinais

ESTATÍSTICA

EXERCÍCIO N o 1 Determine a média, a mediana e a moda para o seguinte conjunto de dados 6 5 8 4 7 6 9 7 3

ESTATÍSTICA

EXERCÍCIO N o 2 Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados 12 32 54 17 82 99 51 11 44 22 22 33 44 52 76 41 37 10 5 87

ESTATÍSTICA

EXERCÍCIO N o 3 Dado o seguinte agrupamento em classes determine: Classes

1,60 1,65 1,70 1,75 1,80 1,65 1,70 1,75 1,80 1,85

Total f

10 15 22 18 3

68 a) os pontos médios de cada classe b) a classe modal c) a moda bruta d) a moda de King e) a classe mediana f) a mediana por agrupamento de classes g) a média por agrupamento de classes

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

MEDIDAS DE ORDENAMENTO São os valores que subdividem uma disposição em rol Medidas: QUARTIS, DECIS E PERCENTIS Os Quartis dividem a disposição em 4 partes iguais Q 1 , Q 2 , Q 3 Os Decis dividem a disposição em 10 partes iguais D 1 , D 2 , D 3 , D 4 , D 5 , D 6 , D 7 , D 8 , D 9 Os Percentis dividem a disposição em 100 partes iguais P 1 , P 2 , P 3 , P 4 , P 5 , P 6 , ... , P 99

ESTATÍSTICA

QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q 1 , Q 2 , Q 3 Entre cada quartil há 25% dos dados da disposição Posição do Primeiro Quartil (Q 1 ) = (n + 1) / 4 Posição do Segundo Quartil (Q 2 ) = 2.(n + 1) / 4 Posição do Terceiro Quartil (Q 3 ) = 3.(n + 1) / 4 O segundo quartil coincide com a Mediana (Q 2 = Md)

ESTATÍSTICA

QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q 1 , Q 2 , Q 3 1, 1, 1, 2, 2, 2, 3 , 3, 3, 4, 4, 4, 5, 5 , 5, 5, 6, 7, 7, 7, 8 , 8, 8, 8, 9, 9, 9 n = 27 7 o Q 1 termo 14 o Q 2 termo 21 o Q 3 termo

ESTATÍSTICA

DECIS Os Decis dividem a disposição em 10 partes iguais D 1 , D 2 , D 3 , D 4 , D 5 , D 6 , D 7 , D 8 , D 9 Entre cada decil há 10% dos dados da disposição Posição do Primeiro Decil (D 1 ) = (n + 1) / 10 Posição do Segundo Decil (D 2 ) = 2.(n + 1) / 10 Posição do Nono Decil (D 9 ) = 9.(n + 1) / 10 O Quinto Decil coincide com a Mediana (D 5 = Md)

ESTATÍSTICA

PERCENTIS Os percentis dividem a disposição em 100 partes iguais P 1 , P 2 , P 3 , P 4 , P 5 , P 6 , ... , P 99 Entre cada percentil há 1% dos dados da disposição Posição do Primeiro Percentil (P 1 ) = (n + 1) / 100 Posição do Segundo Percentil (P 2 ) = 2.(n + 1) / 100 Posição do Nonagésimo Nono Percentil (P 99 ) = 99.(n + 1) / 100 P 50 = Md P 25 = Q 1 P 75 = Q 3

ESTATÍSTICA

EXERCíCIOS 1) Dado o conjunto de dados: a) apresente a disposição em rol; b) o Percentil 50, c) o Primeiro Quartil, d) a Média, e) a Moda e f) a Mediana

10 13 24 45 66 77 11 14 26 33 65 21 57

ESTATÍSTICA

2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil?

ESTATÍSTICA

3) Determine a média, a moda, a mediana, o 1o quartil, o 5o decil, o percentil 75 e o percentil 50 para a seguinte distribuição por valores distintos?

Lucro (US$ mil) 64 65 66 67 68 69 70 71 72 f 4 10 12 12 15 14 9 5 2

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

DISPERSÃO DOS DADOS É frequentemente chamada de variabilidade.

Medidas mais comuns: Variância, Desvio Padrão, Amplitude e Coeficiente de Variação f Dispersão dos dados na amostra Dispersão dos dados na população x

ESTATÍSTICA

Dispersão na População É uma forma de se ver o quanto os dados se afastam da média.

Exemplo: Vilarejo com apenas 11 pessoas 135cm 152cm 136cm 138cm 152cm 157cm 141cm 163cm 143cm 170cm 152cm Média = 149cm Mediana e Moda = 152cm Valor Máximo = 170cm Valor Mínimo = 135cm Amplitude = 35cm Alturas de 11 pessoas

ESTATÍSTICA

Dispersão na População Alturas (N=11) 135cm 136cm 138cm 141cm 143cm 152cm 152cm 152cm 157cm 163cm 170cm Total 135-149 136-149 138-149 141-149 143-149 152-149 152-149 152-149 157-149 163-149 170-149 x - x -14 -13 -11 -8 -6 3 3 3 8 14 21 (x - x) 2 196 169 121 64 36 9 9 9 64 196 441 1314

 

2 Variância = 1314 / 11 = 119,454 cm 2 Desvio Padrão = 119,454 = 10,92 cm Soma dos desvios quadráticos

ESTATÍSTICA

VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO Variância da população

2

=

S

( x - x )

2

/ N

Desvio Padrão da população = Raiz quadrada da variância

 = 

2 Como a dispersão nas amostras é menor do que na população, se faz um ajuste matemático.

ESTATÍSTICA

VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA Variância da Amostra ( s 2

s

2 ou v )

=

S

( x - x )

2

/ ( n -1 )

Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância

s

=

s

2 A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático

ESTATÍSTICA

DESVIO PADRÃO SIGNIFICADO: É um modo de representar a dispersão dos dados ao redor da média.

f x Média

ESTATÍSTICA

DESVIO PADRÃO A curva A mostra uma dispersão dos dados maior do que a curva B , logo o desvio padrão de A é maior do que o de B .

f f Curva A Curva B Média x Média x

ESTATÍSTICA

COEFICIENTE DE VARIAÇÃO O desvio padrão depende da unidade de medida usada, assim um desvio medido em dias será maior do que um medido em meses.

O coeficiente de variação expressa o desvio-padrão como porcentagem do valor da média.

COEF. VARIAÇÃO = 100 . DESVIO PADRÃO MÉDIA Quanto menor for este coeficiente mais homogênea é a amostra.

ESTATÍSTICA

COEFICIENTE DE VARIAÇÃO Classificação da proporção que o desvio padrão apresenta sobre a média.

GRAU DE HOMOGENEIDADE DOS DADOS

até 10% de 10% a 20% de 20% a 30% acima de 30%

   

ÓTIMO BOM REGULAR RUIM

ESTATÍSTICA

EXERCÍCIOS 1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados:

4 5 5 6 6 7 7 8

ESTATÍSTICA

2) Determine o valor de n, a amplitude, a média, o desvio padrão e o coeficiente de variação da seguinte amostra de dados: 22 32 45 22 46 76 24 21 78 43 21 58 92 11 16 28 33 73 11 29 22 47 28 24 21 53 36 88 99 18

Como a base de dados é grande sugere-se o uso da planilha eletrônica Microsoft Excel .

ESTATÍSTICA

3) Com base nos coeficientes de variação calculados nos dois exercícios anteriores classifique a dispersão encontrada:

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

APLICAÇÕES DE AMOSTRAGEM Pesquisa Mercadológica (Índice de satisfação na população) Pesquisa Eleitoral (Percentagem de votos para cada candidato) Perfil Socioeconômico da População (Grau de escolaridade, Renda) População Na População Parâmetros Na Amostra Estatísticas Amostra Inferência Estatística

ESTATÍSTICA

POR QUE USAR A AMOSTRAGEM?

Economia Tempo (É mais barato levantar dados de uma parcela da população) (É mais rápido) Confiabilidade dos Dados (Entrevista mais atenciosa, menos erros) Operacionalidade (Controle dos entrevistadores) QUANDO NÃO USAR A AMOSTRAGEM?

Quando a população for pequena (n > 0,8.N) Quando a característica for de fácil mensuração Quando houver a necessidade de alta precisão (Sim ou Não) (Censo IBGE)

ESTATÍSTICA

TIPOS DE AMOSTRAGEM AMOSTRAGEM ALEATÓRIA SIMPLES (Tem que obedecer a propriedade de qualquer elemento da população ter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabela de números aleatórios ou sorteios) AMOSTRAGEM ALEATÓRIA SISTEMÁTICA (Após obter-se a lista dos elementos da população, sorteia-se a entrada e segue-se a relação N/n.) AMOSTRAGEM ALEATÓRIA ESTRATIFICADA (Elabora-se a amostra através do perfil conhecido da população.

Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra é confeccionada obedecendo-se estes parâmetros.)

ESTATÍSTICA

OUTROS TIPOS DE AMOSTRAGEM AMOSTRAGEM NÃO ALEATÓRIA (De fácil obtenção.) AMOSTRAGEM PARA ESTUDOS COMPARATIVOS (Não visa a descrição de uma população, mas a comparação entre grupos diferentes. Exemplos: Comparar as taxas de tabagismo em indivíduos com câncer de pulmão e sadios.) Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população.

ESTATÍSTICA

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Sejam: n 0 E 0 = Primeira aproximação para o tamanho da amostra = Erro Amostral Tolerável n = Tamanho da Amostra N = Tamanho da População

n

0

= 1 / (E

o

)

2

n = (N . n

0

) / (N + n

o

)

ESTATÍSTICA

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Populações Finitas com Parâmetros de Prevalência Conhecidos

n =

(N . z

2

. p . (1-p)) (E

0 2

. (N-1) + z

2

. p . (1-p))

Onde: N = Tamanho da População z = Nível de confiança expresso em desvio padrão (95%) = 1,96 E 0 = Erro Amostral Tolerável p = Prevalência do evento na População

ESTATÍSTICA

RELAÇÃO ENTRE (n) E (N) Relação entre o tamanho da população e o tamanho da amostra n 600 500 400 300 200 100 0 0 500 1000 1500 2000 2500 3000 3500 N

ESTATÍSTICA

EXERCÍCIOS 1) Determine o tamanho da amostra para uma pesquisa eleitoral em uma cidade com 200.000 eleitores, adotando uma margem de erro de 2 pontos percentuais.

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

TABELAS Tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central.

Uma tabela estatística conterá necessariamente uma série ou uma distribuição de frequência.

Vantagens:

- Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.

ESTATÍSTICA

NORMAS PARA A CONFECÇÃO DE TABELAS São numeradas consecutivamente com algarismos arábicos ; Os números são precedidos da palavra “ Tabela ”; No topo deve estar o título que indica a natureza e as abrangências geográficas e temporal dos dados numéricos; O centro da tabela é representado por uma série de subcolunas onde são alocados os dados; colunas e No rodapé deve-se colocar a opcionalmente uma nota geral fonte ou uma (o responsável pelos dados) e nota específica ; A moldura deve conter no mínimo 3 traços horizontais ; Não se deve fechar uma tabela com traços verticais em suas extremidades .

ESTATÍSTICA

CLASSIFICAÇÃO DAS TABELAS Séries Cronológicas (temporais ou históricas); Variável: Tempo Constantes: Lugar e Espécie Séries Geográficas (territoriais); Variável: Lugar Séries Especificativas; Variável: Espécie Séries Mistas; Constantes: Tempo e Espécie Constantes: Tempo e Lugar Quando há mais de uma variável.

Distribuição de Frequência

ESTATÍSTICA

Séries Cronológicas (Temporais ou Históricas) Tabela 1: Aceitação do produto X na Cidade Y Anos 2007 2008 2009 2010 Fonte: Hipotética Percentual 25,74 26,85 27,94 32,45

ESTATÍSTICA

Séries Geográficas (Territoriais) Tabela 2: Aceitação produto X no Ano de 2011 Cidades Itajaí Lages Florianópolis Blumenau Fonte: Hipotética Percentual 10,44 29,45 8,66 9,82

ESTATÍSTICA

Séries Especificativas Tabela 3: Aceitação do produto X no Ano de 2011 em Florianópolis Segmento populacional Percentual Infantil Juvenil 60,25 20,72 Adulto 3a Idade 2,75 5,82 Fonte: Hipotética

ESTATÍSTICA

Séries Mistas (Ex: Especificativa-Cronológica-Geográfica) Tabela 4: Vendas de alguns produtos por ano e cidade (milhares) Produtos 2010 2011 Fpolis Lages Fpolis Lages Cosméticos 24,24 9,34 25,95 9.98

Vestuário 112,72 27,45 111,75 29,48 Audio Video 86,75 18,45 79,37 19,57 1,95 0,85 2,01 0,84 Fonte: Hipotética

ESTATÍSTICA

Distribuições de Frequência Tabela 5: Distribuição de frequência dos pesos corporais de uma amostra (valores em quilogramas) Pesos 64 65 66 67 Total Frequência 51 100 22 14 187 Fonte: Hipotética Frequência Acumulada 51 151 173 187 -

ESTATÍSTICA

GRÁFICOS Gráfico é a forma geométrica de apresentação dos dados e respectivos resultados de sua análise.

A escolha do modelo ideal de representação gráfica depende das preferências e do senso estético do elaborador.

Vantagens:

- Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.

ESTATÍSTICA

NORMAS PARA A CONFECÇÃO DE GRÁFICOS Deve facilitar a interpretação dos dados para um leigo; Não há a necessidade de se colocar título se estiver na mesma página da tabela correspondente; Há a necessidade de se colocar o título se a tabela correspondente não estiver na mesma página.

O senso estético individual determina o espaço do gráfico (L x A); As colunas, barras, linhas e áreas gráficas devem ser ordenadas de modo crescente ou decrescente, mas a ordem cronológica prevalece;

ESTATÍSTICA

ORIGEM DOS GRÁFICOS O diagrama cartesiano é a figura geométrica que deu origem à técnica de construção de gráficos estatísticos.

Utiliza-se o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais.

Ordenadas (eixo y) 1 o Quadrante Abscissas (eixo x) Eixo y Frequências Eixo x Valores da Variável

ESTATÍSTICA

GRÁFICO EM COLUNAS OU DE BARRAS Tabela 1: Quantidade de exames realizados em um determinado laboratório em 2011.

Exames Hematologia Bioquímica Imunologia Parasitologia Quantidade 9824 21534 15432 4310 Fonte: Hipotética 25000 20000 15000 10000 5000 0 Hemat Bioq Imunol Parasit Figura 1: Gráfico em colunas do número de exames em um determinado laboratório em 2011.

ESTATÍSTICA

GRÁFICO DE BARRAS HORIZONTAL Tabela 2: Quantidade de exames realizados em um determinado laboratório em 2011.

Exames Hematologia Bioquímica Imunologia Parasitologia Quantidade 9824 21534 15432 4310 Fonte: Hipotética Parasit Imunol Bioq Hemat 0 5000 10000 15000 20000 25000 Figura 2: Gráfico em barras horizontais do número de exames realizados em um determinado laboratório no ano de 2011.

ESTATÍSTICA

GRÁFICO DE SETORES OU CIRCULAR Tabela 3: Quantidade de exames realizados em um determinado laboratório em 2011.

Exames Hematologia Bioquímica Imunologia Parasitologia Quantidade 9824 21534 15432 4310 Fonte: Hipotética Imunol Parasit Hemat Bioq Figura 3: Gráfico circular do número de exames realizados em um determinado laboratório no ano de 2011.

ESTATÍSTICA

HISTOGRAMA DE FREQUÊNCIA Tabela 4: Notas dos alunos na disciplina de Estatística no curso de Administração (ano x) 6 8 2 4 0 Notas 2 4 6 Frequência 2 7 11 8 10 10 5 Fonte: Dados Fictícios 12 10 8 6 4 2 0 0 a 2 2 a 4 4 a 6 6 a 8 8 a 10 Figura 4: Histograma das notas dos alunos

ESTATÍSTICA

HISTOGRAMA DE FREQUÊNCIA

A área do proporcional frequências; à histograma soma é das

Para comparar duas distribuições, o ideal é utilizar números percentuais; 35 30 25 20 15 10 5 0 5,7 0 a 2 20 31,4 28,6 14,3 2 a 4 4 a 6 6 a 8 8 a 10 Figura 5: Histograma dos percentuais das notas dos alunos

ESTATÍSTICA

POLÍGONO DE FREQUÊNCIA

É um uma Gráfico em Linha distribuição frequência; de de

Para se obter um polígono (linha pontos fechada), médios da deve-se completar a figura, ligando os extremos da linha obtida aos à última, da distribuição.

classe anterior à primeira e posterior 15 10 5 0 35 30 25 20 5,7 20 31,4 28,6 14,3 0 0 a 2 2 a 4 4 a 6 6 a 8 8 a 10 11 Figura 6: Polígono de Frequência percentual de das notas dos alunos

ESTATÍSTICA

POLÍGONO DE FREQUÊNCIAS ACUMULADAS (Sinônimo: Ogiva) Tabela 5: Notas dos alunos na disciplina de estatística no ano x 4 6 8 0 Notas 2 2 4 Frequência F. Acumulada % 2 7 5,7 25,7 6 8 11 10 57,1 85,7 10 5 100,0 Fonte: Dados Fictícios 120 100 80 60 40 20 0 0 5,7 25,7 57,1 85,7 100 0 a 2 2 a 4 4 a 6 6 a 8 8 a 10 Figura 7: Polígono de frequências acumuladas das notas dos alunos

ESTATÍSTICA

GRÁFICO STEM AND LEAF (TRONCO E FOLHAS) 13 14 15 15 22 23 28 29 33 35 36 37 39 39 45 47 53 57 58 58 59 62 63 65 71 72 Conjunto de Dados Tronco (Stem) Folha (Leaf) 1 2 3 4 5 6 7 3455 2389 356799 57 37889 235 12 Figura 8: Gráfico Stem-Leaf onde o primeiro dígito é o tronco e o segundo é a folha

ESTATÍSTICA

GRÁFICO DE BARRAS COM DESVIO PADRÃO 1,95 1,9 1,85 1,8 1,75 1,7 1,65 1,6 1,55 Medicina Odontologia Farmacia Nutrição Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de estudantes da faculdade x (valores fictícios).

ESTATÍSTICA

GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode) 1,95m 1,90m 1,85m 1,80m 1,75m 1,70m 1,65m 1,60m 1,55m Valor Máximo Percentil 75 Percentil 50 Percentil 25 Valor Mínimo Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).

ESTATÍSTICA

EXERCÍCIOS 1) Construa uma série cronológica com os dados das vendas de um determinado produto de uma empresa fictícia.

ESTATÍSTICA

2) Construa o Gráfico de Barras com os dados do exercício anterior.

ESTATÍSTICA

3) Construa o Gráfico em Setores do seguinte agrupamento em classes: Pesos (Kg) 40 60 60 80 100 80 100 120 Total f 15 26 38 9 88

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

POPULAÇÃO E AMOSTRA Média População x x x x x x Amostras

ESTATÍSTICA

POPULAÇÃO E AMOSTRA f Distribuição da população Distribuição das médias de amostras de mesmo tamanho extraídas da população x x

ESTATÍSTICA

POPULAÇÃO E AMOSTRA A média calculada para uma amostra dificilmente será igual à média real da população; O tamanho da discrepância depende do tamanho da amostra e da variabilidade dos dados.

f Média a Média b x Discrepância Inversamente proporcional a n Diretamente proporcional à variabilidade dos dados

f

ESTATÍSTICA

ERRO PADRÃO DAS MÉDIAS O desvio padrão da distribuição das médias é chamado ERRO PADRÃO DAS MÉDIAS (EPM) x x

ESTATÍSTICA

f ERRO PADRÃO DAS MÉDIAS x x CÁLCULO DO ERRO PADRÃO DAS MÉDIAS (EPM) EPM = s

/

n Mede a dispersão das médias das diferentes amostras de mesmo tamanho, extraídas da mesma população, em torno da média das médias, isto é, em torno da média verdadeira da população estudada.

ESTATÍSTICA

CÁLCULO DO ERRO-PADRÃO A PARTIR DE UMA AMOSTRA COM 10 PESOS Pesos (n=10) 20Kg 23Kg 24Kg 36Kg 37Kg 38Kg 39Kg 43Kg 45Kg 55Kg Total 20-36 23-36 24-36 36-36 37-36 38-36 39-36 43-36 45-36 55-36 x - x -16 -13 -12 0 1 2 19 9 3 7 (x - x) 2 256 169 144 0 1 4 9 49 81 361 1074 Variância (s 2 ) = 1074 / (10-1) = 119,333 Kg 2 Desvio Padrão (s) = 119,333 = 10,924 Kg Erro Padrão (EPM) = 10,924 / 10 = 3,45 Kg

ESTATÍSTICA

f INTERVALO DE CONFIANÇA (Amostras Grandes) Mostra o intervalo em que se situa a média real da população; Comumente se adota um intervalo com 95% de confiança (z=1,96); O tamanho da amostra deve ser razoavelmente grande (n>30).

Limite Inferior:

IC

(95%)

= x - 1,96 . EPM

Limite Superior:

IC

(95%)

= x + 1,96 . EPM

Média a Média b x

ESTATÍSTICA

f INTERVALO DE CONFIANÇA (Amostras Pequenas) Comumente se adota um intervalo com 95% de confiança; O valor de t (Distribuição t de Student) varia conforme o tamanho da amostra (gl = n-1) Possibilita o cálculo para amostras pequenas (n<30).

Distribuição t de Student Média a Média b x Limite Inferior:

IC

(95%)

= x - t . EPM

Limite Superior:

IC

(95%)

= x + t . EPM

ESTATÍSTICA

COMPARAÇÃO DE DISTRIBUIÇÕES Amostras Pequenas Valor de t é variável (t = 1,96 a 12,706) 95% de Confiança Amostras Grandes Valor de z é constante (z = 1,96) 95% de Confiança f f Média a Média b Distribuição t de Student x Média a Média b Distribuição Normal x

ESTATÍSTICA

INTERVALO DE CONFIANÇA INTERPRETAÇÃO: Se forem extraídas 100 amostras de mesmo tamanho da população, 95 delas estarão situadas dentro do intervalo e 5 não; Um intervalo de confiança muito grande sugere que a média da amostra encontrada é pouco representativa da média (verdadeira) da população; O erro padrão da média mostra o quão bem a média é conhecida, assim quanto menor for o EPM menor será o IC.

ESTATÍSTICA

INTERVALO DE CONFIANÇA EXEMPLO: Em uma amostra de 300 estudantes do sexo masculino da faculdade Z, verificou-se que a média das alturas era de 1,75m. Sabendo que o desvio-padrão da amostra era de 10cm, determine o intervalo de confiança para a média das alturas desta população.

EPM = s / n IC (95%) = x - 1,96 . EPM = 175 - 1,96 . 0,5773 = 173,87cm EPM = 10 / 300 IC (95%) = x + 1,96 . EPM = 175 + 1,96 . 0,5773 = 176,13cm EPM = 0,5773cm 1,7387m 1,7613m

ESTATÍSTICA

COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA IC (95%) Faculdade Z x = 1,75m 1,7387m 1,7613m IC (95%) IES X 1,71m 1,75m x = 1,73m Conclusão: As médias populacionais não devem ser consideradas diferentes.

ESTATÍSTICA

COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA IC (95%) Faculdade Z x = 1,75m 1,7387m 1,7613m IC (95%) IES Y 1,726m 1,734m x = 1,73m Conclusão: As médias populacionais PODEM ser consideradas diferentes.

ESTATÍSTICA

EXERCÍCIOS 1) Quando se compara duas médias amostrais oriundas de populações distintas, pode-se dizer que as populações são diferentes quando as médias amostrais são diferentes?

ESTATÍSTICA

2) Uma empresa com sede em São José verificou que o prazo médio de entrega de um lote de produtos tinha em Florianópolis um tempo médio de 10 dias e desvio padrão de 1 dia. Outra amostra de produtos entregue em Chapecó, apresentou como média 12 dias e desvio padrão de 2,5 dias. Sabendo que a primeira amostra continha 70 produtos e a segunda 90 pergunta-se: Há diferença entre as duas populações com relação ao tempo necessário de entrega dos produtos?

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

y

ESTATÍSTICA

DISTRIBUIÇÃO NORMAL x

Variável contínua

(infinitos resultados possíveis)

Não dá para enumerar os possíveis resultados

Média, Moda e Mediana

ESTATÍSTICA

CURVA NORMAL

É descrita pela média e pelo desvio padrão.

A mediana, a média e a moda coincidem.

A curva é simétrica ao redor da média.

A curva é mesocúrtica.

y Média, Moda e Mediana x

ESTATÍSTICA

CURVA NORMAL

As inferências em pesquisas em administração estão baseadas em dados, cuja distribuição é normal.

A curva normal (Gauss) é simétrica, unimodal e tem forma de sino.

É assintótica em relação ao eixo horizontal (eixo x).

y Média, Moda e Mediana x

ESTATÍSTICA

A ESTATÍSTICA Z

A estatística score) está baseada na curva normal.

Z (standard

Mede o afastamento de um valor em relação a média em unidades de desvios padrão.

y Z = x - x s 1 DP 1 DP -3 2 DP -2 3 DP -1 0 2 DP +1 3 DP +2 +3 x

ESTATÍSTICA

A ESTATÍSTICA Z Exemplo:

A altura média dos estudantes da FESSC é de 1,70m com desvio padrão de 10cm

y Z = x - x s 140 150 160 170 180 190 200 x -3 -2 -1 0 +1 +2 +3 z

ESTATÍSTICA

y ÁREAS DA CURVA NORMAL 2 DP 1 DP 1 DP 2 DP -3 DP -2 DP 3 DP 3 DP -1 DP Média, Moda e Mediana +1 DP +2 DP +3 DP x Áreas -1DP a +1DP

-2DP a +2DP

-3DP a +3DP

68,27% 95,45% 99,73% -1,96DP a +1,96DP

95% Média a 1DP

Média a 2 DP

Média a 3DP

34,13% 47,72% 49,86%

ESTATÍSTICA

ÁREAS DA CURVA NORMAL y 34,13% 47,72% -3 -2 -1 0 49,86% +1 +2 x +3 z

ESTATÍSTICA

ÁREAS DA CURVA NORMAL y 68,27% -3 -2 -1 95,45% 99,73% 0 +1 +2 x +3 z

ESTATÍSTICA

TABELA Z

ESTATÍSTICA

EXERCÍCIOS 1) O processo de fabricação de uma determinada empresa apresenta a média de peso de uma peça igual a 100g e desvio padrão de 1,5 g.

Qual é a proporção de peças entre 100 e 102g?

?

100 102 0 ? x z Z = (x - média) / desvio padrão = (102 - 100) / 1,5 = 1,33 na tabela qdo z = 1,33 a área é de 50% - 9,18% = 40,82%

ESTATÍSTICA

2) Calcule as seguintes proporções de peças: (a) com peso entre 98 e 102g (b) abaixo de 98g (c) acima de 102g (d) abaixo de 100g (e) abaixo de 95g

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

a DIAGRAMA DE DISPERSÃO Mostra o comportamento de duas variáveis quantitativas (com dados numéricos).

a a b b b

ESTATÍSTICA

CORRELAÇÃO LINEAR POSITIVA a Quando valores pequenos da variável com valores pequenos de b a tendem a estar relacionados , enquanto que valores grandes de a tendem a estar relacionados com valores grandes de b .

Exemplos: Peso x Altura Nível socioeconômico x Volume de vendas Consumo de Álcool x Preval. Cirrose Hepática b

ESTATÍSTICA

CORRELAÇÃO LINEAR NEGATIVA a Quando valores pequenos da variável com valores grandes de b a tendem a estar relacionados , enquanto que valores grandes de a tendem a estar relacionados com valores pequenos de b .

Exemplos: Renda Familiar x Número de Filhos Escolaridade x Absenteísmo Volume de vendas x Passivo circulante b

ESTATÍSTICA

a CORRELAÇÃO NÃO LINEAR O diagrama de dispersão mostra um conjunto de pontos aproximando-se mais de uma parábola do que de uma reta.

Exemplos: Coef. de Letalidade (a) x Dose do Medicamento (b) Custo (a) x Lote Econômico de Compra (b) b

ESTATÍSTICA

COEFICIENTE DE CORRELAÇÃO DE PEARSON

r = n .

S

(X.Y) n .

S

X

2

- (

S

X)

2

.

S

X .

S

Y n .

S

Y

2

- (

S

Y)

2

S

(X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a soma

S

X = Somatório dos valores da variável X

S

Y = Somatório dos valores da variável Y

S

X 2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma

S

Y 2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma

ESTATÍSTICA

EXEMPLO Cálculo do coeficiente de correlação para os dados das variáveis X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos.

X 101 193 .

.

.

42 1452 Y 3,2 4,6 .

.

.

2,8 39,3 X 2 Y 2 X . Y 10201 10,24 37249 .

.

.

1764 21,16 .

.

.

7,84 323,2 887,8 .

.

.

117,6 251538 153,55 5706,2

ESTATÍSTICA r = n .

S

(X.Y) n .

S

X

2

- (

S

X)

2

.

S

X .

S

Y n .

S

Y

2

- (

S

Y)

2

r = 12 . 5706,2 - 1452 . 39,3 12 . 251538 - (1452)

2

. 12 . 153,55 - (39,3)

2 r = 0,69 (Correlação Linear Positiva r > 0)

ESTATÍSTICA

INTERPRETAÇÃO

O Valor de r (Correlação Linear de Pearson) varia de -1 a +1.

O sinal indica o sentido (correlação positiva ou negativa).

O valor indica a força da correlação ( Fraca, Moderada ou Forte ) - 1 valor de r Forte Moderada Fraca Ausência Fraca Moderada Forte - 0,7 - 0,3 0 + 0,3 + 0,7 + 1

ESTATÍSTICA

EXERCÍCIO 1) Coloque V (Verdadeiro ou F (Falso): ( ) Quando o valor de r for maior que 0,7 ou menor que -0,7 a correlação entre as duas variáveis em estudo é forte ( ( ) O sinal negativo de r indica que as variáveis em estudo são inversamente proporcionais ( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que as variáveis sejam diretamente proporcionais.

) O coeficiente de correlação de Pearson pode ser aplicado em dados nominais

Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.

Retornar

ESTATÍSTICA

TESTES DE ASSOCIAÇÃO São Testes de Hipóteses para dados nominais H 0 (Hipótese Nula): Não existe associação entre as variáveis estudadas H 1 (Hipótese Alternativa): existe associação entre as variáveis estudadas Respondem um problema: (1) A propaganda está associada ao desempenho das vendas?

(2) Um método de treinamento está associado a produtividade?

(3) O número de horas de trabalho está associado ao estresse?

ESTATÍSTICA

TESTE DE ASSOCIAÇÃO QUI-QUADRADO É um teste não paramétrico. Símbolo:

2 É muito empregado em pesquisas sociais e de saúde.

A interpretação dos resultados é mais favorável quando são baseados em tabelas de contingência 2 x 2 (1 grau de liberdade).

Exemplo de uma tabela de contingência 2 x 2: Com Propaganda Sem Propaganda Aumento nas vendas Redução nas vendas 70 ( a ) 21 ( b ) 35 ( c ) 24 ( d )

ESTATÍSTICA

TESTE DE ASSOCIAÇÃO QUI-QUADRADO Cálculo do

2 em tabelas 2 x 2 com Correção de Continuidade.

2

= n . ( a . d - b . c - ( n / 2 ) )

2

( a + b ) . ( c + d ) . ( a + c ) . ( b + d )

O valor de

2 encontrado é transferido para uma tabela que fornecerá o valor de p (probabilidade de significância).

ESTATÍSTICA

Cálculo do exemplo: Propaganda x Desempenho das Vendas

2

= n . ( a . d - b . c - ( n / 2 ) )

2

( a + b ) . ( c + d ) . ( a + c ) . ( b + d )

2 = 150 . ( 70 . 24 - 21 . 35 - ( 150 / 2 ) ) 2 ( 70 + 21 ) . ( 35 + 24 ) . ( 70 + 35 ) . ( 21 + 24 )

2 = 4,475 p < 0,05 Há associação entre as variáveis

ESTATÍSTICA

TESTE DE ASSOCIAÇÃO QUI-QUADRADO Valores de p com 1 grau de liberdade (tabelas 2 x 2) p

2 0,250 0,100 1,32 2,71 0,050 0,025 0,010 0,005 0,001 3,84 5,02 6,63 7,88 10,8 Exemplos: Se for encontrado um valor de

2 = 6,63 o valor de p será 0,01 Se for encontrado um valor de

2 = 2,54 então 0,10 > p > 0,05

ESTATÍSTICA

INTERPRETAÇÃO

Quando

Aceita-se H 0

p > 0,05

(Hipótese Nula) Não há associação

Quando p < 0,05

Aceita-se H 1 (Hipótese Alternativa) Há associação Observações Comumente se adota 0,05 como nível de significância O Teste Exato de Fisher substitui o

2 em amostras muito pequenas A associação não deve ser confundida com relação causal

ESTATÍSTICA

EXERCÍCIOS 1) Uma pesquisa que tinha como objetivo verificar a existência de associação de algumas variáveis com o volume de vendas de um determinado produto encontrou os seguintes valores de

2:

2 = 9,88 para o índice de escolaridade

2 = 6,22 para o renda familiar

2 = 1,42 para o hábito de fumar Qual destas 3 variáveis mostrou-se mais fortemente associada com o volume de vendas e qual é o valor do seu p (probabilidade de significância)?

ESTATÍSTICA

2) Uma organização está tentando descobrir se um novo programa de treinamento do pessoal de vendas está associado a uma maior satisfação de sua clientela. Observe a seguinte tabela de contingência e tente responder essa dúvida.

Treinamento Novo Treinamento Clássico Clientes satisf Clientes Insatisf 41 103 37 106

Fonte Bibliográfica

     BARBETA, P. A.

Estatística Aplicada às Ciências Sociais.

5.ed. Florianópolis: UFSC, 2006.

DAWSON, B.; TRAPP, R.G.

Basic & Clinical Biostatistical.

3.ed. New York: Lange Medical Books/McGraw-Hill, 2006.

LEVIN, J.

Estatística Aplicada às Ciências Humanas.

7.ed. São Paulo: Harbra, 2007.

SPIEGEL, M. R.

Books, 2006.

Estatística.

8.ed. São Paulo: Makron STEVENSON, W. J.

Estatística Aplicada à Administração.

São Paulo: Harbra, 2007.

Retornar