Cursul 3 - medinfo.umft.ro

Download Report

Transcript Cursul 3 - medinfo.umft.ro

UNIVERSITATEA DE MEDICINA SI
FARMACIE “Victor Babeş” TIMISOARA
DISCIPLINA DE
INFORMATICA MEDICALA
http://moodle.umft.ro
1
CURSUL 3
2
BIOSTATISTICA
(I)
3
Capitolele biostatisticii
• Statistica elementară
–
–
–
–
–
Inferenta statistica
Statistica descriptiva - Parametrii statistici
Estimarea statistica
Teste statistice
Corelatia si regresia
• Aplicaţii speciale:
– Epidemiologie (Analiza riscului)
– Aplicaţii în demografie (Analiza supravietuirii)
– Sănătate publică (Statistica sanitară)
• Prelucrări avansate (Analiza clasificării etc)
4
1. INFERENTA STATISTICA
• 1.1. CONCEPTE GENERALE
– a) populatie, individ
– b) definitie:
– Biostatistica = stiinta estimarii caracteristicilor
unei populatii si/sau compararea populatiilor
– c) metode:
• recensamânt - toti indivizii; acelasi moment
• screening - numar mare; criterii de selectie
• esantionare - submultime a populatiei
5
– d) INFERENTA STATISTICA
• Definiţie: EXTINDEREA PROPRIETATILOR
DETERMINATE PE UN ESANTION LA
INTREAGA POPULATIE
– e) ESANTION REPREZENTATIV
• CRITERII:
– ECHIPROPBABILITATE
– INDEPENDENTA
6
f) METODE DE SELECTIE ÎN EŞANTION:
• SELECTIA SIMPLA
– NUMERE ALEATOARE ASOCIATE
• SELECTIA MULTISTRATIFICATA
• SELECTIA MIXTA
– CLUSTERE
7
• 1.2. VARIABILE
– a) DEFINITIE:
• o caracteristica a populatiei care este studiata
si masurata la toti indivizii din esantion
– b) TIPURI DE VARIABLE:
• NUMERICE
– măsurate cu un instrument
– se precizează unitatea de măsură
– tipuri: interval sau true zero
• ORDINALE
– scară convenţională, fără unităţi
– exprimă ordinea (ranguri)
• NOMINALE (calitative, “count data”)
8
• 1.3. ETAPELE STUDIULUI
– PROIECTARE
– COLECTAREA DATELOR
– PRELUCRARE
– PREZENTARE REZULTATE:
– tabele, grafice:
• Histograme (coloane, bare, 3D etc)
• Sectoare [“pie”] (in special pentru %)
• Linii [polygon]
• Puncte [“scatter]
• Hărţi
9
10
1.4. PROIECTAREA UNUI
STUDIU
• definirea populatiei
• selectia variabilelor
• acuratetea si precizia masurarilor
• dimensiunea esantionului
11
2. PARAMETRII
STATISTICI
12
• 2.1. EXEMPLU:
– studiul dezvoltarii copiilor
• populatia: copii de 10 ani, din
Timisoara, in 2004
• dimensiunea: 400 copii
• date colectate : inaltimea, in cm
• acuratetea : 1 cm
– tabel de date si histograma
13
TABEL şi HISTOGRAMA
14
Concluzii:
– valori extreme - rare
– valori centrale - mai des
• INDICATORI AI TENDINTEI
CENTRALE
– variabilitatea
• INDICATORI DE DISPERSIE
15
2.2. INDICATORII
TENDINTEI CENTRALE
A) Media aritmetică
B) Mediana
C) Moda
16
– a) MEDIA ARITMETICA (MEAN):


X   Xi  / N
 i1 
N
17
• b) MEDIANA (MEDIAN)
– VALOAREA CARE IMPARTE ESANTIONUL IN
DOUA PARTI EGALE
• Ex: pentru un numar par sau impar de elemente
• Recomandata pentru variable ordinale
• c) MODA (MODE)
– VALOAREA CEA MAI FRECVENTA
– CLASE MODALE
– DISTRIBUTII UNI~, BI~, MULTIMODALE
• recomandate pentru variable nominale
18
• d) POZITIA RELATIVA
–
–
–
–
–
DISTRIBUTII SIMETRICE :
X = Me = Mo
DISTRIBUTII ASIMETRICE (skew):
X = cea mai sensibila valoare
Mo = cea mai robusta (putin sensibila)
19
2.3. INDICATORI DE
DISPERSIE
A) Pentru variabile numerice
B) Pentru variabile ordinale
C) Pentru proporţii
20
A) Variabile numerice
a) DEVIAŢIA STANDARD (s)
b) VARIANŢA (s2)
c) COEFICIENTUL DE VARIAŢIE (cv)
 x  x 
2
s
i
n 1
cv  s x
21
d) DISTRIBUTIA NORMALA (GAUSS)
REPREZENTARE GRAFICA
22
e) Intervale definite cu “s”
xi  ( x  s, x  s); p  68%
xi  ( x  2s, x  2s); p  95%
xi  ( x  3s, x  3s); p  99.7%
• p = proportia indivizilor care au marimea in
intervalul respectiv
• p = probabilitatea ca un individ sa aiba marimea in
intervalul respectiv
EX: studiu inaltimea copiilor: n = 25 copii
m = 137 cm (ac=1)
s = 5 cm
23
f) Curba Gauss - Proprietăţi
( x   )2
1  2 2
f ( x)  y 
e
2
z
x

• Depinde de doi parametri:
– μ = media (populaţiei)
– σ = deviaţia standard (a populaţiei)
• Curba normalizată (funcţie de z)
– are media μ=0 si deviaţia standard σ=1
EX: studiu inaltimea copiilor: n = 25 copii
m = 137 cm (ac=1)
s = 5 cm
24
g) DISTRIBUTIA GAUSS
NORMALIZATA
25
B) Variabile ordinale (rang)
• QUANTILE – impartirea in “n” intervale
• CAZURI PARTICULARE
–
–
–
–
–
MEDIANA
QUARTILE
DECILE
CENTILE
PROMILE
n=2
n=4
n = 10
n = 100
n = 1000
• Calcul: dupa ordonare!
26
C) Variabile calitative (nominale)
• Proporţia Clasei:
pi = Ni / N (procentul … 100)
• Deviatia standard a proporţiei:
s p  pi qi / N
qi  1  pi
• pi – probabilitatea de a aparţine clasei
• qi – probabilitatea de a nu aparţine clasei
27
2.4. ASIMETRIE
(SKEWNESS)
– Coeficientul lui Pearson: a = (X-Mo)/s
– “coada” (tail) la dreapta sau la stanga
28
2.5. EXCES
(KURTOSIS)
• Exces: (b) – aplatizare, boltire
– (distributie leptokurtica, platikurtica)
29
- pauza 30