Introducere in Biostatistica

Download Report

Transcript Introducere in Biostatistica

BIOSTATISTICA
Introducere în statistică
1
Scurt istoric
- Inițial "statistica" echivala cu descrierea statului, expunerea situaţiei
geografice, economice şi politice.
- A apărut la italieni unde încă din sec. XIII - XIV în Republica Veneţia se
elaborau rapoarte privitoare la partenerii săi comerciali, fiind utilizate în
politica comercială oficială.
- "Descrierea statului" a atins apogeul în sec. XVI- XVII când, în Germania, s-a
constituit o şcoală cunoscută sub denumirea de şcoala descriptivă germană.
- "Descrierea statului" a devenit disciplină de predare academică, încadrată
într-un sistem construit după norme teoretice şi practice, care s-au elaborat
şi dezvoltat în universităţile germane. Noua disciplină a primit numele de
statistică (Statistik).
- În sens matematic statistica este un instrument al matematicii utilizat pentru
prelucrarea şi interpretarea informaţiilor numerice.
Scopul statisticii
Scopul statisticii poate fi dedus din clasificarea acesteia:
- statistica descriptivă
- statistica analitică.
Statistica descriptivă se ocupă de prezentarea, clasificarea şi sintetizarea
datelor din observaţii. Aceasta prezinta informaţia existentă în datele
respective cu ajutorul indicatorilor statistici - numere ce exprimă caracteristici
sau tendinţe ale fenomenului studiat.
Statistica analitică (inferentiala) foloseşte teoria probabilităţilor pentru
extragerea şi prelucrarea informaţiei statistice; în multe cazuri aceste metode
pun în evidenţă legităţi statistice.
Biostatistica – statistica aplicata in medicina
Biostatistica – este ramura statisticii ce studiază aspectele legate de medicină
şi ocrotirea sănătăţii.
Obiectivele biostatisticii:
1. Starea sănătăţii populaţiei:
- Reproducerea şi mortalitatea populaţiei;
- Morbiditatea şi invaliditatea;
- Parametrii dezvoltării fizice.
2. Legătura dintre influenţa mediului ambiant şi factorilor sociali asupra
sănătăţii populaţiei.
3. Acumularea şi analiza datelor referitor la activitatea instituţiilor şi cadrelor
medicale.
4. Evaluarea eficacităţii metodelor de profilaxie şi tratament.
5. Planificarea, economia şi finanţarea ocrotirii sănătăţii.
Pornind de la obiective deosebim următoarele compartimente ale biostatisticii:
- Statistica sănătăţii populaţiei;
- Statistica ocrotirii sănătăţii;
- Statistica managementului de profilaxie, tratament şi altor activităţi în
medicină.
Biostatistica – scopuri
Descriptiv
(statistica
descriptivă): Inferenţial (statistica inferenţială):
evidențierea caracteristicilor importante Cum (şi când) generalizăm
ale unui set de date medicale.
rezultatele obţinute de la un
Metode:
eşantion la populaţia generală
• Organizarea
• Sumarizarea
• Caracterizarea unui set de date
Populaţia
Instrumente:
• Grafice:
– Distribuţia de frecvenţe
(histograma)
– Distribuţia de frecvenţe (histograma
diferenţelor pentru date perechi)
– Compararea grafică a distribuţiilor
Eşantionul
datelor
– Identificarea relaţiilor liniare
– Compararea relaţiilor liniare
Inferenta statistica
5
Metode de cercetare utilizate în biostatistică
Metoda observării
Urmărirea desfăşurării unor fenomene pentru a le putea analiza dinamica, sau
pentru compararea lor, in vederea realizarii sintezei caracteristicilor lor
esenţiale. Se realizează pe diferite căi:
• Statistică – se acumulează informaţia sub formă de valori numerice despre
schimbările fenomenului studiat sau activitatea organelor, instituţiilor
sanitare şi altor servicii pentru sănătate.
cercetarea integrală - a întregului volum numeric al colectivităţii - când avem
de a face cu un fenomen de apariţie rară, cu un număr mic de cazuri,
fenomen ce impune măsuri urgente sau când ne interesează determinarea
stării de sanatate a întregii populaţii;
cercetarea selectivă – se foloseşte mai des - urmăreşte studiul unui fenomen
cu o frecvenţă mai mare pe baza unei colectivităţi selective, cand este
nevoie de a studia aprofundat un aspect, un fenomen răspândit într-o
localitate sau un grup de populaţie.
• Aprecierea prin expertiză – fenomenul general este studiat pe fiecare aspect prin
intermediul experţilor. De exemplu, pentru bolnavii spitalizati, fiecare caz de boală
tratat în staţionar va fi studiat atat in decursul spitalizării cat si după externare pe
baza istoriei de boală. Experţii apreciază calitatea investigaţiilor, corectitudinea
diagnosticului şi tratamentului în fiecare caz concret de patologie. Datele
generalizate servesc la obtinerea unor coeficienţi de corijare a indicilor obţinuţi pe
cale statistică. În funcţie de timpul când se efectuează observarea delimităm:
- cercetarea curentă (permanentă, continuă) – când fenomenul studiat variaza rapid (zi
de zi, oră de oră). Astfel de cercetări se efectuează de regulă în secţiile de
reanimare, în maternitate sau in secţiile de boli infecţioase.
- cercetarea periodică (la anumite intervale de timp) – când fenomenul studiat variaza
lent, sau are o apariţie şi evoluţie periodică. De exemplu, se ştie că o parte din boli
evoluează în condiţii atmosferice specifice ale anului (gripa, virozele respiratorii,
unele boli infecţioase etc.). Ca urmare, cercetarea poate fi efectuată numai pe
parcursul acestor perioade de timp sau la sfârşitul lor. Astfel de cercetare se impune
în cazul unui volum mare al totalităţii (structura populaţiei după sex, vârstă,
ocupaţie, locul de trai etc.).
- cercetare la un moment critic – atunci când se fixează data şi chiar ora de înregistrare
a fenomenului studiat (recensământul populaţiei, înregistrarea personalului
medico-sanitar etc.).
Metoda epidemiologică
Sintetizează cele evidenţiate prin metoda observării şi prezintă un studiu
corelativ al fenomenelor din cadrul sănătăţii publice cu factorii de risc. Această
metodă, ca şi cea precedentă, foloseşte pe larg o serie de metode matematice
pentru a găsi legitatea dinamicii si structurii fenomenelor studiate în legătură
cu factorii ce le determină (valorile medii, dispersia, corelaţia, regresia etc.).
Metoda istorică
Este strâns legată cu primele două metode fundamentând studiul sanitar al
sănătăţii publice sau al activităţii serviciilor pentru sănătate în cadrul dezvoltării
istorice a societăţii. Este un fapt dovedit că gradul de dezvoltare a societăţii, în
trecut şi în prezent, determină nivelul de trai al populaţiei, calitatea vieţii deci
şi sănătatea ei. Aici mai des se foloseşte metoda comparării aceluiaşi fenomen
raportat la diferitele categorii de populaţie, diferenţiate după sex, grupuri
sociale, vârstă, ocupaţii etc. sau teritorii (continente, ţări, regiuni, localităţi)
studiate acum şi în trecut.
Metoda economică
Precizează starea de sănătate publică, determinată de prezenţa surselor
băneşti, materiale, economice etc. Această metodă se foloseşte la aprecierea
eficacităţii activităţii serviciilor pentru sănătatea populaţiei (din punct de
vedere social şi economic) în cadrul medicinii de stat şi private.
Metoda experimentală
Urmăreşte scopul de a elabora şi aproba noi forme şi metode de organizare al
asistenţei medicale, aplicarea în practică a experienţei înaintate, verificarea
noilor metode de diagnosticare şi tratament etc. Specificul acestei metode
constă în aceea că cercetătorul singur îşi „creează” obiectul şi metoda de
cercetare, reproducând astfel fenomenele sau aspectele ce-l interesează în
condiţii de laborator, apoi analizând totul în detaliu conform scopului stabilit.
În general, în orice studiu statistic nu se foloseşte numai o metodă izolată de
cercetare. Pentru o investigare multilaterală a fenomenului, cercetătorul
trebuie să decidă ce metode se impun.
Metode de colectare a datelor statistice
Pot fi divizate în două grupe mari:
Grupa directă (datele se obtin prin observarea directa a fenomenului):
• Metoda observării
• Anchetare
• Interviu
• Monitorizare
Grupa indirectă - datele se extrag din documentaţia medicală).
Cel mai des sunt folosite:
1. Metoda observării (directă - se utilizează de obicei în clinică): medicul, după ce face
anamneza bolnavului, face studiul obiectiv şi investigaţiile de laborator ale pacientului,
înregistrează în fişă aceste date.
2. Metoda extragerii informaţiei dintr-un formular statistic (indirectă), care poate fi:
– fişa medicală a bolnavului de staţionar
- fişa medicală a bolnavului de ambulator
- raport statistic privind numărul de maladii înregistrate la bolnavii domiciliaţi în
teritoriul de deservire a instituţiei etc.
3. Metoda de anchetare - utilizează informaţia prin intermediul unor anchete, anterior
pregătite, care includ întrebări speciale. Această metodă se foloseşte în studiile
sociologice, dar poate fi aplicată şi în orice studiu statistic sanitar.
Noţiuni de bază în biostatistică
În biostatistică sunt cunoscute următoarele noţiuni de bază:
• colectivitatea (populatia) statistică
• unitatea de observare
• variabila statistică
• indicatori statistici
• date statistice
11
Colectivitatea (populatie) statistică
Colectivitatea statistica reprezintă un număr de elemente (unităţi de observare)
omogene, luate împreună în baza unui factor comun în anumită perioadă de timp şi
spaţiu. Numărul de unităţi de observare determină volumul colectivitatii supuse
studiului şi se notează prin litera „n”. După volum deosebim două tipuri de colectivitati
statistice:
• Colectivitatea integrală
• Colectivitatea selectivă
Metodele de selectare a colectivității selective:
- Cercetarea prin sondaj - valoarea rezultatelor depinde de efectuarea corectă. Nu
permite să se tragă concluzii generale, valabile pentru colectivitatea integrală, fiind
mai mult o metodă de investigaţie preliminara unui studiu de mare volum. De obicei se
efectuează pe baza unui eşantion mic.
- Cercetarea monografică - limitarea volumului eşantionului e completată cu o
aprofundare a cercetării caracteristicilor esenţiale, de exemplu în cazul unui examen
medical clinic cu un scop bine determinat (stabilirea gradului de răspândire al unei boli
sau al unui grup de boli din aceeaşi clasă). Tot astfel de cercetări pot fi aplicate pe un
eşantion mic după spaţiu, dar majorat în volum după timp (studiul natalităţii,
mortalităţii pe o perioadă de mai mulţi ani într-o strânsă legătură cu factorii socialeconomici, sanitaro-igienici).
12
- Cercetarea selectivă – studiul selectiv reprezentativ pentru colectivitatea
integrală şi care poate fi efectuat prin selecţia:
- aleatorie - se efectuează prin extrageri din liste în care sunt înregistrate
toate cazurile individuale fără nici o grupare sistemică prealabilă.
- sistemică –fiecare unitate de observaţie are şanse egale să fie aleasă.
Pentru selecţie cazurile de evidenţă sunt ordonate în ordine alfabetică şi se
selectează fiecare a 4-a, a 6-a ori a 10-a, în funcţie de pasul de numărare.
În acest mod se obţine o selecţie uniformă. Intervalul se calculează astfel
ca eşantionul să cuprindă 5 până la 10% din colectivitatea integrală.
- stratificată – urmăreşte selectarea unităţilor de observaţie din grupurile
tipice ale colectivitatii integrale. Toate unităţile de observare se grupează
după anumite caracteristici tipice (vârstă, sex sau după intensitatea
frecvenţei fenomenului). Din fiecare grup, pe cale aleatorie sau sistemica,
este selectat un anumit număr de unităţi astfel ca raportul după
caracteristici în eşantion să fie acelaşi ca şi în totalitatea integrală.
- în clustere –din colectivitatea integrală se selectează serii de unităţi
individuale care sunt ulterior examinate în întregime.
Distribuţia datelor în colectivitatea selectivă
Poate fi:
• Alternativa
• Asimetrica (pe stanga)
• Simetrica
• Asimetrica (pe dreapta)
• Asimetrica (bimodala)
Unitatea de observare statistica
Element component al colectivităţii statistice, purtător al tuturor trăsăturilor
comune ale colectivităţii supuse studiului.
Variabila statistică
Proprietatea comună unităţilor de observaţie care variază ca valoare de la o
unitate la alta. Variabilele statistice pot fi clasificate după:
• Modul de exprimare:
- calitative (nominative), exprimate în cuvinte: profesie, culoarea părului,
culoarea tegumentelor, starea la externare a unui bolnav, etc.;
- cantitative (numerice), exprimate în cifre: înălţime, greutate, tensiune
arterială, puls, temperatură, etc.
- continue (măsurabile); pot lua orice valoare din scara lor de variaţie:
greutatea unei persoane, înălţimea, temperatura, etc.;
- discrete (numarabile); pot lua numai valori întregi: numărul de copii, numărul
de persoane, număr de medici, număr de vizite, etc;
• Modul de obţinere:
- primare, obţinute în etapa de colectare a datelor;
- derivate, obţinute în procesul prelucrării datelor statistice
Indicatori statistici
Sunt expresia numerică a unor fenomene, procese sau categorii economice şi
sociale, definite în timp, spaţiu şi structură organizatorică. Funcţiile lor sunt:
• funcţia de măsurare;
• funcţia de comparare;
• funcţia de analiză;
• funcţia de sinteză;
• funcţia de estimare;
• funcţia de verificare a ipotezelor.
Indicatorii statistici pot fi cu valori: absolute, relative şi medii.
Valorile relative sunt rata (frecventa), raportul şi proporţia (ponderea).
Rata (frecventa)
Arată cât de des evenimentul respectiv (naşteri, îmbolnăviri, decese) apare în
populaţie. Componentele ratei sunt:
• Numărător: numărul de evenimente observate;
• Numitor: populaţia în care evenimentele au loc;
• Timpul specificat când au loc evenimentele;
• Un multiplicator (transformă rata dintr-o fracţie într-un număr întreg)
Tipurile de rate sunt:
• brute
• specifice
Raportul
Permite compararea a doua colectivitati, prin împărţirea a doua numere.
Exemplu: raport dintre bărbaţi şi femei, naşteri şi avorturi, nr. de medici şi
asistente medicale. În aceste cazuri nu este necesară o relaţie specifică între
numărător şi numitor.
Proporţia (ponderea)
Indica fracţiunea populaţiei afectată de fenomenul studiat. Caracteristicile de
bază sunt:
• coeficientul a 2 numere;
• valoarea numărătorul este inclusa în valoarea numitorului;
• o proporţie întotdeauna ia valori între 0 şi 1 sau între 0 şi 100%.
Exemplu de proporţie:
În anul 2006 în Romania au fost inregistrati ca invalizi 7695 bărbaţi şi 6005
femei. Care este procentul femeilor din numărul total?
Exemplu de rate si ponderi:
Numarul de cazuri de imbolnaviri in functie de varsta si zona geografica
Observatie:
O comparatie poate fi facuta numai cu ajutorul indicatorilor tip rata
Seria statistică de variaţie
Este şirul de valori numerice ale variabilelor statistice luate in considerare,
ordonate crescător sau descrescător în funcţie de mărimea acestora.
Seria statistică reprezintă corespondenţa a două şiruri, cel al valorilor
variantelor (x) şi cel al frecvenţelor (f), motiv pentru care se mai numeşte şi
serie de distribuţie/serie de frecvenţe. Suma frecvenţelor variantelor
corespunzătoare corespunde cu numărul de cazuri cercetate (Σf = n).
Cerinţele de bază pentru formarea seriei de variaţie:
1. Ordonarea valorilor variantelor;
2. Numărarea frecvenţelor fiecărei variante;
3. Reprezentarea grafică a seriei de variaţie.
Proprietăţile seriilor de variaţie
sunt:
- tendinţa centrală
- variabilitatea
- forma distribuţiilor
Indicatorii tendinţei centrale sunt:
- media aritmetică
- media armonică
- media cronologică
- media pătratică
- media geometrică
Mărimile medii sunt mărimi tipice, caracteristice, ce definesc un fenomen
variabil.
În cercetările care privesc starea de sănătate a populaţiei, de un interes
deosebit este cunoaşterea comparativă a fenomenelor studiate faţă de un
etalon, mărimea medie. Aceasta are aceleaşi dimensiuni cu ale variabilei a
cărei repartiţie de frecvenţe o caracterizează. Astfel dacă variabila priveşte
înălţimea în cm a nou născutului şi mărimea medie va fi masurata tot în cm.
Media aritmetică simplă
Este valoarea medie care se obţine din suma valorilor individuale dintr-o
colectivitate omogenă, divizată la numărul total al cazurilor studiate.
Media aritmetică simplă se utilizează pentru a stabili valoarea medie în seriile
statistice în care fiecărei valori a variantei îi corespunde o singură frecvenţă.
Formula de calcul:
Exemplu de calcul:
Greutatea la naştere la un număr de 6 copii de sex masculin este (în grame):
3000; 2600; 2800; 3100; 3200; 2700.
Aplicând formula de calcul se obţine media greutăţii, la naştere, la lotul de 6
copii, de 2900 gr.
Media aritmetică ponderată
Media aritmetică ponderată este valoarea medie care se obţine din suma
produsului valorilor dintr-o colectivitate omogenă, cu frecvenţele
corespunzătoare, divizată la numărul total al cazurilor studiate. Media
aritmetică ponderată se utilizează în calcularea valorii medii în cazul în care
valorile individuale au frecvenţe diferite. În acest caz media aritmetică simplă
nu se poate utiliza.
Formula de calcul:
Exemple de calcul:
Varsta medie
Într-un spital, medicii prezintă următoarea distribuţie conform vârstei: 40 persoane de 37
ani; 40 persoane de 38 ani; 10 persoane de 41 ani şi 10 persoane de 44 ani.
Aplicând formula de calcul, vom obţine vârsta medie a personalului, de 38,5 ani:
Durata medie de spitalizare
Media armonică
Media armonică se determină ca valoarea inversă a mediei aritmetice calculată
din inversele valorilor seriei.
Media armonică simplă
Exemple
Fie valorile: 1, 5, 10. Care este valoarea medie?
Trei investiţii produc acelaşi venit. Valorile lor sunt:
5%, 10% şi 15% , care este media de plasare a capitalului pentru toate trei?
Media armonică ponderata
Exemple
Mortalitatea generală din 3 localităţi rurale este de 8‰, 9‰ şi 10‰, iar
numărul de locuitori 4000, 4500 şi 7000 şi nu cunoaştem cifrele absolute de
decedaţi, media aritmetică simplă este de 9‰ în timp ce media armonică,
ponderând valorile relative cu populaţia la care se referă, va fi 9,12‰:
Media cronologică
Media cronologică se calculează în cazul unei serii de valori, care prezintă
variaţii în timp (lunare, anuale).
Formula de calcul:
unde:
X(1, 2, 3, 4, n) – mărimea valorilor la începutul primei perioade şi sfârşitul
celor patru perioade;
N – numărul de perioade la care ne referim
Exemplu:
numărul de gravide în evidenţă la medicul de familie la început de an a fost
120, iar la sfârşitul celor patru trimestre – 130, 144,152, 100. Conform mediei
aritmetice simple, ar fi fost 129 gravide, în timp ce media cronologică este de
134, conform formulei:
Media pătratică
Este tot o medie de calcul cu aplicaţii speciale şi reprezintă valoarea care,
înlocuind termenii seriei, nu modifică suma pătratelor lor.
Media pătratică simplă :
Media pătratică ponderata:
Modulul
Este mărimea medie care corespunde valorii cu cele mai multe frecvenţe. Se
calculeaza luând valoarea cu frecvenţă maximă drept valoare medie.
Exprimă mărimea cu cea mai mare pondere, deci caracteristica determinantă.
Se calculează după formula:
XMo – limita inferioară a intervalului modal;
h – mărimea intervalului modal (cu frecvenţa cea
mai mare);
Δ1 – diferenţa dintre frecvenţa intervalului modal şi
a intervalului precedent;
Δ2 – diferenţa dintre frecvenţa intervalului modal şi
a intervalului următor;
Exemplu de calcul:
Fie distributia:
Intervalul modal (zona cu frecventa maxima - cele mai multe valori) este 1.000 – 1.200