Genetikai epidemiológia

Download Report

Transcript Genetikai epidemiológia

A biostatisztikai elemzés helye az orvostudományban III. A klinikai epidemiológia és populációgenetika alapfogalmai és az alkalmazott statisztikai módszerek Dr. Prohászka Zoltán

Az MTA doktora

Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2013-05-09 [email protected]

Epidemiológia

• A betegségek előfordulásának leírása, az okok feltárásának segítése

– A genetikai és környezeti tényezők együttes hatásának vizsgálata, ill. törekvés ezek közötti különbségtételre

• Genetikai epidemiológia: a betegségek esetleges öröklődésének vizsgálata, genetikai meghatározttságuk igazolása, feltárása

A genetikai epidemiológiai módszerekkel megválaszolható kérdések

• Van családi halmozódás? • Van arra utaló adat, hogy a betegség genetikai meghatározottságú? • Kimutatható valamely genetikai modell? • Hol található a betegséget meghatározó gén? • Mi a betegség keletkezésének mechanizmusa?

A(z genetikai) epidemiológia során használt fogalmak, módszerek, folyamatok

• Deskriptív epidemiológia: hipotézis generálás

Breast Cancer (C50), World Age-Standardised Incidence Rates, Females, World Regions, 2008 Estimates

http://info.cancerresearchuk.org/cancerstats/types/breast/incidence/uk-breast-cancer-incidence-statistics

Hipotézis generálás genetikai epidemiológiai adatokkal

• Nemzetközi variabilitás a fenotípusban – Életkorra illesztett incidencia és prevalencia adatok • Migrációs vizsgálatok – Környezeti és genetikai meghatározottság közötti különbségtételre ad lehetőséget • Rasszok, etnikumok és szocio-ökonomikus csoportok közötti különbségek elemzése • Admixture vizisgálatok (beházasodás) • Nemi különbségek – X és Y kromoszómához kötött betegségek, hormonális hatások, környezeti-viselkedési hatások • Életkor hatása – Családi halmozódású betegségforma általában hamarabb kezdődik, mint a sporadikus (pl. retinoblasztoma: two-hit model)

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia • Családi halmozódás: hipotézis alátámasztása

Genetic studies into inherited and sporadic hemolytic uremic syndrome Warwicker and Goodship, 1998

Családvizsgálatok

• Fenotípus: folytonos vagy diszkrét? • Családfa: – Nuclear family, beteg-pár, teljes család, ikrek és case control vizsgálat (pl. emlőrákosok rokonai vs. biztosan nem azok) • Gyakorlott kérdező és előzetes kérdéssor a biztosítéka a pontos adatok nyerésének • Ikervizsgálatok • Adoptációs vizsgálatok • Vérrokonság

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia • Családi halmozódás • Szegregációs vizsgálat: a genetikai modell tesztelése – A családok tagjain tett megfigyelések (fenotípus) alapján felépített genetikai modellek vizsgálata (molekuláris adatok nélkül) – Egy vagy több génes-e betegség? Öröklésmenet domináns, recesszív, ko-domináns, egyéb?

Washington University ( www )

Modes of inheritance

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia • Családi halmozódás • Szegregációs vizsgálat: a genetikai modell tesztelése • Linkage analízis • Asszociációs vizsgálat Fogékonysági vagy rizikó gének felismerésére alkalmas módszerek

ROCHE Genetic Education (www)

Differences between linkage and association Linkage Linkage is a property of loci Role: * To identify a biological mechanism for transmission of a trait * To locate the gene involved Coarse mapping (>1cM) No information about which allelic variant associated with higher risk of disease Require family pedigrees Use very polymorphic markers Association Association is a property of alleles Role: * To identify association between an allelic variant and a disease * To identify linkage disequilibrium between a disease allele and a marker Fine mapping (<1cM) Case-control or family based approach Usually bi-allelic markers

Linkage analízis

• Felhasznált elvek: – A különböző kromoszómákon található gének egymástól függetlenül szegregálódnak – Az egy kromoszómán található gének közötti fizikai távolság növekedésével a rekombináció valószínűsége nő • Érintett családok több tagjában is meghatározásra kerülnek polimorf, ismert lokalizációjú markerek • Rekombinációs események követhetőek, melyből a feltételezett lókusz pozíciója nagyjából meghatározható – LOD-score módszer (LOD: logarithm of likelihood ratio) – Beteg testvér módszer • Finomtérképezés – LD-map – Haplotipizálás, szekvenálás – Loss-of heterozygosity

Asszociációs vizsgálatok

• Populációs (case-control) • Családi (proband-parent trio, transmission disequlibrium test)

Odds Ratio: 3.6

95% CI = 1.3 to 10.4

ROCHE Genetic Education (www)

Milyen okok vezethetnek inkonzisztens eredményekhez asszociációs vizsgálatokban?

• Betegek (fenotípus) és kontrollok eltérő definiálása • Genetikai heterogenitás populációk között • Random error • Tervezési és kiertékelési különbségek – Fenotípus nem megfelelő definiálása (az is betegcsoportba kerül, aki valójában nem beteg) – Kontroll csoport nem megfelelő választása (betegek vagy rokonok is bekerülnek) – Alcsoport/ high-throughput analízis esetén a többszörös összehasonlítás eredményének korrekciója elmarad (Bonferroni) – Kis mintaszám – A replikációs vizsgálat mellőzése

Hum Genet.

1991 Apr;86(6):595-8.

A marked drop in the incidence of the null allele of the B gene of the fourth component of complement (C4B*Q0) in elderly subjects: C4B*Q0 as a probable negative selection factor for survival.

Kramer J , Fülöp T , Rajczy K , Nguyen AT , Füst G .

Department of Immunopathology, National Institute of Haematology and Blood Transfusion, Budapest, Hungary.

Ann N Y Acad Sci.

2003 Dec;1010:496-9.

An age-associated decrease in the frequency of C4B*Q0 indicates that null alleles of complement may affect health or survival.

Arason GJ , Bödvarsson S , Sigurdarson ST , Sigurdsson G , S , Kramer J , Füst G .

Thorgeirsson G , Gudmundsson Department of Immunology, Institute of Laboratory Medicine and Department of Medicine, Landspítali University Hospital, LSH Hringbraut, 101 Reykjavík, Iceland. [email protected]

A fenotípus….

A genetikai meghatározottság elemzése • genotype frequencies

allele frequencies

rr 200 white Rr R500 pink genotype frequencies: 200/1000 = 0.2 rr RR 300 red 500/1000 = 0.5 Rr 300/1000 = 0.3 RR total = 1000 flowers

Describing genetic structure

genotype frequencies • allele frequencies

200 rr = 400 r 500 Rr = 500 r = 500 R allele frequencies: 900/2000 = 0.45 r 300 RR = 600 R 1100/2000 = 0.55 R total = 2000 alleles

A Hardy-Weinberg elv

• Az aktuálisan evolúciós hatásnak ki nem tett populáció génkészlete több generáción keresztül egyensúlyban marad, azaz teljesül az elv • Feltételezve, hogy egy jelleget a lókusz p és q alléljei határoznak meg, érvényesül hogy • 1=p+q (allélfrekvenciák összege) • • • • • • Azaz a genotípusok eloszlására érvényes a következő összefüggés (Hardy-Weinberg egyenlet):

1.0 = p 2 + 2pq + q 2 p Ahol: 2

=

az AA genotípus gyakorisága 2pq q 2 = az Aa genotípus gyakorisága = az aa genotípis gyakorisága

A HW elv teljesülése

• A HW elv egy ideális helyzetre vonatkozik (modell) • A valós helyzet lényegesen eltér ettől • A HW elv ideálistól való eltérését okozzák – Ha az egyedek nem diploidok – Vannak ivartalan szaporodási események – A generációk átfedőek – A párválasztás nem véletlenszerű – A populáció mérete nem végtelen (korlátozott) – Az allélfrekvenciák eltérőek a nemekben – Van migráció, változik a mutációs ráta és szelekció érvényesül

A HW elv teljesülésének tesztelése kísérleteink, vizsgálataink során • • • Kötelező A kontroll minta genotípus eloszlásának adott pillanatban meg kell felelnie a HW egyensúlynak Ha egy minta genotípus eloszlása eltérést mutat a HW egyensúlytól, az több dologra utalhat: – Genotipizálási hiba (kontroll csík!!) – Mintavételezési hiba – Szelekciós, mutációs hatás vagy egyéb tényezők (rokonházasság, nem random párválasztás, migráció, nemi kapcsoltság) Írd ide a

vad/vad

genotípust hordozók számát: Írd ide a

vad/variáns

genotípust hordozók számát:

23 45

Írd ide a

variáns/variáns

genotípust hordozók számát: Összes vizsgált száma:

10

78 vad allél frekvenciája: 0,583333 variáns allél frekvenciája: 0,416667 Eltérés a HW-egyenlőségtől:

NEM

Chi négyzet próba, p= 0,256387 27 38 14 78 Várhatóan

vad/vad

genotípust hordozók száma Várhatóan

vad/variáns

genotípust hordozók száma Várhatóan

variáns/variáns

genotípust hordozók száma

Milyen analízist végezhetünk a különböző öröklésmenetű betegségek esetén?

A chi négyzet próba

• • Tegyük fel, hogy 200 személyt vontunk be vizsgáltunkba, a csoport fele beteg, míg másik fele képezte a kontrollt A 200 személy közül 50 esetében találtunk rizikó genotípust, míg 150 személynél nem. Csoport Nem rizikó genotípus Rizikó genotípus Beteg 100 Kontroll 100 150 50 200

A chi négyzet próba

• • Ha a rizikó genotípus és a betegség között nem állna fenn kapcsolat (azok

függetlenek

lennének), akkor a betegek és a kontrollok csoportjában az emberek 25 –25%-a esne a rizikó genotípus kategóriába (null-hipotézis). A várható előfordulási gyakoriságokat a táblázat széli gyakoriságaival (

marginal frequency

, a sorok és oszlopok összesített értékei) számíthatjuk ki, feltételezve, hogy ezek a számok adottak egy vizsgálatban. Csoport

Várható (expected) előfordulási gyakoriság

Beteg Nem rizikó genotípus 75 Rizikó genotípus 25 100 Kontroll 75 25 100 150 50 200

A megfigyelt gyakoriságok

• • • A chi négyzet teszt alapfeltevése az, hogy a várt és a megfigyelt eloszlási gyakoriságok között nincs különbség Ha a táblázat oszlopait és sorait meghatározó jellegzetességek egymással kapcsolatot mutatnak, akkor a várt és a megfigyelt eloszlások egymástól lényegesen eltérnek Az eltérés

mértékét

fejezi ki a chi négyzet értéke. Esetünkben a betegcsoportban jóval nagyobb a rizikógenotípus frekvenciája, mint a kontroll csoportban, vagyis levonhatjuk azt a következtetést, hogy a betegség kapcsolatban van a rizikó genotípussal, a chi-négyzet értéke utal a kapcsolat erősségére. Csoport

Megfigyelt (observed) előfordulási gyakoriság

Beteg Kontroll Nem rizikó genotípus Rizikó genotípus 60 40 100 90 10 100 150 50 200

A példa számaival végzett chi-négyzet próba eredménye Chi-négyzet: Szabadsági fok: p-értéke: Egy- vagy kétoldalas a p? 24,00 1 <0,0001 Két oldalas Relatív kockázat (RR) (95% CI) Esélyhányados (OR) (95% CI) 2,0 (1,57–2,54) 6,0 (2,79–12,91) Prospektív kohorsz Eset-kontroll

Az esélyhányados (odds ratio)

• A esélyhányados a kockázat becslésére szolgál, és leggyakrabban

eset-kontroll

tanulmányok során találkozunk alkalmazásával. • Az OR annak az esélye, hogy egy eseményt elszenvedett személy (beteg) a rizikófaktornak (rizikó allél) nem volt kitéve a rizikófaktornak

ki volt téve

, osztva annak az esélyével, hogy egy eseményt el nem szenvedett személy (kontroll) • Példánk eset-kontrollos vizsgálat volt (induláskor tudtuk ki beteg és ki a kontroll), így helyesen odds ratio-t lehet számolni • Példánkban 10* 60/40*90=6

A relatív kockázat (relative risk)

• A

relatív kockázat

, melynek jelölése általánosan

RR (relative risk

), mindig egy adott beteg csoport és egy adott kontroll csoport vonatkozásában fejezhető ki, és az adott betegségre vonatkozik. • Kiszámításakor a rizikóhatásnak kitett (exposed) és a ki nem tett (non exposed) csoportokban megfigyelt betegség incidenciákat osztjuk egymással. • A relatív kockázat a két csoport esemény rátáinak hányadosa. • Példánknál maradva, a betegség relatív rizikója 40/50 osztva 60/150 azaz 2. • Relatív rizikót prospektív kohorsz vizsgálatban lehet megállapítani (induláskor mindenki egészséges). • Példánkból helyesen nem lehet relative risket számolni

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia • Családi halmozódás • Szegregációs vizsgálat: a genetikai modell tesztelése • Linkage analízis • Asszociációs vizsgálat Fogékonysági vagy rizikó gének felismerésére alkalmas módszerek • Klónozott gének funkcionális vizsgálata

Szekvencia variációk

Egyedek közti különbség = 0.1% Mutáció < 1% < Polimorfizmus