Transcript proteomika1
Bioinformatika - Proteomika Medzihradszky (Fölkl) Katalin Adjunct Professor of Pharmaceutical Chemistry, University of California San Francisco és Proteomikai Kutatócsoport, SzBK Csoportvezető, tudományos főmunkatárs e-mail: [email protected] vagy [email protected] Bioinformatika úgy általában • adatbázisok felépítése • ezen adathalmazok statisztikai analízise, matematikai értelmezése • szabályszerűségek meghatározása • szabályok hasznosítása – predikciók pl. funkcióra, rokonságra, eredetre, szerkezetre stb. Bioinformatika úgy általában • „összehordott” adatokból építkezünk • többnyire elmélet eleinte • a gyakorlati hasznosítás majd a végén jön • persze ez visszahat az elméletre Mit lehet kiaknázni? • • • • genomiális adatbázisok fehérje szekvencia adatbázisok fehérje 3D szerkezeti adatbázisok stb, stb Meghatározó faktor: Mennyire megbízhatóak az adatok? Proteomika A sejt fehérjetartalmának kvalitatív és kvantitatív jellemzése Mi van jelen? Mennyi? Milyen formában? Lokalizáció? Kölcsönhatások? Partnerek? A proteomika különleges jellege • nagyon is gyakorlati tudomány • adatokat produkálunk, amit informatika segítségével adatbázisokból értelmezünk • bővítjük/építjük az adatbázisokat, ill. új adatbázisokat hozunk létre • új bioinformatikai eszközöket fejlesztünk ki az eredmények alapján Problémák • állandó dinamikus változások • hatalmas mennyiségi különbségek • igen eltérő fizikai tulajdonságok/ vagy csak árnyalatnyi különbségek – ugyanannak a génnek a termékeire Még mindig „problémák” Poszt-transzlációs módosítások Idő-, faj-, állapot-, lokalizáció- stb. függő • permanens vs. dinamikus • teljes vs. részleges • jelentős vs. csekély méretváltozás • hidrofil • hidrofób Nem árt érteni a biológiához! Láthatóvá tenni a komplexitást... Frakcionálni kell ! 1D-, 2D-, multidimenziós módszerek Mi mindent kell meggondolni? • • • • • • Mennyire univerzális a módszer? Felbontása? Dinamikus tartománya? Követhetősége? Reprodukálhatósága? Kvantitatív-e? 1D-SDS-PAGE * Minden belemegy a gélbe, de kicsi a felbontás. 1 2 3 4 5 6 7 8 9 10 11 12 13 * Várhatóan fehérje-elegyeket kell analizálni. 14 15 16 17 18 19 2D-elfo 1. dimenzió: izoelektromos fókuszálás → pI szerint - pH 3-10 DE savas vagy bázikus fehérjék NEM fókuszálódnak membrán-fehérjék kicsapódnak – ionos detergens nem használható 2. dimenzió: SDS-PAGE 2 proteins 1. spot 7. spot 2 proteins 3 proteins 8. spot 3 proteins 5. spot 2. spot 2 proteins 1 protein 1 protein 9. spot 3. spot 1 protein 6. spot 4. spot 4 proteins pH: 3 4 5 6 7 8 9 10 Több példányban elkészítendő, statisztikai analízisre alkalmatos 2D-elfo másképpen 1. dimenzió: 16 BAC-PAGE (pozitív „fejű” detergens) 2. dimenzió: SDS-PAGE Minden belemegy a gélbe, de átlósan frakcionálódik – kis felbontás Speciális 2D elválasztás 16-BAC S D S Pros35 10/14 (71%) 33% Pros7 34/36 (94%) 63% Pros6 12/12 (100%)42% Pros28.1 14/21 (66%) 54% Pros29 19/23 (83%) 59% Pros2 13/15 (86%) 42% GC12000 13/14 (93%) 35% ProsMA5 22/44 (50%) 56% Pros25 12/15 (80%) 50% Pros3 18/24 (75%) 53% Pros26 6/15 (40%) Pros5 11/12 (92%) 26% GC17331 11/23 (47%) 46% l(2)05070 15/19 (79%) 72% 46% Festés • Commassie Brillian Blue – kvanti • Ezüst – érzékenyebb, de NEM kvanti Trükkök: • funkciós csoportra specifikus festés • differenciál festés 2D-kromatográfia 1. dimenzió: kation - ioncsere 2. dimenzió: fordított fázisú HPLC Követés: 215 nm-en → peptidkötés Nyilván semmi hidrofób nem érvényesül ilyen körülmények között... Reprodukálhatóság degradálódik az oszlop életkorával! Ki is kell találni mit is válogattunk szét! • Edman szekvenálás → N-terminuson blokkolt fehérjékkel, keverékkel nem megy • Western-blot → tudni kell, hogy mit keresünk, és kell jó ellenanyag alapötlet • Egy bizonyos fehérje adott specificitású enzimmel emésztve szekvenciájára jellemző hasítási termékeket fog produkálni • Ha a valóságos emésztményt az adatbázis „insilico” eredményeivel összevetjük azonosítani tudjuk a fehérjét Az összehasonlítás alapja csak valami biztosan megjósolható és egyértelműen meghatároztató tulajdonság lehet: TÖMEG A tömegspektrometria előnyei • alkalmazható keverékekre • blokkolt fehérjékre is • kovalens módosítások azonosíthatóak Detektálási érzékenység • Edman szekvenálás – kb. 1 pmól - 10-12 M • MS – kb. 5-50 fmól - 5x 10-15 - 10-14 M • Western blot – kevesebb, mint 10-15 M MS-alapú Proteomika • Fordított bioinformatika: mérési adatok + adatbázisok + algoritmusok → biológiai eredmények Tudni illik valamit az analitikai módszerről Mass Spectrometry 101 • Ionokat mérünk Matrix Assisted Laser Desorption Ionization Electrospray Ionization – többszörösen töltött ionok • Nagy vákuumban • quadrupole, Time-of-Flight, ioncsapda MS → MH+ adatok MS-MS alias CID, CAD, PSD ... → szekvencia info 1567.69 3000 2500 Monoizotópos tömeg csak C12, H1, N14, O16 and S32 ← 1 C13 2000 2 C13 1500 1000 500 0 1567 1568 1569 1570 1571 1567.69 3000 Felbontás: m/Dm = 1567.69/0.2 ~ 8000 2500 2000 1500 1000 500 0 1567 1568 1569 1570 1571 Miért is kell felbontás? Normál peptid, 1000-es felbontás Normál peptid, 10 000-es felbontás Br-Trp-tartalmú peptid, 1000-es felbontás Br-Trp-tartalmú peptid, 10 000-es felbontás 3+ töltésű peptid, kis felbontás 3+ töltésű peptid, nagy felbontás 492.26522 492.59948 Δ = 0.33426 = kb. 1/3 Tömegmérés pontossága 0.1 Da mérési hiba egész jó 2 kDa-nál, DE katasztrófális egy kis molekulánál Relatív értéket adjunk meg! pars per million Milyen pontosan tudunk mérni? belső standarddal 20 ppm-en belül ± 0.02 Da @ 1000 külső standarddal 200 ppm-en belül ± 0.2 Da @ 1000 intakt fehérjékre 0.1%-on belül ± 10 Da @ 10 000 Gyenge jeleknél nem érvényesül a Gauss eloszlás! Emésztési elegy MALDI-spektruma Peptidek ESIMS analízise 150 100 50 572.4 572.2 572.0 571.8 571.6 571.4 571.2 571.0 0 570.8 [1-45]Me3 m/z [1-45]AcMe [1-45]AcMe 2 & [1-45]Me [1-45]AcMe [1-45]Me 2 [1-45]Me Ion Counts 100 571.03(9+) 200 [1-45]Me3 150 250 Ion Counts 200 [1-45]AcMe3 [1-45]AcMe 2 [1-45]AcMe3 & [1-45]Me2 50 0 560 565 570 575 m/z 580 585 590 Intakt fehérjék MALDI-analízise 17010 7000 x4 6000 49170 21741 4000 34006 1000 31266 32167 27431 24585 2000 17912 3000 15696 Intensity 5000 0 20000 30000 40000 m/z 50000 Intakt fehérje ESI-analízise Ha ez így megy, minek egyáltalán emésztgetni? Miért nem mérjük az intakt fehérjéket? preparatív és interpretív akadályok Minta-előkészítés Legyen a fehérje hozzáférhető a hasításra: → denaturálás → diszulfid-hidak bontása Emésztés, kémiai hasítás Specifikus hasítások • tripszin - Lys↓ Arg ↓ • endoproteáz Lys-C - Lys ↓ • endoproteáz Glu-C - Glu ↓ (Asp ↓) • endoproteáz Asp-N - ↓Asp (↓Glu) pH kb. 7.5 - 8 • CNBr (+75 %-os TFA) - Met ↓ Egy nagyon praktikus software http://prospector.ucsf.edu Segít pl. mólsúly –számításban, „megjósolja” a hasítási vagy MS-MS termékeket ... „mindentudó”adatbázis-lekereső Az analízis • Egyben mérjünk vagy frakcionáljunk? MALDI vs ESIMS LC-MALDI LC-ESIMS Mennyire kellene pontosan mérni a peptideket ? MH+ = 1296.4 ± 0.3 ppm • 9 különböző aminosav-összetétel • 36292 különböző szekvencia • 3 különböző elemi összetétel Ile/Leu ThrVal/SerLeu GlyGlu/AlaAsp Miért kell még szekvencia info? • Keverékek • Kovalens módosítások • Izoformák • Splice variants • És ha nincs bent az adatbázisban? Hogyan tegyünk szert a szükséges információra? Feladat: → meghatározni a komponensek tömegét → egyet fizikailag elkülöníteni → „szétverni” Műszeres megoldás: tandem tömegspektrometria, ionkapu, ioncsapda Fragmentálás: post-source decay (PSD), ütközéses aktiválás (CID/CAD), elektronbefogás (ECD) Peptid fragmentáció NH2-CH(R1)-CO-NH-CH(R2)-CO~ ~CO-NH-CH(Rn)-COOH yn-1 (72) 159 256 371 534 Ala-Ser-Pro-Asp-Tyr-Arg 637 550 453 338 175 yn-2 b2 bn-1 y1 bi=S gyöksúly + 1 yi = S gyöksúly + 19 A fragmentáció módszer- és készülékfüggő! SHREK - Elméleti MALDI-CID spektrum – MS product 60.04 S 130.09 y1-NH3 276.16 y2 399.21 b3+H2O 528.25 b4+H2O 70.07 R 138.07 H 277.14 HR-NH3 406.18 HRE-NH3 552.29 y4-NH3 84.08 K 147.11 y1 286.15 RE 415.23 y3-NH3 556.26 m3 87.09 R 197.10 a2 294.17 HR 423.21 HRE 569.32 y4 100.09 R 207.09 b2-H2O 336.18 a3-NH3 432.26 y3 575.30 m2 101.11 K 225.10 b2 353.20 a3 465.22 a4-NH3 583.32 m4 102.06 E 258.16 RE-28 363.19 b3-H2O 482.25 a4 584.27 m5 110.07 H 259.13 y2-NH3 364.17 b3-NH3 492.23 b4-H2O 625.33 m1 112.09 R 266.17 HR-28 381.20 b3 493.22 b4-NH3 129.10 K 269.12 RE-NH3 395.22 HRE-28 510.24 b4 SHREK – elméleti ECD fragmensek 131.0946 z1 242.1253 c2 353.2050 a3 416.2383 z3 527.2690 c4 197.1039 a2 260.1372 z2 398.2264 c3 482.2476 a4 553.2972 z4 Elméleti „spektrum”: → lehetséges fragmensek, egyenlő intenzitással És egy valóságos spektrum 175.11 Arg 300 Ion Counts 250 GL V Val 171.07 a2 T b2 y5 TSG-H2O 187.10 159.10 TSGLD 516.31 228.09 474.19 b3-H2O 100 270.15 C* 141.09 SGLDS-28-H2O y3 327.17 210.08 118.02 50 Val 363.14 274.19 74.05 150 Gly GC*TS-28 y2 72.07 200 Asn Ala y1 414.20 345.23 396.19 y4 459.27 0 100 200 300 400 500 600 m/z 120 y7 Ser Ion Counts 100 precursor ion 702.43 y8 Asp 80 60 Leu y6 40 615.40 2+ y15 Gly Thr y10 Cys* 987.58 y9 730.91(2+) 20 Ser 832.92(2+) 817.45 930.55 y11 y12 1074.66 1175.76 Gly Thr y13 y14 1320.75 1377.74 0 600 800 1000 1200 m/z 1400 y15 1478.77 A proteomika „Achilles sarka”? Elméleti azaz megjósolt „adatokon” alapuló azonosítás bioinformatika = bio + informatika • Nem szabad elfelejtenünk, hogy biológiai mintákkal dolgozunk! • és kémiailag is aktív vegyületekkel! • Az algoritmus lehet tökéletes, csak a biológiai rendszer nem viselkedik! Megtörtént a frakcionálás, az emésztés...Jön az analízis! Mondjuk, MALDI MS-mérés frakcionálatlan, vagy HPLC után → egy jellemző (?) MH+ sorozat ↓ MS-Fit Peptide Mass Fingerprint – alapú fehérjeazonosítás Mi lehet a baj? → aspecifikus hasítás, kovalens módosítás, szennyezés stb. Nem mindig ilyen szép a menyasszony! • azaz a PMF-alapú azonosítást meg kell erősíteni MIÉRT??? – lásd előbb és később is... • a „vád tanúja”: az MS-MS kísérlet eredménye MS-MS eredményekkel is lehet keresgélni! Független PMF és MS-MS azonosítás az igazi! Elegánsabb az on-line LCMSMS A nanoHPLC oszlopról minden megy a tömegspektrométerbe (250 nL/min) ún. „adatfüggő” adatgyűjtés 1) MS mérés 2) Komputer kiválasztja a legintenzívebb iont 3) MS-MS mérés MS + MS-MS combined total ion curren MS MS-MS Lekeresés csak MS-MS adatokkal „script” – az összes MS-MS adatok megfelelő formába rendezve az egyes spektrumokkal független lekeresés az eredményeket viszont fehérjénként összegezzük Nem igazi adatokhoz, hanem az elméleti spektrumhoz hasonlítunk! Kovalens módosítások detektálása • szerencsés esetben találhatunk ilyet is automatizált MS-MS analízissel • lekereső programok lehetővé teszik a kovalens módosítások követését Túl sok variációs lehetőség rengeteg félreértelmezést okozhat ! Schistosoma mansoni proteomikája G. Knudsen, J.H McKerrow, UCSF * kb. 200 millió ember fertőződik évente, bőrön keresztül, fertőzött vízben * Átmeneti hordozó – Biomphalaria glabrata * Kulcs a fertőzéshez: a cercaria által kiválasztott enzim-keverék Egyszerű, jól ismert keverékkel van dolgunk... • a csigából kibújt féreg-növendékeket jól lemossuk • bőr-lipidekkel megindítjuk a kiválasztást • a fehérje-oldatot bekoncentráljuk • 1D SDS-PAGE fehérje-frakcionálásra • gélben emésztés tripszinnel • LC/MS/MS analízis Eksigent/Famous - 75 mm ID PepMap column; 300 nL/min flow; water/ACN/0.1% HCOOH mobile phase, gradient elution, QSTAR; 1 sec MS/3 sec CID; single charged and dynamic exclusion Mit találtunk? • cercaria felszíni fehérjéket • cercaria elasztázt és glikolitikus enzimeket • csiga immunválasz-fehérjéket • fotoszintézisben résztvevő fehérjéket • humán keratint • marha szérum albumint Honnan jött mindez? • • • • • • a cercaria külsejéről ez az igazi! – a kiválasztott fehérjék az átmeneti hordozóból a salátából, amit a csigák ettek – éheztessük őket? a technikus kezéről? hajából? a laborból mindenütt – lehet, hogy takarítani kellene? Új, hatásosabb izolálási módszer→ az elasztáz-aktivitás 40x-esére nőtt! Eddig csak kvali volt... Kvantitatív proteomika 1) a frakcionálás szintjén Pl. 2D gélek összehasonlítása vizuálisan, komputer programokkal, differenciál festéssel 2) az MS-analízis során Az MS NEM kvantitatív módszer * a különböző molekulák nem egyformán detektálhatók pl. különböző peptidek relatív intenzitása nem tükrözi relatív mennyiségüket * nem minden komponenst detektálunk az elegyekből Hogy lehet ezt legyőzni? csak nagyon hasonló peptidek relatív intenzitását vethetjük össze! 1) Jelöljünk két sejt-populációt hasonlóan, de megkülönböztethetően! 2) Keverjük össze az összes fehérjét! 3) A keveréket emésszük, analizáljuk! És így kvantizhatunk! Hogyan jelölhetünk? • ICAT – Cys-oldalláncának alkilezése, könnyű (H8) és nehéz (D8) alkilcsoporttal → amiben nincs Cys, az kiesik → a deuterált vegyület retenciós ideje kicsit hosszabb azonosítás: MS-MS alapon kvanti: MS-alapon relatív intenzitásokból ingadozás: van az 30% is! Hogyan jelölhetünk? • SILAC (stable isotope labeling) C13, N15, O18 tápanyaggal visszük be – jelölt aminosav → Olyat kell választani, ami nem alakulhat át más aminosavvá, illetve nem szintetizálódik a sejtben Tripszines emésztéshez Arg a menő! a keveréket frakcionáljuk, emésztjük, analizáljuk azonosítás MS-MS alapon kvanti a relatív intenzitásból Hogyan jelölhetünk? • tripszines emésztés H2O18-ban Két oxigén lép be, minden peptid jelölődik Rengeteg információ Még a szekvenálás is könnyebb, a Cterminális ionok csúsznak DE beszárítás a normál emésztés után, hosszú enzimes inkubáció... → veszteségek, nem specifikus hasítások Hogyan jelölhetünk? • iTRAQ ™ (Applied Biosystems) Nagyon ravasz jelölés! • amino-csoportra (N-terminus, Lys) • 4-féle stabil izotópos szerkezet, azonos additív tömeggel, de különböző fragmensekkel (m/z 114, 115, 116, 117) azonosítás és kvanti az MS-MS adatokból! iTRAQ jelölés 4 mintát kvantitatíve megkülönböztetni. Minden peptidet jelöl, a módosítottakat is Egyszerű a mintaelőkészítés Jelnövelő hatású (szuperponálódik a 4-féle jel) 20%-nál kisebb standard deviáció Jobb minőségű CID spektrumok Poszt-transzlációs változásokat is lehet így mérni! DRÁGA Ross et. al. MCP 2004 Mi ebből a tanulság?/ Take home message • Ha biológus vagy → eredj programozást és statisztikát tanulni • Ha matematikus vagy → irány a biológia • Ha proteomikával akarsz foglalkozni → tömegspektrometria sem árt Mi ebből a tanulság?/ Take home message • Mennyiben lehet biológiai folyamatokat statisztikailag/matematikailag elírni? • A komputer gyors, nem hibázik, „tanulékony”, de hülye... • Mi emberek ellenben képesek vagyunk felismerni a váratlant, az újat – feltéve, hogy használjuk az eszünket.... Minta kérdések • Mitől függ, mennyire jó egy adatbázis? • Mi az oka, hogy nincs tökéletesen működő adatbázis-lekereső szoftver? • Miért van szükség proteomikára? • Miért kell „jelölni” kvantitatív proteomikában? • Miért előnyös egy olyan jelölés, ami minden peptidet módosít? És valóban módosít-e minden peptidet? Hasznos web-oldalak ProteinProspector – http://prospector.ucsf.edu MS-BLAST - http://dove.emblheidelberg.de/Blast2/msblast.html BLAST - http://www.ncbi.nlm.nih.gov/BLAST/ European Bioinformatics Institute http://www.ebi.ac.uk/ Szekvencia-összehasonlítás – http://www.ebi.ac.uk/clustalw/index.html MS kezdőknek - „What is mass spectrometry” www.asms.org