Transcript proteomika1

Bioinformatika - Proteomika
Medzihradszky (Fölkl) Katalin
Adjunct Professor of Pharmaceutical Chemistry,
University of California San Francisco
és
Proteomikai Kutatócsoport, SzBK
Csoportvezető, tudományos főmunkatárs
e-mail: [email protected] vagy
[email protected]
Bioinformatika úgy általában
• adatbázisok felépítése
• ezen adathalmazok statisztikai
analízise, matematikai értelmezése
• szabályszerűségek meghatározása
• szabályok hasznosítása – predikciók pl.
funkcióra, rokonságra, eredetre,
szerkezetre stb.
Bioinformatika úgy általában
• „összehordott” adatokból építkezünk
• többnyire elmélet eleinte
• a gyakorlati hasznosítás majd a végén
jön
• persze ez visszahat az elméletre
Mit lehet kiaknázni?
•
•
•
•
genomiális adatbázisok
fehérje szekvencia adatbázisok
fehérje 3D szerkezeti adatbázisok
stb, stb
Meghatározó faktor:
Mennyire megbízhatóak az adatok?
Proteomika
A sejt fehérjetartalmának
kvalitatív és kvantitatív
jellemzése
Mi van jelen? Mennyi? Milyen formában?
Lokalizáció? Kölcsönhatások? Partnerek?
A proteomika különleges jellege
• nagyon is gyakorlati tudomány
• adatokat produkálunk, amit informatika
segítségével adatbázisokból
értelmezünk
• bővítjük/építjük az adatbázisokat, ill. új
adatbázisokat hozunk létre
• új bioinformatikai eszközöket
fejlesztünk ki az eredmények alapján
Problémák
• állandó dinamikus változások
• hatalmas mennyiségi különbségek
• igen eltérő fizikai tulajdonságok/ vagy
csak árnyalatnyi különbségek –
ugyanannak a génnek a termékeire
Még mindig „problémák”
Poszt-transzlációs módosítások
Idő-, faj-, állapot-, lokalizáció- stb. függő
• permanens vs. dinamikus
• teljes vs. részleges
• jelentős vs. csekély méretváltozás
• hidrofil
• hidrofób
Nem árt érteni a biológiához!
Láthatóvá tenni a komplexitást...
Frakcionálni kell !
1D-, 2D-, multidimenziós módszerek
Mi mindent kell meggondolni?
•
•
•
•
•
•
Mennyire univerzális a módszer?
Felbontása?
Dinamikus tartománya?
Követhetősége?
Reprodukálhatósága?
Kvantitatív-e?
1D-SDS-PAGE
* Minden belemegy a gélbe, de
kicsi a felbontás.
1
2
3
4
5
6
7 8
9
10
11
12
13
* Várhatóan fehérje-elegyeket
kell analizálni.
14
15
16
17
18
19
2D-elfo
1. dimenzió: izoelektromos fókuszálás
→ pI szerint - pH 3-10
DE
savas vagy bázikus fehérjék NEM fókuszálódnak
membrán-fehérjék kicsapódnak
– ionos detergens nem használható
2. dimenzió: SDS-PAGE
2 proteins
1. spot
7. spot
2 proteins
3 proteins
8. spot
3 proteins
5. spot
2. spot
2 proteins
1 protein
1 protein
9. spot
3. spot
1 protein
6. spot
4. spot
4 proteins
pH:
3
4
5
6
7
8
9
10
Több példányban elkészítendő, statisztikai analízisre alkalmatos
2D-elfo másképpen
1. dimenzió: 16 BAC-PAGE
(pozitív „fejű” detergens)
2. dimenzió: SDS-PAGE
Minden belemegy a gélbe, de átlósan
frakcionálódik – kis felbontás
Speciális 2D elválasztás
16-BAC
S
D
S
Pros35
10/14 (71%) 33%
Pros7
34/36 (94%) 63%
Pros6
12/12 (100%)42%
Pros28.1
14/21 (66%) 54%
Pros29
19/23 (83%) 59%
Pros2
13/15 (86%) 42%
GC12000
13/14 (93%) 35%
ProsMA5
22/44 (50%) 56%
Pros25
12/15 (80%) 50%
Pros3
18/24 (75%) 53%
Pros26
6/15 (40%)
Pros5
11/12 (92%) 26%
GC17331
11/23 (47%) 46%
l(2)05070
15/19 (79%) 72%
46%
Festés
• Commassie Brillian Blue – kvanti
• Ezüst – érzékenyebb, de NEM kvanti
Trükkök:
• funkciós csoportra specifikus festés
• differenciál festés
2D-kromatográfia
1. dimenzió: kation - ioncsere
2. dimenzió: fordított fázisú HPLC
Követés: 215 nm-en → peptidkötés
Nyilván semmi hidrofób nem érvényesül
ilyen körülmények között...
Reprodukálhatóság degradálódik az oszlop
életkorával!
Ki is kell találni mit is válogattunk szét!
• Edman szekvenálás
→ N-terminuson blokkolt fehérjékkel,
keverékkel nem megy
• Western-blot
→ tudni kell, hogy mit keresünk, és kell jó
ellenanyag
alapötlet
• Egy bizonyos fehérje adott specificitású
enzimmel emésztve szekvenciájára jellemző
hasítási termékeket fog produkálni
• Ha a valóságos emésztményt az adatbázis „insilico” eredményeivel összevetjük azonosítani
tudjuk a fehérjét
Az összehasonlítás alapja csak valami biztosan
megjósolható és egyértelműen
meghatároztató tulajdonság lehet:
TÖMEG
A tömegspektrometria előnyei
• alkalmazható keverékekre
• blokkolt fehérjékre is
• kovalens módosítások azonosíthatóak
Detektálási érzékenység
• Edman szekvenálás – kb. 1 pmól - 10-12 M
• MS – kb. 5-50 fmól - 5x 10-15 - 10-14 M
• Western blot – kevesebb, mint 10-15 M
MS-alapú Proteomika
• Fordított bioinformatika:
mérési adatok + adatbázisok +
algoritmusok → biológiai eredmények
Tudni illik valamit az analitikai módszerről
Mass Spectrometry 101
• Ionokat mérünk
Matrix Assisted Laser Desorption Ionization
Electrospray Ionization – többszörösen töltött ionok
• Nagy vákuumban
• quadrupole, Time-of-Flight, ioncsapda
MS → MH+ adatok
MS-MS alias CID, CAD, PSD ...
→ szekvencia info
1567.69
3000
2500
Monoizotópos tömeg
csak C12, H1, N14, O16 and S32
← 1 C13
2000
2 C13
1500
1000
500
0
1567
1568
1569
1570
1571
1567.69
3000
Felbontás: m/Dm = 1567.69/0.2
~ 8000
2500
2000
1500
1000
500
0
1567
1568
1569
1570
1571
Miért is kell felbontás?
Normál peptid, 1000-es felbontás
Normál peptid, 10 000-es felbontás
Br-Trp-tartalmú peptid, 1000-es felbontás
Br-Trp-tartalmú peptid, 10 000-es felbontás
3+ töltésű peptid, kis felbontás
3+ töltésű peptid, nagy felbontás
492.26522
492.59948
Δ = 0.33426 = kb. 1/3
Tömegmérés pontossága
0.1 Da mérési hiba egész jó 2 kDa-nál,
DE katasztrófális egy kis molekulánál
Relatív értéket adjunk meg!
pars per million
Milyen pontosan tudunk mérni?
belső standarddal 20 ppm-en belül
± 0.02 Da @ 1000
külső standarddal 200 ppm-en belül
± 0.2 Da @ 1000
intakt fehérjékre 0.1%-on belül
± 10 Da @ 10 000
Gyenge jeleknél nem érvényesül a Gauss eloszlás!
Emésztési elegy MALDI-spektruma
Peptidek ESIMS analízise
150
100
50
572.4
572.2
572.0
571.8
571.6
571.4
571.2
571.0
0
570.8
[1-45]Me3
m/z
[1-45]AcMe
[1-45]AcMe 2
& [1-45]Me
[1-45]AcMe
[1-45]Me 2
[1-45]Me
Ion Counts
100
571.03(9+)
200
[1-45]Me3
150
250
Ion Counts
200
[1-45]AcMe3
[1-45]AcMe 2
[1-45]AcMe3
& [1-45]Me2
50
0
560
565
570
575
m/z
580
585
590
Intakt fehérjék MALDI-analízise
17010
7000
x4
6000
49170
21741
4000
34006
1000
31266
32167
27431
24585
2000
17912
3000
15696
Intensity
5000
0
20000
30000
40000
m/z
50000
Intakt fehérje ESI-analízise
Ha ez így megy, minek
egyáltalán emésztgetni?
Miért nem mérjük az intakt
fehérjéket?
preparatív és interpretív akadályok
Minta-előkészítés
Legyen a fehérje hozzáférhető a
hasításra:
→ denaturálás
→ diszulfid-hidak bontása
Emésztés, kémiai hasítás
Specifikus hasítások
• tripszin - Lys↓ Arg ↓
• endoproteáz Lys-C - Lys ↓
• endoproteáz Glu-C - Glu ↓ (Asp ↓)
• endoproteáz Asp-N - ↓Asp (↓Glu)
pH kb. 7.5 - 8
• CNBr (+75 %-os TFA) - Met ↓
Egy nagyon praktikus software
http://prospector.ucsf.edu
Segít pl. mólsúly –számításban,
„megjósolja” a hasítási vagy MS-MS
termékeket ...
„mindentudó”adatbázis-lekereső
Az analízis
• Egyben mérjünk vagy frakcionáljunk?
MALDI vs ESIMS
LC-MALDI
LC-ESIMS
Mennyire kellene pontosan mérni
a peptideket ?
MH+ = 1296.4 ± 0.3 ppm
• 9 különböző aminosav-összetétel
• 36292 különböző szekvencia
• 3 különböző elemi összetétel
Ile/Leu ThrVal/SerLeu GlyGlu/AlaAsp
Miért kell még szekvencia info?
• Keverékek
• Kovalens módosítások
• Izoformák
• Splice variants
• És ha nincs bent az adatbázisban?
Hogyan tegyünk szert a
szükséges információra?
Feladat:
→ meghatározni a komponensek tömegét
→ egyet fizikailag elkülöníteni
→ „szétverni”
Műszeres megoldás: tandem
tömegspektrometria, ionkapu, ioncsapda
Fragmentálás: post-source decay (PSD),
ütközéses aktiválás (CID/CAD), elektronbefogás (ECD)
Peptid fragmentáció
NH2-CH(R1)-CO-NH-CH(R2)-CO~ ~CO-NH-CH(Rn)-COOH
yn-1
(72) 159 256 371 534
Ala-Ser-Pro-Asp-Tyr-Arg
637 550 453 338 175
yn-2
b2
bn-1
y1
bi=S gyöksúly + 1
yi = S gyöksúly + 19
A fragmentáció módszer- és készülékfüggő!
SHREK - Elméleti MALDI-CID spektrum – MS product
60.04
S
130.09
y1-NH3
276.16
y2
399.21
b3+H2O
528.25
b4+H2O
70.07
R
138.07
H
277.14
HR-NH3
406.18
HRE-NH3
552.29
y4-NH3
84.08
K
147.11
y1
286.15
RE
415.23
y3-NH3
556.26
m3
87.09
R
197.10
a2
294.17
HR
423.21
HRE
569.32
y4
100.09
R
207.09
b2-H2O
336.18
a3-NH3
432.26
y3
575.30
m2
101.11
K
225.10
b2
353.20
a3
465.22
a4-NH3
583.32
m4
102.06
E
258.16
RE-28
363.19
b3-H2O
482.25
a4
584.27
m5
110.07
H
259.13
y2-NH3
364.17
b3-NH3
492.23
b4-H2O
625.33
m1
112.09
R
266.17
HR-28
381.20
b3
493.22
b4-NH3
129.10
K
269.12
RE-NH3
395.22
HRE-28
510.24
b4
SHREK – elméleti ECD fragmensek
131.0946
z1
242.1253
c2
353.2050
a3
416.2383
z3
527.2690
c4
197.1039
a2
260.1372
z2
398.2264
c3
482.2476
a4
553.2972
z4
Elméleti „spektrum”:
→ lehetséges fragmensek, egyenlő intenzitással
És egy valóságos spektrum
175.11
Arg
300
Ion Counts
250
GL
V
Val
171.07
a2
T
b2
y5
TSG-H2O
187.10
159.10
TSGLD 516.31
228.09
474.19
b3-H2O
100
270.15
C*
141.09
SGLDS-28-H2O
y3
327.17
210.08
118.02
50
Val
363.14
274.19
74.05
150
Gly
GC*TS-28
y2
72.07
200
Asn
Ala
y1
414.20
345.23
396.19
y4
459.27
0
100
200
300
400
500
600
m/z
120
y7
Ser
Ion Counts
100
precursor ion
702.43
y8
Asp
80
60
Leu
y6
40
615.40
2+
y15
Gly
Thr
y10
Cys*
987.58
y9
730.91(2+)
20
Ser
832.92(2+)
817.45
930.55
y11
y12
1074.66
1175.76
Gly
Thr
y13
y14
1320.75
1377.74
0
600
800
1000
1200
m/z
1400
y15
1478.77
A proteomika „Achilles sarka”?
Elméleti azaz megjósolt „adatokon”
alapuló azonosítás
bioinformatika = bio + informatika
• Nem szabad elfelejtenünk, hogy
biológiai mintákkal dolgozunk!
• és kémiailag is aktív vegyületekkel!
• Az algoritmus lehet tökéletes, csak a
biológiai rendszer nem viselkedik!
Megtörtént a frakcionálás, az
emésztés...Jön az analízis!
Mondjuk, MALDI
MS-mérés frakcionálatlan, vagy HPLC után
→ egy jellemző (?) MH+ sorozat
↓ MS-Fit
Peptide Mass Fingerprint – alapú
fehérjeazonosítás
Mi lehet a baj?
→ aspecifikus hasítás, kovalens módosítás,
szennyezés stb.
Nem mindig ilyen szép a
menyasszony!
• azaz a PMF-alapú azonosítást meg kell
erősíteni
MIÉRT??? – lásd előbb és később is...
• a „vád tanúja”: az MS-MS kísérlet
eredménye
MS-MS eredményekkel is lehet keresgélni!
Független PMF és MS-MS azonosítás az igazi!
Elegánsabb az on-line LCMSMS
A nanoHPLC oszlopról minden megy a
tömegspektrométerbe (250 nL/min)
ún. „adatfüggő” adatgyűjtés
1) MS mérés
2) Komputer kiválasztja a legintenzívebb
iont
3) MS-MS mérés
MS + MS-MS combined total ion curren
MS
MS-MS
Lekeresés csak MS-MS adatokkal
„script” – az összes MS-MS adatok
megfelelő formába rendezve
az egyes spektrumokkal független
lekeresés
az eredményeket viszont fehérjénként
összegezzük
Nem igazi adatokhoz,
hanem az elméleti
spektrumhoz hasonlítunk!
Kovalens módosítások detektálása
• szerencsés esetben találhatunk ilyet is
automatizált MS-MS analízissel
• lekereső programok lehetővé teszik a
kovalens módosítások követését
Túl sok variációs lehetőség
rengeteg félreértelmezést okozhat !
Schistosoma mansoni proteomikája
G. Knudsen, J.H McKerrow, UCSF
* kb. 200 millió ember fertőződik évente, bőrön
keresztül, fertőzött vízben
* Átmeneti hordozó – Biomphalaria glabrata
* Kulcs a fertőzéshez:
a cercaria által kiválasztott enzim-keverék
Egyszerű, jól ismert keverékkel van
dolgunk...
• a csigából kibújt féreg-növendékeket jól
lemossuk
• bőr-lipidekkel megindítjuk a kiválasztást
• a fehérje-oldatot bekoncentráljuk
• 1D SDS-PAGE fehérje-frakcionálásra
• gélben emésztés tripszinnel
• LC/MS/MS analízis
Eksigent/Famous - 75 mm ID PepMap column; 300 nL/min flow;
water/ACN/0.1% HCOOH mobile phase, gradient elution,
QSTAR; 1 sec MS/3 sec CID; single charged and dynamic exclusion
Mit találtunk?
• cercaria felszíni fehérjéket
• cercaria elasztázt és glikolitikus
enzimeket
• csiga immunválasz-fehérjéket
• fotoszintézisben résztvevő fehérjéket
• humán keratint
• marha szérum albumint
Honnan jött mindez?
•
•
•
•
•
•
a cercaria külsejéről
ez az igazi! – a kiválasztott fehérjék
az átmeneti hordozóból
a salátából, amit a csigák ettek – éheztessük őket?
a technikus kezéről? hajából?
a laborból mindenütt – lehet, hogy takarítani
kellene?
Új, hatásosabb izolálási módszer→ az
elasztáz-aktivitás 40x-esére nőtt!
Eddig csak kvali volt...
Kvantitatív proteomika
1) a frakcionálás szintjén
Pl. 2D gélek összehasonlítása vizuálisan,
komputer programokkal, differenciál
festéssel
2) az MS-analízis során
Az MS NEM kvantitatív módszer
* a különböző molekulák nem egyformán
detektálhatók
pl. különböző peptidek relatív intenzitása
nem tükrözi relatív mennyiségüket
* nem minden komponenst detektálunk az
elegyekből
Hogy lehet ezt legyőzni?
csak nagyon hasonló peptidek relatív
intenzitását vethetjük össze!
1) Jelöljünk két sejt-populációt hasonlóan,
de megkülönböztethetően!
2) Keverjük össze az összes fehérjét!
3) A keveréket emésszük, analizáljuk!
És így kvantizhatunk!
Hogyan jelölhetünk?
• ICAT – Cys-oldalláncának alkilezése,
könnyű (H8) és nehéz (D8) alkilcsoporttal
→ amiben nincs Cys, az kiesik
→ a deuterált vegyület retenciós ideje
kicsit hosszabb
azonosítás: MS-MS alapon
kvanti: MS-alapon relatív intenzitásokból
ingadozás: van az 30% is!
Hogyan jelölhetünk?
• SILAC (stable isotope labeling)
C13, N15, O18
tápanyaggal visszük be – jelölt aminosav
→ Olyat kell választani, ami nem alakulhat át más
aminosavvá, illetve nem szintetizálódik a sejtben
Tripszines emésztéshez Arg a menő!
a keveréket frakcionáljuk, emésztjük, analizáljuk
azonosítás MS-MS alapon
kvanti a relatív intenzitásból
Hogyan jelölhetünk?
• tripszines emésztés H2O18-ban
Két oxigén lép be, minden peptid
jelölődik
Rengeteg információ
Még a szekvenálás is könnyebb, a Cterminális ionok csúsznak
DE beszárítás a normál emésztés után,
hosszú enzimes inkubáció...
→ veszteségek, nem specifikus hasítások
Hogyan jelölhetünk?
• iTRAQ ™ (Applied Biosystems)
Nagyon ravasz jelölés!
• amino-csoportra (N-terminus, Lys)
• 4-féle stabil izotópos szerkezet, azonos
additív tömeggel, de különböző
fragmensekkel (m/z 114, 115, 116, 117)
azonosítás és kvanti az MS-MS adatokból!
iTRAQ jelölés
4 mintát kvantitatíve megkülönböztetni.
Minden peptidet jelöl, a módosítottakat is
Egyszerű a mintaelőkészítés
Jelnövelő hatású (szuperponálódik a 4-féle jel)
20%-nál kisebb standard deviáció
Jobb minőségű CID spektrumok
Poszt-transzlációs változásokat is lehet így mérni!
DRÁGA
Ross et. al. MCP 2004
Mi ebből a tanulság?/
Take home message
• Ha biológus vagy → eredj programozást
és statisztikát tanulni
• Ha matematikus vagy → irány a biológia
• Ha proteomikával akarsz foglalkozni →
tömegspektrometria sem árt
Mi ebből a tanulság?/
Take home message
• Mennyiben lehet biológiai folyamatokat
statisztikailag/matematikailag elírni?
• A komputer gyors, nem hibázik,
„tanulékony”, de hülye...
• Mi emberek ellenben képesek vagyunk
felismerni a váratlant, az újat – feltéve,
hogy használjuk az eszünket....
Minta kérdések
• Mitől függ, mennyire jó egy adatbázis?
• Mi az oka, hogy nincs tökéletesen
működő adatbázis-lekereső szoftver?
• Miért van szükség proteomikára?
• Miért kell „jelölni” kvantitatív
proteomikában?
• Miért előnyös egy olyan jelölés, ami
minden peptidet módosít? És valóban
módosít-e minden peptidet?
Hasznos web-oldalak
ProteinProspector – http://prospector.ucsf.edu
MS-BLAST - http://dove.emblheidelberg.de/Blast2/msblast.html
BLAST - http://www.ncbi.nlm.nih.gov/BLAST/
European Bioinformatics Institute http://www.ebi.ac.uk/
Szekvencia-összehasonlítás –
http://www.ebi.ac.uk/clustalw/index.html
MS kezdőknek - „What is mass spectrometry” www.asms.org