Transcript 6 paskaita

Doc. Robertas Damaševičius
KTU Programų inžinerijos katedra,
Studentų 50-415
Email: [email protected]
Proteomika
 Mokslas apie baltymus, jų struktūrą ir funkcijas
 Tyrimų objektas: organizmo proteomas – organizmo gyvenimo metu




sukuriamų baltymų visuma.
Proteomika yra visų genomo koduojamų baltymų ir jų sąveikų tyrimas
Proteomikos tikslas yra išsiaiškinti organizmo baltymų funkcinę
paskirtį ir jų sąveikas
Sekantis organizmo tyrimo žingsnis po genomikos.
Proteomikos problemos yra žymiai sudėtingesnės:
 Atskirų ląstelių proteomai skiriasi ir nuolat keičiasi dėl biocheminės
sąveikos su genomu ir aplinka.
 Baltymai žymiai sudėtingesni negu genomą sudarančios nukleorūgštys
Bioinformatika (B110M100)
2
Pagr. proteomikos problemos
 Baltymų atskyrimas. Sudėtingo baltymų mišinio išskaidymas į






atskirus baltymus
Baltymų nustatymas. Naudojami masės spektrometrijos metodai
Baltymų sekų analizė. Atliekama panašių baltymų sekų paieška
duomenų bazėse, numatoma jų struktūra ir nustatomi evoliuciniai
sąryšiai tarp baltymų
Struktūrinė proteomika – baltymų struktūrų trimatėje erdvėje
tyrimas
Sąveikos proteomika - baltymų sąveikos tyrimas atominiame,
molekuliniame ir ląstelės lygmenyje
Baltymų modifikavimas – modifikuotų baltymų formų tyrimas
Ląstelinė proteomika – baltymų ir baltymų-baltymų sąveikos vietos
ląstelėje nustatymas
Bioinformatika (B110M100)
3
Proteomikos įrankiai
 Baltymų funkcijos analizės įrankiai
 leidžia palyginti dominančią baltymų seką su
informacija, saugoma antriniuose baltymų duomenų
bankuose, kurie apima informaciją apie baltymų
domenus, pėdsakus ir pan.
 Sėkmės atveju pavyksta aproksimuoti dominančio
baltymo biocheminę funkciją.
 Struktūrinės analizės įrankiai
 leidžia palyginti dominančias struktūras su žinomomis
struktūromis, esančiomis duomenų bazėse.
Bioinformatika (B110M100)
4
Baltymų struktūra
 Sudaryti iš amino rūgščių
 Gali būti aprašyti amino rūgščių sekomis, kurių abėcėlę
sudaro 20 simbolių: A, C, D, E, F, G, H, I, K, L, M, N, P, Q,
R, S, T, V, W ir Y
 Pagrindinė baltymų savybė yra tai, kad jie gali sudaryti
trimates struktūras, kurių forma priklauso nuo jų amino
rūgščių sekos
Bioinformatika (B110M100)
5
Baltymų struktūros tipai
 Pirminė struktūra - amino rūgščių seka baltymo polipeptidinėje
grandinėje
 Antrinė struktūra - paprasčiausi erdvinės struktūros elementai (αspiralės, β-struktūros, vingiai). Palaiko polipeptidinės grandinės
skeletinės dalies >C=O ir >N-H grupės
 Tretinė struktūra - visos peptidinės grandinės ir šoninių grandinių
išsidėstymas erdvėje. Ją palaiko šoninių R-grupių tarpusavio
sąveikos ir sąveikos su vandeniu
 Ketvirtinė struktūra - iš dviejų ir daugiau narių (baltymų
grandinių) sudaryti stambesni junginiai (asociatai)
Bioinformatika (B110M100)
6
Susirangymo variantai
 Dažniausi taisyklingo susirangymo variantai yra:
 Spiralė (α-spiralė) - galima įsivaizduoti, kad
polipeptidinė grandinė užvyniojama ant menamo
cilindro. Kiekviena >C=O grupė sudaro vandenilinę
jungtį su ketvirtąja nuo jos >N-H grupe.
 Klostė (β-klostė) - sudaro dvi ar daugiau lygiagrečios
polipeptidinės grandinės, taip pat sukabintos >C=O ir
>N-H vandenilinėmis jungtimis.
Bioinformatika (B110M100)
7
Baltymo struktūros savybės
 Baltymų struktūros numatymas remiasi taip vadinamu
Anfinsen postulatu:
 Baltymo struktūrą visiškai apsprendžia jo amino rūgščių seka.
 Baltymo struktūros savybės:
 Unikalumas – seka neturi kitos struktūros su palyginamo dydžio
laisvąja energija.
 Stabilumas – esant mažiems aplinkos sąlygų pokyčiams baltymo
struktūra nesikeičia.
 Kinetinis prieinamumas – struktūros formavimasis neapima
sudėtingų struktūros pokyčių.
Bioinformatika (B110M100)
8
Baltymų struktūros numatymas
 Tikslas: nustatyti trimatę (tretinę) baltymų struktūrą iš jų
amino rūgščių sekų informacijos (pirminės struktūros)
 Motyvacija: eksperimentinis baltymų struktūros
nustatymas naudojant rentgeno kristalografiją arba
branduolinį magnetinį rezonansą yra brangus ir reikalauja
daug laiko.
Bioinformatika (B110M100)
9
Problemos sudėtingumas
 Galimų baltymų struktūros variantų yra labai daug (10143
eilės) – Levinthal paradoksas
 Fizikiniai baltymų struktūrinio stabilumo mechanizmai
dar nėra visiškai suprantami
 Tretinės baltymų struktūros susiformavimui gali reikėti
išorinių faktorių (pvz., kitų baltymų) pagalbos
 Seka gali įgyti įvairias struktūras ir nebūtinai pačias
optimaliausias termodinaminiu požiūriu
Bioinformatika (B110M100)
10
Baltymų struktūros modeliavimas
 Šablono pasirinkimas
 sekų sugretinimo metodai
 paieška duomenų bazėse, pvz., FASTA arba BLAST.
 Tikslinio baltymo ir šablono sugretinimas.
 Modelio konstravimas
 Sugeneruojamas trimatis struktūrinis baltymo modelis.
 fragmentų surinkimo metodas (modelis surenkamas iš pastovių
struktūrinių fragmentų žinomose panašiose struktūrose),
 segmentų suderinimo metodas (baltymas sudalinimas į trumpus
segmentus remiantis biocheminiais parametrais, pvz. alfa anglies atomų
koordinatės, ir atliekama šablonų paieška segmentams duomenų bazėje)
 Modelio įvertinimas –
 statistinių potencialų metodas arba
 fizikiniai energijos skaičiavimai.
Bioinformatika (B110M100)
11
Baltymų modeliavimo schema
Daugybinis sekų
s
u
g
r
e
t
i
n
i
m
a
Baltymo
seka
Eksperimentiniai
duomenys
Paieška duomenų
Srities
priskyrimas
s
Homologija?
Taip
b
Ne
a
ė
z
j
e
Antrinės struktūros
n
u
m
a
t
y
m
a
Baltymų struktūros
a
s
t
p
a
ž
i
n
i
m
a
s
Struktūrų šeimos
a
n
a
l
i
ė
z
Antrinių struktūrų
s
u
g
r
e
t
i
n
i
m
a
Taip
Numatyta
struktūra
s
?
Ne
Lyginamasis
modeliavimas
Sekos-struktūros
s
u
g
r
e
t
Trimatis baltymo
modelis
Bioinformatika (B110M100)
i
n
i
m
a
s
Tretinės struktūros
n
u
m
a
t
y
m
a
s
12
Lyginamojo baltymų modeliavimo
metodai
 Homologijų modeliavimo metodai
 Remiasi prielaida, kad homologiški baltymai turės panašią struktūrą
 Naudojamas sekų sugretinimas
 Problemos kyla dėl sugretinimo problemų, o ne dėl struktūros
numatymo pagal duotą šabloninę seką
 Baltymų vėrimo (threading) metodas
 Atlieka nežinomos struktūros baltymo amino rūgščių sekos
palyginimą su žinomomis struktūromis saugomomis duomenų bazėje
 Speciali vertinimo funkcija įvertina sekos atitikimą struktūrai ir
priskiria geriausia tinkantį trimatį baltymo modelį
Bioinformatika (B110M100)
13
Gardelės baltymų modelis (1)
 Raudona (R) spalva - hidrofobinė amino rūgštis
 Mėlyna (M) spalva - hidrofilinė amino rūgštis
3.5Å
R
R
R
M
M
M
R
M
R
R
M
M
Bioinformatika (B110M100)
14
Gardelės baltymų modelis (2)
 Gardelės baltymai naudoja du realybės supaprastinimus
 amino rūgštys yra modeliuojamos kaip rutuliukai, kurie yra
 suneriami ant tamprios gardelės.
 Gardelės baltymai yra panašūs į tikrus baltymus tuo, jog
 turi energijos funkciją, ir
 sąlygų, apsprendžiančių kaimyninių rutuliukų sąveiką, aibę.
 Energijos funkcija modeliuoja sąveiką tarp realių baltymo
amino rūgščių, pvz., hidrofobiškumą arba vandenilines jungtis.
 Rutuliukai taip pat yra kelių tipų, atspindinčių skirtingas amino
rūgščių savybes.
Bioinformatika (B110M100)
15
Gardelės algoritmas
 Gardelės algoritmas:
 Sukurti matricą (dvimatį masyvą).
 Laisvai pasirinkti pradinį tašką kaip pradžios radikalą.
 Pridėti arba atimti 1 prie pradinio radikalo pozicijos.
 Patikrinti, ar naujas taškas nėra užimtas.
 Įvertinti energiją.
 Eiti į 3 žingsnį ir kartoti.
Bioinformatika (B110M100)
16
Energijos įvertinimo algoritmas
 Jeigu raudona yra greta tuščios vietos, tai E=E+1.
 Jeigu mėlyna yra greta tuščios vietos, tai E=E-1.
 Jeigu raudona yra greta kitos raudonos, tai E=E-1.
 Jeigu mėlyna yra greta kitos mėlynos, tai E=E+0.
 Jeigu mėlyna yra greta raudonos, tai E=E+0.
Bioinformatika (B110M100)
17
Gardelės metodo įvertinimas
 Gardelės metodo pranašumas:
 Greičiausias ir lengviausias metodas sukurti
polipeptidų grandinę, naudojant sudėtingas gardeles
galima tiksliai pavaizduoti baltymų struktūrą.
 Gardelės metodo trūkumai:
 metodas tik aproksimuoja realius baltymus,
 mažas tikslumas.
Bioinformatika (B110M100)
18
Antrinės baltymų struktūros
numatymas
 Bioinformatikos metodų, kurių tikslas yra numatyti antrinę





baltymų struktūrą remiantis žiniomis apie jų pirminę struktūrą
(amino rūgščių sekas), visuma.
Struktūros numatymas reiškia atskirų amino rūgščių sekos
regionų suskirstymas į α-spirales, β-klostes ir vingius.
Chou-Fasman metodas
GOR metodas
Neuroninių tinklų metodas
PHD metodas
Bioinformatika (B110M100)
19
Chou-Fasman metodas
 1974 m. pasiūlė Chou ir Fasman.
 Paremtas santykiniu kiekvienos amino rūgšties dažniu
žinomose α, β ir vingio tipo struktūrose, kurios buvo nustatytos
naudojant rentgeno kristalografijos metodą. Pagal šiuos
dažnius buvo apskaičiuota kiekvienos amino rūgšties buvimo
kiekviename antrinės struktūros tipe tikimybė.
 Remiantis α, β ir vingio tipo struktūrų dažniu PDB duomenų
bazėje yra įvertinamas kiekvienas peptidų sekos langas ir
nustatoma atitinkama baltymo antrinė struktūra.
Bioinformatika (B110M100)
20
Chou-Fasman metodo algoritmas (1)
1) Visiems peptido radikalams priskiriamos atitinkamos tikimybės
2) Nustatomi α-spiralės regionai, kur 4 iš 6 greta einančių radikalų
tenkinama sąlyga P(α-spiralė) > 100. Α-spiralė plečiama į abi
puses tol, kol pasiekiama, kad 4 greta einantiems radikalams
tenkinama sąlyga P(α-spiralė) < 100 (α-spiralės pabaiga). Jei
segmentas yra ilgesnis negu 5 radikalai ir jame tenkinama sąlyga
P(α-spiralė) > P(β-klostė), segmentas yra α-spiralė.
3) 2 žingsnis kartojamas tol, kol surandamos visos spiralės sekoje
4) Nustatomi β-klostės regionai, kur 3 iš 5 greta einančių radikalų
tenkinama sąlyga P(β-klostė) > 100. Β-klostė plečiama į abi puses
tol, kol pasiekiama, kad 4 greta einantiems radikalams tenkinama
sąlyga P(β-klostė) < 100 (β-klostės pabaiga). Jei segmente
tenkinamos sąlygos P(β-klostė) < 105 ir P(β-klostė) > P(α-spiralė),
segmentas yra β-klostė.
Bioinformatika (B110M100)
21
Chou-Fasman metodo algoritmas (2)
5) 4 žingsnis kartojamas tol, kol surandamos visos spiralės sekoje.
6) Jeigu α-spiralė ir β-klostė persidengia, tuomet persidengianti dalis
yra laikoma α-spiralės dalimi, jeigu segmente tenkinama sąlyga
P(α-spiralė) > P(β-klostė). Persidengianti dalis yra laikoma βklostės dalimi, jeigu tenkinama sąlyga P(β-klostė) > P(α-spiralė).
7) Vingio vieta j yra apskaičiuojama pagal formulę:
pt   pt  j  pt  j  1 pt  j  2 pt  j  3
kur: pt(j) – j-tojo radikalo reikšmė,
Vingio vieta yra prognozuojama, jei tenkinamos šios sąlygos:
p(t) > 0,000075;
vidutinė tetrapeptido (iš 4 amino rūgščių sudaryto peptido) reikšmė
P(vingis) > 1,00;
tetrapeptide tenkinama nelygybė P(α-spiralė) < P(vingis) > P(β-klostė).
Bioinformatika (B110M100)
22
GOR metodas
 Pasiūlė 1978 m. Garnier, Osguthorpe ir Robson
 Statistinis metodas, kuris remiasi žinomų baltymų
struktūros empiriniais tyrimais naudojant rentgeno
kristalografiją
 Pagrindinė idėja: numatant baltymo struktūrą konkrečiame
sekos regione reikėtų ne tik į kiekvienos atskiros amino
rūgšties tikimybę sudaryti tam tikrą antrinę struktūrą, bet ir
į gretimas amino rūgštis
 Tikimybės yra sumuojamos visiems radikalams slenkančiame lange
 Remiantis centrinės ir kraštinių amino rūgščių tikimybėmis
sudaroma matrica
 Remiantis matrica prognozuojama antrinė baltymo struktūra
Bioinformatika (B110M100)
23
GOR metodo algoritmas
Bioinformatika (B110M100)
24
GOR metodas
 Pradžioje sudaromos keturios 17x20 matricos:
 eilutėse yra amino rūgštys,
 stulpeliuose yra tikimybė aptikti amino rūgštį kiekvienoje 17 radikalų
ilgio sekoje
 Šios keturios matricos atspindi centrinės (8-tos nuo fragmento
pradžios) amino rūgšties tikimybę sudaryti
 α-spiralę: kad regionas būtų paskelbtas α-spirale reikia, kad
mažiausiai 4 iš eilės einantys radikalai būtų priskirti α-spiralei
 β-klostę: kad regionas būtų paskelbtas β-kloste reikia, kad mažiausiai
2 iš eilės einantys radikalai būtų priskirti β-klostei
 vingį
 ritę
 Amino rūgščių tikimybių reikšmės tokios pačios, kaip ir Chou-
Fasman metode
Bioinformatika (B110M100)
25
GOR metodas: tikimybės funkcija
 Tikimybės funkcija (vadinama informacija):
 f S ,R N 

I ( S , R )  log
 fR fS 
fS,R yra amino rūgšties R dažnis antrinėje struktūroje S,
N yra amino rūgščių skaičius duomenų bazėje,
fR ir fS – amino rūgščių R ir S dažnis duomenų bazėje.
 Praktikoje naudojama ne I(S,R) reikšmė, o I(dS,R) reikšmė,
kuri reiškia tikimybės skirtumą tarp duotos reikšmės S ir
kitų galimų S reikšmių
Bioinformatika (B110M100)
26
Dirbtinių neuroninių tinklų metodas
 Informacija apie pirminę ir antrinę struktūrą iš PDB duomenų bazės naudojama
neuroniniam tinklui apmokyti
 Apmokytas tinklas naudojamas naujų baltymų antrinės struktūros numatymui
 Kiekvienam struktūros tipui naudojamas atskiras tinklo potinklis
Įėjimo seka
(x1,x2,x3,x4…..)
1-asis neuroninis
tinklas
(alfa-spiralėms
O1
)
Išėjimas
f (o1,o2,o3)
=
2-asis neuroninis
tinklas
(beta-klostėms
O2
)
3-asis neuroninis
tinklas
(vingiams)
Bioinformatika (B110M100)
O3
27
PHD metodas (1)
 PHD algoritmą sudaro šie žingsniai:
 Atlikti paiešką SWISS-PROT duomenų bazėje ir pasirinkti
homologus su aukštomis įvertinimo reikšmėmis
 Iš daugybinio sugretinimo rezultatų sukurti sekos „profilį“
 Įtraukti globalią seką į profilį
 Paduoti profilį apmokytam dviejų sluoksnių neuroniniam
tinklui ir atlikti struktūros prognozavimą
Bioinformatika (B110M100)
28
PHD metodas: neuroniniai tinklai
 Sekos-struktūros tinklas:
 Kiekvienai amino rūgščiai aj nagrinėjamas 13 radikalų aj-6…aj…aj+6
langas.
 Neuroninio tinklo įėjimas: sekos profilis
 Išėjime – trys aj tikimybės: P(aj, alfa), P(aj, beta) ir P(aj,kita)
 Struktūros-struktūros tinklas:
 Kiekvienai amino rūgščiai aj nagrinėjamas 17 radikalų langas
 Neuroninio tinklo įėjimas: tikimybės P(ak, alfa), P(ak, beta) ir P(ak,
kita), k yra [j-8, j+8]
 Išėjime yra trys aj tikimybės: P(aj, alfa), P(aj, beta) ir P(aj, kita)
Bioinformatika (B110M100)
29
Metodų tikslumo įvertinimas
 Shou-Fasman: apie 60%
 GOR: apie 65%
 PHD: virš 70%
 Dirbtiniai neuronų tinklai: 78%
Bioinformatika (B110M100)
30
Baltymų struktūros numatymo
tikslumo įvertinimas
 Naudojama tikslumo matrica [Aij], 3×3, kurios kiekviena eilutė ir
stulpelis atitinka būsenas „α-spiralė“, „β-klostė“ ir „vingis“.
 Matricos Aij ij-asis elementas yra j-tojoje būsenoje numatytų
amino rūgščių skaičius, kurie iš tikrųjų yra i-tojoje būsenoje.
3
 Q3 parametras:
Aii

Q3  3 i 1 3
100%
 Aij
i 1 j 1
 Jei Q3 < 33,3% numatymas yra blogesnis už atsitiktinį.
Bioinformatika (B110M100)
31
Numatymo kokybės įvertinimas
 Numatymo kokybei įvertinti yra naudojamas koreliacijos
koeficientas Ci:
 3 3
  3
 3

Aii   Ajk     Aij   Aji 
 k i j i
  j i  j i

Ci 
3
3
3
3


 3 3
 3 3

 Aii   Aij  Aii   Aji   Ajk   Aij   Ajk   Aji 





j i
j i
j i
j i


 k i j i
 k i j i

Ci=1, kai numatymas yra visiškai tikslus
Ci=0, kai numatymas yra atsitiktinis.
Bioinformatika (B110M100)
32
Struktūros numatymo metodai (1)
 Ab initio baltymų modeliavimo metodai
 Siekia sukurti trimačius baltymų struktūros modelius
remiantis jų fizine struktūra, o ne anksčiau surastais
baltymų modeliais.
 Naudojami metodai:


Baltymų struktūros susiformavimą imituojantys metodai
Stochastiniai metodai ieškantys galimų sprendinių visoje sprendinių
erdvėje (pvz., tinkamos energijos funkcijos globalus optimizavimas).
 Reikalauja daug kompiuterio resursų ir tinka tik
nedideliems baltymams modeliuoti.
Bioinformatika (B110M100)
33
Struktūros numatymo metodai (2)
 Lyginamojo baltymų modeliavimo metodai
 Naudojasi anksčiau surastomis baltymų struktūromis
kaip atskaitos taškais arba šablonais
 Pasiteisina, nes tretinė struktūra yra sudaryta tik iš
ribotos aibės tretinės struktūros motyvų (manoma, kad
apie 2000)
Bioinformatika (B110M100)
34
Šoninių grandinių geometrinės
struktūros numatymas
 Aklavietės eliminavimo (dead-end elimination) metodas
 Nuoseklaus vidurkių lauko (self-consistent mean field)
metodas.
 Diskretizuoja kintančius dihedralinius kampus (t.y.,
kampus tarp dviejų plokštumų), kurie apsprendžia šoninės
grandinės orientaciją pagrindinės grandinės atžvilgiu, į
rotamerų su fiksuotais dihedraliniais kampais aibę
 Po to siekiama nustatyti rotamerų aibę, kuri minimizuoja
bendrąją modelio energiją
Bioinformatika (B110M100)
35
Aklavietės eliminavimo metodas (1)
 Daugiausiai yra naudojamas baltymų struktūrų numatymo





srityje
Minimizuoja funkciją, kurios argumentai yra diskreti
nepriklausomųjų kintamųjų aibė
Pagrindinė idėja: siekiama nustatyti “aklavietes”, t.y. blogas
kintamųjų kombinacijas, kurioms esant funkcija negali pasiekti
globalaus minimumo ir susilaikyti nuo tolesnės paieškos
Leidžia efektyviai numatyti šoninių grandinių struktūrą
Garantuotai suranda geriausią sprendinį
Sudėtingumas: O(n3)
Bioinformatika (B110M100)
36
Aklavietės eliminavimo metodas (2)
 Algoritmui realizuoti reikia šios informacijos:
 Gerai apibrėžtos baigtinės diskrečių nepriklausomų kintamųjų
aibės
 Iš anksto apskaičiuotos skaitmeninės reikšmės (vadinamos
“energija”) susijusios su kiekvienu elementu kintamųjų aibėje
 Kriterijaus apsprendžiančio, kada elementas yra “aklavietė”, t.y.
negali priklausyti sprendinių aibei
 Minimizuojamos tikslo funkcijos (“energijos” funkcijos)
Bioinformatika (B110M100)
37
Aklavietės eliminavimo metodas (3)
 Baltymų energijos funkciją galima užrašyti taip:
ETOT   Ek rk    Ekl rk , rl 
k
k l
kur: N – baltymo ilgis;
rk – k-tosios šoninės grandinės rotameras.
Ek(rk) – “nuosavoji” rotamero rk energija,
Ekl(rk,rl) – “porinė” rotamerų ir energija.
 Be to, laikoma, kad Ekk(rkA,rkA) yra lygi 0.
Bioinformatika (B110M100)
38
Aklavietės eliminavimo metodas (4)
 Vieno rotamero eliminavimo kriterijus užrašomas taip:
  min E r
N
Ek rkA 
l 1
A X
kl k , rl
X
min Ekl rkA , rl X
 

 

  E r   max E r
N
k
B
k
l 1
X
B X
kl k , rl

kur:
yra minimali (geriausia) energija tarp k-tosios
X
šoninės grandinės rotamero rkA ir bet kurio l-tosios šoninės grandinės
rotamero X.
max E kl rkB , rl X
yra maksimali (blogiausia) energija tarp k-tosios
šoninės grandinės rotamero rkB ir bet kurio l-tosios šoninės grandinės
rotamero .
X
Bioinformatika (B110M100)
39
Aklavietės eliminavimo metodas (5)
 Rotamerų poros eliminavimo kriterijus užrašomas taip:
U
AB
kl
def
 
 

 Ek rkA  El rl B  Ekl rkA , rl B

kur: UklAB yra vidinė rotamerų poros rkA ir rlB energija.
 Duota rotamerų A ir B pora negali būti galutiniame sprendinyje, jeigu
yra kita rotamerų pora C ir D, kurios energija visada yra geresnė:
 min  
N
U klAB

i 1
X
E ki rkA , ri X


 Elj rl , r jX
B
 
 max E r
N
U klCD

i 1
X
ki
C
X
k , ri
 E r
lj
l
D
, r jX

kur: A≠C, B ≠D ir k ≠l.
 Šie du kriterijai yra taikomi iteraciškai tol, kol pasiekiamas rezultatas,
kai negalima eliminuoti nei vieno rotamero arba jų poros.
Bioinformatika (B110M100)
40
Nuoseklaus vidurkių lauko algoritmas (1)
 Leidžia nustatyti optimalią šoninių amino rūgščių grandinių





padėtį esat duotai fiksuotai pagrindinei baltymo grandinei
Greitesnis negu Aklavietės eliminavimo algoritmas, tačiau nėra
toks tikslus
Naudojamas tik labai didelių baltymų struktūrai numatyti
Kiekvienos šoninės grandinės padėčių kampai yra
diskretizuojami į rotamerų aibę
Kiekvienam rotamerui kiekvienoje padėtyje priskiriama tam
tikra tikimybė
Visos struktūros tikimybė apibrėžiama kaip atskirų rotamerų
tikimybių funkcija
Bioinformatika (B110M100)
41
Nuoseklaus vidurkių lauko algoritmas (2)
 Algoritmui realizuoti reikia šios informacijos:
 Gerai apibrėžtos baigtinės diskrečių nepriklausomų
kintamųjų aibės.
 Iš anksto apskaičiuotos skaitmeninės reikšmės
(vadinamos “energija”) susijusios su kiekvienu elementu
kintamųjų aibėje ir jų poromis.
 Kiekvieno rotamero pradinės tikimybės.
 Rotamero energijos ir tikimybių funkcijos.
Bioinformatika (B110M100)
42
Nuoseklaus vidurkių lauko algoritmas (3)
 Pradžioje yra laikoma, kad yra p rotamerų k-tojoje padėtyje, o rotamero
tikimybė yra 1/p
 Transformacija tarp energijos ir tikimybės yra atliekama naudojant
Bolcmano formulę. Temperatūros parametras yra naudojamas kaip
optimizavimo parametras
 Kiekvieno rotamero energijos pasiskirstymas yra proporcingas jo
tikimybei
 N ilgio baltymo su p rotamerų energija iteracijoje i:
 
 
N
p
  
M i rkA  Ek rkA   Pi 1 rxy Exy rkA , rxy

x 1 y 1
kur: Mi – vidutinė lauko energija
E – iš anksto apskaičiuota rotamero energija,
Pi(rkA) – rotamero tikimybė
Bioinformatika (B110M100)
43
Nuoseklaus vidurkių lauko algoritmas (4)
 Tikimybės apskaičiuojamos naudojant Bolcmano formulę:
 
Pi rkA
 

 M i rkA
  exp 
kT


 
  p
 M i rky
   exp 

kT
  y 1


 


1
kur: k – Bolcmano konstanta, T – temperatūra.
 Sistemos energija apskaičiuojama taip:
M sys  M sin gle  M pair
kur:
   
p
N
M sin gle   P rxy Ex rxy
x 1 y 1
N
p
M pair  
  Pr Pr E r
N
p
x 1 y 1 a  x 1 b 1
Bioinformatika (B110M100)
y
x
b
a
xy
y
x
, rab

44
Struktūrinis sugretinimas (1)
 Naudojamas baltymų struktūros sugretinimui, kai sekos evoliucijos
metu taip nutolo, kad įprastiniai sekų sugretinimo metodai neleidžia
nustatyti sekų panašumo
 Leidžia patikimiau nustatyti ryšį tarp baltymų
 Turint struktūrinio sugretinimo tarp tikslinės ir šabloninės sekos
informaciją galima sukurti labai patikimus baltymų modelius.
 Kombinacinio išplėtimo metodas
 Pirmiausiai sugretina trumpus dviejų analizuojamų baltymų fragmentus, o
paskui juos surenka į didesnį sugretinimą.
 Naudojant įvairius dydžius, pvz., vietinę antrinę struktūrą ar kaimyninės
grandinės hidrofobiškumą, sukuriamos sugretintų fragmentų poros, kurios
yra naudojamos sudarant panašumų matricą
 Struktūrinis sugretinimas yra optimalus kelias matricoje iš vienos baltymų
struktūros būsenos į kitą.
Bioinformatika (B110M100)
45
Struktūrinis sugretinimas (2)
 Algoritmo tikslas: surasti vietinį „gerą“ baltymų ir
struktūrų sugretinimą.
 Algoritmo eiga:
 Pasirinkti pradines sugretintų fragmentų poras.
 Sudaryti sugretinimo kelią iteraciškai pridedant sugretintų
fragmentų poras.
 Kartoti 2 žingsnį tol, kol pereinama per visą kiekvieno
baltymo sekos ilgį.
Bioinformatika (B110M100)
46
Struktūrinis sugretinimas (3)
 Atstumas tarp dviejų skirtingų sugretintų fragmentų porų:
1 m
Dij   d A ( piA  k  1, p Aj  m  k )  d B ( piB  k  1, p Bj  m  k )
m k 1
kur: dA(p,q) – atstumas tarp baltymo α-anglies atomų padėtyse p ir q.
 Tarkime sugretinimo kelias jau yra sudarytas iš sugretintų fragmentų
porų. N-toji pora yra pridedama jei tenkinamos sąlygos:
Dnn  D0
1 n1
 Din  D0
n  1 i 0
1
n2
n
n
 D
i 0 j 0
ij
 D1
 kur: D0, D1 – atkirtimo atstumai.
 Jei paskutinė sąlyga netenkinama, sugretinimo kelio ilginimas yra
baigiamas.
Bioinformatika (B110M100)
47
Baltymų mikrogardelių panaudojimas
Panaudojimas
Aprašymas
Baltymų
Antikūnų mikrogardelės pagalba galima tirti baltymų
ekspresijos tyrimai ekspresiją, nes kiekvienas antikūnas, esantis
mikrogardelės taške, atpažįsta specifinę aminorūgščių
seką
Baltymų funkcijos
tyrimai
Grupės baltymų substratinis specifiškumas ir
fermentinis aktyvumas gali būti tiriami veikiant
mikrogardelę skirtingais substratais
Baltymų sąveikos
su baltymais
tyrimai
Dviejų baltymų gebėjimas sąveikauti gali būti tiriamas
veikiant mikrogardelę fluorochromu pažymėtais
baltymais
Farmakologiniai
tyrimai
Vaistų gebėjimas susijungti su ląstelės baltymais gali
būti tiriamas veikiant mikrogardelę įvairiais
pažymėtais vaistais