Transcript 6 paskaita
Doc. Robertas Damaševičius KTU Programų inžinerijos katedra, Studentų 50-415 Email: [email protected] Proteomika Mokslas apie baltymus, jų struktūrą ir funkcijas Tyrimų objektas: organizmo proteomas – organizmo gyvenimo metu sukuriamų baltymų visuma. Proteomika yra visų genomo koduojamų baltymų ir jų sąveikų tyrimas Proteomikos tikslas yra išsiaiškinti organizmo baltymų funkcinę paskirtį ir jų sąveikas Sekantis organizmo tyrimo žingsnis po genomikos. Proteomikos problemos yra žymiai sudėtingesnės: Atskirų ląstelių proteomai skiriasi ir nuolat keičiasi dėl biocheminės sąveikos su genomu ir aplinka. Baltymai žymiai sudėtingesni negu genomą sudarančios nukleorūgštys Bioinformatika (B110M100) 2 Pagr. proteomikos problemos Baltymų atskyrimas. Sudėtingo baltymų mišinio išskaidymas į atskirus baltymus Baltymų nustatymas. Naudojami masės spektrometrijos metodai Baltymų sekų analizė. Atliekama panašių baltymų sekų paieška duomenų bazėse, numatoma jų struktūra ir nustatomi evoliuciniai sąryšiai tarp baltymų Struktūrinė proteomika – baltymų struktūrų trimatėje erdvėje tyrimas Sąveikos proteomika - baltymų sąveikos tyrimas atominiame, molekuliniame ir ląstelės lygmenyje Baltymų modifikavimas – modifikuotų baltymų formų tyrimas Ląstelinė proteomika – baltymų ir baltymų-baltymų sąveikos vietos ląstelėje nustatymas Bioinformatika (B110M100) 3 Proteomikos įrankiai Baltymų funkcijos analizės įrankiai leidžia palyginti dominančią baltymų seką su informacija, saugoma antriniuose baltymų duomenų bankuose, kurie apima informaciją apie baltymų domenus, pėdsakus ir pan. Sėkmės atveju pavyksta aproksimuoti dominančio baltymo biocheminę funkciją. Struktūrinės analizės įrankiai leidžia palyginti dominančias struktūras su žinomomis struktūromis, esančiomis duomenų bazėse. Bioinformatika (B110M100) 4 Baltymų struktūra Sudaryti iš amino rūgščių Gali būti aprašyti amino rūgščių sekomis, kurių abėcėlę sudaro 20 simbolių: A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W ir Y Pagrindinė baltymų savybė yra tai, kad jie gali sudaryti trimates struktūras, kurių forma priklauso nuo jų amino rūgščių sekos Bioinformatika (B110M100) 5 Baltymų struktūros tipai Pirminė struktūra - amino rūgščių seka baltymo polipeptidinėje grandinėje Antrinė struktūra - paprasčiausi erdvinės struktūros elementai (αspiralės, β-struktūros, vingiai). Palaiko polipeptidinės grandinės skeletinės dalies >C=O ir >N-H grupės Tretinė struktūra - visos peptidinės grandinės ir šoninių grandinių išsidėstymas erdvėje. Ją palaiko šoninių R-grupių tarpusavio sąveikos ir sąveikos su vandeniu Ketvirtinė struktūra - iš dviejų ir daugiau narių (baltymų grandinių) sudaryti stambesni junginiai (asociatai) Bioinformatika (B110M100) 6 Susirangymo variantai Dažniausi taisyklingo susirangymo variantai yra: Spiralė (α-spiralė) - galima įsivaizduoti, kad polipeptidinė grandinė užvyniojama ant menamo cilindro. Kiekviena >C=O grupė sudaro vandenilinę jungtį su ketvirtąja nuo jos >N-H grupe. Klostė (β-klostė) - sudaro dvi ar daugiau lygiagrečios polipeptidinės grandinės, taip pat sukabintos >C=O ir >N-H vandenilinėmis jungtimis. Bioinformatika (B110M100) 7 Baltymo struktūros savybės Baltymų struktūros numatymas remiasi taip vadinamu Anfinsen postulatu: Baltymo struktūrą visiškai apsprendžia jo amino rūgščių seka. Baltymo struktūros savybės: Unikalumas – seka neturi kitos struktūros su palyginamo dydžio laisvąja energija. Stabilumas – esant mažiems aplinkos sąlygų pokyčiams baltymo struktūra nesikeičia. Kinetinis prieinamumas – struktūros formavimasis neapima sudėtingų struktūros pokyčių. Bioinformatika (B110M100) 8 Baltymų struktūros numatymas Tikslas: nustatyti trimatę (tretinę) baltymų struktūrą iš jų amino rūgščių sekų informacijos (pirminės struktūros) Motyvacija: eksperimentinis baltymų struktūros nustatymas naudojant rentgeno kristalografiją arba branduolinį magnetinį rezonansą yra brangus ir reikalauja daug laiko. Bioinformatika (B110M100) 9 Problemos sudėtingumas Galimų baltymų struktūros variantų yra labai daug (10143 eilės) – Levinthal paradoksas Fizikiniai baltymų struktūrinio stabilumo mechanizmai dar nėra visiškai suprantami Tretinės baltymų struktūros susiformavimui gali reikėti išorinių faktorių (pvz., kitų baltymų) pagalbos Seka gali įgyti įvairias struktūras ir nebūtinai pačias optimaliausias termodinaminiu požiūriu Bioinformatika (B110M100) 10 Baltymų struktūros modeliavimas Šablono pasirinkimas sekų sugretinimo metodai paieška duomenų bazėse, pvz., FASTA arba BLAST. Tikslinio baltymo ir šablono sugretinimas. Modelio konstravimas Sugeneruojamas trimatis struktūrinis baltymo modelis. fragmentų surinkimo metodas (modelis surenkamas iš pastovių struktūrinių fragmentų žinomose panašiose struktūrose), segmentų suderinimo metodas (baltymas sudalinimas į trumpus segmentus remiantis biocheminiais parametrais, pvz. alfa anglies atomų koordinatės, ir atliekama šablonų paieška segmentams duomenų bazėje) Modelio įvertinimas – statistinių potencialų metodas arba fizikiniai energijos skaičiavimai. Bioinformatika (B110M100) 11 Baltymų modeliavimo schema Daugybinis sekų s u g r e t i n i m a Baltymo seka Eksperimentiniai duomenys Paieška duomenų Srities priskyrimas s Homologija? Taip b Ne a ė z j e Antrinės struktūros n u m a t y m a Baltymų struktūros a s t p a ž i n i m a s Struktūrų šeimos a n a l i ė z Antrinių struktūrų s u g r e t i n i m a Taip Numatyta struktūra s ? Ne Lyginamasis modeliavimas Sekos-struktūros s u g r e t Trimatis baltymo modelis Bioinformatika (B110M100) i n i m a s Tretinės struktūros n u m a t y m a s 12 Lyginamojo baltymų modeliavimo metodai Homologijų modeliavimo metodai Remiasi prielaida, kad homologiški baltymai turės panašią struktūrą Naudojamas sekų sugretinimas Problemos kyla dėl sugretinimo problemų, o ne dėl struktūros numatymo pagal duotą šabloninę seką Baltymų vėrimo (threading) metodas Atlieka nežinomos struktūros baltymo amino rūgščių sekos palyginimą su žinomomis struktūromis saugomomis duomenų bazėje Speciali vertinimo funkcija įvertina sekos atitikimą struktūrai ir priskiria geriausia tinkantį trimatį baltymo modelį Bioinformatika (B110M100) 13 Gardelės baltymų modelis (1) Raudona (R) spalva - hidrofobinė amino rūgštis Mėlyna (M) spalva - hidrofilinė amino rūgštis 3.5Å R R R M M M R M R R M M Bioinformatika (B110M100) 14 Gardelės baltymų modelis (2) Gardelės baltymai naudoja du realybės supaprastinimus amino rūgštys yra modeliuojamos kaip rutuliukai, kurie yra suneriami ant tamprios gardelės. Gardelės baltymai yra panašūs į tikrus baltymus tuo, jog turi energijos funkciją, ir sąlygų, apsprendžiančių kaimyninių rutuliukų sąveiką, aibę. Energijos funkcija modeliuoja sąveiką tarp realių baltymo amino rūgščių, pvz., hidrofobiškumą arba vandenilines jungtis. Rutuliukai taip pat yra kelių tipų, atspindinčių skirtingas amino rūgščių savybes. Bioinformatika (B110M100) 15 Gardelės algoritmas Gardelės algoritmas: Sukurti matricą (dvimatį masyvą). Laisvai pasirinkti pradinį tašką kaip pradžios radikalą. Pridėti arba atimti 1 prie pradinio radikalo pozicijos. Patikrinti, ar naujas taškas nėra užimtas. Įvertinti energiją. Eiti į 3 žingsnį ir kartoti. Bioinformatika (B110M100) 16 Energijos įvertinimo algoritmas Jeigu raudona yra greta tuščios vietos, tai E=E+1. Jeigu mėlyna yra greta tuščios vietos, tai E=E-1. Jeigu raudona yra greta kitos raudonos, tai E=E-1. Jeigu mėlyna yra greta kitos mėlynos, tai E=E+0. Jeigu mėlyna yra greta raudonos, tai E=E+0. Bioinformatika (B110M100) 17 Gardelės metodo įvertinimas Gardelės metodo pranašumas: Greičiausias ir lengviausias metodas sukurti polipeptidų grandinę, naudojant sudėtingas gardeles galima tiksliai pavaizduoti baltymų struktūrą. Gardelės metodo trūkumai: metodas tik aproksimuoja realius baltymus, mažas tikslumas. Bioinformatika (B110M100) 18 Antrinės baltymų struktūros numatymas Bioinformatikos metodų, kurių tikslas yra numatyti antrinę baltymų struktūrą remiantis žiniomis apie jų pirminę struktūrą (amino rūgščių sekas), visuma. Struktūros numatymas reiškia atskirų amino rūgščių sekos regionų suskirstymas į α-spirales, β-klostes ir vingius. Chou-Fasman metodas GOR metodas Neuroninių tinklų metodas PHD metodas Bioinformatika (B110M100) 19 Chou-Fasman metodas 1974 m. pasiūlė Chou ir Fasman. Paremtas santykiniu kiekvienos amino rūgšties dažniu žinomose α, β ir vingio tipo struktūrose, kurios buvo nustatytos naudojant rentgeno kristalografijos metodą. Pagal šiuos dažnius buvo apskaičiuota kiekvienos amino rūgšties buvimo kiekviename antrinės struktūros tipe tikimybė. Remiantis α, β ir vingio tipo struktūrų dažniu PDB duomenų bazėje yra įvertinamas kiekvienas peptidų sekos langas ir nustatoma atitinkama baltymo antrinė struktūra. Bioinformatika (B110M100) 20 Chou-Fasman metodo algoritmas (1) 1) Visiems peptido radikalams priskiriamos atitinkamos tikimybės 2) Nustatomi α-spiralės regionai, kur 4 iš 6 greta einančių radikalų tenkinama sąlyga P(α-spiralė) > 100. Α-spiralė plečiama į abi puses tol, kol pasiekiama, kad 4 greta einantiems radikalams tenkinama sąlyga P(α-spiralė) < 100 (α-spiralės pabaiga). Jei segmentas yra ilgesnis negu 5 radikalai ir jame tenkinama sąlyga P(α-spiralė) > P(β-klostė), segmentas yra α-spiralė. 3) 2 žingsnis kartojamas tol, kol surandamos visos spiralės sekoje 4) Nustatomi β-klostės regionai, kur 3 iš 5 greta einančių radikalų tenkinama sąlyga P(β-klostė) > 100. Β-klostė plečiama į abi puses tol, kol pasiekiama, kad 4 greta einantiems radikalams tenkinama sąlyga P(β-klostė) < 100 (β-klostės pabaiga). Jei segmente tenkinamos sąlygos P(β-klostė) < 105 ir P(β-klostė) > P(α-spiralė), segmentas yra β-klostė. Bioinformatika (B110M100) 21 Chou-Fasman metodo algoritmas (2) 5) 4 žingsnis kartojamas tol, kol surandamos visos spiralės sekoje. 6) Jeigu α-spiralė ir β-klostė persidengia, tuomet persidengianti dalis yra laikoma α-spiralės dalimi, jeigu segmente tenkinama sąlyga P(α-spiralė) > P(β-klostė). Persidengianti dalis yra laikoma βklostės dalimi, jeigu tenkinama sąlyga P(β-klostė) > P(α-spiralė). 7) Vingio vieta j yra apskaičiuojama pagal formulę: pt pt j pt j 1 pt j 2 pt j 3 kur: pt(j) – j-tojo radikalo reikšmė, Vingio vieta yra prognozuojama, jei tenkinamos šios sąlygos: p(t) > 0,000075; vidutinė tetrapeptido (iš 4 amino rūgščių sudaryto peptido) reikšmė P(vingis) > 1,00; tetrapeptide tenkinama nelygybė P(α-spiralė) < P(vingis) > P(β-klostė). Bioinformatika (B110M100) 22 GOR metodas Pasiūlė 1978 m. Garnier, Osguthorpe ir Robson Statistinis metodas, kuris remiasi žinomų baltymų struktūros empiriniais tyrimais naudojant rentgeno kristalografiją Pagrindinė idėja: numatant baltymo struktūrą konkrečiame sekos regione reikėtų ne tik į kiekvienos atskiros amino rūgšties tikimybę sudaryti tam tikrą antrinę struktūrą, bet ir į gretimas amino rūgštis Tikimybės yra sumuojamos visiems radikalams slenkančiame lange Remiantis centrinės ir kraštinių amino rūgščių tikimybėmis sudaroma matrica Remiantis matrica prognozuojama antrinė baltymo struktūra Bioinformatika (B110M100) 23 GOR metodo algoritmas Bioinformatika (B110M100) 24 GOR metodas Pradžioje sudaromos keturios 17x20 matricos: eilutėse yra amino rūgštys, stulpeliuose yra tikimybė aptikti amino rūgštį kiekvienoje 17 radikalų ilgio sekoje Šios keturios matricos atspindi centrinės (8-tos nuo fragmento pradžios) amino rūgšties tikimybę sudaryti α-spiralę: kad regionas būtų paskelbtas α-spirale reikia, kad mažiausiai 4 iš eilės einantys radikalai būtų priskirti α-spiralei β-klostę: kad regionas būtų paskelbtas β-kloste reikia, kad mažiausiai 2 iš eilės einantys radikalai būtų priskirti β-klostei vingį ritę Amino rūgščių tikimybių reikšmės tokios pačios, kaip ir Chou- Fasman metode Bioinformatika (B110M100) 25 GOR metodas: tikimybės funkcija Tikimybės funkcija (vadinama informacija): f S ,R N I ( S , R ) log fR fS fS,R yra amino rūgšties R dažnis antrinėje struktūroje S, N yra amino rūgščių skaičius duomenų bazėje, fR ir fS – amino rūgščių R ir S dažnis duomenų bazėje. Praktikoje naudojama ne I(S,R) reikšmė, o I(dS,R) reikšmė, kuri reiškia tikimybės skirtumą tarp duotos reikšmės S ir kitų galimų S reikšmių Bioinformatika (B110M100) 26 Dirbtinių neuroninių tinklų metodas Informacija apie pirminę ir antrinę struktūrą iš PDB duomenų bazės naudojama neuroniniam tinklui apmokyti Apmokytas tinklas naudojamas naujų baltymų antrinės struktūros numatymui Kiekvienam struktūros tipui naudojamas atskiras tinklo potinklis Įėjimo seka (x1,x2,x3,x4…..) 1-asis neuroninis tinklas (alfa-spiralėms O1 ) Išėjimas f (o1,o2,o3) = 2-asis neuroninis tinklas (beta-klostėms O2 ) 3-asis neuroninis tinklas (vingiams) Bioinformatika (B110M100) O3 27 PHD metodas (1) PHD algoritmą sudaro šie žingsniai: Atlikti paiešką SWISS-PROT duomenų bazėje ir pasirinkti homologus su aukštomis įvertinimo reikšmėmis Iš daugybinio sugretinimo rezultatų sukurti sekos „profilį“ Įtraukti globalią seką į profilį Paduoti profilį apmokytam dviejų sluoksnių neuroniniam tinklui ir atlikti struktūros prognozavimą Bioinformatika (B110M100) 28 PHD metodas: neuroniniai tinklai Sekos-struktūros tinklas: Kiekvienai amino rūgščiai aj nagrinėjamas 13 radikalų aj-6…aj…aj+6 langas. Neuroninio tinklo įėjimas: sekos profilis Išėjime – trys aj tikimybės: P(aj, alfa), P(aj, beta) ir P(aj,kita) Struktūros-struktūros tinklas: Kiekvienai amino rūgščiai aj nagrinėjamas 17 radikalų langas Neuroninio tinklo įėjimas: tikimybės P(ak, alfa), P(ak, beta) ir P(ak, kita), k yra [j-8, j+8] Išėjime yra trys aj tikimybės: P(aj, alfa), P(aj, beta) ir P(aj, kita) Bioinformatika (B110M100) 29 Metodų tikslumo įvertinimas Shou-Fasman: apie 60% GOR: apie 65% PHD: virš 70% Dirbtiniai neuronų tinklai: 78% Bioinformatika (B110M100) 30 Baltymų struktūros numatymo tikslumo įvertinimas Naudojama tikslumo matrica [Aij], 3×3, kurios kiekviena eilutė ir stulpelis atitinka būsenas „α-spiralė“, „β-klostė“ ir „vingis“. Matricos Aij ij-asis elementas yra j-tojoje būsenoje numatytų amino rūgščių skaičius, kurie iš tikrųjų yra i-tojoje būsenoje. 3 Q3 parametras: Aii Q3 3 i 1 3 100% Aij i 1 j 1 Jei Q3 < 33,3% numatymas yra blogesnis už atsitiktinį. Bioinformatika (B110M100) 31 Numatymo kokybės įvertinimas Numatymo kokybei įvertinti yra naudojamas koreliacijos koeficientas Ci: 3 3 3 3 Aii Ajk Aij Aji k i j i j i j i Ci 3 3 3 3 3 3 3 3 Aii Aij Aii Aji Ajk Aij Ajk Aji j i j i j i j i k i j i k i j i Ci=1, kai numatymas yra visiškai tikslus Ci=0, kai numatymas yra atsitiktinis. Bioinformatika (B110M100) 32 Struktūros numatymo metodai (1) Ab initio baltymų modeliavimo metodai Siekia sukurti trimačius baltymų struktūros modelius remiantis jų fizine struktūra, o ne anksčiau surastais baltymų modeliais. Naudojami metodai: Baltymų struktūros susiformavimą imituojantys metodai Stochastiniai metodai ieškantys galimų sprendinių visoje sprendinių erdvėje (pvz., tinkamos energijos funkcijos globalus optimizavimas). Reikalauja daug kompiuterio resursų ir tinka tik nedideliems baltymams modeliuoti. Bioinformatika (B110M100) 33 Struktūros numatymo metodai (2) Lyginamojo baltymų modeliavimo metodai Naudojasi anksčiau surastomis baltymų struktūromis kaip atskaitos taškais arba šablonais Pasiteisina, nes tretinė struktūra yra sudaryta tik iš ribotos aibės tretinės struktūros motyvų (manoma, kad apie 2000) Bioinformatika (B110M100) 34 Šoninių grandinių geometrinės struktūros numatymas Aklavietės eliminavimo (dead-end elimination) metodas Nuoseklaus vidurkių lauko (self-consistent mean field) metodas. Diskretizuoja kintančius dihedralinius kampus (t.y., kampus tarp dviejų plokštumų), kurie apsprendžia šoninės grandinės orientaciją pagrindinės grandinės atžvilgiu, į rotamerų su fiksuotais dihedraliniais kampais aibę Po to siekiama nustatyti rotamerų aibę, kuri minimizuoja bendrąją modelio energiją Bioinformatika (B110M100) 35 Aklavietės eliminavimo metodas (1) Daugiausiai yra naudojamas baltymų struktūrų numatymo srityje Minimizuoja funkciją, kurios argumentai yra diskreti nepriklausomųjų kintamųjų aibė Pagrindinė idėja: siekiama nustatyti “aklavietes”, t.y. blogas kintamųjų kombinacijas, kurioms esant funkcija negali pasiekti globalaus minimumo ir susilaikyti nuo tolesnės paieškos Leidžia efektyviai numatyti šoninių grandinių struktūrą Garantuotai suranda geriausią sprendinį Sudėtingumas: O(n3) Bioinformatika (B110M100) 36 Aklavietės eliminavimo metodas (2) Algoritmui realizuoti reikia šios informacijos: Gerai apibrėžtos baigtinės diskrečių nepriklausomų kintamųjų aibės Iš anksto apskaičiuotos skaitmeninės reikšmės (vadinamos “energija”) susijusios su kiekvienu elementu kintamųjų aibėje Kriterijaus apsprendžiančio, kada elementas yra “aklavietė”, t.y. negali priklausyti sprendinių aibei Minimizuojamos tikslo funkcijos (“energijos” funkcijos) Bioinformatika (B110M100) 37 Aklavietės eliminavimo metodas (3) Baltymų energijos funkciją galima užrašyti taip: ETOT Ek rk Ekl rk , rl k k l kur: N – baltymo ilgis; rk – k-tosios šoninės grandinės rotameras. Ek(rk) – “nuosavoji” rotamero rk energija, Ekl(rk,rl) – “porinė” rotamerų ir energija. Be to, laikoma, kad Ekk(rkA,rkA) yra lygi 0. Bioinformatika (B110M100) 38 Aklavietės eliminavimo metodas (4) Vieno rotamero eliminavimo kriterijus užrašomas taip: min E r N Ek rkA l 1 A X kl k , rl X min Ekl rkA , rl X E r max E r N k B k l 1 X B X kl k , rl kur: yra minimali (geriausia) energija tarp k-tosios X šoninės grandinės rotamero rkA ir bet kurio l-tosios šoninės grandinės rotamero X. max E kl rkB , rl X yra maksimali (blogiausia) energija tarp k-tosios šoninės grandinės rotamero rkB ir bet kurio l-tosios šoninės grandinės rotamero . X Bioinformatika (B110M100) 39 Aklavietės eliminavimo metodas (5) Rotamerų poros eliminavimo kriterijus užrašomas taip: U AB kl def Ek rkA El rl B Ekl rkA , rl B kur: UklAB yra vidinė rotamerų poros rkA ir rlB energija. Duota rotamerų A ir B pora negali būti galutiniame sprendinyje, jeigu yra kita rotamerų pora C ir D, kurios energija visada yra geresnė: min N U klAB i 1 X E ki rkA , ri X Elj rl , r jX B max E r N U klCD i 1 X ki C X k , ri E r lj l D , r jX kur: A≠C, B ≠D ir k ≠l. Šie du kriterijai yra taikomi iteraciškai tol, kol pasiekiamas rezultatas, kai negalima eliminuoti nei vieno rotamero arba jų poros. Bioinformatika (B110M100) 40 Nuoseklaus vidurkių lauko algoritmas (1) Leidžia nustatyti optimalią šoninių amino rūgščių grandinių padėtį esat duotai fiksuotai pagrindinei baltymo grandinei Greitesnis negu Aklavietės eliminavimo algoritmas, tačiau nėra toks tikslus Naudojamas tik labai didelių baltymų struktūrai numatyti Kiekvienos šoninės grandinės padėčių kampai yra diskretizuojami į rotamerų aibę Kiekvienam rotamerui kiekvienoje padėtyje priskiriama tam tikra tikimybė Visos struktūros tikimybė apibrėžiama kaip atskirų rotamerų tikimybių funkcija Bioinformatika (B110M100) 41 Nuoseklaus vidurkių lauko algoritmas (2) Algoritmui realizuoti reikia šios informacijos: Gerai apibrėžtos baigtinės diskrečių nepriklausomų kintamųjų aibės. Iš anksto apskaičiuotos skaitmeninės reikšmės (vadinamos “energija”) susijusios su kiekvienu elementu kintamųjų aibėje ir jų poromis. Kiekvieno rotamero pradinės tikimybės. Rotamero energijos ir tikimybių funkcijos. Bioinformatika (B110M100) 42 Nuoseklaus vidurkių lauko algoritmas (3) Pradžioje yra laikoma, kad yra p rotamerų k-tojoje padėtyje, o rotamero tikimybė yra 1/p Transformacija tarp energijos ir tikimybės yra atliekama naudojant Bolcmano formulę. Temperatūros parametras yra naudojamas kaip optimizavimo parametras Kiekvieno rotamero energijos pasiskirstymas yra proporcingas jo tikimybei N ilgio baltymo su p rotamerų energija iteracijoje i: N p M i rkA Ek rkA Pi 1 rxy Exy rkA , rxy x 1 y 1 kur: Mi – vidutinė lauko energija E – iš anksto apskaičiuota rotamero energija, Pi(rkA) – rotamero tikimybė Bioinformatika (B110M100) 43 Nuoseklaus vidurkių lauko algoritmas (4) Tikimybės apskaičiuojamos naudojant Bolcmano formulę: Pi rkA M i rkA exp kT p M i rky exp kT y 1 1 kur: k – Bolcmano konstanta, T – temperatūra. Sistemos energija apskaičiuojama taip: M sys M sin gle M pair kur: p N M sin gle P rxy Ex rxy x 1 y 1 N p M pair Pr Pr E r N p x 1 y 1 a x 1 b 1 Bioinformatika (B110M100) y x b a xy y x , rab 44 Struktūrinis sugretinimas (1) Naudojamas baltymų struktūros sugretinimui, kai sekos evoliucijos metu taip nutolo, kad įprastiniai sekų sugretinimo metodai neleidžia nustatyti sekų panašumo Leidžia patikimiau nustatyti ryšį tarp baltymų Turint struktūrinio sugretinimo tarp tikslinės ir šabloninės sekos informaciją galima sukurti labai patikimus baltymų modelius. Kombinacinio išplėtimo metodas Pirmiausiai sugretina trumpus dviejų analizuojamų baltymų fragmentus, o paskui juos surenka į didesnį sugretinimą. Naudojant įvairius dydžius, pvz., vietinę antrinę struktūrą ar kaimyninės grandinės hidrofobiškumą, sukuriamos sugretintų fragmentų poros, kurios yra naudojamos sudarant panašumų matricą Struktūrinis sugretinimas yra optimalus kelias matricoje iš vienos baltymų struktūros būsenos į kitą. Bioinformatika (B110M100) 45 Struktūrinis sugretinimas (2) Algoritmo tikslas: surasti vietinį „gerą“ baltymų ir struktūrų sugretinimą. Algoritmo eiga: Pasirinkti pradines sugretintų fragmentų poras. Sudaryti sugretinimo kelią iteraciškai pridedant sugretintų fragmentų poras. Kartoti 2 žingsnį tol, kol pereinama per visą kiekvieno baltymo sekos ilgį. Bioinformatika (B110M100) 46 Struktūrinis sugretinimas (3) Atstumas tarp dviejų skirtingų sugretintų fragmentų porų: 1 m Dij d A ( piA k 1, p Aj m k ) d B ( piB k 1, p Bj m k ) m k 1 kur: dA(p,q) – atstumas tarp baltymo α-anglies atomų padėtyse p ir q. Tarkime sugretinimo kelias jau yra sudarytas iš sugretintų fragmentų porų. N-toji pora yra pridedama jei tenkinamos sąlygos: Dnn D0 1 n1 Din D0 n 1 i 0 1 n2 n n D i 0 j 0 ij D1 kur: D0, D1 – atkirtimo atstumai. Jei paskutinė sąlyga netenkinama, sugretinimo kelio ilginimas yra baigiamas. Bioinformatika (B110M100) 47 Baltymų mikrogardelių panaudojimas Panaudojimas Aprašymas Baltymų Antikūnų mikrogardelės pagalba galima tirti baltymų ekspresijos tyrimai ekspresiją, nes kiekvienas antikūnas, esantis mikrogardelės taške, atpažįsta specifinę aminorūgščių seką Baltymų funkcijos tyrimai Grupės baltymų substratinis specifiškumas ir fermentinis aktyvumas gali būti tiriami veikiant mikrogardelę skirtingais substratais Baltymų sąveikos su baltymais tyrimai Dviejų baltymų gebėjimas sąveikauti gali būti tiriamas veikiant mikrogardelę fluorochromu pažymėtais baltymais Farmakologiniai tyrimai Vaistų gebėjimas susijungti su ląstelės baltymais gali būti tiriamas veikiant mikrogardelę įvairiais pažymėtais vaistais