STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Download Report

Transcript STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

STRUKTŪRINĖ IR
FUNKCINĖ GENOMIKA,
PROTEOMIKA IR
BIOINFORMATIKA
ĮVADAS

Genomika yra rūšies viso genomo molekulinė
analizė

Genomo analizę sudaro dvi pagrindinės fazės



Genolapio sudarymas
Sekvenavimas (nukleotidų sekos nustatymas)
1995 m. mokslininkai vadovaujami Craigo
Venterio ir Hamiltono Smitho nustatė pirmojo
organizmo pilną DNR seką

Tai buvo bakterija Haemophilus influenzae
10-2
1.83 milijonų bp
~ 1,743 genų
Bakterijos Haemophilus influenzae pilnas genolapis
10-3

1996 m. buvo pabaigtas pirmojo eukariotinio organizmo
genomo tyrimas. Jį atliko pasaulinis mokslininkų
konsorciumas, vadovaujamas Andre Goffeau iš Belgijos


Saccharomyces cerevisiae
Genomą sudaro 16 linijiškų chromosomų





~ 12 milijonų bp, ~ 6,200 genų
Vėliau buvo sekvenuoti kitų organizmų genomai, įskaitant
žmogų
Struktūrinė genomika prasideda genolapio sudarymu ir
baigiasi pilnu genomo sekvenavimu
Funkcinė genomika tiria, kaip genų sąveikos skuria
organizmo požymius
Funcinės genomikos pagrindinė paskirtis yra išsiaiškinti
genetinių sekų reikšmę organizmo funkcionavimui

Daugeliu atvejų tai leidžia suprasti geno funkciją
10-4



Pilnas rinkinys baltymų, kuriuos gali sintetinti
organizmas, yra vadinamas proteomu
Proteomika yra visų genomo koduojamų
baltymų ir jų sąveikų tyrimas
Proteomikos tikslas yra išsiaiškinti
organizmo baltymų funkcinę paskirtį


Taip pat ji siekia ištirti baltymų sąveikas
Bioinformatikos tikslas yra perskaityti
informaciją, esančią genetinėse sekose,
naudojant matematinius/kompiuterinius
metodus
10-5
10.1 STRUKTŪRINĖ GENOMIKA


DNR sričių struktūrinė organizacija paprastai
nustatoma trimis būdais
1. Citogenetinis (geno)kartografavimas



Remiasi mikroskopine analize
Genai siejami su chromosomų ruožais
2. Sankibos (geno)kartografavimas


Remiasi kryžminimais
Nustatoma genų padėtis vienas kito atžvilgiu


Atstumai matuojami genolapio vienetais (arba centimorganais)
3. Fizinis (geno)kartografavimas


Remiasi DNR klonavimo metodais
Nustatoma genų padėtis vienas kito atžvilgiu

Atstumai matuojami bazių poromis
10-6
Citogenetinis (geno)kartografavimas

Citogenetinis kartografavimas remiasi mikroskopija


Eukariotų chromosomas galima atskirti pagal




Dažniausiai naudojamas tiriant eukariotus, turinčius
dideles chromosomas
Dydį
Centromeros padėtį
Ruožuotumą
Ruožuotumas išryškėja chromosomas nudažius
specifiniais dažais

Jis naudojamas genų kartografavimui
10-7

Darant citogenetinį kartografavimą yra bandoma
nustatyti genų išsidėstymą specifinių chromosomos
ruožų atžvilgiu


Dažniausiai tai yra augalų ir gyvūnų genų lokalizacijos
nustatymo pirmasis etapas
Citogenetinis kartografavimas remiasi mikroskopija

Todėl jo skiriamoji geba yra gana limituota


Daugelio rūšių atveju ji yra ~ 5 milijonus bp
Skiriamoji geba daug geresnė toms rūšims, kurios turi
politenines chromosomas

Pvz., Drosophila melanogaster
10-8
Hibridizacija in situ

Hibridizacija in situ padeda nustatyti geno padėtį
intaktinėse chromosomose



Ji naudojama nustatyti genų ar DNR sekų lokalizaciją
didelėse eukariotų chromosomose
Naudojami zondai, padedantys aptikti ieškomas
DNR sekas (“taikinį”)
Dažniausiai naudojami fluorescenciniais dažais
pažymėti DNR zondai

Šis metodas vadinamas fluorescencine in situ hibridizacija
(FISH)
10-9
Ląstelės veikiamos medžiagomis, fiksuojančiomis
jas ant stikliuko
DNR zondai yra chemiškai
modifikuoti taip, kad prie jų
gali prisijungti
fluorescuojanti žymė
Fluorescencinės in situ hibridizacijos (FISH) metodas
10-10

Fluorescencinių zondų skleidžiamai šviesai
aptikti yra naudojami fluorescenciniai
mikroskopai

Fluorescuojantis zondas yra matomas kaip
švytinti sritis nešvytinčiame fone


Zondai prisitvirtina tik prie specifinių sekų
FISH eksperimentų rezultatai yra lyginami su
Giemsa dažais nudažytų chromosomų
vaizdu

Zondo padėtis gali būti nusakoma G ruožų
atžvilgiu
10-11
10-12
10-13
Sankibos (geno)kartografavimas

Sankibos kartografavimas remiasi rekombinantinių
palikuonių dažnio skaičiavimu




Visi genai, esantys vienoje chromosomoje, yra paveldmi
kartu sukibę, t.y. sudaro vieną sankibos grupę
Jei įvyksta krosingoveris, gali pasikeisti sukibusių genų seka
Krosingoverio dažnis tuo mažesnis, kuo arčiau vienas kito
yra sukibę genai
Gali būti sudaromi ne genų, o genetinių žymenų
genolapiai. Molekulinis žymuo yra DNR fragmentas,
kuris randamas specifinėje chromosomos vietoje ir
gali būti specifiškai atpažintas

Kaip ir alelių atveju, molekulinių žymenų ypatybės gali skirtis
tarp skirtingų individų
10-14
Restrikcijos fragmentų ilgio
polimorfizmas (RFLP)


Restrikcijos fermentai atpažįsta specifines
DNR sekas ir jose kerpa DNR
Ilgose chromosomose gali būti daug vietų,
kurias atpažįsta ir kerpa restrikcijos fermentai


Jos yra pasiskirstę atsitiktinai
Lyginant du individus galima aptikti tokių
atpažinimo vietų kiekio ir/ar išsidėstymo skirtumus
10-15
10-16
10-17
Restrikcijos vieta,
randama tik 1-ame
individe
Rodyklės rodo
restriktazių kirpimo
vietas
Populiacijoje stebimas DNR
fragmentų ilgio polimorfizmas
Ši variacija gali atsirasti dėl delecijų,
duplikacijų, genų mutacijų ir t.t.
Restrikcijos fragmentų ilgio polimorfizmas (RFLP)
10-18
EcoRI kirpimo
vietos yra abiejose
chromosomose
EcoRI kirpimo vietų
nėra abiejose
chromosomose
Trijų individų chromosominės DNR RFLP analizė
10-19
EcoRI kirpimo vieta
yra tik vienoje
chromosomoje
Trys individai turi daug
bendrų vienodo ilgio DNR
fragmentų
Jei šie fragmentai randami
99% visų populiacijos
individų, jie vadinami
monomorfiniais
Polimorfinės
juostos
pažymėtos
strėlėmis
10-20
RFLP genolapiai


RFLP sankibos analizė gali būti atlikta su
daugeliu RFLP žymenų, nustatant jų santykinę
padėtį genome
Genolapis, sudarytas iš daugelio RFLP
žymenų, vadinamas RFLP genolapiu

RFLP genolapiai naudojami genų padėčiai
nustatyti tam tikroje chromosomoje
10-21
Keletas
žinomų genų
pažymėti
raudonai
Kairiojoje
pusėje nurodyta
RFLP žymenų
išsidėstymas
Dešiniojoje
pusėje nurodyti
genetiniai
atstumai
Supaprastintas augalo Arabidopsis thaliana RFLP genolapis
10-22
Fizinis (geno)kartografavimas

Fiziniam kartografavimui atlikti reikia klonuoti
daugelį chromosominės DNR fragmentų

Klonuoti DNR fragmentai yra apibūdinami pagal




1. Dydį
2. Turimus genus
3. Padėtį chromosomoje
Pastaraisiais metais naudojant fizinį
kartografavimą sekvenuoti ištisi genomai
10-23
10-24
10.2 FUNKCINĖ GENOMIKA

Atliekamas plataus masto genomų
sekvenavimas leidžia tyrinėti genų veiklą daug
sudėtingesniame lygmenyje


Dabar galima vienu metu tirti daugelio genų grupių
veiklą
Vienas iš pagrindinių genominių tyrimų tikslų
yra nustatyti tas DNR sritis, kuriose iš tiesų yra
genų

Vienas būdų tai padaryti yra parodyti, kad tiriama
sritis yra transkribuojama į RNR
10-25
Genų ekspresija gali būti nustatyta
cDNR bibliotekoje

Tai padaroma sukuriant cDNA biblioteką


cDNR (copy DNA) yra gaunama atvirkštinės transkriptazės pagalba
susintetinus DNR nuo mRNR, išskirtos iš ląstelės
cDNR biblioteka taip pat vadinama EST biblioteka (expressed
sequence tag library)


EST bibliotekoje esančios sekos gali būti sekvenuotos ir
vėliau palygintos su genomo sekomis


Šios sekos taip pat gali būti naudojamos kaip žymenys, atliekant fizinį
chromosomų kartografimą
Atitikimai rodo, kurios genomo vietos koduoja genus
cDNR bibliotekos sukūrimas padeda tirti genų reguliaciją
genomo lygmenyje

Tokių tyrimų strategija yra išskirti mRNR esant skirtingoms ląstelės ar
organizmo funkcionavimo sąlygoms

Tada galima nustatyti tas mRNR, kurios yra sintetinamos tik esant
vienokioms ar kitokioms sąlygoms
10-26
Mikrogardelės gali nustatyti
transkribuojamus genus

Sukurtas naujas tyrimo metodas, vadinamas DNR
mikrogardelėmis (taip pat vadinama genų lustais)


Šis naujas metodas leidžia vienu metu tirti tūkstančių genų
veiklą
DNR mikrogardelė yra maža silicio, stilo ar plastiko
plokštelė, padengta daugelio DNR sekų taškeliais

Kiekviena iš šių sekų atitinka vieną žinomą geną

Šios sekos veikia kaip zondai, aptinkantys transkribuojamus genus
10-27

Šie DNR fragmentai gali būti



Amplifkuoti PGR pagalba ir vėliau pritvirtinti ant
mikrogardelės
Tiesiogiai susintetinti ant mikrogardelės
Viena mikrogardelė turi dešimtis tūkstančių skirtingų taškų,
o jos dydis neviršia pašto ženklo



Kiekvieno taško (su skirtingo geno DNR) padėtis gardelėje yra
tiksliai žinoma
DNR mikrogradelių gamybos technologija yra gana
įdomi ir primena technologiją, kuri naudojama
rašaliniuose spausdintuvuose
Pagamintos DNR mikrogardelės naudojamos
hibridizacijai su cDNR, susintetinta atvirkštinės
transkriptazės pagalba nuo iš ląstelės išskirtų mRNR
10-28


Mikrogardelė nuplaunama
Po to ji tiriama skenuojančiu
konfokaliniu fluorescenciniu
mikroskopu

Tiriama fluorescuojančios
vietos, kurios rodo įvykusią
hibridizaciją
10-29
10-30
DNR mikrogardelių panaudojimas
Panaudojimas
Aprašymas
Specifinėms ląstelėms
būdingos genų
ekspresijos tyrimai
Lyginant cDNR, gautas iš skirtingų tipų ląstelių,
galima nustatyti genus, kurių ekspresija vyksta tik
tam tikrose ląstelėse ar audiniuose
Genų reguliacijos tyrimai Galima tirti kintančių aplinkos sąlygų įtaką genų
ekspresijai
Metabolizmo kelių
tyrimai
Galima tirti visų genų, dalyvaujančių viename ar
kitame metabolizmo kelyje, ekspresiją
Vėžinių ląstelių tyrimai
Skirtingų tipų vėžinių ląstelių genų ekspresija
labai skiriasi. DNR mikrogardeles galima naudoti
klasifikacijai navikų, kurie morfologiškai nesiskiria
Genetinio kintamumo
tyrimai
Mutantinis alelis gali hibridizuotis su mikrogardele
prasčiau, negu laukinio tipo alelis
Mikroorganizmų
kamienų identifikacija
Mikrogardelių pagalba galima atskirti giminiškų
bakterijų rūšis ar porūšius
10-31
10.3 PROTEOMIKA

Proteomika tiria organizmo gaminamų baltymų
funkcinę paskirtį


Genomikos duomenys gali suteikti svarbių žinių apie
proteomą



Pilnas rūšies baltymų rinkinys yra vadinamas proteomu
1. DNR mikrogardelės parodo genus, kurie yra
transkribuojami esant tam tikroms sąlygoms
2. Skirtingų rūšių genų homologijos tyrimai gali būti
panaudojami baltymų struktūrai ar funkcijai nuspėti
Tačiau genominius tyrimus turi sekti tiesioginiai pačių
baltymų tyrimai
10-32
Proteomas yra žymiai didesnis
už genomą


Viso genomo sekvenavimas ir analizė gali
padėti nustatyti visus rūšies genus
Tačiau proteomas yra didesnis už genomą ir
tikrąjį jo dydį sunku nustatyti

Taip įvyksta dėl keletos procesų



1. Alternatyvaus splaisingo
2. RNR redagavimo
3. Potransliacinės kovalentinės modifikacijos
10-33

1. Alternatyvus splaisingas




2. RNR redagavimas



Svarbiausias pokytis, atsiradęs eukariotuose
Viena pre-mRNR yra pertvarkoma į keletą skirtingų mRNR
Splaisingas dažnai yra specifiškas tam tikroms ląstelėms arba tam
tikroms aplinkos sąlygoms
Sutinkamas rečiau už alternatyvų splaisingą
Pakeičia koduojančią mRNR seką
3. Potransliacinė kovalentinė modifikacija

Funkcionaliam baltymui sukurti gali būti reikalingos negrįžtamos
modifikacijos


Grįžtami pokyčiai gali trumpam pakeisti baltymo funkcijas


Proteolitinis procesingas; prostetinių grupių, cukrų ar lipidų prisijungimas
Fosforilinimas; metilinimas
Visi šie procesai padidina potencialių baltymų kiekį proteome
10-34
Baltymų mikrogardelės


Yra kuriamos ir baltymų mikrogardelės
Baltymų mikrogardelių kūrimas yra sudėtingesnis
procesas



1. Baltymus žymiai lengviau pažeisti, atliekant įvairias
manipuliacijas, reikalingas mikrogardelei pagaminti
2. Baltymų sintezė ir išgryninimas reikalauja daug daugiau
laiko, lyginant su DNR
Nepaisant to, pastaraisiais metais yra pasiektas tam
tikras progresas baltymų mikrogardelių kūrime ir
panaudojime proteomikos tyrimuose
10-35
Baltymų mikrogardelių panaudojimas
Panaudojimas
Aprašymas
Baltymų
Antikūnų mikrogardelės pagalba galima tirti baltymų
ekspresijos tyrimai ekspresiją, nes kiekvienas antikūnas, esantis
mikrogardelės taške, atpažįsta specifinę aminorūgščių
seką
Baltymų funkcijos
tyrimai
Grupės baltymų substratinis specifiškumas ir
fermentinis aktyvumas gali būti tiriami veikiant
mikrogardelę skirtingais substratais
Baltymų sąveikos
su baltymais
tyrimai
Dviejų baltymų gebėjimas sąveikauti gali būti tiriamas
veikiant mikrogardelę fluorochromu pažymėtais
baltymais
Farmakologiniai
tyrimai
Vaistų gebėjimas susijungti su ląstelės baltymais gali
būti tiriamas veikiant mikrogardelę įvairiais
pažymėtais vaistais
10-36

Yra du pagrindiniai baltymų mikrogardelių tipai



Antikūnų mikrogardelės



1. Antikūnų mikrogardelės
2. Funkcinės mikrogardelės
Sudarytos iš rinkinio antikūnų, atpažįstančių
trumpas peptidų sekas
Naudojamos įvertinti baltymų ekspresijos laipsniui
Funkcinės mikrogardelės


Sudarytos iš daugelio skirtingų ląstelės baltymų
Naudojamos baltymų funkcijoms tirti
10-37
10.4 BIOINFORMATIKA

Kompiuteris tapo svarbiu genetinių tyrimų
instrumentu


Genetikos ir informatikos mokslų sandūroje
susikūrė nauja mokslo šaka - bioinformatika
Genetinių sekų kompiuterinei analizei
paprastai reikia trijų pagrindinių elementų:



Kompiuterio
Kompiuterinių programų
Genetinių duomenų
10-38
Sekos analizuojamos naudojant
kompiuterines programas


Kompiuterinė programa yra apibrėžta operacijų seka,
kuri gali analizuoti duomenis pasirinktu būdu
Pirmasis kompiuterinės genetinių duomenų analizės
etapas yra kompiuterinių duomenų bylos sukūrimas


Ši byla yra informacijos rinkinys, tinkamas saugoti ir
manipuliuoti kompiuteryje
Pavyzdžiui, bylą gali sudaryti lacY geno iš E. coli DNR
seka
10-39
Skaičiai rodo bazės
numerį sekos
byloje
10-40

Duomenų suvedimas į kompiuterį atliekamas



Rankiniu būdu
Automatizuotai (tiesiogiai iš sekvenavimo įrenginio)
Genetinės sekos, esančios kompiuterinėse bylose,
gali būti analizuojamos daugeliu būdų

Pavyzdžiui, gali būti ieškoma atsakymų į šiuos klausimus



1. Ar sekoje yra genų?
2. Ar genai turi reguliuojančias sekas (promotorius, splaisingo
vietas ir kt.)?
3. Ar seka koduoja polipeptidą?



Jei taip,tai kokia šio polipeptido seka?
4. Ar seka yra homologinė kuriai nors kitai sekai?
5. Koks yra evoliucinis ryšys tarp dviejų ar daugiau genetinių
sekų?
10-41
Kompiuterinės duomenų bazės


Genetinės informacijos kiekis, nustatomas
mokslininkų, yra itin didelis
Ši informacija kompiuterinių bylų pavidalu yra
kaupiama genetinių duomenų bazėse

Bylos tokiose duomenų bazėse dažniausiai yra anotuotos



Jose yra genetinė seka ir detalus jos aprašymas
Be to, pateikiamos kitos svarbios sekų ypatybės
Pasaulyje egzistuoja keletas didelių genetinių
duomenų bazių, turinčių duomenis iš tūkstančių
laboratorijų
10-42
Pagrindinės genetinių duomenų bazės
Tipas
Aprašymas
Nukleotidų
sekos
Duomenys kaupiami trijose bendradarbiaujančiose duomenų
bazėse: GenBank (JAV), EMBL (European Molecular Biology
Laboratory Nucleotide Sequence Database) ir DDBJ (DNA
Data Bank of Japan).
Aminorūgščių Pagrindinės duomenų bazės yra šios: Swissprot (Swiss
sekos
Protein Database), PIR (Protein Information Resource),
Genpept (transliuojamų peptidų sekos iš GenBank db),
TrEMBL (transliojamų peptidų sekos iš EMBL db)
Erdvinės
struktūros
PDB (Protein Data Bank) saugomos biologinių
makromolekulių, pagrindinai baltymų, erdvinės struktūros.
Pagrindiniai duomenys gauti rentgenostruktūrinės analizės
būdu arba naudojam BMR.
Baltymų
motyvai
Prosite yra duomenų bazė, kaupianti informaciją apie
baltymų motyvus, būdingus baltymų šeimoms, domenų
struktūroms ar potransliacinėms modifikacijoms
10-43
Kompiuterinės duomenų bazės


Anksčiau paminėtos genetinių duomenų bazės
kaupia informaciją apie daugelį skirtingų biologinių
rūšių
Taip pat yra kuriamos genomo duomenų bazės



Tai yra specializuotos duomenų bazės, kuriose kaupiami
duomenys apie atskiras rūšis
Jų pagrindinis tikslas yra susisteminti sekvenavimo ir
kartografavimo rezultatus
Genomo duomenų bazėse taip pat yra duomenų apie
alelius, tyrimus atliekančius mokslininkus ir bibliografinės
rodyklės
10-44
Skirtingos analizės strategijos


Kompiuterinės programos gali aptinkti reikšmingas
vietas labai ilgose sekose
Jų veikimo principas gali būti pademonstruotas 54
raidžių sekos pavyzdžiu:
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Šią seką galima analizuoti bent trimis būdais
10-45

Pirmoji programa gali nustatyti visus anglų kalbos žodžius,
esančios šioje sekoje:
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Antroji programa nustato žodžių serijas, kurios formuoja
gramatiškai teisingą sakinį:
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Trečioji programa aptinka penkių raidžių sekas, kurios
randamos orientuotos priešingomis kryptimis:
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE
10-46


Taigi, kompiuterių programos atpažįsta arba sekas,
arba struktūras
Sekų atpažinimas

Programa turi informacijos, kad specifinė seka ar simboliai
turi specializuotą reikšmę


Turėdama šią informaciją, pirmoji programa gali nustatyti sekas ar
raides, kurios sudaro žodžius
Struktūrų atpažinimas

Nėra paremtas specifinių sekų turimos informacijos
atpažinimu

Šio tipo programos (pvz., pavyzdžio trečioji programa) ieško tam
tikrų dėsningų struktūrų, kurios gali būti bet kurioje sekoje ar sekų
grupėje
10-47

Anksčiau paminėtos programos iliustruoja
pagrindines sekų identifikavimo strategijas:

1. Nustatomos prasmingos specializuotos sekos
(sekų elementai), esančios labai ilgoje genetinėje
sekoje



2. Nustatoma sekų ar jų elementų organizacija


Kurie sekų elementai prasmingi, yra nustatyta pačioje
programoje
Pavyzdys yra pirmoji programa
Pavyzdys yra antroji programa
3. Nustatoma sekų struktūra

Pavyzdys yra trečioji programa
10-48


Genetinė seka, turinti tam tikrą funkciją, yra
vadinama sekos elementu arba sekos motyvu
Taip pat aptikti specifiniai aminorūgščių motyvai,
atliekantys baltymuose specializuotas funkcijas


Pvz., asparaginas–X–serinas (kur X yra bet kuri
aminorūgštis) yra eukariotų baltymų glikozilinimo vieta
Prosite duomenų bazėje yra kaupiamos žinios apie
aminorūgščių motyvus, turinčius funkcinę reikšmę

Tokia duomenų bazė padeda greičiau išsiaiškinti naujai aptiktų
baltymų funkcijas
10-49
Trumpi sekų elementai, nustatomi kompiuterinės
analizės metu
Sekos tipas
Pavyzdys
Promotoriai
Daugelis E.coli promotorių turi TTGACA (-35 padėtis) ir TATAAT (10 padėtis) sekas. Eukariotų promotoriai gali turėti CAAT, GC, TATA
dėžutes ir t.t
Atsako elementai
Gliukortikoidų atsako elementai (AGRACA), cAMP atsako
elementai (GTGACGTRA)
Starto kodonas
ATG
Stop kodonai
TAA, TAG, TGA
Splaisingo vieta
GTRAGT------------------YNYTRAC(Y)nAG
Poliadenilinimo signalas
AATAAAA
Aukšto dažnio kartotinės
sekos
Santykinai trumpos sekos, pasikartojančios genome daugelį kartų
Transpozabilūs
elementai
Paprastai nustatomi pagal tai, kad tiesioginės pasikartojančios
sekos yra apsuptos invertuotų pasikartojančių sekų
R – bet kuris purinas, Y – bet kuris pirimidinas, N - bet kuri bazė
10-50
Struktūrinių genų nustatymas

Genų nustatymui kompiuterinės programos gali
naudoti skirtingas strategijas:

Paieška pagal signalą

Programa bando nustatyti žinomų sekų elementų, dažniausiai
randamų genuose, išsidėstymą tiriamoje sekoje


Promotoriai, starto/stop kodonai
Paieška pagal turinį

Programa stengiasi nustatyti sekas, kurių nukleotidų sudėtis skiriasi
nuo atsitiktinio pasiskirstymo

Tai daroma todėl, kad struktūriniuose genuose kodonai naudojami
neatsitiktinai
10-51


Kitas būdas nustatyti koduojančias sritis yra
analizuoti transliuojamus skaitymo rėmelius
DNR sekoje kodonų nuskaitymas gali prasidėti
nuo pirmojo, antrojo arba trečiojo nukleotido


Tai 1, 2 ir 3-as skaitymo rėmeliai
Atviras skaitymo rėmelis (open reading frame ORF) yra nukleotidų seka, neturinti stop
kodonų


Prokariotams būdingi ilgi atviri skaitymo rėmeliai
Eukariotų koduojančios sekos gali būti pertrauktos
intronų
10-52

Kompiuterinė programa gali nustatyti visus atvirus skaitymo
rėmelius genominėje DNR sekoje, ieškodama ilgo ASR
Stop kodonai
Ilgas ASR

Taip pat gali būti, kad seka nuskaitoma iš kairės į dešinę

Todėl naujai nustatytoje sekoje galimi šeši rėmelių skaitymo variantai
10-53
Kompiuterinės programos gali
nustatyti homologines sekas

DNR sekvenavimo duomenys leidžia tirti evoliucinius
ryšius molekuliniame lygmenyje


Tokie tyrimai tapo galingu genomikos tyrimų metodu
Lyginant genetines sekas, kartais galima aptikti dvi
ar daugiau panašių sekų
10-54

lacY geno DNR sekos


~ 78% bazių sutampa
Šiu atveju sekos panašios, nes du tiriami
genai yra homologiški

Jie išsivystė iš to paties protėvinio geno
10-55
Atsitiktinių
mutacijų
kaupimasis
dviejuose
genuose
Du lacY
genai yra
panašūs, bet
nevienodi
10-56


Kai du homologiniai genai yra randami skirtingose
rūšyse, jie yra vadinami ortologais
Kai du homologiniai genai randami tame pačiame
organizme, jie yra vadinami paralogais


Genų šeima, sudaryta iš dviejų ar daugiau homologinių
genų kopijų, esančių to paties organizmo genome
Svarbu nepainioti sąvokų homologija ir panašumas



Homologija nurodo bendrą kilmę
Panašumas reiškia didelį sekų sutapimo laipsnį
Daugeliu atveju panašumas yra dėl homologijos

Tačiau taip yra ne visada
10-57
Tiriant genų sekas galima
nusakyti RNR ir baltymų struktūrą

Makromolekulių, tokių kaip DNR, RNR ir baltymai,
funkcijos priklauso nuo jų struktūros


Jų erdvinė struktūra iš tiesų priklauso nuo juos sudarančių
elementų linijinio išsidėstymo
Dabartiniu metu erdvinė makromolekulių struktūra
tyrinėjama naudojant pagrindinai biofizikinius
metodus



Pvz., rentgenokristalografiją ir BMR
Šie metodai yra techniškai sudėtingi ir reikalauja daug
laiko
DNR sekvenavimas yra žymiai paprastesnis
10-58

RNR molekulės paprastai sudaro antrines
struktūras, turinčias dvigrandinines sritis



Šios struktūros yra toliau lankstomos ir
pakuojamos, susidarant tretinėms struktūroms
Genetikus šios struktūros domina, nes nuo jų
priklauso molekulių funkcijos
Todėl RNR struktūrų kompiuterinis
modeliavimas yra svarbus tokių tyrimų
instrumentas
10-59
Šioje struktūroje
yra 45 smeigtuko
galvutės
struktūros
E.coli 16S RNR antrinės struktūros modelis
10-60



Struktūros nustatymas taip pat naudojamas ir
proteomikoje
Pasikartojantys baltymų struktūriniai elementai yra a
spiralės ir b klostės
Keletas kompiuterinių programų yra naudojamos
antrinei baltymų struktūrai nustatyti, remiantis
pirmine jų struktūra

Šios programos remiasi keletu skirtingų parametrų

Dažniausiai yra naudojami aminorūgščių statistiniai dažniai,
nustatyti tiriant tas antrines struktūras, kurios buvo kristalizuotos

Baltymų antrinės struktūros kompiuterinio nustatymo tikslumas siekia
60-70%
10-61