Predykcja struktur glikanów
Download
Report
Transcript Predykcja struktur glikanów
Institute of Automation
Silesian University of
Technology
Gliwice, Poland
Budowa glikanów produkowanych w procesie glikozylacji jest uzależniona od tzw. kodu
biosyntetycznego - zestawu różnorodnych biosyntetycznych reakcji katalizowanych przez
enzymy – glikotransferazy.
98 genów
glikotransferaz (GT)
Eksperymentalne określenie koncentracji
poszczególnych glikanów jest aktualnie
niezwykle trudnym zadaniem.
42 reakcje
glikozylacji
Na podstawie informacji o poziomie ekspresji genów GT
powinno być możliwe określenie zestawu struktur
pojawiających się z największym prawdopodobieństwem.
Ponad 10,000 różnych
struktur glikanów
Pojawienie się „osobliwych” glikanów na powierzchni komórki jest wykorzystywane w
diagnostyce, gdyż stanowią one znacznik (marker) komórek nowotworowych, ich obecność
często świadczy o szybkim rozwoju choroby.
Informacje o budowie
znanych glikanów
Informacje o ekspresji
genów glikotransferaz
predykcja
Zestaw struktur glikanów
(Kawano et al. 2005)
Budowa bazy danych
Struktury glikanów opisane w
bazie danych KEGG Glycan
rozbito na pojedyncze pary
monosacharydów połączonych
określonym wiązaniem
ENTRY
G00001
Glycan
NAME
N-Acetyl-Dglucosaminyldiphosphodolichol
COMPOSITION (GlcNAc)1 (PP-Dol)1
MASS
203.2 (PP-Dol)
REMARK
Same as: C04500
REACTION
R05969 R05970
PATHWAY
ko00510 N-Glycan biosynthesis
ko01100 Metabolic pathways
ENZYME
2.4.1.141
2.7.8.15
NODE
2
1
PP-Dol
3
0
2
GlcNAc
-4
0
EDGE
1
1
2:a1
1
///
Baza danych KEGG Glycan
| GlcNAc a1 PP-Dol | GlcNAc b1-4 GlcNAc | Man b1-4 GlcNAc | ...
--------+------------------+--------------------+-----------------+---G00001 |
1
|
0
|
0
|
G00002 |
1
|
1
|
0
|
G00003 |
1
|
1
|
1
|
....
Macierz reakcji
| GlcNAc a1 PP-Dol | GlcNAc b1-4 GlcNAc | Man b1-4 GlcNAc | ...
-------------------+------------------+--------------------+-----------------+---GlcNAc a1 PP-Dol
|
1
|
0.456
|
0.364
|
GlcNAc b1-4 GlcNAc |
0.456
|
1
|
0.743
|
Man b1-4 GlcNAc
|
0.364
|
0.743
|
1
|
....
Macierz korelacji
Dla każdej struktury zliczono
ilość wystąpień każdej możliwej
pary
Pomiędzy każdymi dwiema
parami monosacharydów
obliczono miarę podobieństwa
(Cosine) określającą jak często
dane dwie pary wiązań występują
razem w jednym glikanie
Informacje o budowie
znanych glikanów
Informacje o ekspresji
genów glikotransferaz
predykcja
Zestaw struktur glikanów
(Kawano et al. 2005)
Ekspresja genów glikotransferaz (GT)
K562 K.1
K562 K.2
K562 24h.1
K562 0h.1
K562 0h.2
K562 24h.2
surowe dane ekspresji genów
EntrezGeneID | K562 0h.1 | K562 0h.2 | K562 24h.1 | ...
-------------+-----------+-----------+------------+--2523
|
5.98
|
6.01
|
6.31
|
79087
|
5.63
|
5.27
|
5.35
|
2527
|
4.17
|
4.46
|
4.28
|
6482
|
3.63
|
3.60
|
3.60
|
....
przetworzone dane ekspresyjne
|
fold change
|
p-value
|
EntrezGeneID | K562 0h/C | K562 24h/C | K562 0h/C | K562 24h/C |
-------------+------------+------------+-----------+------------+
2523
| 1.3589
|
1.2610
|
0.0342 |
0.0009
|
10678
| 1.3457
|
1.1593
|
0.0346 |
0.0023
|
56886
| 1.4818
|
1.2026
|
0.0442 |
0.0205
|
....
geny GT o zmienionym
poziomie ekspresji
lista reakcji
katalizowanych przez
stymulowane geny
LFuc
GlcNAc
GlcNAc
Gal
GlcNAc
....
a1-3
b1-3
b1-4
b1-4
b1-4
GlcNAc
Gal
Man
Xyl
Man
Ekspresje genów GT zmierzono za
pomocą 6 mikromacierzy
oligonukleotydowych dla komórek
nowotworowych poddanych działaniu
4Gy promieniowania jonizującego.
Dane poddano niestandardowemu
przetwarzaniu dzięki któremu
określono grupę genów GT których
ekspresja zmienia się w sposób
znamienny statystycznie na skutek
promieniowania.
Na podstawie informacji z
literatury określono jakie wiązania
katalizowane są przez
glikotransferazy będące
produktem wybranych genów
Informacje o budowie
znanych glikanów
Informacje o ekspresji
genów glikotransferaz
predykcja
Zestaw struktur glikanów
(Kawano et al. 2005)
Współczynnik predykcji
LFuc
GlcNAc
GlcNAc
Gal
GlcNAc
...
a1-3
b1-3
b1-4
b1-4
b1-4
…
| GlcNAc a1 PP-Dol | GlcNAc b1-4 GlcNAc | ...
------------------+------------------+--------------------+
GlcNAc a1 PP-Dol
|
1
|
0.456
|
GlcNAc b1-4 GlcNAc |
0.456
|
1
|
Man b1-4 GlcNAc
|
0.364
|
0.743
|
...
Dla każdej struktury w oparciu o macierz podobieństwa miedzy
parami glikotransferaz obliczany jest współczynnik predykcji
GlcNAc
Gal
Man
Xyl
Man
Współczynnik predykcji
1
1 n m
S E ( SC (qi , b j ) h(qi ))
m i 1 j 1
1, qi present
h(qi )
0, qi absent
2
E g (qi )
1 n m
S E ( SC (qi , b j ) n
)
m i 1 j 1
Eg (qi )
i 1
• SC (qi,bj)–współczynnik korelacji pomiedzy wiązaniami katalizowanymi przez
glikotransferaze qi oraz element badanej struktury bj
•
Eg(qi) – poziom ekspresji genu qi
• n – liczba genów GT analizowanych za pomocą mikromacierzy
• m – liczba wiązań w aktualnie analizowanej strukturze
Zmiany ekspresji genów GT – K562
300
250
200
150
Expression level
100
50
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 1112 13 14 15 16 17 18 1920 21 22 23 24 25 26 2728 29 30 31 32 33 3435 36 37 38 39 40
GT gene
Weryfikacja metodą leave-one-out
Specyficzności algorytmu zweryfikowano metodą leave-one-out tworząc macierz
podobieństwa dla wszystkich struktur poza jedną która użyta została jako wzorzec
reakcji w miejsce reakcji katalizowanych przez zbiór genów glikotransferaz.
90
Percentage
80
70
60
50
40
0
10
20
30
40
50
Rank
60
70
80
90
100
procent struktur jakie zostały zidentyfikowane na określonym miejscu 4036
elementów listy predykcyjnej lub ponad nim
1st rank
Structure: G04183
Score:
2,404
2nd rank
Structure: G04804
Score:
2,389
3rd rank
Structure: G05226
Score:
2,389
3 struktury o największym
współczynniku predykcji
tj. o największym
prawdopodobieństwie
pojawiania się na
powierzchni badanych
komórek w wyniku
działania promieniowania
jonizującego wg.
zastosowanej metody
Do charakterystyki glikanów na powierzchni komórki użyto lektyn znakowanych barwnikiem
fluoroscencyjnym oraz czytnika mikropłytek mierzącego poziom fluorescencji.
Zmiany na poziomie glikanów określone za pomocą znakowanych lektyn nie odzwierciedlają
bezpośrednio zmian na poziomie transkryptów genów glikotransferaz z uwagi na długi czas
potrzebny na ich zsyntetyzowanie.
transkrypcja
DNA
mRNA
glikozylacja
translacja
Białka (GT)
transport
Glikany
~ 24 godziny
Badanie wykonano 24 godziny po poddaniu komórek działaniu promieniowania jonizującego.
Lektyna
Specyficzność
FC 24h
GSL-I
WGA
UEA-I
α-D-GalNAc
(dGlcNAc)2NeuNAc
Fucose
0,64
1,23
1,34
W wielu sytuacjach zestaw glikanów może nie odzwierciedlać teraźniejszego bądź
przeszłego stanu transkryptomu z powodu skomplikowanych mechanizmów
regulacyjnych pojawiających się na wielu etapach procesu powstawania i transportu
glikanów.
Planowane udoskonalenia metody:
Opracowanie lepszych metod weryfikacji w oparciu o dane uzyskane za
pomocą znakowanych lektyn
Możliwość definiowania zestawu aktywnych reakcji na podstawie danych
innego typu niż mikomacierzowe (np. real-time PCR)
Uwzględnienie kinetyki reakcji glikozylacji podczas wyznaczania
współczynnika predykcji
Dziękuje za uwagę
Zmiany ekspresji genów GT
600
expression level
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
GT gene
1000
expression level
800
600
400
200
0
1 2 3 4 5 6 7 8 9 10 1112 13 14 15 16 17 18 1920 21 22 23 24 25 26 2728 29 30 31 32 33 3435 36 37 38 39 40
GT gene
K562
Zliczenie
podjednostek dla
struktur
w rankingu:
1:10
Zmiana [%]
Xyl
Neu5Ac
Glca
LFuc
3
rozgałęzienia
4
rozgałęzienia
5
rozgałęzień
0
0
2
0
14
26
2
0
45
0
0
2
0
14
26
2
0
15
36
0
0
7
0
4
15
0
0
34
15
36
0
0
7
0
4
15
0
0
9,7
-28,6
-20,0
0,0
0,0
250,0
0,0
-71,4
-42,3
-100,0
0
Próba
Glc
Man
Gal
K
0
31
21
45
0h
0
31
21
24h
0
34
36h
0
0
GlcNAc GalNAc