Thiết kế mồi - Minh Quan Bioinformatic

Download Report

Transcript Thiết kế mồi - Minh Quan Bioinformatic

ĐẠI HỌC NGUYỄN TẤT THÀNH
Bioinformatics
NGUYỄN THÁI MINH QUÂN
1
Học thuyết trung tâm
DNA
3’
5’
Sao chép
Phiên mã
mRNA
Dịch mã
Poly-peptide
Protein
2
PCR (Polymerase Chain Reaction)
3
Phân tích trình tự DNA
 Trình tự DNA:
 Trình tự bộ gene
 Trình tự một gene
 Phân tích:
 Chuyển đổi trình tự DNA
 Dự đoán gene
 Thiết lập bản đồ enzyme cắt giới hạn
 Thiết kế mồi
Bioinformatics
4
Trình tự DNA
Giải trình tự
…ATGCATGCATG…
Phương pháp
Sanger
DNA bộ gene
CSDL trình Bioinformatics
tự gene
Bioinformatics
Bioinformatics
CSDL
trình tự
bộ gene
5
Phương pháp Sanger
Nguồn: the-scientist.com
6
Giải mã trình tự bộ gen người
 Human Genome Project (HGP)
 Bắt đầu năm 1990 – Hoàn tất 2003
 20,000 – 25,000 gene
 Tổng chi phí 3 tỷ USD
Bioinformatics
7
Archon X Prize
 X Prize Foudation
 Chi phí giải mã 1 genome: 10 triệu
USD
 Tốc độ 100 genome người trong vòng
10 ngày
 Độ chính xác 98% trên toàn bộ
genome; 1/100,000
Bioinformatics
8
Chuyển đổi trình tự DNA
 Dựa trên nguyên tắc bổ sung A-T, G-C
 Các dạng chuyển đổi:
 Ngược chiều (Reverse)
 Bổ sung (Complement)
Bioinformatics
9
Ngược chiều và bổ sung
Gene mục tiêu:
Gene mục tiêu:
5’-ATTCAGAATA-3’
5’-ATTCAGAATA-3’
Reverse
5’-ATAAGACTTA-3’
Complement
5’-TATTCTGAAT-3’
Phiên mã
3’-TAAGTCTTAT-5’
GENE ANTISENSE
Phiên mã
3’-ATAAGACTTA-5’
Bioinformatics
5’-ATTCAGAATA-3’
10
Xác định các vùng chuyên biệt trên DNA
Mục tiêu: xác định vị trí các vùng “chức năng” trên DNA:
vùng promotor, vùng gene, vùng nhận biết của enzyme cắt
giới hạn,…
Nguyên tắc: dò tìm tín hiệu đặc trưng dọc theo chiều dài DNA
Vùng tín hiệu
đặc trưng
Vị trí
tìm được
Trình tự DNA:
Bioinformatics
11
Dự đoán gene
 Dự đoán gene của virus, phage,
plasmid
 Dự đoán gene của Prokaryote
 Dự đoán gene của Eukaryote
Bioinformatics
12
Xác định khung đọc mở (ORF)
 ORF (Open Reading Frame)
 Trình tự có codon bắt đầu (AUG) và codon kết
thúc dịch mã (UAA, UAG, UGA).
 Mục tiêu:
 Xác định vùng mã hóa cho protein chức năng
 Cơ sở thiết kế mồi để dòng hóa, biểu hiện trong
vector
 Dự đoán chức năng dựa trên các ORF tương
đồng đã biết chức năng.
Bioinformatics
13
Xác định khung đọc mở (ORF) (tt)
Nguyên tắc: dò tìm trên 6 khung đọc vị trí bộ ba
mở đầu và bộ ba kết thúc.
Trình tự nhập vào: 5’ AATGCTAGCTTACGCTATGAGC 3’
Ba khung đọc trên trình tự nhập vào:
(+1): 5’ AAT GCT AGC TTA CGC TAT GAG C 3’
(+2): 5’ AATG CTA GCT TAC GCT ATG AGC 3’
(+3): 5’ AATGC TAG CTT ACG CTA TGA GC 3’
Ba khung đọc trên trình tự bổ sung:
(-1): 5’ GCT CAT AGC GTA AGC TAG CAT T 3’
(-2): 5’ GCTC ATA GCG TAA GCT AGC ATT 3’
(-3): 5’ GCTCA TAG CGT AAG CTA GCA TT 3’
Bioinformatics
14
Enzyme cắt giới hạn

Là enzyme của vi khuẩn có khả năng cắt DNA ở những vị trí
chuyên biệt.

Chức năng: bảo vệ tế bào vi khuẩn khỏi sự xâm nhập của DNA lạ.

Khoảng 3000 enzyme được tìm thấy với hơn 200 sự chuyên biệt
khác nhau.

Có 3 loại chính:

Loại 1 (1%): nhận diện trình tự dài và cắt tại vị trí xa trình
tự nhận diện khoảng 1000bp

Loại 3 (<1%): nhận diện và cắt tại vị trí xa trình tự nhận
diện 24-26bp.

Loại 2 (95%): nhận diện đoạn trình tự ngắn (4-6bp) và cắt
tại vị trí này. Gồm 2 nhóm: cắt đầu bằng và cắt đầu dính.
Được sử dụng nhiều trong tạo dòng.
Bioinformatics
15
Thiết lập bản đồ enzyme cắt giới hạn
Bản đồ enzyme cắt giới hạn: đánh dấu các vị trí cắt
giới hạn trên toàn bộ bộ gen.
Nguyên tắc: dò tìm từng vùng trình tự nhận biết của
các enzyme cắt giới hạn dọc theo trình tự gốc và xuất
ra vị trí tìm thấy.
Mục tiêu:
Tạo dòng gen
Tạo đột biến
…
Bioinformatics
16
PCR (Polymerase Chain Reaction)
17
PCR (Polymerase Chain Reaction)
18
Máy luân nhiệt
19
Các thành phần của PCR
 DNA khuôn
 Polymerase
 Nucleotide tự do
 Dung dịch đệm
 Mồi
Bioinformatics
20
DNA khuôn
 Là các trình tự DNA dùng để tổng hợp trình tự
mục tiêu
 DNA khuôn có thể là toàn bộ genome hoặc
được giới hạn bởi các enzyme cắt giới hạn
 Cả hai mạch đều được sử dụng trong phản ứng
PCR
Bioinformatics
21
Các loại polymerase dùng trong
PCR
 Tag Polymerase
 Pfu Polymerase
 Polymerase thế hệ mới
Bioinformatics
22
Tag polymerase
 Thermus aquaticus
 Nhiệt độ tối ưu: 75 – 80oC
 Có thể tồn tại 2 giờ ở 92.5oC, 40’ ở 95oC, 7’ ở
97.5oC
 Tốc độ: 1,000bp/10s
 Sai sót: 1/9,000
Bioinformatics
23
Pfu polymerase
 Pyrococcus furiosus
 Chịu nhiệt tốt hơn Tag polymerase
 Có thể tồn tại 6-7h ở 97.5oC
 Tốc độ: 1,000bp/1-2’
 Sai sót: 1/1,300,000
 Có hoạt tính sửa sai
Bioinformatics
24
Polymerase thế hệ mới
 Chịu nhiệt tốt
 Tốc độ cao
 Sai sót ít
 Có thể tái sử dụng nhiều lần
Bioinformatics
25
Nucleotide tự do
 Nucleotide tự do là nguồn nguyên liệu để tổng
hợp mạch mới
 Trong một số trường hợp, người ta bổ sung
một số nucleotide “lạ”
Bioinformatics
26
Dung dịch đệm
 Ảnh hưởng đến hiệu suất, tính chính xác của
phản ứng PCR
 Ứng với từng loại polymerase, nhà sản xuất
khuyến cáo sử dụng dung dịch đệm tương ứng
 Nồng độ Mg2+ là yếu tố quan trọng:
 Thiếu: hoạt động của polymerase kém dẫn đến hiệu
suất PCR kém
 Thừa: thu nhận một số sản phẩm không đặc hiệu, tính
chính xác thấp
Bioinformatics
27
Mồi
 Mồi trong phản ứng sao chép DNA là những
trình tự RNA ngắn được tổng hợp bởi enzyme
Primase
 Mồi trong sinh học phân tử là những đoạn
oligonucleotide ngắn được tổng hợp hóa học
 Ứng dụng: phản ứng PCR, lai phân tử,…
Bioinformatics
Bioinformatics
Thiết kế trình tự mồi
28
Đặc điểm của mồi
 Tính duy nhất: đảm bảo vị trí bắt cặp là DUY
NHẤT trên toàn trình tự
 Chiều dài mồi: tối thiểu 15 base, thông thường
khoảng 17-28 base
 Thành phần base: thường là tổng (G+C)
khoảng 50-60%, tránh trình tự mồi với (A+T)
dài
 Kẹp G/C: tính ổn định ở đầu 3’ ảnh hưởng lớn
tới hiệu quả phản ứng, thường 3’ của mồi là G
hay C
Bioinformatics
29
Đặc điểm của mồi (tiếp theo)
 Độ ổn định đầu 3’: năng lượng cần để phá hủy
sự bắt cặp của 5nu cuối cùng ở đầu 3’, tuy
nhiên để tránh bắt cặp nhầm trên các vùng
giàu GC, 5nu cuối cùng không nên chứa quá
3G/C
 Nhiệt độ nóng chảy (Tm): trong giới hạn 52oC
– 65oC, không nên cách biệt quá lớn giữa 2 mồi
Bioinformatics
30
Các tiêu chuẩn thiết kế mồi
 Tính duy nhất
 Chiều dài: 17-28 base
 Thành phần base: G+C (50-60%), tránh A+T dài
 Tối ưu hóa sự bắt cặp và kéo dài: đầu 3’ của mồi có
độ bền cao và bắt cặp cao
 Nhiệt độ nóng chảy trong giới hạn 48-65˚C
 Sự khác biệt nhiệt độ nóng chảy mồi xuôi và mồi
ngược < 5˚C
 Giảm thiểu sự tự tạo thành cấu trúc bậc hai của
mồi
Bioinformatics
31
Ảnh hưởng của cấu trúc bậc 2
 Cấu trúc bậc 2 giữa hai mồi là sự bắt
cặp bổ sung toàn bộ hay một phần
giữa hai mồi
 Cấu trúc bậc 2 làm mồi mất khả
năng gắn vào DNA mục tiêu
 Giảm số lượng mồi tự do trong môi
trường
 Giảm hiệu quả của phản ứng PCR
Bioinformatics
32
Hairpin
Bioinformatics
33
Self-Dimer
Bioinformatics
34
Dimer
Bioinformatics
35
Mồi hợp lệ?
5’
3’
5’
3’
5’
5’
Bioinformatics
3’
3’
36
Tóm tắt về mồi
Đặc tính:
Tính đặc hiệu
Đặc hiệu cho trình tự
đích (tránh các liên kết
không đặc hiệu)
Tính bền
Hình thành thể lai bền
với đoạn mẫu trong p/ứ
PCR
Tính tương thích
Các đoạn mồi phải chịu
cùng một điều kiện trong
p/ứ PCR
Các yếu tố cần quan tâm:
Tính duy nhất
Chiều dài
Thành phần base
Tính bền
Nhiệt độ nóng chảy
Nhiệt độ hồi tính
Cấu trúc mồi
Sự bắt cặp giữa 2 mồi
Slide 37
THIẾT KẾ MỒI BẰNG CÁC CÔNG CỤ
 Oligo: Life Science Software
 GCG: Accelrys, ICBR maintains the server.
 Primer3: MIT, standalone / web
application
(http://www.bioinformatics.nl/cgibin/primer3plus/primer3plus.cgi)
 BioTools: BioTools, Inc. ICBR distributes
the license.
 Khác: GeneFisher, Primer!, Web Primer,
NBI oligo program, ...
 Oligo Explorer Version 1.1
Slide 38
Mục đích thiết kế mồi
 Thiết kế mồi dòng hóa (Cloning)
 Thiết kế mồi phát hiện (Detecting)
Bioinformatics
39
Thiết kế mồi dòng hóa
 Mồi dòng hóa nhằm mục đích nhân
bản một đoạn gen mục tiêu
 Sản phẩm của phản ứng PCR được
giới hạn bởi 2 mồi xuôi và ngược
 Vùng mở đầu và kết thúc của một
gen phải được đảm bảo
Bioinformatics
40
Yêu cầu đối với mồi dòng hóa
 Mồi xuôi và mồi ngược phải đảm bảo cho
sản phẩm tối ưu nhất, đặc biệt đầu 3’
 Phải lưu ý đến nhiệt độ tách mạch trình
tự, nhiệt độ giữa 2 mồi không quá khác
biệt và nhiệt độ của sản phẩm
 Thời gian của các chu trình phải đảm bảo
sản phẩm được tổng hợp hoàn toàn
Bioinformatics
41
Thiết kế mồi phát hiện
 Mồi phát hiện nhằm mục đích phát
hiện sự tồn tại của một trình tự nào
đó.
 Mồi phát hiện phải được thiết kế trên
một trình tự chuyên biệt cho một
loài hay một nhóm loài quan tâm.
Bioinformatics
42
Yêu cầu đối với mồi phát hiện
 Tính chuyên biệt
 Thời gian của các chu trình vừa đủ
để tổng hợp sản phẩm cần thiết
 Trình tự của sản phẩm phải vừa đủ
cho sự chuyên biệt nhưng không
quá dài.
Bioinformatics
43
Động học của phản ứng PCR
 Tăng trưởng mũ
 Tăng tuyến tính
 Bão hòa
Bioinformatics
44
Bioinformatics
Nguồn: thuvienkhoahoc.com
45
Kiểm tra kết quả PCR – Điện di
 Điện di là hiện tượng dịch chuyển
của các vật thể mang điện tích dưới
tác động của điện trường
 Là 1 kỹ thuật phân tích phân tử
DNA, RNA và protein dựa trên đặc
điểm vật lý của chúng
Bioinformatics
46
Điện di – Thành phần
 Gel (thường là agarose hoặc
polyacrylamide) được cấu trúc với
các kích thước lỗ xác định.
 Dung dịch đệm để dẫn điện và tạo
điện trường, chứa một số chất
nhuộm để xác định vị trí phân tử
trên bản gel.
Bioinformatics
47
Điện di – Hoạt động
 Các phân tử sinh học dịch chuyển
trong điện trường với một tốc độ
khác nhau giới hạn bởi kích thước
phân tử, cấu trúc nội phân tử, cấu
trúc và kích thước lỗ của bản gel
 Thời gian là một yếu tố quyết định
quãng đường dịch chuyển
Bioinformatics
48
Điện di – Kết quả
Bioinformatics
49
Điện di – Kết quả (tt)
Bioinformatics
50
Điện di – Hoạt động
 Các phân tử sinh học dịch chuyển
trong điện trường với một tốc độ
khác nhau giới hạn bởi kích thước
phân tử, cấu trúc nội phân tử, cấu
trúc và kích thước lỗ của bản gel
 Thời gian là một yếu tố quyết định
quãng đường dịch chuyển
Bioinformatics
51