Thiết kế mồi - Minh Quan Bioinformatic
Download
Report
Transcript Thiết kế mồi - Minh Quan Bioinformatic
ĐẠI HỌC NGUYỄN TẤT THÀNH
Bioinformatics
NGUYỄN THÁI MINH QUÂN
1
Học thuyết trung tâm
DNA
3’
5’
Sao chép
Phiên mã
mRNA
Dịch mã
Poly-peptide
Protein
2
PCR (Polymerase Chain Reaction)
3
Phân tích trình tự DNA
Trình tự DNA:
Trình tự bộ gene
Trình tự một gene
Phân tích:
Chuyển đổi trình tự DNA
Dự đoán gene
Thiết lập bản đồ enzyme cắt giới hạn
Thiết kế mồi
Bioinformatics
4
Trình tự DNA
Giải trình tự
…ATGCATGCATG…
Phương pháp
Sanger
DNA bộ gene
CSDL trình Bioinformatics
tự gene
Bioinformatics
Bioinformatics
CSDL
trình tự
bộ gene
5
Phương pháp Sanger
Nguồn: the-scientist.com
6
Giải mã trình tự bộ gen người
Human Genome Project (HGP)
Bắt đầu năm 1990 – Hoàn tất 2003
20,000 – 25,000 gene
Tổng chi phí 3 tỷ USD
Bioinformatics
7
Archon X Prize
X Prize Foudation
Chi phí giải mã 1 genome: 10 triệu
USD
Tốc độ 100 genome người trong vòng
10 ngày
Độ chính xác 98% trên toàn bộ
genome; 1/100,000
Bioinformatics
8
Chuyển đổi trình tự DNA
Dựa trên nguyên tắc bổ sung A-T, G-C
Các dạng chuyển đổi:
Ngược chiều (Reverse)
Bổ sung (Complement)
Bioinformatics
9
Ngược chiều và bổ sung
Gene mục tiêu:
Gene mục tiêu:
5’-ATTCAGAATA-3’
5’-ATTCAGAATA-3’
Reverse
5’-ATAAGACTTA-3’
Complement
5’-TATTCTGAAT-3’
Phiên mã
3’-TAAGTCTTAT-5’
GENE ANTISENSE
Phiên mã
3’-ATAAGACTTA-5’
Bioinformatics
5’-ATTCAGAATA-3’
10
Xác định các vùng chuyên biệt trên DNA
Mục tiêu: xác định vị trí các vùng “chức năng” trên DNA:
vùng promotor, vùng gene, vùng nhận biết của enzyme cắt
giới hạn,…
Nguyên tắc: dò tìm tín hiệu đặc trưng dọc theo chiều dài DNA
Vùng tín hiệu
đặc trưng
Vị trí
tìm được
Trình tự DNA:
Bioinformatics
11
Dự đoán gene
Dự đoán gene của virus, phage,
plasmid
Dự đoán gene của Prokaryote
Dự đoán gene của Eukaryote
Bioinformatics
12
Xác định khung đọc mở (ORF)
ORF (Open Reading Frame)
Trình tự có codon bắt đầu (AUG) và codon kết
thúc dịch mã (UAA, UAG, UGA).
Mục tiêu:
Xác định vùng mã hóa cho protein chức năng
Cơ sở thiết kế mồi để dòng hóa, biểu hiện trong
vector
Dự đoán chức năng dựa trên các ORF tương
đồng đã biết chức năng.
Bioinformatics
13
Xác định khung đọc mở (ORF) (tt)
Nguyên tắc: dò tìm trên 6 khung đọc vị trí bộ ba
mở đầu và bộ ba kết thúc.
Trình tự nhập vào: 5’ AATGCTAGCTTACGCTATGAGC 3’
Ba khung đọc trên trình tự nhập vào:
(+1): 5’ AAT GCT AGC TTA CGC TAT GAG C 3’
(+2): 5’ AATG CTA GCT TAC GCT ATG AGC 3’
(+3): 5’ AATGC TAG CTT ACG CTA TGA GC 3’
Ba khung đọc trên trình tự bổ sung:
(-1): 5’ GCT CAT AGC GTA AGC TAG CAT T 3’
(-2): 5’ GCTC ATA GCG TAA GCT AGC ATT 3’
(-3): 5’ GCTCA TAG CGT AAG CTA GCA TT 3’
Bioinformatics
14
Enzyme cắt giới hạn
Là enzyme của vi khuẩn có khả năng cắt DNA ở những vị trí
chuyên biệt.
Chức năng: bảo vệ tế bào vi khuẩn khỏi sự xâm nhập của DNA lạ.
Khoảng 3000 enzyme được tìm thấy với hơn 200 sự chuyên biệt
khác nhau.
Có 3 loại chính:
Loại 1 (1%): nhận diện trình tự dài và cắt tại vị trí xa trình
tự nhận diện khoảng 1000bp
Loại 3 (<1%): nhận diện và cắt tại vị trí xa trình tự nhận
diện 24-26bp.
Loại 2 (95%): nhận diện đoạn trình tự ngắn (4-6bp) và cắt
tại vị trí này. Gồm 2 nhóm: cắt đầu bằng và cắt đầu dính.
Được sử dụng nhiều trong tạo dòng.
Bioinformatics
15
Thiết lập bản đồ enzyme cắt giới hạn
Bản đồ enzyme cắt giới hạn: đánh dấu các vị trí cắt
giới hạn trên toàn bộ bộ gen.
Nguyên tắc: dò tìm từng vùng trình tự nhận biết của
các enzyme cắt giới hạn dọc theo trình tự gốc và xuất
ra vị trí tìm thấy.
Mục tiêu:
Tạo dòng gen
Tạo đột biến
…
Bioinformatics
16
PCR (Polymerase Chain Reaction)
17
PCR (Polymerase Chain Reaction)
18
Máy luân nhiệt
19
Các thành phần của PCR
DNA khuôn
Polymerase
Nucleotide tự do
Dung dịch đệm
Mồi
Bioinformatics
20
DNA khuôn
Là các trình tự DNA dùng để tổng hợp trình tự
mục tiêu
DNA khuôn có thể là toàn bộ genome hoặc
được giới hạn bởi các enzyme cắt giới hạn
Cả hai mạch đều được sử dụng trong phản ứng
PCR
Bioinformatics
21
Các loại polymerase dùng trong
PCR
Tag Polymerase
Pfu Polymerase
Polymerase thế hệ mới
Bioinformatics
22
Tag polymerase
Thermus aquaticus
Nhiệt độ tối ưu: 75 – 80oC
Có thể tồn tại 2 giờ ở 92.5oC, 40’ ở 95oC, 7’ ở
97.5oC
Tốc độ: 1,000bp/10s
Sai sót: 1/9,000
Bioinformatics
23
Pfu polymerase
Pyrococcus furiosus
Chịu nhiệt tốt hơn Tag polymerase
Có thể tồn tại 6-7h ở 97.5oC
Tốc độ: 1,000bp/1-2’
Sai sót: 1/1,300,000
Có hoạt tính sửa sai
Bioinformatics
24
Polymerase thế hệ mới
Chịu nhiệt tốt
Tốc độ cao
Sai sót ít
Có thể tái sử dụng nhiều lần
Bioinformatics
25
Nucleotide tự do
Nucleotide tự do là nguồn nguyên liệu để tổng
hợp mạch mới
Trong một số trường hợp, người ta bổ sung
một số nucleotide “lạ”
Bioinformatics
26
Dung dịch đệm
Ảnh hưởng đến hiệu suất, tính chính xác của
phản ứng PCR
Ứng với từng loại polymerase, nhà sản xuất
khuyến cáo sử dụng dung dịch đệm tương ứng
Nồng độ Mg2+ là yếu tố quan trọng:
Thiếu: hoạt động của polymerase kém dẫn đến hiệu
suất PCR kém
Thừa: thu nhận một số sản phẩm không đặc hiệu, tính
chính xác thấp
Bioinformatics
27
Mồi
Mồi trong phản ứng sao chép DNA là những
trình tự RNA ngắn được tổng hợp bởi enzyme
Primase
Mồi trong sinh học phân tử là những đoạn
oligonucleotide ngắn được tổng hợp hóa học
Ứng dụng: phản ứng PCR, lai phân tử,…
Bioinformatics
Bioinformatics
Thiết kế trình tự mồi
28
Đặc điểm của mồi
Tính duy nhất: đảm bảo vị trí bắt cặp là DUY
NHẤT trên toàn trình tự
Chiều dài mồi: tối thiểu 15 base, thông thường
khoảng 17-28 base
Thành phần base: thường là tổng (G+C)
khoảng 50-60%, tránh trình tự mồi với (A+T)
dài
Kẹp G/C: tính ổn định ở đầu 3’ ảnh hưởng lớn
tới hiệu quả phản ứng, thường 3’ của mồi là G
hay C
Bioinformatics
29
Đặc điểm của mồi (tiếp theo)
Độ ổn định đầu 3’: năng lượng cần để phá hủy
sự bắt cặp của 5nu cuối cùng ở đầu 3’, tuy
nhiên để tránh bắt cặp nhầm trên các vùng
giàu GC, 5nu cuối cùng không nên chứa quá
3G/C
Nhiệt độ nóng chảy (Tm): trong giới hạn 52oC
– 65oC, không nên cách biệt quá lớn giữa 2 mồi
Bioinformatics
30
Các tiêu chuẩn thiết kế mồi
Tính duy nhất
Chiều dài: 17-28 base
Thành phần base: G+C (50-60%), tránh A+T dài
Tối ưu hóa sự bắt cặp và kéo dài: đầu 3’ của mồi có
độ bền cao và bắt cặp cao
Nhiệt độ nóng chảy trong giới hạn 48-65˚C
Sự khác biệt nhiệt độ nóng chảy mồi xuôi và mồi
ngược < 5˚C
Giảm thiểu sự tự tạo thành cấu trúc bậc hai của
mồi
Bioinformatics
31
Ảnh hưởng của cấu trúc bậc 2
Cấu trúc bậc 2 giữa hai mồi là sự bắt
cặp bổ sung toàn bộ hay một phần
giữa hai mồi
Cấu trúc bậc 2 làm mồi mất khả
năng gắn vào DNA mục tiêu
Giảm số lượng mồi tự do trong môi
trường
Giảm hiệu quả của phản ứng PCR
Bioinformatics
32
Hairpin
Bioinformatics
33
Self-Dimer
Bioinformatics
34
Dimer
Bioinformatics
35
Mồi hợp lệ?
5’
3’
5’
3’
5’
5’
Bioinformatics
3’
3’
36
Tóm tắt về mồi
Đặc tính:
Tính đặc hiệu
Đặc hiệu cho trình tự
đích (tránh các liên kết
không đặc hiệu)
Tính bền
Hình thành thể lai bền
với đoạn mẫu trong p/ứ
PCR
Tính tương thích
Các đoạn mồi phải chịu
cùng một điều kiện trong
p/ứ PCR
Các yếu tố cần quan tâm:
Tính duy nhất
Chiều dài
Thành phần base
Tính bền
Nhiệt độ nóng chảy
Nhiệt độ hồi tính
Cấu trúc mồi
Sự bắt cặp giữa 2 mồi
Slide 37
THIẾT KẾ MỒI BẰNG CÁC CÔNG CỤ
Oligo: Life Science Software
GCG: Accelrys, ICBR maintains the server.
Primer3: MIT, standalone / web
application
(http://www.bioinformatics.nl/cgibin/primer3plus/primer3plus.cgi)
BioTools: BioTools, Inc. ICBR distributes
the license.
Khác: GeneFisher, Primer!, Web Primer,
NBI oligo program, ...
Oligo Explorer Version 1.1
Slide 38
Mục đích thiết kế mồi
Thiết kế mồi dòng hóa (Cloning)
Thiết kế mồi phát hiện (Detecting)
Bioinformatics
39
Thiết kế mồi dòng hóa
Mồi dòng hóa nhằm mục đích nhân
bản một đoạn gen mục tiêu
Sản phẩm của phản ứng PCR được
giới hạn bởi 2 mồi xuôi và ngược
Vùng mở đầu và kết thúc của một
gen phải được đảm bảo
Bioinformatics
40
Yêu cầu đối với mồi dòng hóa
Mồi xuôi và mồi ngược phải đảm bảo cho
sản phẩm tối ưu nhất, đặc biệt đầu 3’
Phải lưu ý đến nhiệt độ tách mạch trình
tự, nhiệt độ giữa 2 mồi không quá khác
biệt và nhiệt độ của sản phẩm
Thời gian của các chu trình phải đảm bảo
sản phẩm được tổng hợp hoàn toàn
Bioinformatics
41
Thiết kế mồi phát hiện
Mồi phát hiện nhằm mục đích phát
hiện sự tồn tại của một trình tự nào
đó.
Mồi phát hiện phải được thiết kế trên
một trình tự chuyên biệt cho một
loài hay một nhóm loài quan tâm.
Bioinformatics
42
Yêu cầu đối với mồi phát hiện
Tính chuyên biệt
Thời gian của các chu trình vừa đủ
để tổng hợp sản phẩm cần thiết
Trình tự của sản phẩm phải vừa đủ
cho sự chuyên biệt nhưng không
quá dài.
Bioinformatics
43
Động học của phản ứng PCR
Tăng trưởng mũ
Tăng tuyến tính
Bão hòa
Bioinformatics
44
Bioinformatics
Nguồn: thuvienkhoahoc.com
45
Kiểm tra kết quả PCR – Điện di
Điện di là hiện tượng dịch chuyển
của các vật thể mang điện tích dưới
tác động của điện trường
Là 1 kỹ thuật phân tích phân tử
DNA, RNA và protein dựa trên đặc
điểm vật lý của chúng
Bioinformatics
46
Điện di – Thành phần
Gel (thường là agarose hoặc
polyacrylamide) được cấu trúc với
các kích thước lỗ xác định.
Dung dịch đệm để dẫn điện và tạo
điện trường, chứa một số chất
nhuộm để xác định vị trí phân tử
trên bản gel.
Bioinformatics
47
Điện di – Hoạt động
Các phân tử sinh học dịch chuyển
trong điện trường với một tốc độ
khác nhau giới hạn bởi kích thước
phân tử, cấu trúc nội phân tử, cấu
trúc và kích thước lỗ của bản gel
Thời gian là một yếu tố quyết định
quãng đường dịch chuyển
Bioinformatics
48
Điện di – Kết quả
Bioinformatics
49
Điện di – Kết quả (tt)
Bioinformatics
50
Điện di – Hoạt động
Các phân tử sinh học dịch chuyển
trong điện trường với một tốc độ
khác nhau giới hạn bởi kích thước
phân tử, cấu trúc nội phân tử, cấu
trúc và kích thước lỗ của bản gel
Thời gian là một yếu tố quyết định
quãng đường dịch chuyển
Bioinformatics
51