정용진 - snubi

Download Report

Transcript 정용진 - snubi

분자생물학 데이터베이스
- 역사적인 배경 -
2006년 3월 28일
정용진
분자생물학 데이터베이스의 발전
데이터베이스 종류
데이터 내용
예
문헌 데이터베이스
서지학적 인용
온라인 간행물
Medline(1971)
사실정보 데이터베이스
핵산서열
아미노산 서열
3차원분자구조
GenBank(82),EMBL(82)
PIR(1968),PRF(1979),
SWISS-PROT(1986)
PDB(1971), CSD(1965)
모티프 라이브러리
분자분류
생화학 경로
PROSITE(1988)
SCOP(1994)
KEGG(1995)
지식기반
도서목록 데이타베이스
 초록, 저자, 제목, 출판자, 색인단어, 분류
기호  2차 출판
 목적
- 정보의 검색
- 사람들이 읽고 이해하기 위한 것
도서목록 데이터베이스
 CA(Chemical Abstracts)
- Chemical Abstracts Service (1907)
- 화학적 문헌
 BA(Biological Abstracts)
- BIOSIS (1926)
- 생물학적, 의학적 문헌
 MEDLINE
- NIH (1971)
- National Center for Biotechnology
Information (NCBI) (1988)
MEDLINE by NCBI
 사실정보 데이터베이스와 연결
- DNA, 단백질 서열, 3차원 분자구조
 온라인으로 전문을 제공하는 출판사와
연결
 무료사용 가능 (인터넷)
사실정보 데이타베이스
 출판된 논문들에 관련된 실험데이터 집합
 컴퓨터를 이용한 분석을 위해 사용
 종류
- 아미노산 서열 데이터베이스
- 3차원 구조 데이터베이스
- 핵산 서열 데이터베이스
아미노산 서열 데이타베이스
 국립 생명의학 연구재단(NBRF)
- Margaret Dayhoff
- NBRF protein sequence database
 PIR (Protein Information Resource)
- 1984 by NIH
 PRF (Protein Research Foundation)
- 1979 by Japan
 SWISS-PROT
- 1984 by 제네바대학
3차원 구조 데이터베이스
 PDB (Protein Data Bank)
- 실험적으로 정해진 생물학적 거대분자
들의 3차원 구조 보관
- Protein, RNA, DNA 등의 구조데이터
- 1971 by BNL  RCSB (1999)
 CSD (Cambridge Structural Database)
- 유기화합물, 금속유기화합물 3차원 구조
- 1965 by CCDC
핵산 서열 데이터베이스
 GenBank
- 1982 by Los Alamos  NCBI (1992)
 EMBL Database
- 1982 by EMBL
 DDBJ (DNA Data Bank of Japan)
- 1984
 International Nucleotide Sequence
Database Collaboration
Flat File형식
 Flat file system
“파일들
사이의 관계를 지배하는 계층적 질서가 없는
파일 유지 관리 체계. 보조 기억 장치인 디스크 내에 저
장되어 있는 파일은 모두 각각 다른 이름을 가져야 한다.
각각 다른 디렉터리에 존재하더라도 2개의 파일이 같은
이름을 가질 수 없다. 매킨토시운영 체계의 초기 버전이
었던 매킨토시 파일 시스템(MFS)과 마이크로소프트 디스
크 운영 체계(MS-DOS)의 버전 1.X 등에서 단층 파일 체
계가 채용되었다. 계층적 파일 시스템(HFS)과 대칭된다.”
 GenBank & SWISS-PROT <그림2-2>
 1) 명명법&서지학적 정보
2) Features table
3) 일차 서열 데이타
유전체 데이타베이스
- 생물종에 대해 특이적이며 주어진 생물종에 대한
유전적 지도, 물리적 지도, 핵산 서열, 그리고 아
미노산 서열과 같은 데이터 포함
- 생물학적 조직  유전체 구조, 기능 표현
<표2-4>
- 기능 유전체학(functional genomics)
- DNA chip, protein chip과 접목
지식기반(Knowledge Base)
 사실정보 데이터베이스 내용의 표준화의
어려움에서 시작
 단순한 검색보다는 추론을 목적으로 함
: 저장된 지식으로부터 새로운 지식 생성
 PROSITE (1988)
SCOP (1994)
KEGG (1995)