재해복구계획

Download Report

Transcript 재해복구계획

재해복구 백업센터
구축 사례 발표
2014 . 10
광운대학교 정보통신처 오준희
[email protected]
세월호 사태의 교훈
대학 전산센터 재해 발생시
반드시 지켜내야 할
가치 있는 한가지
자료 (DATA)
구현에 실패한 자는 용서받을 수 있으나, 백업에 실패한 자는 용서받을 수 없다.
2
백업과 재해복구 계획의 정의
• 백업(Backup)
– 컴퓨터 파일의 손상 혹은 분실에 대비하여 원본 파일의 복사본을 만
드는 과정
• 재해복구계획(Disaster Recover Plan)
– 하드웨어나 소프트웨어의 재해 발생에 대비하여 이러한 재해가 발
생했을 때 취해야 할 행동을 미리 준비하는 것
• 재해복구시스템(Business Recovery System)
– 천재지변이나 테러 같은 참사에도 데이터를 보존하고 자동 복구하
는 장치로, 원격지에 별도의 전산센터를 세워 시스템.데이터 등 정보
자산을 보호하고 재해가 발생하면 즉각 주(主)전산센터를 대체, 기
업의 경영활동이 계속될 수 있도록 하는 체제다.
※ 출처 : 네이버 지식백과
3
백업
4
데이터의 복제본을 만드는 방법 (1)
NETWORK
①
복제본
②
원본
DATA
복제본
③
① 동일서버/장소 백업
② 원격지 백업(백업센터)
③ 소산백업
5
데이터의 복제본을 만드는 방법 (2)
데이터베이스
운영체계
스토리지
③
②
복제본
①
① 스토리지 레벨 복제
– Snapshot, SRDF/MirrorView(EMC), TrueCopy(Hitachi) 등
②운영체계 레벨 복제
– IpStor(Falcon) , TDMF, rsync, xcopy 등
③ 데이터베이스 / 응용 프로그램 레벨 복제
– DataGuard(Oracle), ShareFlex(Quest), Replication(Sybase) 등
6
대학 전산센터 백업의 특징
대부분의 대학에서 백업을 위한 별도의 솔루션을 구비하고 있음
대학 내 백업센터는 광케이블 인프라를 활용한 원격지 건물에 둠
네트워크에 연결되어 있지 않은 미디어에 백업 데이터 보관 필요
장비/솔루션 도입 이후 교체주기 및 필요에 따라 부분적으로 증설 또는 교체
7
[구축사례] 백업장비 및 소프트웨어 현황
구 분
내
용
VTL : EMC DL4106 30TB
백업 장비
PTL : Overland NEO4000e
LTO-5, 2 drive, 60 slot
PC서버 내장디스크 활용 (노후장비)
재난복구 백업
EMC Networker
Host data, NAS, Database 백업용
Trilead VMexplorer
VMware 가상머신 백업용
도입시기
2009.11
2012.05
2007, 2010
2013.12
2011.06
백업 솔루션
export / datapump ( Oracle 번들), MySQL dump
Oracle / MySQL DB 백업 및 재해복구 백업용
rsync (open source), xcopy(windows 번들), tisync(국산)
재해복구 백업용
-
-
8
[구축사례] 대상 자료별 백업 방법
구분
대상
Oracle
Database
백업도구
용도
보관주기
RMAN / Networker
Instance 단위 복원
1개월
Hot Backup / Networker
Instance 단위 복원
1개월
export, data pump / Networker
일부 데이터 확인/복원
3년
MySQL dump / Networker
일부 데이터 확인/복원
1개월
Datafile / Networker
Database 단위 복원
1개월
Networker
File단위 복원
1개월
rsync
재해복구
최근 파일
Networker
File단위 복원
1개월
xcopy / TiSync
재해복구
최근파일
VMexplorer / Networker
VM단위 복원
1개월
storage mirror(Async mode)
재해복구
최근 파일
MySQL
Unix / NFS
File system
NTFS
VMFS
※ Data가 중요한 NAS 서비스는 storage snapshot 기능으로 백업 (1주 보관)
9
[구축사례] 백업 시행방법 및 소산 절차
▶ 백업 시행 방법
백업장소 구분
시행주기
백업방법
시행방법
백업량
매주
전체
≒ 5.8 TB
매일
증분
네트워크를 통해 지정된 시간에
자동으로 백업 시행
재해복구 백업
매일
증분
지난 백업결과의 이상유무를
익일 아침 확인 및 보고
소산백업
매월
소산
테이프 백업을 은행에 보관
전산실 내 백업
≒ 0.3 TB
≒ 0.3 TB
LTO-5 Tape 4개
※ LTO-5 테이프는 비압축시 1.5TB, 압축시 3TB 자료 저장
▶ 은행 자료보관(소산백업) 시행 절차
소산자료
테입저장
테입확인,
봉인, 기록
결재
신규테입 은행보관
및 기존테입 반환
반환테입
봉인확인
테입삭제 및
재활용
백업서버
담당자
관리자
담당자 2인1조
관리자
담당자
10
[구축사례] 백업 구성도
은행 대여금고
연구관 전산장비실
재해복구센터
(국민은행, 하나은행)
(연구관 104호)
(화도관 101호)
백업대상 서버
가상서버 Disk
가상서버 Disk b
1시간단위 복제
1
2
3
4
5
6
7 StorEdge 6100 8
9
10
11
12
13
14
1
2
3
4
5
6
7 StorEdge 6100 8
9
10
11
12
13
14
LAN
국민은행
광운대역 지점
매일 증분 백업
백업서버
매일 증분 백업
주1회 전체 백업
월 1회 소산 보관
하나은행
석계역 지점
학사DB-b
WebDB-b
VmwareB1
VmwareB2
VmCent b
NFS-b1
FC(SAN)
60 slot
백업테이프
30 TB
백업디스크
11
재해복구
12
재해복구 백업센터와 원격지 백업센터 비교
재해복구센터
전산센터
Application
Application
DB engine
DB engine
Storage
Storage
현재
1개월
DATA
1주
DATA
1일
DATA
현재
DATA
Server
Server
DATA
백업센터
현재
DATA
Backup
Device
※ 재해복구센터 및 백업센터 모두 대학 내 타 건물에 설치됨을 가정함
※ 배실, 항온항습, 전원, 광 네트워크는 공통으로 갖춰져 있다고 가정함
13
재해복구 백업센터 구축 절차
• 복구대상 서비스 식별
– 사업영향력평가 또는 서비스 구성도 작성
• 재해복구계획 수립
– 언제, 누가, 무엇을, 어떻게 해야 하는지를 계획
• 장소 선정 및 인프라 구축
– 어디에, 전기/항온항습, 네트워크 포설 등
• 하드웨어, 소프트웨어 도입
세부 내용은
마지막 페이지
구축가이드 참조
– 서버, 스토리지, 솔루션 -> 용량산정 필요
• 데이터 동기화 구현
– Sync/Async, 동기화 주기, 복제방법
• 주기적인 복구 테스트 및 재해복구 계획 업데이트
– 주기적인 테스트 및 재해복구계획 업데이트 업무일정 반영
14
대상 서비스의 식별이 필요
• 재해복구 계획 작성시 서비스 식별을 위해 사업영향력평가(BIA) 시행
• 식별된 서비스의 우선순위별 백업/복원계획 수립
• 복구 대상 서비스의 운영 서버, 데이터의 종류, 저장위치 확인이 필요
※ 정보서비스를 중심으로 구성도를 그릴 수 있을까?
15
광운대학교 정보서비스 구성도
방화벽
서비스
부하분산
서버/가상화
스토리지
NAS/VTL
학사 DBMS(Oracle)
종합정보 C/S
★
♠⊙▲★
♠⊙★
웹 DBMS(Oracle)
모니터링(NMS)
스트리밍
가상센터(vCenter #1)
학사행정
방화벽
종합정보 u-Campus
연구관리 #1, #2
Nokia
IP560
IP380
연
구
관
종합정보서비스
u-Campus
주
대표홈페이지
전
산
센
터
입학, 자산 홈페이지
★
Dell PE 2950
⊙★
Dell R710
♠★
Dell PE 2950
Dell R720
★
Oracle T4-1 #1
Oracle T4-1 #2
★
Dell PE 2650
-
그룹메일 발송기
VTL 30TB
대표웹(3대),웹채팅(1대)
종합정보(3대), 리포트(2대)
SMS(1대), 그룹메일(1대)
인터넷증명(2대), 발급기(1대)
발전기금(1대),
언어교육원(1대)
교수학습센터(1대)
학술진흥재단연동(1대)
원격접속관리(2대)
DB보안
(K-sign
SecureDB)
학사행정
Oracle
(EMC DL4106)
★
★
웹/CMS/자산
Oracle
SAN 50TB
(EMC VNX5500)
★
UPS
3상 50KV * 2대
NAS
(EMC VNX5500)
★
-
교수학습센터
발전기금(본교,법인)
취업정보, 취업통계
VMS(알약)
차세대디스플레이
플라즈마바이오
실험실안전관리
⊙★
⊙▲★
⊙★
CMS
★
★
▲★
Radware AS3
(L4 switch) ▲★
▲★
⊙▲★
DNS(4대), DHCP(2대)
VMS(1대), RADIUS(1대)
LMS(1대), ERD(1대)
취업홈/정보/통계(각 1대),
차세대디스플레이(1대)
플라즈마바이오(1대)
실험실안전관리(1대)
사이버안전의날(1대)
법인발전기금(1대)
대학회계-영현(1대)
항온항습
15RT : 1대
15RT : 1대
▪ 방화벽 없음
언어교육원
웹메일 #1, #2
스팸처리 #1, #2
웹메일 사용자DB
학생계정
★
★
Radware⊙★
Dell R710 4대(VMware vSphere)
AD1016
▪ 방화벽 보호영역
(L4 switch)
SMS 발송기
웹호스팅 #1
웹호스팅 #2
대학회계-더존(본교)
기타
Dell R900
Report(RD)
서버 Farm
Network
DB
SAN
★
Oracle M5000 Dom #1
⊙★
⊙▲★
백업 / 개발 SRC
2013년 5월 현재
범
★
★
iSCSI 12TB
례
: 유지보수 대상
: 내장스토리지
(EqualLogic PS5000)
Dell PE2650
⊙ : 백업클라이언트
Dell PE2950
Dell PE2650
Intel SR2500
HP DL380G5 * 2
HP DL380G5 * 2
Intel SR1400
Oracle T5240
웹호스팅 #1,#2
MySQL
▲ : Secure OS
♠
★
: 재해복구
웹메일사용자
MySQL
Dell R710 2대(VMware vSphere)
화
도
관
재
해
복
구
센
터
재해복구 백업
★
재해복구
방화벽
Nokia
IP380
▪ 방화벽 : 재해복구용
-
원격접속터미널
개발자 PC
입학처리 PC
행정용 PC
주전산기 backup
가상센터(vCenter #2)
NAS backup
Oracle(웹) backup
★
원격터미널(1대)
개발자PC-VM(6대)
회계처리-VM(1대)
입학처리-VM(4대)
행정망 분리VM(30대예정)
Dell PE2950
★ IBM X3650
★ Dell PE2950
★ Dell PE2950
★
iSCSI 12TB
(EqualLogic PS5000)
★
UPS
단상 20KV
재해복구 투자비용
Optimal
Cost/Benefit
Cost of
Incidents
Cost of
Countermeasure
Low
※
※
※
※
Degree of Assurance
High
이론적으로는 교차점에 해당하는 적절한(Optimal) 비용 투자가 적합
실제 대학에서 교차점에 해당하는 만큼의 투자를 이끌어내기 어려움
학적은 공공 측면에서 어떠한 투자를 감내해서라도 지켜야 할 데이터
투자가 가능한 비용 내에서 최대한의 보전이 가능하도록 구성하는 것이 최선
17
재해복구 센터의 처리용량 산정 (1)
• 주 전산센터와 동일한 성능이 필요한가?
– 꼭 필요한 서비스 용량은 얼마일까?
• 서버
– 주 센터와 동일한 하드웨어 벤더나 동일 모델 서버가 필요한가?
– 운영체계는 동일해야 하는가? Unix -> Linux의 변경이 가능할까?
• 스토리지
– 동일 벤더의 스토리지와 복제 솔루션이 필요한가?
– 동일한 용량의 스토리지가 필요한가?
• 소프트웨어 라이선스
– 평상시 사용하지 않는 라이선스는 반드시 구매하여야 하는가?
18
재해복구 센터의 처리용량 산정 (2)
• 성능 요구사항
– 재해복구센터는 주 센터의 복원까지에 꼭 필요한 서비스만 제공
– 성능 = 돈이며, PC서버의 성능은 생각보다 뛰어나다
– 데이터만 있으면, 서버는 재해시 긴급 수배도 가능
• 서버 요구사항
– 대부분의 Unix 계열 서비스는 Linux로 대치 가능하다
• 스토리지 요구사항
– 본교의 경우 가장 큰 용량은 누적된 사용자 데이터와 로그
– 재해복구시 모든 데이터의 운영이 필요한가?
• 라이선스 문제
– Cold standby 형태의 운영에서 라이선스를 미리 구매할 필요는 없다.
– 라이선스는 재해복구센터 가동 시 입력하여 사용하는 것으로 협의
19
복구 테스트와 재해복구 계획 업데이트
• TEST
– 막상 사용하려고 할 때, 무언가 빠져있지 않을까?
• UPDATE
– 주 센터의 변경 내역은 모두 반영되었는가?
• 해결방법
– 정례화 (매년 반복 시행하는 연간 일정에 반영)
테스트와 업데이트는 재해복구 시스템 구축 후
관리하여야 할 가장 중요한 항목
20
서버 가상화가 재해복구에 유리한 이유
■ VM(가상머신)내에 운영체계, 솔루션, 라이선스 키 및 각종 설정값이 모두 포함
■ VM은 하드웨어와 무관하게 운영 가능
■ Storage 내 VM 파일만 복제해 두면 필요시 언제 어디서나 서비스 기동 가능
주 센터
재해복구 센터
Storage 복제 또는
VM 백업도구 이용
※출처 : 굿모닝아이텍 VMware 제안서(2007)
21
서버 가상화 적용 시 재해복구 방안
원격지 재해 복구용 시스템의 서버 환경 구성을 가상화로 구현한다면?
주전산센터
Physical to
Physical
재해복구센터
DR 센터 서버 수 감소
비용 절감
재해복구절차 간결
하드웨어 호환성에 따른 유연성
Physical to Virtual
인프라 환경에 대한 정합성
관리/운영비 절감
쉽고 완벽한 재해 복구
Virtual to Virtual
Storage Replication 또는
VM 복제 솔루션이 필요
※출처 : 굿모닝아이텍 VMware 제안서(2007)
22
[구축사례] 기술요소 고려사항
• 장소선정
– 전기, 항온항습, 광 네트워크, 랙 설치공간 등 전산장비실 설치가 가능한 공간
• 네트워크 bandwidth
– 경험상 백업이 가장 많은 bandwidth를 차지함
• 서버 구성
– 한 세대가 지나간 서버 또는 일부 서비스를 통합 후 유휴서버를 할당하였음
• 스토리지 구성
– PC용 SATA 디스크 장착 가능한 서버 활용 시 저비용으로 고용량 구성 가능
• 데이터 동기화 구성
– Async 모드일 경우 오픈 소스 또는 번들 소프트웨어를 활용(export, rsync, xcopy 등)
• 데이터 동기화 점검방법 개발
– 모든 서비스 그러하듯 ‘구축’보다 ‘운영'이 더 중요!
– 본교는 자체개발 NMS 모듈에 백업결과 모니터링을 포함
23
[구축사례] 재해복구 백업센터 구성 내역
▶ 하드웨어, 소프트웨어
구분
네트워크
보안
장비 및 소프트웨어
도입년도
용도
Cisco 7509 Router
1999
인터넷 연결
Cisco 2960 L2 switch
2001
HOST 연결
Nokia IP380
2003
기본보안 설정
2010
VMware hosts
2007
Oracle DB server
2007
NFS server
2008
데이터 복제
Dell PowerEdge R710
E5530 CPU * 2, 64GB mem, 146GB * 2 disk
서버
Dell PowerEdge 2950 (2대)
E5430 CPU * 2, 16G mem, 146GB*2 disk
IBM X3650
E5405 CPU * 2, 4G mem, 2TB disk
스토리지
소프트웨어
EqualLogic PS5000E
SATA 1TB * 16 disk
Oracle
1996~
Entera
1996~
평상시에는 on-line하지 않으므
로 라이선스는 별도 구입하지
않고 설치해 놓은 상태로 유지
하는 것을 협의하였음
※ 네트워크 연결은 1Gb FC 2 channel 사용
24
[구축사례] 데이터 동기화 도구 및 방법
▶ 데이터 동기화 도구 및 방법
대상
동기화 도구
동기화 주기
동기화 용량
복원방법
복원시간
Oracle
export
1일 / full
12GB
3GB
import
2시간
30분
MySQL
rsync
1일 / incremental
22GB
2GB
daemon start
10분 이내
NFS mount
10분 이내
NFS
rsync
1일 / incremental
3.5TB
1.6TB
250GB
VMFS
Storage mirror
VMexplorer
5분 / incremental
1일 / incremental
2.4TB
800GB
CIFS
xcopy/ TiSync
1일 / incremental
3TB
Mirror 볼륨 전환
10분 이내
VM별 import
10~30분 / VM당
볼륨 mount
10분 이내
※ 매일 시행되는 incremental backup은 밤시간을 이용하여 완료하도록 schedule 구성
25
[구축사례] 동기화 / 복구 방법 도식
주 전산센터
Oracle
재해복구 벡업센터
export
Oracle
engine
복제본
import
MySQL
Unix/Linux
rsync
복제본
원본
바로 재사용
NFS
CIFS
원본
nfs mount
network drive
네트웍
마운트
복제본
바로 재사용
복제
async mirror
VMFS
ESX host
VMexplorer
복제본
: backup
upload
ESX host
: restore
26
[구축사례] 재해복구 이전 서비스 내역
• 증명, 종합정보 담당자용(C/S)
– 학사 DBMS, 미들웨어, 서버 프로그램, C/S 프로그램 및 source
– 웹 reporting 서버/솔루션
• 대표 홈페이지, 종합정보(웹, 온라인교육)
– 홈페이지 DBMS, WEB/WAS 서버 프로그램, NFS 데이터
• 메일/SMS
– 웹 메일(사용자), 그룹메일 발송기, SMS 발송기
• 호스팅서비스
– 각급기관 홈페이지
• 기타 업무 시스템
– 회계서버(더존), 이러닝 컨텐츠, 백신
※ 본교는 주 전산센터 기능의 대부분을 재해복구센터에 복원 가능하도록 구성하였음
27
[구축사례] 재해복구 백업센터 구축 이력
• 2003.10 원격지 교환기 실에 노후 서버를 이용한 백업 구성
• 2006.09 재해복구계획 작성 및 품의
• 2007.09 재해복구 백업센터 1차 기능 구축 완료
• 2011.06 재해복구 백업센터 완료보고(총장 품의)
• 2012.04 재해복구 모의훈련 시행 및 결과 품의
• 2012.06 교육전산망 서울모임 대학 구축사례 발표
※ 재해복구는 예산승인도 어렵고, 우선순위도 낮아 구축에 오랜 시간이 소요됨
※ 최근 보안감사 시 점검항목에 재해복구 시설과 재해복구계획 포함 추세
28
재해복구를 구현하려는 대학을 위한 제언
• 최소한의 원격지 백업은 반드시 필요하다
– 원격지 소산 은행 대여금고 활용은 비용과 보안문제 해결
• 재해복구계획의 수립 및 총장인가 필요
– 계획수립 및 계획의 총장 인가는 최소한의 책임
• 사업 연속성을 위해 꼭 필요한 서비스를 식별
– DNS, 학적(증명) , 홈페이지 등 전산센터만의 재해 시 필요사항 확인
• 대학 내 전산장비실 활용 가능한 공간 이용
– 도서관, 교환기실, IDF실 등 환경과 보안이 갖추어진 공간 찾기
29
재해복구 백업센터 구축 가이드
• 정보시스템 재해복구 지침 (2005. 12)
– 정보화 진흥원 홈페이지 (구 한국전산원 ITA 팀)
– 자료실 -> 조사연구보고서 -> ‘재해복구’ 로 검색
• 정보시스템 재해복구 지침 (2007. 12)
– 한국정보통신기술협회 홈페이지
– TTAS.KO-10.0259
– 자료검색 –> ‘재해복구’로 검색
- 감사합니다 30