Transcript 재해복구계획
재해복구 백업센터 구축 사례 발표 2014 . 10 광운대학교 정보통신처 오준희 [email protected] 세월호 사태의 교훈 대학 전산센터 재해 발생시 반드시 지켜내야 할 가치 있는 한가지 자료 (DATA) 구현에 실패한 자는 용서받을 수 있으나, 백업에 실패한 자는 용서받을 수 없다. 2 백업과 재해복구 계획의 정의 • 백업(Backup) – 컴퓨터 파일의 손상 혹은 분실에 대비하여 원본 파일의 복사본을 만 드는 과정 • 재해복구계획(Disaster Recover Plan) – 하드웨어나 소프트웨어의 재해 발생에 대비하여 이러한 재해가 발 생했을 때 취해야 할 행동을 미리 준비하는 것 • 재해복구시스템(Business Recovery System) – 천재지변이나 테러 같은 참사에도 데이터를 보존하고 자동 복구하 는 장치로, 원격지에 별도의 전산센터를 세워 시스템.데이터 등 정보 자산을 보호하고 재해가 발생하면 즉각 주(主)전산센터를 대체, 기 업의 경영활동이 계속될 수 있도록 하는 체제다. ※ 출처 : 네이버 지식백과 3 백업 4 데이터의 복제본을 만드는 방법 (1) NETWORK ① 복제본 ② 원본 DATA 복제본 ③ ① 동일서버/장소 백업 ② 원격지 백업(백업센터) ③ 소산백업 5 데이터의 복제본을 만드는 방법 (2) 데이터베이스 운영체계 스토리지 ③ ② 복제본 ① ① 스토리지 레벨 복제 – Snapshot, SRDF/MirrorView(EMC), TrueCopy(Hitachi) 등 ②운영체계 레벨 복제 – IpStor(Falcon) , TDMF, rsync, xcopy 등 ③ 데이터베이스 / 응용 프로그램 레벨 복제 – DataGuard(Oracle), ShareFlex(Quest), Replication(Sybase) 등 6 대학 전산센터 백업의 특징 대부분의 대학에서 백업을 위한 별도의 솔루션을 구비하고 있음 대학 내 백업센터는 광케이블 인프라를 활용한 원격지 건물에 둠 네트워크에 연결되어 있지 않은 미디어에 백업 데이터 보관 필요 장비/솔루션 도입 이후 교체주기 및 필요에 따라 부분적으로 증설 또는 교체 7 [구축사례] 백업장비 및 소프트웨어 현황 구 분 내 용 VTL : EMC DL4106 30TB 백업 장비 PTL : Overland NEO4000e LTO-5, 2 drive, 60 slot PC서버 내장디스크 활용 (노후장비) 재난복구 백업 EMC Networker Host data, NAS, Database 백업용 Trilead VMexplorer VMware 가상머신 백업용 도입시기 2009.11 2012.05 2007, 2010 2013.12 2011.06 백업 솔루션 export / datapump ( Oracle 번들), MySQL dump Oracle / MySQL DB 백업 및 재해복구 백업용 rsync (open source), xcopy(windows 번들), tisync(국산) 재해복구 백업용 - - 8 [구축사례] 대상 자료별 백업 방법 구분 대상 Oracle Database 백업도구 용도 보관주기 RMAN / Networker Instance 단위 복원 1개월 Hot Backup / Networker Instance 단위 복원 1개월 export, data pump / Networker 일부 데이터 확인/복원 3년 MySQL dump / Networker 일부 데이터 확인/복원 1개월 Datafile / Networker Database 단위 복원 1개월 Networker File단위 복원 1개월 rsync 재해복구 최근 파일 Networker File단위 복원 1개월 xcopy / TiSync 재해복구 최근파일 VMexplorer / Networker VM단위 복원 1개월 storage mirror(Async mode) 재해복구 최근 파일 MySQL Unix / NFS File system NTFS VMFS ※ Data가 중요한 NAS 서비스는 storage snapshot 기능으로 백업 (1주 보관) 9 [구축사례] 백업 시행방법 및 소산 절차 ▶ 백업 시행 방법 백업장소 구분 시행주기 백업방법 시행방법 백업량 매주 전체 ≒ 5.8 TB 매일 증분 네트워크를 통해 지정된 시간에 자동으로 백업 시행 재해복구 백업 매일 증분 지난 백업결과의 이상유무를 익일 아침 확인 및 보고 소산백업 매월 소산 테이프 백업을 은행에 보관 전산실 내 백업 ≒ 0.3 TB ≒ 0.3 TB LTO-5 Tape 4개 ※ LTO-5 테이프는 비압축시 1.5TB, 압축시 3TB 자료 저장 ▶ 은행 자료보관(소산백업) 시행 절차 소산자료 테입저장 테입확인, 봉인, 기록 결재 신규테입 은행보관 및 기존테입 반환 반환테입 봉인확인 테입삭제 및 재활용 백업서버 담당자 관리자 담당자 2인1조 관리자 담당자 10 [구축사례] 백업 구성도 은행 대여금고 연구관 전산장비실 재해복구센터 (국민은행, 하나은행) (연구관 104호) (화도관 101호) 백업대상 서버 가상서버 Disk 가상서버 Disk b 1시간단위 복제 1 2 3 4 5 6 7 StorEdge 6100 8 9 10 11 12 13 14 1 2 3 4 5 6 7 StorEdge 6100 8 9 10 11 12 13 14 LAN 국민은행 광운대역 지점 매일 증분 백업 백업서버 매일 증분 백업 주1회 전체 백업 월 1회 소산 보관 하나은행 석계역 지점 학사DB-b WebDB-b VmwareB1 VmwareB2 VmCent b NFS-b1 FC(SAN) 60 slot 백업테이프 30 TB 백업디스크 11 재해복구 12 재해복구 백업센터와 원격지 백업센터 비교 재해복구센터 전산센터 Application Application DB engine DB engine Storage Storage 현재 1개월 DATA 1주 DATA 1일 DATA 현재 DATA Server Server DATA 백업센터 현재 DATA Backup Device ※ 재해복구센터 및 백업센터 모두 대학 내 타 건물에 설치됨을 가정함 ※ 배실, 항온항습, 전원, 광 네트워크는 공통으로 갖춰져 있다고 가정함 13 재해복구 백업센터 구축 절차 • 복구대상 서비스 식별 – 사업영향력평가 또는 서비스 구성도 작성 • 재해복구계획 수립 – 언제, 누가, 무엇을, 어떻게 해야 하는지를 계획 • 장소 선정 및 인프라 구축 – 어디에, 전기/항온항습, 네트워크 포설 등 • 하드웨어, 소프트웨어 도입 세부 내용은 마지막 페이지 구축가이드 참조 – 서버, 스토리지, 솔루션 -> 용량산정 필요 • 데이터 동기화 구현 – Sync/Async, 동기화 주기, 복제방법 • 주기적인 복구 테스트 및 재해복구 계획 업데이트 – 주기적인 테스트 및 재해복구계획 업데이트 업무일정 반영 14 대상 서비스의 식별이 필요 • 재해복구 계획 작성시 서비스 식별을 위해 사업영향력평가(BIA) 시행 • 식별된 서비스의 우선순위별 백업/복원계획 수립 • 복구 대상 서비스의 운영 서버, 데이터의 종류, 저장위치 확인이 필요 ※ 정보서비스를 중심으로 구성도를 그릴 수 있을까? 15 광운대학교 정보서비스 구성도 방화벽 서비스 부하분산 서버/가상화 스토리지 NAS/VTL 학사 DBMS(Oracle) 종합정보 C/S ★ ♠⊙▲★ ♠⊙★ 웹 DBMS(Oracle) 모니터링(NMS) 스트리밍 가상센터(vCenter #1) 학사행정 방화벽 종합정보 u-Campus 연구관리 #1, #2 Nokia IP560 IP380 연 구 관 종합정보서비스 u-Campus 주 대표홈페이지 전 산 센 터 입학, 자산 홈페이지 ★ Dell PE 2950 ⊙★ Dell R710 ♠★ Dell PE 2950 Dell R720 ★ Oracle T4-1 #1 Oracle T4-1 #2 ★ Dell PE 2650 - 그룹메일 발송기 VTL 30TB 대표웹(3대),웹채팅(1대) 종합정보(3대), 리포트(2대) SMS(1대), 그룹메일(1대) 인터넷증명(2대), 발급기(1대) 발전기금(1대), 언어교육원(1대) 교수학습센터(1대) 학술진흥재단연동(1대) 원격접속관리(2대) DB보안 (K-sign SecureDB) 학사행정 Oracle (EMC DL4106) ★ ★ 웹/CMS/자산 Oracle SAN 50TB (EMC VNX5500) ★ UPS 3상 50KV * 2대 NAS (EMC VNX5500) ★ - 교수학습센터 발전기금(본교,법인) 취업정보, 취업통계 VMS(알약) 차세대디스플레이 플라즈마바이오 실험실안전관리 ⊙★ ⊙▲★ ⊙★ CMS ★ ★ ▲★ Radware AS3 (L4 switch) ▲★ ▲★ ⊙▲★ DNS(4대), DHCP(2대) VMS(1대), RADIUS(1대) LMS(1대), ERD(1대) 취업홈/정보/통계(각 1대), 차세대디스플레이(1대) 플라즈마바이오(1대) 실험실안전관리(1대) 사이버안전의날(1대) 법인발전기금(1대) 대학회계-영현(1대) 항온항습 15RT : 1대 15RT : 1대 ▪ 방화벽 없음 언어교육원 웹메일 #1, #2 스팸처리 #1, #2 웹메일 사용자DB 학생계정 ★ ★ Radware⊙★ Dell R710 4대(VMware vSphere) AD1016 ▪ 방화벽 보호영역 (L4 switch) SMS 발송기 웹호스팅 #1 웹호스팅 #2 대학회계-더존(본교) 기타 Dell R900 Report(RD) 서버 Farm Network DB SAN ★ Oracle M5000 Dom #1 ⊙★ ⊙▲★ 백업 / 개발 SRC 2013년 5월 현재 범 ★ ★ iSCSI 12TB 례 : 유지보수 대상 : 내장스토리지 (EqualLogic PS5000) Dell PE2650 ⊙ : 백업클라이언트 Dell PE2950 Dell PE2650 Intel SR2500 HP DL380G5 * 2 HP DL380G5 * 2 Intel SR1400 Oracle T5240 웹호스팅 #1,#2 MySQL ▲ : Secure OS ♠ ★ : 재해복구 웹메일사용자 MySQL Dell R710 2대(VMware vSphere) 화 도 관 재 해 복 구 센 터 재해복구 백업 ★ 재해복구 방화벽 Nokia IP380 ▪ 방화벽 : 재해복구용 - 원격접속터미널 개발자 PC 입학처리 PC 행정용 PC 주전산기 backup 가상센터(vCenter #2) NAS backup Oracle(웹) backup ★ 원격터미널(1대) 개발자PC-VM(6대) 회계처리-VM(1대) 입학처리-VM(4대) 행정망 분리VM(30대예정) Dell PE2950 ★ IBM X3650 ★ Dell PE2950 ★ Dell PE2950 ★ iSCSI 12TB (EqualLogic PS5000) ★ UPS 단상 20KV 재해복구 투자비용 Optimal Cost/Benefit Cost of Incidents Cost of Countermeasure Low ※ ※ ※ ※ Degree of Assurance High 이론적으로는 교차점에 해당하는 적절한(Optimal) 비용 투자가 적합 실제 대학에서 교차점에 해당하는 만큼의 투자를 이끌어내기 어려움 학적은 공공 측면에서 어떠한 투자를 감내해서라도 지켜야 할 데이터 투자가 가능한 비용 내에서 최대한의 보전이 가능하도록 구성하는 것이 최선 17 재해복구 센터의 처리용량 산정 (1) • 주 전산센터와 동일한 성능이 필요한가? – 꼭 필요한 서비스 용량은 얼마일까? • 서버 – 주 센터와 동일한 하드웨어 벤더나 동일 모델 서버가 필요한가? – 운영체계는 동일해야 하는가? Unix -> Linux의 변경이 가능할까? • 스토리지 – 동일 벤더의 스토리지와 복제 솔루션이 필요한가? – 동일한 용량의 스토리지가 필요한가? • 소프트웨어 라이선스 – 평상시 사용하지 않는 라이선스는 반드시 구매하여야 하는가? 18 재해복구 센터의 처리용량 산정 (2) • 성능 요구사항 – 재해복구센터는 주 센터의 복원까지에 꼭 필요한 서비스만 제공 – 성능 = 돈이며, PC서버의 성능은 생각보다 뛰어나다 – 데이터만 있으면, 서버는 재해시 긴급 수배도 가능 • 서버 요구사항 – 대부분의 Unix 계열 서비스는 Linux로 대치 가능하다 • 스토리지 요구사항 – 본교의 경우 가장 큰 용량은 누적된 사용자 데이터와 로그 – 재해복구시 모든 데이터의 운영이 필요한가? • 라이선스 문제 – Cold standby 형태의 운영에서 라이선스를 미리 구매할 필요는 없다. – 라이선스는 재해복구센터 가동 시 입력하여 사용하는 것으로 협의 19 복구 테스트와 재해복구 계획 업데이트 • TEST – 막상 사용하려고 할 때, 무언가 빠져있지 않을까? • UPDATE – 주 센터의 변경 내역은 모두 반영되었는가? • 해결방법 – 정례화 (매년 반복 시행하는 연간 일정에 반영) 테스트와 업데이트는 재해복구 시스템 구축 후 관리하여야 할 가장 중요한 항목 20 서버 가상화가 재해복구에 유리한 이유 ■ VM(가상머신)내에 운영체계, 솔루션, 라이선스 키 및 각종 설정값이 모두 포함 ■ VM은 하드웨어와 무관하게 운영 가능 ■ Storage 내 VM 파일만 복제해 두면 필요시 언제 어디서나 서비스 기동 가능 주 센터 재해복구 센터 Storage 복제 또는 VM 백업도구 이용 ※출처 : 굿모닝아이텍 VMware 제안서(2007) 21 서버 가상화 적용 시 재해복구 방안 원격지 재해 복구용 시스템의 서버 환경 구성을 가상화로 구현한다면? 주전산센터 Physical to Physical 재해복구센터 DR 센터 서버 수 감소 비용 절감 재해복구절차 간결 하드웨어 호환성에 따른 유연성 Physical to Virtual 인프라 환경에 대한 정합성 관리/운영비 절감 쉽고 완벽한 재해 복구 Virtual to Virtual Storage Replication 또는 VM 복제 솔루션이 필요 ※출처 : 굿모닝아이텍 VMware 제안서(2007) 22 [구축사례] 기술요소 고려사항 • 장소선정 – 전기, 항온항습, 광 네트워크, 랙 설치공간 등 전산장비실 설치가 가능한 공간 • 네트워크 bandwidth – 경험상 백업이 가장 많은 bandwidth를 차지함 • 서버 구성 – 한 세대가 지나간 서버 또는 일부 서비스를 통합 후 유휴서버를 할당하였음 • 스토리지 구성 – PC용 SATA 디스크 장착 가능한 서버 활용 시 저비용으로 고용량 구성 가능 • 데이터 동기화 구성 – Async 모드일 경우 오픈 소스 또는 번들 소프트웨어를 활용(export, rsync, xcopy 등) • 데이터 동기화 점검방법 개발 – 모든 서비스 그러하듯 ‘구축’보다 ‘운영'이 더 중요! – 본교는 자체개발 NMS 모듈에 백업결과 모니터링을 포함 23 [구축사례] 재해복구 백업센터 구성 내역 ▶ 하드웨어, 소프트웨어 구분 네트워크 보안 장비 및 소프트웨어 도입년도 용도 Cisco 7509 Router 1999 인터넷 연결 Cisco 2960 L2 switch 2001 HOST 연결 Nokia IP380 2003 기본보안 설정 2010 VMware hosts 2007 Oracle DB server 2007 NFS server 2008 데이터 복제 Dell PowerEdge R710 E5530 CPU * 2, 64GB mem, 146GB * 2 disk 서버 Dell PowerEdge 2950 (2대) E5430 CPU * 2, 16G mem, 146GB*2 disk IBM X3650 E5405 CPU * 2, 4G mem, 2TB disk 스토리지 소프트웨어 EqualLogic PS5000E SATA 1TB * 16 disk Oracle 1996~ Entera 1996~ 평상시에는 on-line하지 않으므 로 라이선스는 별도 구입하지 않고 설치해 놓은 상태로 유지 하는 것을 협의하였음 ※ 네트워크 연결은 1Gb FC 2 channel 사용 24 [구축사례] 데이터 동기화 도구 및 방법 ▶ 데이터 동기화 도구 및 방법 대상 동기화 도구 동기화 주기 동기화 용량 복원방법 복원시간 Oracle export 1일 / full 12GB 3GB import 2시간 30분 MySQL rsync 1일 / incremental 22GB 2GB daemon start 10분 이내 NFS mount 10분 이내 NFS rsync 1일 / incremental 3.5TB 1.6TB 250GB VMFS Storage mirror VMexplorer 5분 / incremental 1일 / incremental 2.4TB 800GB CIFS xcopy/ TiSync 1일 / incremental 3TB Mirror 볼륨 전환 10분 이내 VM별 import 10~30분 / VM당 볼륨 mount 10분 이내 ※ 매일 시행되는 incremental backup은 밤시간을 이용하여 완료하도록 schedule 구성 25 [구축사례] 동기화 / 복구 방법 도식 주 전산센터 Oracle 재해복구 벡업센터 export Oracle engine 복제본 import MySQL Unix/Linux rsync 복제본 원본 바로 재사용 NFS CIFS 원본 nfs mount network drive 네트웍 마운트 복제본 바로 재사용 복제 async mirror VMFS ESX host VMexplorer 복제본 : backup upload ESX host : restore 26 [구축사례] 재해복구 이전 서비스 내역 • 증명, 종합정보 담당자용(C/S) – 학사 DBMS, 미들웨어, 서버 프로그램, C/S 프로그램 및 source – 웹 reporting 서버/솔루션 • 대표 홈페이지, 종합정보(웹, 온라인교육) – 홈페이지 DBMS, WEB/WAS 서버 프로그램, NFS 데이터 • 메일/SMS – 웹 메일(사용자), 그룹메일 발송기, SMS 발송기 • 호스팅서비스 – 각급기관 홈페이지 • 기타 업무 시스템 – 회계서버(더존), 이러닝 컨텐츠, 백신 ※ 본교는 주 전산센터 기능의 대부분을 재해복구센터에 복원 가능하도록 구성하였음 27 [구축사례] 재해복구 백업센터 구축 이력 • 2003.10 원격지 교환기 실에 노후 서버를 이용한 백업 구성 • 2006.09 재해복구계획 작성 및 품의 • 2007.09 재해복구 백업센터 1차 기능 구축 완료 • 2011.06 재해복구 백업센터 완료보고(총장 품의) • 2012.04 재해복구 모의훈련 시행 및 결과 품의 • 2012.06 교육전산망 서울모임 대학 구축사례 발표 ※ 재해복구는 예산승인도 어렵고, 우선순위도 낮아 구축에 오랜 시간이 소요됨 ※ 최근 보안감사 시 점검항목에 재해복구 시설과 재해복구계획 포함 추세 28 재해복구를 구현하려는 대학을 위한 제언 • 최소한의 원격지 백업은 반드시 필요하다 – 원격지 소산 은행 대여금고 활용은 비용과 보안문제 해결 • 재해복구계획의 수립 및 총장인가 필요 – 계획수립 및 계획의 총장 인가는 최소한의 책임 • 사업 연속성을 위해 꼭 필요한 서비스를 식별 – DNS, 학적(증명) , 홈페이지 등 전산센터만의 재해 시 필요사항 확인 • 대학 내 전산장비실 활용 가능한 공간 이용 – 도서관, 교환기실, IDF실 등 환경과 보안이 갖추어진 공간 찾기 29 재해복구 백업센터 구축 가이드 • 정보시스템 재해복구 지침 (2005. 12) – 정보화 진흥원 홈페이지 (구 한국전산원 ITA 팀) – 자료실 -> 조사연구보고서 -> ‘재해복구’ 로 검색 • 정보시스템 재해복구 지침 (2007. 12) – 한국정보통신기술협회 홈페이지 – TTAS.KO-10.0259 – 자료검색 –> ‘재해복구’로 검색 - 감사합니다 30