슬라이드 1

Download Report

Transcript 슬라이드 1

4. 활용분야
메모리 디스크를 공유한 EBH(ETL, Batch Hub)
정보계 구축
국제회계기준 (IFRS) 구축
MDM (Master Data Manamemt)
MDW (Manufacturing Data Warehouse )
-0-
© 2011 DataStreams Corp. All Rights Reserved.
활용분야 : 메모리 디스크를 공유한 EBH (ETL, Batch Hub)
적용범위
특징
• 정보계 구축
• 메모리 Disk를 활용한 성능 확보
• 데이터 HUB 구축
• ETL, Batch 등에 사용되는 마스터 데이터 공유를 통한
데이터 재가공성 확보
ODS
DW
DBMS
계정계
DBMS
EBH Disk
DM
일반 Storage
경영정보
IFRS
M/F IMS
Src 1
Src 2
Mapping
Hub
Tgt/Src Tgt/Src
바젤II
Risk
M/F DB2
KPI
SSD Storage
UNIX
Src 1
Src 2
Sorting
Hub
Tgt/Src Tgt/Src
EUC
-1-
© 2011 DataStreams Corp. All Rights Reserved.
활용분야 : 정보계 구축
적용범위
특징
• 정보계 구축 ETL
• EBH를 활용한 데이터 처리의 효율성 확보
• 단위 업무별 Batch
• 메타데이터 시스템 연동에 따른 관리편의성 확보
• 변경분 데이터 추출 연동
• 변경분 처리솔루션과 연동하여 데이터 정합성 확보
계정계
ODS
EAI를 이용
DBMS
DBMS
User Log
DW
BATCH
TS를 이용
BATCH
TS를 이용
DBMS
FTP 전송
변경분
File
User Log
FTP 전송
BATCH
TS주1)를 이용
변경분
File
추출File
DB Log
ETL HUB
BCV
 데이터 표준 규칙의 적용
- 필드 규칙 및 테이블간 RI규칙 검증
- ETL에 손쉬운 검증 규칙의 추가가 가능함
주1) TS : TeraStream의 약자
변경분File
FTP 전송
FTP 전송
공유File
BATCH
TS를 이용
검증규칙
DM & Sub System
통합
메타데이터 관리
저장소
-2-
Risk
KPI
EUC
바젤II
© 2011 DataStreams Corp. All Rights Reserved.
활용분야 : 국제회계 (IFRS) 구축
적용범위
특징
• IFRS 구축
• NRT (Neal Real Time)를 이용한 데이터 연속성 확보
• Rule Engine을 이용한 시스템 구축
• 메타데이터 시스템과 Rule관련 연동
Front System
연결재무제표
Financial data Mart
ETL/EAI
여신
Accounting Logic
수신
Value Management
신탁
Hedge Accounting
자회사
IFRS 1
자회사
IFRS 2
자회사
IFRS 3
Financial Data Mart
Measurements
유가증권
Workflow (BPM)
FX
Consolidation
파생상품
SPC
신용카드
기타
Posting Rule Engine
IFRS
Metadata
품질관리
COA 코드표준
OLAP
Reporting
Multi-GAAP
IFRS
GAAP
OLAP
Reporting
Rule set 관리
MultiGAAP
Segment
report
K GAAP
-3-
© 2011 DataStreams Corp. All Rights Reserved.
활용분야 : MDM (Master Data Management)
적용범위
특징
• 마스터 데이터 추출,정제 후 초기 및 변경 적재
• 단일 회사의 제품으로 MDM(통합,표준,품질,연계)구현 가능
• Legacy 배포 이후 정합성 검증을 위한 주기적 추출 및 분석
• 데이터통합 및 표준,품질 엔진과 연동하여 효율적 업무지원
• 마스터 활용성 및 품질관리 지표 측정을 위한 가공분석
• 솔루션간의 통합 연계를 통한 데이터 흐름 파악 용이
신규등록
분류체계
코드체계
속성체계
변경,삭제
경영
일괄변경
재무
마스터 모델, 데이터체계
인사
판매
검색
요청
검토
워
크
플
로
우
마스터데이터
통합모델
분류
체계
관리
체계
및
모
니
터
링
변경
이력
MDM
승인
담당자
배
포
운영기준,업무규칙,성과지표
제조
검증
배포
연계
Interface
:
:
:
추
출
품질
모니터링
CRM
SCM
SEM
관리회계
업무관리자
마스터관리자
시스템정보
업무규칙
-4-
KPI지표
© 2011 DataStreams Corp. All Rights Reserved.
활용분야 : MDW (Manufacturing Data Warehouse)
적용범위
특징
• 고속 배치 처리 성능을 기반으로 통합 제조DW에 활용
• 표준관리 및 MDM시스템과의 연동으로 통합,표준,품질
연계 구현
• 설비정보 및 공정실적 정보의 신속한 추출,분석
• 복잡한 프로세스에서의 빠른 데이터 분석 기능 제공
• 공정간 이동실적 현황 준실시간 중계
해외법인
MES
추출,가공
솔루션
적용방안
• 전사 제조사업장간 통합 분석 및 자원배치 지원
추출,가공
품질감시
제조ODS
해외법인
MES
통합 제조 MDW및 DM
M
E
해외법인
MES
S
Staging
표준화
표준화
Report
대용량 Data 수집 및 가공,적재



실시간 공정,설비 현황 조회
LOT,공정,설비,제품,품질이력 데이터 추출
특정설비,현장의 LOT 재공 상태 모니터링
Spec 변경 대응
 공정 실적집계 및 마감업무 지원
- 대용량, 준실시간 공정실적 정산 소요 자원


Back Flush등 일일 실적마감 지원

실시간 LOT 추적 및 Capa 산출 지원
Spec변경 대상 LOT 확인,분석 ATP 지원
제조 가능량 및 납품 가능 시기 역 산출
가동율 및 품질 이력의 추적
 설비정보 및 공정간 이동현황 중계 지원
- 설비 Trouble Shoot 수집,연계 및 공정간
품질감시
전사
ERP
관리
회계
해외법인
MES
 신속한 공정 데이터 수집,분석
- 라인 발란스 ,불량 정보 등 신속한 데이터 수집 및
통합
품질


물류 이동 중계
자재,외주,공정간 품질 및 고객 Claim 연계 분석 지원
품질이력 추적,불량원인 분석,불량예방 지원
BOM 구성 및 재공(WIP) 분석
 표준 BOM 및 LOT별 BOM을 고려한 ATP
역산출 지원
- BOM 자재 생성 및 오더 Capa Tracking 지원




-5-
설비별 LOT 적체현황 관리 지원
설비별 LT,소요자재,배합표 등 기준정보
적정 재공,생산Capa반영한 ATP
공정별 자재 사용량,공통/개별 자재 분석
© 2011 DataStreams Corp. All Rights Reserved.
5. 상세기능 및 구축사례
TeraStream 상세기능
TeraStream 구축사례
-6-
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 및 사례 목차
 TeraStream 상세기능
 TeraStream 구축사례
 정렬 및 가공
 국민은행 EDW/통합 DM 구축 1, 2차 프로젝트
 조인 기능
 국민은행 경영정보 차세대구축 프로젝트
 병렬처리
 기업은행 정보계 차세대구축 프로젝트
 검증기능 - 입출력 건수 검증
 우리은행 CRM 구현
 검증기능 - Lookup
 하나은행 정보계 차세대구축 프로젝트
 웹 모니터링
 하나은행 정보계 준실시간 프로젝트
 연계 기능 - SQL 및 Procedure
 KOSCOM PowerBASE 데이터 전환
 연계 기능 – 어플리케이션
 대신증권 차세대시스템 구축
 전/후 처리기능
 행정안전부 시도정책 결정시스템 구축
 Sort 엔진 및 고속 추출 엔진(FACT)
 국세청 소득세연말정산간소화 프로젝트
 다국어 지원
 보건복지부 전자바우처 DW성능개선결과
 예약 실행 기능
 한국방송통신대학 정보계 구축
 관리기능
-7-
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 정렬 및 가공
 Sort 엔진을 이용한 데이터 정렬 기능 사용
 데이터베이스 상에서의 정렬 및 집계보다 월등한 성능 발휘
1. 그룹핑할 기준key는 BAN_ID로 지정
BAN_ID는 오름차순으로 정렬
•
Sort 엔진 탑재로 탁월한 소트 성능
•
Grouping 연산 및 데이터 집계 데이터의 빠른 연산
•
정렬과 동시에 중복제거기능과 입/출력 개수 지정 가능
•
EBCDIC, BIT, COMP 등 다양한 타입 변환 제공
2. Grouping 연산 편집창
CALL_MINS에 BAN_ID별로 GroupbyCount 매핑
-8-
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 조인 기능
 File to File, File to DB, DB to DB 조인 기능
 INNER, LEFT, RIGHT 조인 기능 지원
조인 타입 (INNERJOIN) 정의
파일과 테이블 간의 조인 정의
ALIAS를 통한 참조 제공
조인키 설정
-9-
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 병렬처리
 병렬 처리 개수 지정을 통한 동시 실행 쓰래드 개수 설정 가능
 시간이 과도하게 소요되는 작업에 대한 응답속도 향상
•
컨버터 엔진 내에 자체 병렬 엔진 탑재
•
멀티 프로세스 방식이 아닌 멀티 쓰래드 방식으로 구현
•
병렬 작업 쓰래드 개수는 최대 64개 까지 지정 가능
•
컨버터(EBCDIC->ASCII, 연산이 있는 컬럼이 많은 경우),
변환 작업에서 자체 병렬 엔진을 이용하여 빠른 작업처리
병렬처리개수 지정
•
쓰래드를 이용한 병렬 엔진으로 병렬작업의 부담을 최소화
병렬프로세스 실행화면
- 10 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 검증 기능 - 입출력 건수 검증
 예상 입출력 건수와 실제 입출력 건수를 통해 프로젝트 수행에 대한 건수 검증
• 예상 입/출력 건수와 실제 측정한 입/출력 건수를 비교검증하는 job의 검증 결과를 조회/출력
- 11 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 검증 기능 - LOOKUP
 TSCODE 함수를 통한 파일 및 테이블의 LOOKUP 기능 지원
 LOOKUP을 통한 코드값의 간접적 검증 및 코드 테이블 데이터 활용
코드 파일
입력컬럼
LOOKUP
Key컬럼
출력컬럼
• 코드 검증 함수 (tscode): 검증할 코드컬럼의 코드와 코드파일의 데이터를 매핑(검증) 후 코드값를 가져옴
- 12 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 웹 모니터링
 웹브라우저를 통해 Dashboard형태로 프로젝트 실행 결과 실시간 모니터링 제공
프로그램 성공, 실패 등 실행 결과
- 13 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 연계 기능 – SQL 및 Procedure
 외부명령어 블록을 통한 쉘스크립트 실행 및 OS 커맨드 실행 기능
 USQL 블록을 통한 사용자 SQL 스크립트, Procedure Block 수행
외부명령어 블록
USQL 블록
- 14 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 연계 기능 – 어플리케이션
 자사 제품 간의 연계 제공
 타 플랫폼과의 연계 제공
LAN 혹은WAN
•자체
인터페이스 기능 탑재를 통해 ETL 서버 상의 프로젝트간 연계를 달성
•데이터베이스
•압축을
간 리스너를 통한 연결이 불가능한 경우 효과적
통한 전송 효율 달성 계획 중
- 15 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 전/후 처리기능
 컨버터, 조인 블록 상에서 처리하는 레코드 단위로 블록의 실행 전 처리 및 실행 후 처리를 지원
 사용자는 C 스타일의 로직 작성을 통해 전/후 처리 기능 이용
실행 결과물을 표준출력창에 출력
•
컨버터/조인 블록에서 기능 제공
•
블록 처리 전, 대상 레코드에 대한 전처리 기능을 적용하여
추가의 가공 또는 로직 처리가 가능
•
부서테이블의
각 레코드의 부서번호를
실행 전 처리(가공)
블록 처리 결과에 대해서도 후처리 기능을 통해 추가의
가공 및 로직 처리가 가능
•
소스 데이터로는 제공되지 않은 추가 칼럼 정의에 유용하게
사용되며, 소스 레코드를 건 별로 읽기 작업하면서 컬럼값에
따른 분기 작업 및 추가 가공 작업 등에 효과적으로 적용
FFD File로 본 전처리후 결과
- 16 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : Sort 엔진 및 고속 추출 엔진(FACT)
 독립 제품 라이선스로 제공되는 Sort 엔진, 고속 추출엔진(FACT)를 TeraStream에 기본적으로 탑재
•
Sort 엔진인 CoSORT의 실행스크립트를 그래픽
인터페이스를 통해 사용자 친화적으로 생성
•
자사 고속 추출 엔진인 FACT를 언로드 블록에
기본적으로 탑재
•
사용자SCL 블록을 통해 CoSORT 실행 스크립트
직접 편집 및 실행
- 17 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 다국어 지원
 유니코드 지원을 통해 UI 상에서 다양한 언어 표현 가능
 유니코드 데이터에 대한 디스플레이 기능과 함께 다국어 완벽 지원
•
다국어명 사용 가능
•
블록명, FFD명, 프로젝트명 등에서 영어, 중국어, 일어 등
다국어 입력 사용 가능(언어별 UI)
•
자국어를 테이블명, 컬럼명으로 사용하더라도 표현에
전혀 제한이 없게 됨
•
- 18 -
유니코드 지원
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 예약 실행 기능
 자체 스케줄러 도입을 통한 스케줄링 예약 실행 구현
 영업일 테이블 별도 보유 및 다양한 형태의 스케줄링 방법 제공
 기준 시간 단위 실행 및 반복 실행 기능
- 19 -
© 2011 DataStreams Corp. All Rights Reserved.
상세기능 : 관리기능
 사용자 관리 및 권한 관리를 위해 User Manager 제공
 프로젝트 별 권한 (열기, 수정, 실행) 관리
•
계정 – 작업그룹 – 권한그룹 관계를 통해 사용자 관리 및 권한
•
프로젝트 별 권한을 관리
관리 실시
•
UNIX의 권한 체계와 유사한 체계의 권한 및 계정관리를 통해
권한 위반에 대한 상세 이벤트로그 제공
- 20 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 국민은행 EDW/통합 DM 구축 1, 2차 프로젝트
도입
효과
 정보계 업무를 TeraStream을 이용하여 IMS HDB, HOST DB2, Oracle, DB2 UDB 등 다양한 형태의
DB 데이터 처리
 다양한 비즈니스 로직을 적용한 대용량 데이터(일 EBCDIC 4TB)의 일배치 목표시간 2시간 30분 만족
고객사 이슈
•
•
•
•
M/F 및 IMS HDB의 컨버젼 기능 요구
시계열 컬럼 부재 상황에서 변경분 처리
대용량 데이터의 배치시간 내 처리(원천 기준 일 10TB )
대용량 단일 파일의 병렬 처리
시스템 구성도
파일처리 흐름
원천 시스템
EDW
Sybase ASIQ
IMS HDB
적용방안
ETL
A-SOR
Informover
• 메인 프레임 데이터를 UNIX환경의 데이터로 전환
•
•
•
•
( 초기10TB → 25TB) 18시간에 처리
데이터의 한글 변환 등 다양한 데이터 변환 및 가공
계정 서버에서 신ODW 서버로 ETL
- Daily 변경분 데이터 약 200GB를 TeraStream FACT엔진을
이용하여 약 1시간 30분안에 추출
정보계 시스템에서의 ETL 및 배치 업무 수행 내용
- 수신, 여신, 외국환, 통합, 공통 정보계 업무
- OLAP Mart 구축
정보계 배치를 주요작업 기준 목표시간(6시간) 안에 적재
- 주요작업이 목표 시간처리로 타팀 제공 완료
- 동시에 OLAP Mart작업 구현
DB QUERY
IBM M/F
- Seg분할
- 컨버젼 & Array 분할
- 로직적용
영역DM
통합DM
ETL
HDB, DB2
Informover
- 컨버젼
- 로직적용
Server RDB
TS(FACT)
ETL
- 로직적용
- 21 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 국민은행 경영정보 차세대구축 프로젝트
도입
효과
 검증을 마친 TeraStream을 이용한 안정적이고 완성도 높은 데이터와 이행 시간의 최소화
 TeraStream과 C Language의 적절한 배치로 효과적인 Batch Program구현 및 배치 성능 향상
고객사 이슈
시스템 구성도
• AS-IS 경영정보 시스템(M/F DB2)에서 안정적인 변환 및 이행
가능한 ETL 솔루션 필요
• 다양한 종류의 DBMS데이터의 추출,적재가 가능한 솔루션필요
• 차세대 프로젝트 개발 인력과 오픈 후 운영 인력이 동일하여
데이터 이행을 통하여 익숙해진 솔루션을 경영정보 Batch 프로
그램 개발에 동시 적용이 필요한 솔루션 필요
• Batch 프로그램 개발의 효율성과 성능 개선을 위하여
C Language와 원활한 호환이 가능한 Batch 개발 솔루션 필요
적용방안
추출
전송
•
•
•
•
매핑 및 적재
AS-IS추출데이터
M/F
FTP/
Informove
DB
데
이
터
전
환
전송
ASCII
변환
추출
파일
(TeraStream/ProC)
파일정제,가공
Target
파일
UNIX
추출
파일
수행Log
오류
파일
Staging
DB
M/F,UNIX
추출/전송
Log
경영관리
LOAD
DB
데
이
터
검
증
To-Be원장
추출 파일
(EBCDIC)
• 계정계 DB(M/F DB2)에서 전송된 EBCDIC데이터를
TeraStream의 변환 기능을 이용하여 변환 및 TO-BE 매핑작업
TeraStream을 이용한 검증 프로그램과 AS-IS상호 비교로
정확한 데이터 정합성 확보
TO-BE DBMS인 SybaseIQ와 UDB(UNIX DB2)의 효과적인
DISK활용을 위한 공유영역과 비공유 영역의 구분 활용
TeraStream을 기본 배치Tool로 하여 배치 프로그램을
개발하며 C Language로 개발된 프로그램은 TeraStream으로
수용하여 진행
SybaseIQ와 UDB의 동시 접속으로 배치 프로그램 효율성
극대화
사전작업
AS_IS
검증
재처리
작업
공 코드매핑
통
모 고객번호
듈 계좌번호
AS_IS
검증데이터
추출/전송
Log
TO_BE
검증데이터
회계관리
업무지원
리스크관리/
내부통제
TO_BE
검증
검증결과 DB
(Result)
- 22 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 기업은행 정보계 차세대구축 프로젝트
도입
효과
 ODS 및 DW구축으로 인한 경영정보 시스템에 요구되는 데이터 확보
 종합수익/성과/바젤II/영업실적포털로 제공되는 계정계/계정서버와의 복잡한 인터페이스에서
EDW를 중심으로하는 종합보고서 시스템 구축
고객사 이슈
시스템 구성도
• 경영정보 시스템에서 요구되는 데이터 충분성 확보를 위하여
ODS & DW 필요
• Bank DB/AS-IS DW에 적재되어 있는 과거데이터 이행
• 현행 종합수익/성과/바젤II/영업실적포탈로 제공되는 계정계/
영업점
자동화기기
TeraStream의 변환 기능을 이용하여 Staging DB구축
• Bank DB/AS-IS DW에 적재되어 있는 과거데이터 리모트 추출
(FACT)을 통한 DW 이행, AS-IS(계정계) 추출 시 약 2Tbyte
• 대량 데이터에 대한 CDC (Change Data Capture: 일중 수시
추출) 적용을 TeraStream으로 구축하여 이행시간 단축 실현
• 단위마트,분석마트 이행 시 이행시간 단축
• 계정데이터 이행, DW, 단위마트, 분석마트의 정기 Batch 작업
시간 단축
- 일일 배치 데이터사이즈는 200Gbyte
고객
수신
정산
여신
상품관리
외환
재무회계
대행
적용방안
• 계정계 DB(M/F DB2)에서 전송되어지는 EBCDIC데이터를
계약
공통
신용카드 전자금융
디퍼드
복제
콜센터/폰뱅킹
환원
속보
직원실적 예보
재무일계 관리
Staging
실시간
분석
수신
고객
여신
계약
상품
조직
집계
정보
경영
정보
영업정보
마케팅 고객
공통
재무
기타업무
거래
요약집계
E
T
L
종합수익관리
리스크관리
운영리스크관리
WMS
배치 I/F
계정계 서버시스템
Transformation
신용카드
방카슈량스
여신종합
국외전산
외환시스템
자본시장
예산/자산관리
인사
대외기관
•은행연합회
•한국신용평가
•한국신용정보 데이터 관리 Infra
•증권거래소
- 23 -
영업실적포털
상품 조직 계약
성과관리
Extract
모바일
통합CRM
Feedback
원가결산
기타계정배치
Rule
인터넷
DW
후처리ODS
차세대
경영정보
시스템
실시간 ODS
실시간 I/F
계정서버와의 복잡한 인터페이스를 위한 단위마트 시스템 필요
• 현행 전산자료출력, 각종 보고서 통합을 위한 분석마트 필요
계정계 시스템
메타데이터관리
Cleansing
감사정보
DM
점질분석
분석마트 단위업무
마트
수신
고객
여신
마케팅
실적
보고서
성과
OLAP/Reporting
정형분석
비정형분석
수익
Query Tool
리스크
비정형조회
비정형보고서
Loading
데이터 품질 관리
통합 스케줄링
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 우리은행 CRM 구현
도입
효과
 ORACLE DBMS 데이터 이행 및 배치 작업을 목표시간 8시간 내 완료
 복잡한 업무 로직을 TeraStream을 이용하여 완벽하게 구현
고객사 이슈
•
•
•
•
신속하고 정확한 데이터 이행을 위한 솔루션 필요
정확한 데이터 검증을 통한 신뢰성 있는 데이터 확보 필요
EDW 데이터를 CRM 시스템으로 이행 가능한 솔루션 필요
CRM 배치작업 진행 가능한 솔루션 필요
시스템 구성도
CRM 서버
M/F(EDW)
변환, 로직 적용/
데이터검증
조인
DB2
TO-BE
Fixed SAM
ASCII
적용방안
• TeraStream 과 pro* C 을 이용한 CRM 배치 작업 구현
• 데이터 이행 및 배치 구현( SIZE : 600 GB , 시간 : 8시간)
• EDW(File) 데이터 와 TO_BE 데이터를 TeraStream을 이용하여
FTP전송
EBCDIC
Variable SAM
상호검증(적재건수검증)
• 우리은행 스케줄러와 연동하여 ETL 이행 및 배치
(오전8시~오후8시)
분석 CRM
변환/적재
EBCDIC
Fixed SAM
Fixed SAM
FTP전송
분석 DM
Oracle
- 24 -
운영 CRM
적재
운영 DM
Oracle
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 하나은행 정보계 차세대구축 프로젝트
도입
효과
 ADW, BSA, CRM, SEM, AUI, 단위업무 등 정보계 전체 배치작업의 효율적인 구성
 Sybase DB 및 Oracle 등 이기종 DB간 효과적이고 안정적인 배치작업 지원
 준실시간 데이터 처리 및 적재를 위한 TeraStream 사용
고객사 이슈
시스템 구성도
• 제한된 시간내 계정계 데이터의 DW적재 및 마트, CRM, SEM
등 정보계 전체 배치작업을 가능하게 할 ETL 필요
• 이기종 DB간 구성 및 다양한 시스템 환경에 유연하게 대처할 수
있는 ETL 필요
• 준실시간 데이터 가공 및 적재를 처리할 수 있는 효율적이고
안정적인 ETL 필요
계정계
정보계
상품DB
EAI데이터
전송
적용방안
AUI ETL
BSA DB
AUI DB
NRT가공
및 적재
Flat
File
Oracle DB
복제
• ADW ETL : 계정계 BCV에서 짧은 시간동안 데이터를 정보계
DW로 추출 및 적재, Mart 구성까지 배치 지원
• 전사 ETL : ADW 및 BSA에서 데이터를 추출, 가공하여 CRM 및
SEM DB로 적재하는 배치 작업 지원
• BSA ETL : 계정계에서 발생하는 실시간 데이터를 EAI를 통해
전송 받아 가공/적재하는 준실시간 온라인 지원
• AUI ETL : ADW에서 데이터를 추출하여 AUI로, 적재 AUI에서
데이터 추출하여 단위업무 DB로 데이터를 가공 적재하는 배치
작업 지원
BSA ETL
ADW 데이터
BACKUP
ADW ETL
계정계
데이터추출
및 ADW적재
상품BCV DB
- 25 -
Flat
File
ADW/AUI
데이터추출,
AUI/단위업무
데이터 적재
Flat
단위업무DB
File
ADW DB
Flat
File
BDW DB
전사 ETL
CRM DB
Flat
File ADW/BSA
데이터 추출, SEM DB
CRM/SEM
데이터 적재
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 하나은행 정보계 준실시간 프로젝트
도입
효과




원천시스템에서 발생된 변경 데이터를 3분내에 정보계 목적 테이블에 변경 적재
실시간 모니터링을 통하여 원천시스템부터 정보계 시스템까지의 데이터 흐름 확인
정보계 타켓테이블 컬럼 변경시 별도의 프로그램 수정 없이 자동 변경, 관리하여 유지보수 편의성 제공
오류 발생시 SMS 및 이벤트 발생으로 인하여 즉각적인 비상대응체제 제공
고객사 이슈
시스템 구성도
• 기존 MQ(Message Queue) 방식을 이용하여 디퍼드 처리시
1시간 이상의 데이터 지연 현상 발생
• 디퍼드 대상 테이블 추가 변경 시 프로그램 구현의
불편함과 별도의 모니터링이 없는 관계로 오류 발생시
대처 방안이 힘듦
EAI전송파일
DW
로그
업무
로그
 Variable 형식
•트랙잭션 처리
•파일컬럼 자동처리
•EAI송수신 정보 호출
•Enter값 치환 호출
•데이터 전송누락 검증
•
•
•
•
•
DW
로그
업무
로그
NRT 파일처리
업무별 Agent 관리
• 계정계에서 발생된 변경 데이터를 EAI를 통하여 정보계 서버에
전송
NRT 데몬을 통한 실시간 파일 전송 체크
파일 처리
- 테이블별 분리 및 중복 제거
NRT Connection 모듈
- 가공 및 적재 처리시 Message Queue방식을 이용한 처리방식
적재 처리
- MERGE INTO 및 BULK 적재 방식을 통한 준 실시간 데이터
적재 처리
NRT 모니터링
- 실시간 데이터 가공 / 적재 모니터링
- 시간당 데이터 추이 분석 자료 제공
EAI전송파일
EAI
 MAX 2000rows
전송
적용방안
NRT데몬
Connection
module
NRT수신
상태 테이블
업무 후처리 모듈
•NRT엔진구동
NRT 후 처리
NRT 모니터링
•오류발생처리 호출
•트랜잭션 처리
•출력로그생성
•종료코드처리
•Return
NRT수신
상태 테이블
- 26 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 KOSCOM PowerBASE 데이터 전환
도입
효과
 KOSCOM공금융 PowerBASE 구축 사업에서 TeraStream이 Data Conversion Tool로 선정되어
Tandom을 ORACLE로 전환
 각 증권사별 전환시간 6시간 목표 달성
고객사 이슈
시스템 구성도
• 여러 개(1회 최대 6개)의 증권사 Tandom DB 에서 Oracle
DB로 전환할 때 목표시간(6시간) 내 전환 필요
-> 같은 날 동시에 여러 개 증권사 데이터 6시간내 전환
구시스템
신시스템
2007년 2월부터
증권사별 순차적 정지
2007년 2월 ~ 2008년 4월 증권사별 순차적 OPEN
TO-BE
(Base21)
AS-IS
(B21,현선물,BP,HTS)
적용방안
• Tandom 데이터를 ORACLE 데이터로 전환
•
•
•
•
•
(1TB 전환 4시간 40분 소요 -> 목표시간 대비 1시간 20분 단축)
총 43개 증권사 데이터 전환(동일 데이터 로직 사용)
여러 개의 증권사 데이터가 존재하는 Tandom 데이터 파일을
FTP로 신시스템에 전송
증권사별로 데이터를 분할하며 데이터 정제작업 진행
- 코드정제 및 데이터 layout체크 등
데이터를 가공하여 타켓데이터 생성후 신시스템에 적재
- 정제된 데이터를 TeraStream을 이용하여 전환로직 반영, 가공
각 증권사 별 순차적 OPEN
Tandom
매핑룰
Convert
Extract
증권사별 분할/
데이터 정제
Load
FTP 전송
ORACLE
- 27 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 금융
 대신증권 차세대시스템 구축
도입
효과
 서비스 속도와 안정성 보장
 타 시스템과의 표준화된 연계
 24*365 시스템의 구축 및 운영시스템의 빠른 이슈해결과 편리한 보수
고객사 이슈
시스템 구성도
• ASCII 파일처리 등 BULK 처리 필요
• 타언어 모듈을 Shell을 통해 호출하고자 하는 요구사항
채널(서비스)
비즈니스 시스템
채널통합(대외)
코어/경영지원 온라인 AP
X-MINS
FEP
Cybos 단말
IE
적용방안
•
•
•
•
•
데이터 추출 및 가공하여 트랜잭션 처리
추출 가공된 데이터로 전문 구축
아스키 파일처리 등 BULK 처리
타언어 모듈을 Shell을 통해 호출하여 사용 가능
TeraStream 사용 예
1. 비정기적 ETL 또는 파일가공 작업
Cybos UI -> TeraStream
Cybos UI에서 전문 또는 리포트파일 생성
2. 일/주/월/분기/년 데이터 배치 및 비정기 데이터 가공 작업
- Control-M과 TeraStream연계
- TeraStream을 이용하여 계정계에서 소스데이터 추출 및
가공하여 계정계로 적재
CB+
FIX
1. Cybos ->
TeraStream
HIS
(Web
Server)
Control-M
TR(Online)
계정계
(비즈니스 데이터)
CORE DB
NEFSS
Oracle
AIX
Websphere
Batch AP
CORE DB
Scheduler
3. Control-M ->
TeraStream->
OTIS
TeraStream
Unix
Shell
2. Control-M ->
TeraStream
Oracle
AIX
OTIS
CORE DB
Oracle
AIX
- 28 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 공공
 행정안전부 시도정책 결정시스템 구축
도입
효과
 각 시도 및 군 데이터를 추출하고 중앙 부처 및 기관 데이터는 EAI와 연동하여 데이터를 전송하고
전송된 데이터는 가공/적재 후 DW/DM에 데이터를 생성하고 각 시도 및 중앙에 필요한 데이터 전송
고객사 이슈
시스템 구성도
• 업무와 정보를 수평·수직적으로 연계하는 실질적인 전자
정부 완성
• 시도, 시군구간 연계된 통합정보를 활용하여 시도 행정
업무에 필요한 가치 있는 양질의 정보 제공
• 신속․정확한 의사결정지원체계 구축
적용방안
• 중앙부처 시스템/시도업무시스템/시군구 업무시스템/유관기관 및
단체시스템간에 필요한 데이터를 DW/DM 간에 EAI로 전송하고,
ETL로 구성
• 대상 : 중앙 및 16개 시도
• 시도별 업무 현황
1) 내부행정(토지,건물,자산증감현황) -> 서울시
2) 환경(대기,토양오염,물관리 등) :인천,대전,울산,충남,전남
3) 광주(의약품,공중위생,식품위생) : 보건위생
4) 경제통상(에너지,노동행정,중소기업,경제동향 등):경남,제주,경북,
부산, 대구,경기, 강원,충북,전북
• 일 데이터 처리량은 50GB 내외
• 처리 데이터 보관 방법 : 프로젝트가 성공적으로 완료 후 특정 파일
시스템으로 데이터를 전송하여 이를 백업 솔루션으로 백업
• 중앙 부처에 관련 된 데이터는 EAI를 통하여 파일로 데이터가
제공되고, 중앙 및 시군구 데이터(Oracle)는 직접 추출(FACT)하여
DW/DM(Sybase) 에 적재
EAI
ETL
중앙 통합 데이터마트
중앙부처
유관 시스템
ODS
DW
DM
중앙 DW/DM로 부터
필요 데이터를 각 16개
시도로 EAI를 통해 전송
연계기관 :
연계기관 내부
파일을 주기별로
EAI를 통하여
각시도 및 중앙
부처에 전송
각 시도의 DW/DM를
중앙 DW/DM으로
전송
시도/시군구
행정 시스템
ODS
DW
DM
시도 데이터웨어하우스(16개시도)
- 29 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 공공
 국세청 소득세연말정산간소화 프로젝트
도입
효과




다양한 포맷의 데이터 처리: 여러 기관의 다양한 포멧의 데이터를 처리
대용량 데이터 처리: 각 기관의 다량의 데이터를 완료 목표시점인 08:00 까지 완료
암호화 병행 : 기존 데이터를 암호와 복호화 모듈을 적용하여 처리했음에도 목표시간 준수
다양한 DB간의 데이터 변환 ( ASCII => EBCDIC, EBCDIC => ASCII ) 구현
고객사 이슈
• 여러 기관의 다양한 포맷의 File 데이터 효과적 처리 필요
• 입력 데이터의 수집 시간이 일정치 않고 summary필요,
시스템 구성도
내부시스템
외부시스템(서비스)
대용량 데이터를 신속한 처리할 필요
TIS 시스템
• 최종 결과를 메인프레임 시스템으로 제공
(ASCII -> EBCDIC) 할 수 있는 솔루션 필요
세적정보
세적정보
적용방안
• 각 기관별 수집 데이터에 대한 포맷 표준화 진행
• 외부시스템으로의 연계파일 작성시 실명을 암호화 적용(연동)
• 대용량 파일의 분할을 통하여 Oracle 적재 시 병렬작업으로
•
•
•
•
수행
수집된 데이터의 오류(형식오류, 내용오류 등) 체크
- Header,Midlle, Data File간 값비교, 오류발생시 작업중단.제어
- 형식 및 내용오류 외에 데이터의 중복체크
- 오류의 관리를 위한 테이블 관리
데이터의 오류를 신속하게 제출기관에 통보하여 수정/보완
전각문자를 변환모듈 적용
K청 소득세연말정산 프로젝트에서는 대용량 데이터 처리 외
에도 시스템의 구성상 요구되는 항목들을 처리 하는 것이 목표
세적정보
세적정보
소득정보
자
료
교
환
시
스
템
추출시 암호화
TIS
세적정보
FTP 전송
세적정보
소득자료
추출시 암호화
소득정보
소득자료
소득자료
ASCII 컨버젼
소득자료
소득자료
외부 기관
소득자료
비즈니스로직
적용
복호와 및
오류체크
외부제출
자료
외부제출
자료
- 30 -
외부제출
자료
FTP 전송
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 공공
 보건복지부 전자바우처 DW 성능 개선 결과
도입
효과




통계제공시간 단축: 기존에 1~6일 소요되었으나 수 초 ~ 수 분 이내로 통계시간 단축
정보 프로세스의 단축: 자료처리 절차의 간소화와 업무담당자가 직접 정보 획득
1개의 통계장표에 여러명 투입하여 작업하였으나 DW구축으로 현업이 직접 조회 및 편집 가능
일관된 데이터 제공으로 인한 데이터 신뢰성 증가
고객사 이슈
• 데이터 정합성 결여
• 통계자료 요청시 며칠 소요로 인한 정보의 즉시성 결여
• 부정결제시 즉시 확인이 불가능
• 통계데이터의 신뢰성 결여로 관리원과 현업간의 불화
시스템 구성도
원천 시스템
전자바우처 통계분석시스템 DW 서버
Source DB
(oracle)
Target DB
(oracle)
FACT
바우처
서비스
적용방안
원천소스에서 ODS로 일배치
통계분석을 위한 ODS, DW, DM 구축 및 모델링
바우처 시스템 (DB1 -> 신규 DW서버)
서버
- OS기종 : AIX 5.3(ASIS,TOBE동일)
- CPU : Power5, 2.1GHz, 6core , IBM P시리즈
- MEM : 12 GB
- H/W : 1TB
• 심플한 로직으로 유지보수가 용이함
부정
결제
•
•
•
•
임신
출산
ETL
ODS
- 1:1 맵핑적재
- 일배치
- ODS로 적재
ETL
DM
DW
ETL
- ODS데이터 컨버젼
- DW로 update/insert
- ODS와 DW 데이터 가공
- DM으로 update/insert
제공기관
인력
IBM P시리즈
- 31 -
© 2011 DataStreams Corp. All Rights Reserved.
TeraStream 구축사례 : 학교
 한국방송통신대학 정보계 구축
 기존에 15일 정도 소요되던 성적, 등록, 입학 등의 학사업무 통계가 4시간 이내로 단축됨
 대학행정 통계가 1시간 이내에 완료됨
도입
효과
고객사 이슈
시스템 구성도
• 학사통계 자동화 : 기존 10명 정도의 사람이 수작업으로
15일 정도 걸리던 작업을 자동화 및 인원, 시간 단축 필요
데이터 추출/적재
ETL 컨트롤
대학행정
정보계 서버
• 학교행정업무 전산화 : 전산화 된 행정업무에 적합 한 행정통계
시스템 필요
데이터
추출/적재
대학원
TeraStream
적용방안
• 학사업무와 대학행정업무 데이터를 Oracle DB에서 추출,
가공하여 Oracle DB의 ODS, DW, DM로 적재 후 정형 및
비정형 Report를 위한 통계 데이터를 제공함
• 학사정보 데이터 (초기분/변경분) : 20GB/1GB,
변경적재 총4시간
• 대학행정 데이터(초기분/변경분) : 5GB/100MB,
변경적재 총1시간
작업 Tool
총 작업 시간
학사정보 통계시스템
• 4시간 이내
대학행정 통계시스템
• 1시간 이내
전자결제
튜터
행정
평생
교육원
학사업무
학사
졸업
등록
ODS
데이터
추출/적재
성적
입학
DW
DM
데이터
추출/가공/적재
데이터
추출/적재
15일 이상 소요되던 학사정보 통계가 4시간으로 단축된
- 32 -
© 2011 DataStreams Corp. All Rights Reserved.
데이터스트림즈 제품군
DI제품
DQ제품
Deliver
Customized Data
Manage Metadata
Assure
High Quality
Near Real Time
Data Processing
Analyze Application
and Data
Deliver
Real time Change
Data
Manage Masterdata
- 33 -
© 2011 DataStreams Corp. All Rights Reserved.
㈜데이터스트림즈
www.datastreams.co.kr
TEL 82-2-3473-9077 FAX 82-2-3473-9084