데이터 분석 환경을

Download Report

Transcript 데이터 분석 환경을

공공기관을 위한 Power BI
2016.01
솔루션 개요
주요 기능
구축사례
경쟁제품 비교
제품 정보 및 문의
1. 솔루션 개요
Microsoft는 단위 기관용 데이터베이스 솔루션부터 클라우드 기반 대용량 데이터
서비스까지 종합적으로 제공합니다. 또한 기관 데이터센터 시스템과 외부 데이터센터
시스템간에 동시에 공존하는 서비스를 신뢰할 수 있는 보안 환경으로 구성할 수
있습니다.
3
1. 솔루션 개요
Microsoft는 기관의 대용량 데이터 또는 업무별 특정 데이터 분석을 위하여 일관성
있는 분석 도구 및 환경을 제공합니다. 따라서 기관 내부 사용자는 Excel 기반으로
기관 외부 사용자는 Office 365 서비스에 포함된 Excel 및 모바일 서비스를 활용하여
데이터 분석을 구현할 수 있습니다.
찾기
분석
시각화
공유
Power Query 기반의 자료 검색,
추출 및 변환 진행
기관내 데이터센터 및 클라우드
데이터센터의 데이터를 공유할
수 있는 Power BI 사이트 구성
지원
Power Pivot 기능을 활용한
신속한 분석 및 비교
Q&A
모빌리티
Power View 및 Power Map 통한
데이터 분석 결과 시각화
4
실시간 질의에 대한 응답 지원
HTML5 및 디바이스별 최적화된
형태로 접근 방법 제공
1. 솔루션 개요
Microsoft Power BI는 데이터 취합에서 보고서 작업 완료 후 보고 작업까지 걸리는
시간을 최소화하여 의사결정 시간을 단축시킴으로써 업무의 효율성을 증대하는
최적화된 도구입니다.
다양한 유형의 데이터
데이터 모델링/연산
보고서 디자인/Format
보고서 Format/데이터
보고서 게시/공유
소스 활용
- 데이터 연관관계 설정
사용자 결정 및 작성
변경
읽기/보고서/데이터
- Excel, Text 파일
- 필드 생성
- Chart/이미지
- Chart/이미지
- Database데이터
- 분석 조건
- 분석 조건
- 하둡 활용 비정형 데이터
- 보고서 리스트 유형
- 보고서 리스트 유형
5
수정권한 관리
2. 주요 기능
SQL Server 기반으로 데이터 분석 환경을 구성할 때 기관의 사용자의 필요에 따라
구현이 가능합니다.
• Main 대시보드
• 주요 통합경영정보 (기관실적,
상시 모니터링)
• 일반경영정보 (영역별
일반경영정보)
• 다차원 분석, 분석대상 그래프,
기간별 추이/추세 분석을 통한 향후
예측 및 상승, 하락 요인 정보 제공
• 일반 사용자에게는 정형 보고서
위주의 정보를 제공
• 비정형 분석을 통한 상세원인 분석
• 데이터 유형에 따른 그래프나
표형태의 정보 제공
• 정형/비정형 보고서 제공
• 정형 보고서 제공
6
2. 주요 기능
SQL Server 기반 데이터 분석 아키텍처는 5단계로 이루어져 있으며, 필요한 모든
기능이 SQL Server 단일 솔루션이 포함되어 있습니다.
7
2. 주요 기능
데이터 분석 인프라를 구성하는 도구에는 데이터 추출/변환/정제 도구로써 SQL
Server Integration Service가 있습니다.
 상용 DBMS, SAP ERP 등 기업 내 다양한 LOB 시스템과의 데이터 연동을 지원함.
 필요시 사용자 제작 Adapter를 만들어서 인터페이스 확장이 가능함.
 비정형 쿼리, 오브젝트(테이블, 뷰, 프로시저 등) 기반의 추출 및 스크립트 객체를 통한 프로그래밍 기능을 통해
유연한 데이터 추출이 가능함
운영 시스템
• 비정형 쿼리
• 오브젝트 기반
• 스크립트 객체
• 시각적인 디자인과 디버깅
SQL Server
Data Warehouse
Data Connect Adapter /
Oracle-CDC for SSIS
• …..
 작업 공정 디버깅 용이
• 대량 데이터 처리를 위한 기능
 이기종 데이터베이스 직접 연동
 csv, xls 파일 연동
Adapter 추가 기능
LOB 1
 병렬
 변경
제공
CDC
• SQL Server-Specific Built-in Support
• Oracle Connectivity
• SAP Connectivity
LOB 2
Flat File
• XML Data Support
데이터 처리 (CDC)를 위한 컨트롤
(Oracle / SQL Server 소스에 대한
기능 무상 제공)
 오류에 대해 메일 및 SMS 발송
 오류 Log 일괄 기록과 관리
• Connectivity to Excel, Access, and FileBased Databases
• The Flat File Provider
처리와 직렬 처리 제어
• 관리 기능
• DB2 Connectivity
• …
 Visual Studio 기반의 통합 개발 환경 제공
 시각적인 Control Flow, Data Flow 디자인
• Integration Service는 기본 제공 Adapter
외에도 Customer Adapter 추가를 통해
뛰어난 확장성을 보장합니다.
8
 행당 수행시간 비교로 튜닝 포인트 제공
2. 주요 기능
데이터 분석 인프라를 구성하는 도구에는 데이터 정제(Data Cleansing) 도구가
사용됩니다.
 데이터에 대한 지식 관리가 가능함.
 생성된 KB를 이용하여 데이터에 대한 정제, 매칭 및 프로파일 작업을 수행할 수 있음
 Azure Data Market 의 데이터 서비스를 참조 데이터로 활용 가능함
• 데이터 매칭 및 정제
 KB를 기반하여 정확하지 않은 데이터에 대한 수정, 제거 등
관리 가능
 Rule base 혹은 Interactive 프로세스 지원
• 데이터 프로파일링
 KB 구축, 데이터 도메인 관리, 매칭, 정제 등 각 데이터 관리
단계에서의 데이터 프로파일링 지원
• 모니터링
 데이터 품질관리 Activity의 상태에 대한 추적 및 모니터링
제공
 꾸준한 데이터 품질 유지 가능
• Integration Services와의 연계
 Integration services 내의 DQS 컴포넌트를 이용해
ETL 작업에서의 데이터 정제 가능
• Master Data Services와의 연계
 MDS 내 DQS 관련 컴포넌트가 통합
 마스터 데이터 구축 및 관리 시 데이터 정제, 매칭 등의
DQS 관련 기능 사용 가능
9
2. 주요 기능
데이터 분석 인프라 구성 후에 효율적인 분석을 위하여 다차원 데이터를 구성하거나
OLAP 및 발견(Data Mining) 엔진을 제공합니다.
 Analysis Services OLAP 엔진을 통해 Data Mart 를 만들 수 있음.
 예측값을 다차원/비정형 분석하거나 데이터 마이닝/Write-back 기반의 시뮬레이션 이 가능함.
1. 비즈니스 업무 요건에 What-if와 같은 데이터 마이닝 모델에 다양한 값 입력
2. 마이닝 결과 값을 다시 결과 창에 표시
1. Client Tool에서 Cube에
접근하여 다차원 데이터 조회
2. Bube에서 조회 조건에 따라
결과 집계 값 호출
• 데이터 마이닝
 다양한 데이터 마이닝 알고리즘을 응용하여 마이닝 모델 생성 및 이용
 마이닝 알고리즘 : 의사결정트리, 연관분석, 클러스터링, 시퀀스 클러스터링, 시계열,
신경망,
선형 회기분석, 로지스틱 회기 분석, 텍스트 마이닝, Naïve Bayes
Cube
1. 변경된 값을 Cube에 저장하기 위해 Write-back 기능 이용.
Dimension은 Fact Table에 저장되며, Measure 값은 Write-Back
Table에 임시 저장, Commit을 할 시에 원본 Cube 저장
Cube
• 다차원 분석
 Excel, Reporting Service 등 클라이언트 툴을 통해
Cube에 접근
 데이터의 집계를 계층적으로 Drill-Down, DrillAcross, Drill-Through 및 Pivoting을 통해 다양한
관점으로 데이터를 조회
Cube
DW
2. Cube를 재조회시에는 변경된 값으로 조회된다.
• Write-Back
 분석시 변경된 값을 다시 Cube에 저장하여 데이터 재 조회시 새로 변경된 값으로 조회
 Excel의 What-if 분석 기능과 함께 시뮬레이션 가능
10
2. 주요 기능
데이터 분석 도구로써 마이닝 구조 생성, 모델 생성, 탐색 및 테스트 기능을
제공합니다.
 SQL Server 2012에 내장된 마이닝 서비스를 통해 고급 분석 제공
•의사결정 트리
마이닝 모델 생성 및
입력/예측 선택
•데이터 원본 뷰에서
마이닝 대상 테이블,
뷰 선택
•의사결정 트리 탭에서
마이닝 모델을
구성하는 모든 트리
모델 검사
•각 모델이 얼마나 잘
예측하는지 계산하고
각 모델의 결과를
비교
11
2. 주요 기능
데이터 분석 도구로써 Excel Add-in 도구가 있고, Excel 내부에 다양한 차트 기능이
포함되어 있습니다.
• SQL Server 설치 후에 Microsoft SQL Server Data
Mining Add-ins for Office를 설치하면, 위 화면과
같은 Data Mining, Analyze, Design 메뉴가 새로
생깁니다. 이중에서 Analyze 메뉴를 이용하여
엑셀 테이블에 있는 데이터에 대해서 요인분석,
군집 분석, 예외분석, 시나리오 분석, 예측을
실행할 수 있습니다
• 요인분석 - 특정 결과값에 가장
큰 영향을 주는 데이터 패턴
요인 분석
• 군집분석 - 테이블 데이터에서
유사한 특징을 갖는 행 값을
감지하여 군집으로 분류
12
• 예외값 강조 - 테이블 전체의 일반적인
패턴에서 벗어나는 예외 값을 갖는 열들을
분석하고 강조
2. 주요 기능
데이터 분석 및 리포팅 도구로써 Excel이나 Sharepoint에 활용할 수 있는 PowerPivot
기능을 제공합니다.
 PowerPivot for Excel/Sharepoint를 통하여 Cube, 관계형 데이터 소스 및 Text, Excel 등 다양한 소스 연결 가능.
 대량 데이터를 사용자가 Excel을 이용하여 직접 분석하고 SharePoint Server를 통해 게시 및 공유가 가능함.
다양한 데이터 소스와의
연결성 제공
관계 생성
• User Friendly
 Excel 기반의 대량 데이터 사용자 분석
 슬라이서 기능을 통해 필터 조건 등의 적용이
용이하며, 편리한 UX 제공
 Excel의 각종 서식을 그대로 사용 가능
• 뛰어난 대용량 데이터 분석 기능 및 이기종
데이터 소스 지원
데이터 추출 후 DM/DW의
테이블 간의 FK 기반 관계
자동 생성
 SQL Server / Analysis Server 뿐 아니라, Teradata,
Oracle, DB2, Sybase 등 다양한 데이터 원본
(DM/DW)과 연동
 Cube 없이도 DM/DW의 테이블 간 관계를 그대로
이용하여 피벗팅 및 분석 가능
 xVelocity 엔진 기반 Column 단위의 데이터 압축을
통해 대량 데이터 분석 성능 향상
슬라이서
13
2. 주요 기능
데이터 분석 및 리포팅 도구로써 SQL Server Reporting Service를 통해 반복되는
보고서를 만들 수 있습니다.
 동일한 형식으로 반복되는 정형 보고서를 미리 만들 수 있습니다.
 Power View를 통해 손쉬운 웹 기반 수정이 가능한 비정형 리포팅을 지원합니다.
 클라이언트에서 필요할 때마다 만들 수도 있고, 리포팅 서버를 구축하여 자동 생성을 할 수도 있습니다.
기관내
정형 보고서
작성 및 공유
BI 포탈
게시
SQL Server Data Tools / Report
Builder를 이용한 리포트 작성
분석용
비정형 보고서
작성 및 공유
다양하게
이용
:
:
SharePoint 기반 BI 포탈에 리포트 게시
BI 포탈
저장
Power View를 이용한 웹 기반 비정형
리포트 작성
다양하게
이용
SharePoint 기반 BI 포탈에 리포트 저장
14
2. 주요 기능
지도 서비스 또는 솔루션과 결합하여 Geo Dashboard를 만들어 시각화할 수
있습니다. (Power Map)
 시각적이고 동적인 보고서를 만들 수 있습니다.
 기관 내부 통계 뿐만 아니라 연구용 데이터를 활용하여 다양한 분석을 가능하게 합니다.
15
2. 주요 기능
데이터 분석 리포트와 데이터를 모아서 SharePoint Server 기반으로 보고서 포탈을
만들 수 있습니다.
 SharePoint Server 은 Excel Service 기능으로 보고서 관리, 권한 관리, 모니터링 등을 구현함.
 권한 관리, 검색, 공유, 버전 관리가 가능합니다.
Sharepoint 기반의 분석 포탈
데이터 갱신
• 현업 사용자 리포트의 공유 및 협업
• 스케줄링 기반 데이터 갱신 자동화
• 최신 데이터 기반의 리포트 유지 가능
버전 관리
• 리포트에 대한 버전 관리
리포트 공유 및 협업
• 그룹웨어 및 다양한 시스템과의 연동 가능
• 이메일, RSS Feed 등 다양한 방법으로 공유
보고서 이력관리 및 모니터링
• Powerpivot 관리 대시보드 기반
관리 제공
16
3. 구축사례
•
•
•
•
예산회계DW
Power BI 도입
담당자 활용도 증가
다양한 기관이나 관점에
따른 보고서 활용 능력
강화
• 대학 정보 공시를 위한 BI
구축
• 데이터 통계/분석 정보와
통합 성과 관리 토대로 공시
정보 확정
• 다양한 데이터를 종합적으로
취합하여 분석 환경을
구축함.
• 의료정보시스템 전체 SQL
Server 2012 적용
• 연구용 LIMS에도 적용.
• 환자정보, 의료 정보, 의료
연구 정보 DW에도 적용.
• IFRS(국제회계기준) 도입에
따른 보고서 포탈
• 다양한 보고서 작성 자동화
• 현업 스스로 보고서 양식
생성
• 재무회계 정보의 관리/통제
강화
• 거래 내역 기반 마케팅
분석 기능 구현
• VAN 서비스를 넘어
‘Marketing Service
Provider’로 역량 강화
• SQL Server 2012
어플라이언드 도입
(Parallel Data
Warehouse + BI)
• 농업관측정보시스템
• SQL Server 적용함.
• Excel 통합성 및 Third-part
애플리케이션 호환성을
통해 개발 확장성이 높은
시스템 구축.
17
• 미국 농림 수산부
• 25TB 이상의 DW에 적용.
• SQL Server 2012
• 워싱턴대 생명공학연구소
• 20TB 연구용 DW에 적용
• SQL Server 2012
4. 경쟁제품 비교
구분
애플리케이
션
Biz.
Application
Microsoft BI
• SharePoint Server / Excel 2010
What-if Analysis 기반 계획수립 기능 및 Budget 제출. 승인 기능, Budget 결합 조
정 및 버전관리 기능을 제공
Oracle
• Oracle Hyperion Planning
Planning, Budgeting 등
• Oracle BI Applications
재무관리, 자산, 비용 및 인력 계획, 전략
재무 솔루션
SAP (BO)
• Financial apps
기획, 예산, 재무 보고서, 연결재
무재표, 성과금관리
• ALG
ABC 비용산출, 이윤 분석
• Cartesis
재무보고, 표준 및 규제화
• SQL Server Analysis Services / SharePoint Server (PerformancePoint Service)
비즈니스 룰을 적용한 KPI를 이용하는 성과관리 솔루션
성과관리
BI 포탈/검
색/협업
정형/비정
형 리포팅
• Oracle Scorecard and Strategy
Management
성과관리 솔루션
• Crystal Xcelcius (1)
Visualization 웹 대시보드 및 프
레젠테이션
• BI Interactive Dashboards
비즈니스 대시보드 솔루션
• Planning Modeler
비즈니스 데이터 시뮬레이션/모
델링
• SharePoint Server
보고서 관리 및 조직 내 정보 공유하고 검색 및 협업 포탈 제공
• Oracle WebCenter Suite
보고서 관리, 검색 기능 등
• Excel & Excel Services
다차원분석을 위한 Pivoting, Drill Down, Drill Across, Drill Through 및 데이터 마
이닝 기능 제공
• BI Answers
Ad-hoc 쿼리를 통한 비정형 리포팅 솔루
션
• PowerPivot for Excel/SharePoint
강력한 In-memory 사용자 분석 (Mash-up Data 분석)
• Oracle Times Ten
In-memory 사용자 분석
• Power View
사용자를 위한 손쉬운, 미려한 웹
비정형 리포팅
• BI Publisher
정형/비정형 웹 리포팅 솔루션
(구 BRIO)
-
• Crystal Reports (1)
엔터프라이즈 리포팅 솔루션
• Web Intelligence
웹 기반 정형/비정형 리포팅
• Desktop Intellgence
In-memory 사용자 분석
• SQL Server Reporting Services
다양한 관계 형 데이터 원본 및 다차원 데이터 원본에서 기업 보고서를 작성하기
위한 솔루션
분석
및
IBM
• Cognos Planning, TM1
실시간 재무 및 운영 계획 솔루션
오피스 연동
리포팅
• Excel & Excel Services
Native Excel 지원
• Office Plug-in
Office 연동 애플리케이션
• Business Insights, IBM Lotus
Connections
보고서, 기준 정보, 분석, 비즈니스 이벤트
검색, BI 포탈
• Business Insights Advanced, Query
Studio
Ad-hoc 쿼리를 통한 비정형 리포팅 솔루션
• IBM TM1
In-memory 사용자 분석
• Report Studio
현업 보고서이며 다양한 데이터 원본 지원.
단일 메타 레이어 지원과 다언어 보고서 지
원
• Office Connection
Office 연동 애플리케이션
• HANA
In-memory 기반 분석 엔진
In-Memory
분석 엔진
고급 분석/
데이터 마이
닝
• Business Insights
비즈니스 대쉬보드 솔루션
• Access 3rd party OLAP
오피스로 큐브 연동
• SQL Server Analysis Services
xVelocity in-memory 엔진을 이용한 빠른 분석 기능 제공.
OLAP
• Live Office
오피스를 통해 리포트 접근
• Metrics Studio
전략 수립 및 성과 모니터링 솔루션
-
• SQL Server Analysis Services
하나 이상의 물리적 데이터 원본을 기반으로 Cube를 만들면 최종 사용자는
Microsoft Excel 등의 다양한 클라이언트 도구로 데이터 분석
• SQL Server Analysis Services
Writeback 기반 시뮬레이션 분석 및 다양한 데이터 마이닝 알고리즘을 이용한 예
측 분석 가능
• Essbase, Oracle OLAP
OLAP 엔진
• Oracle Data Mining option
고급 분석을 위한 데이터 마이닝 모델 생
성 및 소비
18
-
• Universe
• Voyage
Ajax OLAP 클라이언트
• Analytic Engines
집합 분석, 예측 분석, 프로세스
분석
• PowerCubes, TM1, InfoSphwere
Warehouse Cubing Services
OLAP 엔진
• Analysis Studio
OLAP/DW에 대한 정보 분석 솔루션
• IBM SPSS
다양한 통계 및 고급 분석 기능 지원
Power BI
4. 경쟁제품 비교
구분
ETL
데이터
관리
DW
데이터 품
질/
MDM
데이터 웨
어하우스
Microsoft BI
Oracle
SAP (BO)
• SQL Server Integration Services
데이터 웨어하우징을 위한 ETL(추출, 변환 및 로드) 작업 및 고성능 데이터 적재,
워크 플로우 작성 기능 제공
• Oracle Data Integrator, Oracle
Warehouse Builder
데이터 웨어하우징을 위한 ETL Tool
• Data Integrator
• SQL Server Data Quality Services
ETL/MDM 등을 위한 데이터 정제, 매칭, 프로파일링, 모니터링을 제공하는 데이터
품질관리 서비스
• Oracle Data Profiling, Oracle Data
Quality for Data Integrator
데이터 정제, 프로파일링 등 제공
• Data Quality XI
• SQL Server Database Engine
대용량 데이터 웨어하우스에 최적화된 xVelocity 컬럼 기반 인덱스를 제공하는 고
성능 데이터베이스 엔진
• Oracle 11g R2
대용량 데이터 처리를 위한 데이터베이스
엔진 제공
• Sybase IQ
데이터 웨어하우스에 최적화된
데이터베이스 엔진
• SQL Server Fast Track DW
대량 집계/분석 업무에 최적화된 H/W 및 S/W 참조 아키텍처. 다양한 H/W 벤더
기반 가이드 제공
• Oracle Exadata
EDW를 위한 대용량 데이터 웨어하우스
Appliance
• SQL Server Master Data Services
기업 내 주요 마스터 데이터에 대한
통합 관리/구독 서비스
• SQL Server PDW
MPP 기반의 EDW를 위한 대용량 데이터 웨어하우스 Appliance
• Data Federator
• RapidMarts
• Data Inxight XI
정보의 품질에 대해서 모니터링,
분석 및 리포팅
IBM
• IBM Information Integration (Ascential),
Data Integration
ETL 및 병합, 정제, 차원 관리
• IBM Information Integration (Ascential)
데이터 정제, 프로파일링 등 제공
• IBM DB2
대용량 데이터 처리를 위한 데이터베이스
엔진 제공
• IBM iSAS
MPP 기반의 EDW를 위한 대용량 데이터
웨어하우스 Appliance
• Netezza
MPP 기반의 EDW를 위한 대용량 데이터
웨어하우스 Appliance
19
Power BI
5. 제품 정보 및 문의
20