Transcript 통합!!!!.

CHAPTER 6 Review
Questions
1조
성빈이와 연
장자들
Foundations of Business Intelligence :
Database and Information Management
1. 전통적 파일환경에서 데이터 자원관리
의 문제점은 무엇이며 데이터베이스
시스템에 의해 어떻게 해결되는가?
파일 구성 관련 개념
•Bit - 컴퓨터가 다룰 수 있는 데이터의 가장 작은 단위
•Byte - Bit의 그룹. 하나의 문자 문자, 글씨, 숫자를 표현
•Field - byte의 그룹. 단어들의 조합, 복잡한 숫자 표현 (이름, 나이)
•Record - field의 그룹. 서로 연관된 자료 항목들의 집합으로 구성됨
기본 원소가 되는 자료저장이나 표현의 기본 단위
학생들의 이름, 수강하는 강좌, 날짜, 학년 등
•Files - record의 그룹. 어떤 프로그램에 의하여 사용되는 데이터의 집합 또는
사용자에 의하여 작성된 문서 등, 일정한 규칙에 의해 기록된 관련 있는
정보의 완전한 집합체로서 고유의 이름이 할당되어있음.
•Databases – file들의 그룹 . 자료 기지 또는 자료 틀/ 동시에 복수의 적용 업무를
지원할 수 있도록 복수 이용자의 요구에 호응해서 데이터를 받아들이고
저장, 공급하기 위해 일정한 구조에 따라서 편성된 데이터의 집합
•Entity (실체) – 개별적으로 인식될 수 있는 것으로 데이터베이스에 저장되는
데이터의 대상이 되는 것. 하나의 실체는 많은 속성을 지님.
•Attribute(속성) – 데이터의 가장 작은 논리적 단위
실체에서 묘사되어진 각각의 특성과 특질
ex) 학생 ID, 학년 등은 course 독립체의 속성
데이터 계층
Database
File
Record
COURSE
File
FINANCIAL
File
PERSONAL
File
Student_ID
39044
59432
64029
COURSE
Course Date Grade
IS101 F08
B+
IS101 F08
A
IS101 F08
C
Student_ID
39044
Course Date Grade
IS101 F08
B+
Field
IS 101 (Course Field)
Byte
0100 1001 (Letter 1 in ASCII)
Bit
0
전통적 파일 프로세싱
회계와
재무
user
s
Application
Program 1
A
B
C
D
A
B
C
D
인적자원
user
s
Application
Program 2
판매와
마케팅
user
s
Application
Program 3
A
B
C
D
제조
user
s
Application
Program 4
A
B
C
D
전통적 조직에서는 시스템은 회사 전체 포괄하는 계획 없이 부분적 성장하는 경향
데이터 중복 및 불일치
데이터 중복
- 데이터가 하나 이상의 장소나 위치에 저장되어 여러 데이터 파일이 중복
적으로 나타나는 것을 의미
- 데이터 중복은 기업 안의 여러 조직들이 독립적으로 데이터를 수집하고
저장하기 때문에 발생
- 데이터 중복 저장은 저장 자원 낭비와 같은 속성이 다른 값을 가지게
되는 데이터 불일치를 발생.
데이터 불일치
- 같은 속성의 값이 서로 다른 것
- 부분적으로 데이터가 업그레이드 되어서 문제 발생
Ex) ‘Student_ID’ or ‘ID’ , ‘extra large’ or ’EX’
 데이터 내용은 같지만 제목이 달라 다른 데이터로 저장됨
프로그램 간 데이터 의존성
- 파일에 저장된 데이터와 이 파일을 갱신하고 유지하는 데 필요한 특정
프로그램 간의 결합관계
- 프로그램과 데이터의 의존성은 파일들 안에 저장된 데이터와
프로그램의 연결을 의미
- 파일에서 저장된 데이터의 결합과 데이터의 변경을 특정 프로그램에 의존
- 전통적인 파일 환경에서는 소프트웨어의 프로그램의 어떤 변화던지
해당 프로그램에 의해 접근 된 데이터의 변화가 필요
- 하지만 변화를 구현하는 데는 수백만 달러가 들어감
Ex) 5자리 우편번호(ZIP code)  9자리 우편번호
 연동된 모든 프로그램이 9자리 우편번호로 변경되어야 함
수백만 달러의 비용이 소요됨
유연성 부족
- 전통적 파일 시스템은 정기적 보고서를 제공할 수 있지만,
특별한 보고서 요구에는 대응할 수 없음.
- 특별한 요청에 필요한 정보는 시스템 어디엔가 있을 수 있지만,
그것을 찾기 위해선 시간과 비용이 많이 듦
- 기존파일환경에서는 광범위한 프로그래밍의 분석 후
계획된 결과루틴을 전달할 수 있음
- 적시에 전달되지 못하고 잘못된 오류의 정보를 나타낼 수 있음
낮은 보안성
- 데이터 통제, 관리하는 메커니즘이 거의 없으므로 정보에 접근,
분배하는 것은 통제 밖
- 낮은 데이터 통제 및 관리 능력은 정보 엑세스 및 보급을 통제하기 어려움
- 누가 조직의 데이터에 엑세스 했는지, 변경 했는지 관리할 방법이 없음
데이터 공유 및 가용성 결여
- Availability (가용성) : 쓰고 싶을 때 쓸 수 있는 성질
- 다양한 파일이나 기업의 여러 부서에서의 정보들은 서로 연관이 없음
- 정보가 서로 다른 파일 및 부서에 위치해서 서로 연계되지 않아,
정보의 공유 및 엑세스 불가능
- 두 개의 다른 시스템에서 같은 정보에 대해 다른 값을 찾았을 때
시스템의 정확성은 신뢰 할 수 없게 됨
DBMS (데이터베이스 관리시스템)
- 조직이 데이터를 중앙집권화 하고, 효율적으로 관리하고, 응용프로그램에 의해
저장된 데이터에 접근 할 수 있게 허락해주는 소프트웨어
- 응용프로그램과 물리적인 데이터 파일간의 인터페이스의 역할
Ex) 응용프로그램이 총급여 데이터를 필요로 하면 DBMS는
데이터 베이스에서 찾아서 제공
- DBMS는 logical view와 physical view로 구분되어 데이터가 어디에 어떻게
실제로 저장되어 있는지, 프로그래머 또는 최종 사용자가 이해하는 것을 도와줌
Logical View
•
- 데이터를 최종 사용자, 전문기업들이 인지하여 발생하는 것
- 데이터를 최종사용자나 비즈니스전문가가 인지하는 방식으로 표현

Physical View
- 데이터가 실제 물리적 저장 매체에 어떻게 조직화되고, 구조화 되는지 보여주는 것
- 데이터가 실제 물리적 저장매체에 어떻게 구조화되는지 보여줌.
DBMS가 전통적 파일 환경의 문제점을 해결하는 방식
- 같은 데이터가 반복되는 별개 파일의 최소화를 통해 데이터 중복,
불일치성 감소
- 중복데이터가 발생해도 DBMS가 모든 중복 데이터를 같은 값으로
만들기 때문에 데이터 불일치 제거 가능
- DBMS는 데이터가 제자리를 유지하면서도 프로그램과
분리될 수 있도록 만듦
- 사용자 및 프로그래머가 데이터베이스 있는 데이터에서 특별한 질의가
수행 가능하고, 이를 통해 정보에 대한 접근과 가용성은 높아지고 프로그램
개발 및 유지보수 비용은 줄어듬
- DBMS 이용해 중앙에서 데이터, 데이터 사용, 보안 관리 가능
- 전통적인 데이터 파일을 사용하면, 데이터의 형식이나 사이즈를
명시 한 뒤, 그 데이터들이 어디에 위치해있는지 알아내고 지정해야 하는데
DBMS는 이러한 불편한 절차를 줄여줌
데이터 관리 시스템(DBMS)
Employee ID
Name
SSN
Position
Data Hired
Gross Pay
Net Pay
Lite Insurance
Pension Benefit
Health care
Name
SSN
Health care
Database
Management
System
복지관점
Name
SSN
Gross Pay
Net Pay
급여관점
이러한 데이터들은 하나의 데이터베이스에 저장되고,
조직은 이 데이터들을 더 쉽게 관리할 수 있음
Foundations of Business Intelligence :
Database and Information Management
2. DBMS의 주요능력?,
관계 형 DBMS가 강력한가?
DBMS(데이터 베이스 관리 시스템)
• 데이터 베이스 관리시스템은 조직이 데이터를 집중화
시키고 ,데이터를 효율적으로 관리하고, 어플리케이션
프로그램을 통해 비축된 데이터에 접근하는 것을 제공
하는 소프트웨어이다.
DBMS(데이터 베이스 관리 시스템)의
주요 능력
• DATA DEFINITION
• DATA DICTIONARY
• Querying and Reporting
DATA DEFINITION(데이터 정의)
• 데이터베이스의 컨텐츠 구조를 명시
• 데이터베이스 테이블을 만들거나 각 테이블의 필드의
특징을 규정하는데 사용
DATA DICTIONARY(데이터 사전)
• 데이터요소와 그 특징을 정의하여 저장하는 자동화 혹
은 수동화 파일
• Ex)Microsoft Access(Figure6-6)
Querying and Reporting
Data manipulation language<데이터 조작 처리언어>
-대부분의 DBMS는 데이터 조작처리언어라 불리는 특별한 언어를 가짐
-데이터베이스에서 데이터를 추가,변화,삭제,검색하는데 사용
-최종사용자나 프로그래밍 능력자가 정보요구 만족과 어플리케이션을
개발할 수 있도록 데이터추출을 허용하는 명령어를 포함
-SQL이 현재 가장 중요한 데이터 조작 처리언어
SQL(구조화 질의어)
-DB2, Oracle, SQL server같은 대형 및 중급 컴퓨터를 위한 DBMS의 사용자는
database로부터 필요한 정보를 얻기 위해 SQL을 이용
-ACESS및 다른 DBMS는 보고서 생성능력을 갖춤
관심자료에 대해 쿼링에 의한것보다 더 구조화 되고 세련되게 보여주는것이
가능하기 때문
관계형 DBMS
-오늘날 정보시스템에서 데이터를 체계화하고 유지하기 위한 주요한
방법
-행과 열로 구성된 2차원의 테이블로 데이터를 체계화
-각각의 테이블은 독립체(ENTITY)와 속성(ATTRIBUTE)을 포함
공통의 데이터 요소를 공유하는 두 개의 테이블로부터 유저가
원하는 정보를
쉽게 결합하여 새로운 테이블을 만들어 보여주기 때문에
편리하고 강력하다.
Columns(열)
공급자 이름등은
이 테이블의 필드 ,해당필드의
속성을 나타냄
Row
행,실제적인 정보를
나타냄
Key Field
레코드 각각을 고유하
게 구분할 수 있는 필드
<속한 하나하나의 속성
을 primary key 라함>
Foreign Key
외부 키 검색 필드
Select 연산 –
파일에서 기술된 기준을
만족시키는 모든 Record
의 부분집합을 생성
Join 연산 –
사용자에게 개별 테이블이
제공 가능한 정보 이상의
정보를 제공하기 위해
관계형 테이블을 결합시킴
Project 연산 –
사용자가 필요한 정보로만
구성된 새로운 테이블을
만들 수 있도록 테이블에
서 원하는 열을 생성
Foundations of Business Intelligence :
Database and Information Management
3. 데이터베이스 설계의 중요한
원리는 무엇인가?
개념적
설계
데이터
베이스
설계
물리적
설계
 개념적 설계: 비즈니스 관점에서 데이터 베이스에 관한
추상적인 모델을 만드는 것
 물리적 설계: 직접 접근되는 저장장치에서 데이터베이스가
실제로 어떻게 배열되는지 보여줌
정규화(normalization)
• 데이터베이스 모델을 효과적으로 사용하려면 데이터의 복잡한 그룹
에서 중복 데이터 요소와 다루기 불편한 다대다 관계성을 최소화 시
켜야 한다. 복잡한 그룹에서 작고, 안정적이며, 유연하고 적응력 있
는 데이터 구조를 생성하는 프로세스를 의미한다.
개체관계성(entity-relationship diagram)
• 올바른 데이터 모델을 확보하지 못하면 시스템은 회사를 잘 지원하지 못할 것이
다.그것은 시스템이 부정확하거나 불안전하면 어려운 데이터로 작업해야 하기
때문이다. 그러기 때문에 충실하고 올바른 데이터 설계가 필요하다.
- 그림 6-11참고
6-11 개체관계성도
제공
공급자
주문
라인_
아이템
부품
공급
포함
포함
주문
포함
• 그림을 보면 주문, 라인_아이템, 부품, 공급자 개체 간의 관계성을
설명하며 박스는 개체를 나타낸다. 하나의 주문이 여러 개의 라인_
아이템을 포함 할 수 있음을 보여준다. 각 부품은 오직 한 개의 공급자만
있으나 이와 동일한 공급자는 여러 가지의 부품을 공급할 수 있다.
Foundations of Business Intelligence :
Database and Information Management
Operational
data
Customer
data
Manufacturing
data
Historical
data
External
data
Extract
And
Transform
Data
Ware
house
Information
Directory
Data
Access and
Analysis
Foundations of Business Intelligence :
Database and Information Management
5. 왜 정보정책, 데이터 관리와 데이터
품질보증은 기업의 데이터
자원 관리에서 필수적인가?
정보정책의 작용
정보를 공유, 전파, 획득, 표준화, 분류, 저장하는 조직의 룰을
어느 사용자와 조직적 부서가 정보를 공유할 수 있는지를 확인하기
위한 명확한 절차와 책임을
어디에서 정보가 유통되는지를
누가 정보를 업데이트 하고 유지하는지를
데이터 관리의 작용
명확한 정책과 절차를 통한 어느 데이터가 조직적 자원으로써
관리 될 수 있는지에 대한 책임
정보 정책을 개발. 데이터를 계획.
논리적 데이터 베이스의 설계, 데이터 사전을 개발을 감독
시스템 전문가와 최종사용자가 데이터를 사용하는 상황 감독.
규
정
데이터 품질 보증
데이터 품질 감사의 중요성
의
미-- 정보 시스템에서 데이터의 정확성과 완전성을 구조적 감사.
중요성-- 전체의 데이터 파일과 샘플 데이터 파일 감사
최종 사용자의 데이터 품질에 대해 인식을 감사
데이터 정리의 중요성
정
의-- 데이터 베이스에서 부정확 불완전 부적절한 포맷 혹은 중복된 데
이터를 식별하고 수정한다.
중요성-- 각각 분리된 정보시스템에서 생성된 데이터간의 일치성을 강화.
자동으 로 데이터 파일을 조사. 오류 데이터를 정정. 데이터를 기업전
반의 일관성있는 포맷으로 통합
CHAPTER 6 Case Study
1조
성빈이와 연
장자들
What Can Business Learn From Text Mining?
1. 현재 사업에서 구조화 되지 않은
데이터의 증가가 어떠한 문제인가?
Unstructured Data 란?
•Unstructured Data는 미리 데이터 모델을 정의할 수 없다.
•관계형 테이블(Relational Table) 에 적합하지 않는
정보에 관해 언급한다.
•Unstructured Data는 일반적으로 문서로 나타나지만,
날짜, 수 같은 데이터를 포함 할 수 있다.
•Unstructured Data는 데이터베이스나 문서에 주석이
달린 형태에 저장된 데이터와 비교했을 때 전통적인
컴퓨터 프로그램을 사용하여 이해하는 것을 어렵게 하고,
이것은 불규칙성과 모호성의 결과를 초래한다.
• 2007년 2월 폭풍우로 인해 케네디 공항에서 많은 항공편 취소됨
- 전례가 없던 수준의 고객 불만을 경험.
- 폭풍우 동안 하루에 15000개의 E-mail을 받음.
• 양이 평소보다 많았기 때문에 JetBlue 항공사는 ‘고객의 소리’가 담긴
JetBlue
항공의
다른
고객
분석
도구와
함께
E-mail을 전부 읽을 방법 찾지 못함.
Attensity의 소프트웨어 통합
→ 분석 결과, JetBlue 항공은 고객이 회사와 함께했던
주요 현안을 다루는 고객 권리 선언을 개발
• JetBlue 항공사는 텍스트 분석 선두 업체인 Attensity와 계약 맺음
- 이틀 안에 받은 E-mail을 모두 분석할 수 있게 됨.
• 고객의 감정, 선호도, 요청 같이 고객의 소리를 통해서만 얻을 수 있는
정보를 빠르게 추출하는 것이 가능해 짐.
• 고객의 의견을 통해서 특정 제품과 서비스 문제, 마케팅에 대한 반응도
알 수 있음.
Unstructured Data의 증가 이유
경영자들은 Unstructured Data가 몇 년 전보다 더 규정하기 어려워진
고객 행동과 태도에 대한 특별한 통찰력을 제공할 수 있다고 믿음.
Unstructured Data의 증가
Unstructured Data의 증가가 어떤 문제인가?
Unstructured Data의 증가
해결책 : 텍스트 마이닝
데이터가 정형화 되어 있지 않음
데이터 분석에 많은
비용과 시간이 필요
Unstructured Data의 증가로 텍스트 마이닝 시스템의 필요성 생김
→ 텍스트 마이닝을 하기 위한 비용 증가
What Can Business Learn From Text Mining?
2. 어떻게 텍스트 마이닝에 의해서
의사 결정이 향상되는가?
텍스트 마이닝
호텔 이용 고객들의 만족도
조사를 통하여 정보 수집
텍스트 마이닝
고객에 대한 빠른 피드백을 할 수 있는
의사결정시간을 갖게 함.
텍스트 마이닝에 의해서 의사결정이 향상되는가?
문서군집
정보추출
자동문서 요약
What Can Business Learn From Text Mining?
3. 어떤 종류의 기업이 텍스트 마이닝 소프트웨어로
부터 혜택을 받을 가능성이 가장 높은가? 설명하라.
텍스트 마이닝은 구조화 되지 않은 데이터에서 패턴과 관계를 발견
중요한 정보를 추출하고 요약한다.
이메일, 블로그 포스팅, 콜센터 기록,온라인 고객 설문,소셜 네트워크서비스
등에서 텍스트 마이닝을 통해 유용한 정보를 생산
텍스트 마이닝은 폭넓은 고객에 대한 이해를 가능케 해주고
기업이 올바른 의사결정을 내릴 수 있도록 도와준다.
즉 CRM(고객관계관리)를 중시하는 다양한 분야(전자업체등의 제조업체
다양한 서비스업체등등)기업에 유용하다.
케이스 내 사례
젯블루 항공사는 Attensity에서 공급하는 텍스트마이닝 소프트웨어를 사용
Gaylord는 클라라브릿지 텍스트 분석 솔루션을 사용
기타 사례
HP는 콜센터,온라인포럼등에서 텍스트마이닝 기법을 이용
고객관계관리 서비스를 개선
이렇듯 텍스트마이닝 소프트웨어를 활용하여 고객에 대한 폭넓은 이해를
통해 피드백을 구함으로써 기업은 올바른 방향으로 마케팅을 펼칠 수있고
서비스나 제품을 개선함으로써 고객을 유지할 수 있다.
우리조 의견 및 결론
텍스트 마이닝 소프트웨어는 PC,핸드폰 등의 전자제품이나 자동차등을
생산하는 제조업체에게도 마케팅이나 애프터 서비스등에 있어
유용하게 사용될 것같다.
하지만
항공사,호텔,레스토랑등의 서비스분야의 기업에 더욱 유용하게
사용될 듯 싶다. 고객이 서비스에 갖는 만족이나 불만 상황등은 개개인의
특성에 따라 매우 다양하고 비정형화된 모습으로 드러난다는 점 때문이라고
생각!
EX>케이스 내에서 GAYLORD호텔은 고객이 다른 방이 시끄러운것 보다는
다른 서비스에 대해 더 많은 클레임을 걸지만 옆방이 시끄러운것이
호텔을 다시 찾는데 가장 자주 영향을 끼친다는 것을 알아낸다.
EX>핸드폰등의 제품은 약간의 불 만족시는 보통 그대로 사용(인지부조화)
큰 문제일 경우 A/S나 리콜등의 조치와 다른 제품제공등의 방법을 사용가능
그러나 서비스는 지속적으로 고객의 작은 불만사항도 캐치하여
서비스를 개선하지 못하면 쉽게 경쟁사에 고객층을 빼앗길 수 있음
이때문에 텍스트 마이닝 소프트웨어가 서비스업체에 더욱 유용할 것
What Can Business Learn From Text Mining?
4. 어떤 방법으로 텍스트 마이닝이 잠재적으로
개인 정보 프라이버시의 침해를 초래할 수 있을까?
설명해보아라.
웹 마이닝은 텍스트 마이닝 기법을 활용하는 수많은 분야중 하나.
웹 컨텐츠 마이닝에 가장 많이 사용된다.
웹 컨텐츠 마이닝은 웹 페이지의 텍스트, 이미지, 오디오,
비디오 데이터를 포함하는 컨텐츠로부터 지식을 추출하는 과정을 뜻한다.
그 중 많은 것을 차지하는 부분이 바로 텍스트!
개인은 텍스트를 이용해 많은 정보를 생산한다.(블로그 ,웹포럼등)
예로 소셜 네트워크 서비스가 대표적
개인은 소셜 네트워크 서비스를 통해 자신의 개인정보를 누출할 수있으며
기업은 텍스트마이닝 소프트웨어는 물론 텍스트마이닝기법이 활용된 검색
엔진(EX포털)를 통해 소셜네트워크에서 필요한 개인정보를
추출해낼 수 있다.
EX>
구매정보나 자주 이용한 서비스 업체등을 게시- 악용의 가능성
기업에 대한 부정적인 글을 게시 – 입사 지원이나 서비스등에서 불리
실직이나 빚에 대한 글을 게시- 은행대출등에서 불리
실제 미국에서 SNS를 활용한 개인신상정보 수집이 보편화
뉴욕의 컨설팅업체인 윈터버리그룹은 미국 기업들이 2012년
온라인 데이터 수집을 위해서만 8억4000만 달러를 쓸 것이라고 예상했다.
마이크로소프의 최근 조사에 따르면 미국내 고용주의 75%가 SNS 관련
사이트에서 입사지원자의 성향이나 능력을 ‘뒷조사’하고, 70%는 실제로
사이트에서 확인된 내용을 근거로 채용을 거부하거나
진급을 누락시키는 것으로 나타났다.
Credit Bureau Errors – Big People Problems
1. CB의 데이터 품질 문제의
CB, lender, 개인에 대한 사업적 영향을
접근해보자.
CB (credit bureau)
금융거래를 하는 모든 개인의 신용정보를 집중·관리 하고 이를
가공해 최종적으로 점수화한 뒤 각 회원(금융회사)에 제공하는
기구이면서 개인고객의 모든 신용정보를 집중시켜 취합된 정
보를 관리하고 가공해 다시 나눠주는 시스템.
CB
(credit
bureau)
데이터 품질 문제의 CB, lender, 개인에 대한
사업적 영향
CB
대출기관
개인
• 정보를 신용평가 하기 위해 수집한 개
인 정보를 사용하는 기업에게 판매하
는데 불완전한 데이터를 제공할 수 있
다. (개인정보 오류로 인한 문제 발생)
• 불안전한 데이터의 발생은 불완전한
일치로 인해 고객에게 부정확한 정보
를 제공 할 수 있다.
• 개인에게 맞지 않는 데이터가 잘못된
계좌로 갈 수 있고 (개인 신용 정보 오
류발생) 대출 등 금융업무에 피해를
입게 된다.
Credit Bureau Errors – Big People Problems
2. CB의 데이터 품질 문제로 인해 발생되
는 윤리적 이슈는 무엇인가?
당신의 답변을 설명하라.
개인정보 유출
사생활 침해
CB는 개인정보를 수집해서
가공한 다음 각 금융회사에
전달한다. 이 과정에서 개인
정보가 유출되면 심각한
사회문제와 고객과의 신뢰에
금이 갈 수 있다. 개인정보가
유출되면서 고객의 사생활
또한 침해 받게 된다.
Credit Bureau Errors – Big People Problems
칼럼 (속성, 필드)
공급자
번호
공급자 이름
공급자 거리
공급자
도시
공급자
상태
공급자
주소
8259
CBM Inc.
74 5th Avenue
Dayton
OH
45220
8261
B. R.
Molds
12 Mill Drive
Cleveland
KY
49345
로우
(레코드
Tuples)
키 필드
(주요 키)
이러한 과정처럼 고객들의 명단을 찾아야 하는데 회사 직원의 실수로
부품 번호
부품 명
단가
공급자 번호
문서를 잘못 일거나 실수로 번호를 잘못 바뀌게 하면 문제를 발생할 수 있다.
137
Door latch
22.00
8259
Door 돈은
lock 3.5Billion의
31.00 큰 돈을 8261
신용당국에서150
매달 처리하는
처리하는데 각각의
고객들을 상대하는데 큰 문제가 발생할 수 있다.
주요 키
외부 키
→데이터 관리가 기술적으로 정확하게 정리할 필요가 대두됨.
Credit Bureau Errors – Big People Problems
Lego : Embracing Change by Combining BI with a Flexible
Information System
1. SAP’s three-tier 시스템 중에서 데이터
베이스의 역할을 좀 설명하라.
SERVER,USER,DATABASE
SAP
세계1위의 ERP 벤더
Server + User + Database
서버 + 이용자 + 데이터 베이스
SAP’s tree-tier 시스템
1. 표현층 (Presentation Layer)
2. 응용층 (Application Layer)
3. 데이터 베이스 층 (Database Layer)
SERVER,USER,DATABASE
데이터 베이스의 역할
• 다른 공급업체들에게 SAP의 비즈니스 스위트 지원 데이터 베이스를 제공 받음
예: Oracle, Microsoft, MySQL
• 관련된 데이터 베이스가 LEGO의 상품, 매일 작업, 공급체인, 천명 직원들의
정보를 포함한다.
• 관리자들은 쿼리 도구로 데이터 베이스에서 간편하게 보고서를 획득할 수 있다.
• 그리고 허가한 직원들이 어디서도 직접적으로 데이터 베이스를 사용할 수 있다.
Lego : Embracing Change by Combining BI with a Flexible
Information System
2. 왜 분산 구조가 유연성이 있는가?
설명하라.
분산 데이터 베이스
권위 있는 개인이
여러 지역으로 분산된
데이터베이스에 직접 접근하는 것을
가능케 한다.
기타
지역
아시아
네트
워크
북아메
리카
유럽
사용자는 데이터가
실제 어디에서 저장 되있는지
의식할 필요가 없다.
분산되어 저장된 데이터베이스는
장애에 강하다.
낮은 비용으로 대규모 이용자가
데이터 공유 가능하고 데이터 처리가 빠르며
규모를 적절히 조절가능
Lego : Embracing Change by Combining BI with a Flexible
Information System
3. Sap의 비즈니스 소프트웨어에 포함된
BI 기능의 일부를 알아보아라
Business Intelligence(BI)
●
의사결정에유용한 새로운 현상, 관계, 통찰에 대한 데이터를 분석, 통합, 접근 할 수 있도록 도움
<신속하고 정확한 의사결정을 위해 사용되는 Data의 접근, 수집, 보관 등의 애플리케이션과 기술의 집합>
생산자로부터 물건과 정보가 도매업자, 소매상인, 소비자에게 이동하는 전 과정을 실시간으로 볼 수 있다.
이를 통해 제조업체는 고객이 원하는 제품을 적기에 공급하고 재고관리 비용을 줄일 수 있다.
<공급사슬관리> 또는 <유통 총 공급망 관리>로 불림
제품 설계도부터 최종 제품 생산에 이르는 전체과정을 일관적으로 관리해
제품의 부가가치를 높이고 원가를 줄이는 생산프로세스다.
개발과정과 시스템이 최적화 되어있음
Lego : Embracing Change by Combining BI with a Flexible
Information System
4. 분산구조에서 다중 데이터베이스들이
갖는 주요 장점과 단점은 무엇인가?
설명하라.
Distributed
computing
distributed
architecture
분산 컴퓨팅 환경 [ distributed computing environment]
복수의 컴퓨터 간 애플리케이션을 분산 처리하기 위한 환경
분산 컴퓨팅 환경을 실현한 네트워크 환경에서 프로그램이나 데이터가 어디 있는
지 신경 쓸 필요 없이, 네트워크 전체가 마치 1대의 컴퓨터인 것처럼 동작하게 하
는 것이 분산 컴퓨팅 환경이 추구하는 이상이다.
분산 컴퓨팅 환경을 실현하기 위해선 복수의 컴퓨터상의 프로그램 간 통신을 위한
원격 절차 호출(RPC), 분산 파일 시스템, 디렉터리 서비스, 인증 서비스가 필요
또 특별히 DCE(Distributed Computing Environment)는
유닉스의 개발·보급을 위한 업계 단체인 개방 소프트웨어 재단(OSF)이 개발한 분
산 컴퓨팅 환경 실현을 위한 일련의 소프트웨어를 의미하며
이것을 OSF 분산 컴퓨팅 환경(OSF/DCE)이라고도 한다.
분산구조의 종류
1. Partitioned database [분할 데이터베이스]
2. Duplicate database [중복 데이터베이스]
분산구조
장점
1. 분산구조(distributed architecture)가 유럽, 북아메리카 그리고 아시
아를 포함한 기업의 다양한 장소로부터
데이터베이스 시스템에 직접 접근하는 것을 가능하게 함
2. 하나의 거대한 중앙시스템 취약성 감소, 지역 사용자에 대한 서비스와
응답성 향상, 더 작고 저렴한 컴퓨터에서 가동될 수 있음
분산구조
단점
1. 지역 데이터베이스는 중앙의 데이터 표준 및 정의의 영향권에서
벗어날 수 있음
2. 중요한 데이터는 폭 넓게 분산되어 접근시 보안문제 발생
3. 소프트웨어 개발비용 증대, 설계/관리의 복잡성, 통제의 어려움
1. Partitioned database [분할 데이터베이스]
DB의 일부는 어떤 한 장소에서 물리적으로 유지되고
다른 부분은 이와는 다른 장소에서 유지됨
원거리에 있는 프로세스가 그 지역에 제공해야 할
데이터를 다룰 수 있도록 하기 위함
파일의 변화는 시스템을 사용하지 않을 때 배치 방식을 기반으로
중앙 데이터베이스에 반영
2. Duplicate database [중복 데이터베이스]
중앙 데이터베이스를 원거리 장소에 복사해놓는다.
(즉 완전히 duplicate)
ex) 중앙 메인프레임 데이터베이스를 비행 배차 담당자에게 더 많은 정보
즉각적으로 제공할 수 있는replicated database로 대체
지역 데이터베이스 가동하지 않는 시간 동안
중앙 데이터베이스가 업데이트 되어야 함
1. Partitioned database [분할 데이터베이스]
장점
1. 오류로 인한 데이터 삭제시
DB의 일부분만 제거
단점
1.한 시스템에서는 부분적인 DB만
사용가능
2. 각 시스템 연결 비용 들어감
2. Duplicate database [중복 데이터베이스]
장점
1. 한쪽의 시스템이 고장나도
백업이 가능
2. 쉽게 전체 정보제공 가능
단점
1. 똑같은 내용의 DB를 다른 장소
에 저장해두려면 비용 증가