PowerPoint 프레젠테이션

Download Report

Transcript PowerPoint 프레젠테이션

I am Computer
12장 데이터베이스
12.1 데이터베이스와 데이터베이스 관리자
12.2 데이터베이스 관리시스템
12.3 데이터베이스의 유형
12.4 데이터마이닝과 데이터웨어하우스
I am Computer
12장 데이터베이스
12.1 데이터베이스와 데이터베이스 관리자
- 데이터베이스
- 데이터베이스의 구성요소
- 데이터베이스 관리자
데이터베이스
사람들이 관심을 가지고 있는 데이터를 모아둔 것
 백화점의 고객자료의 데이터베이스, 학교에서 사용되는
학생자료 데이터베이스 등
공용의 개념을 기초에 두고, 여러 개의 응용프로그
램들이 쉽게 접근 가능하고 데이터의 중복을 최소
화 할 수 있도록 조직된 파일들의 집합
보통 줄여서, DB(database)라고 함
I am Computer
데이터베이스
데이터베이스와 DBMS
DBMS(Database Management System)
응용프로그램1
응용프로그램2
응용프로그램n
데이터베이스관리시스템
(DBMS)
데이터베이스
데이터베이스와 데이터베이스 관리시스템
I am Computer
데이터베이스
데이터베이스의 예
I am Computer
데이터베이스
데이터베이스의 구성요소
개체
 데이터베이스가 표현하고자 하려는 유, 무형의 정보 객
체(object)
 하나 이상의 속성(attribute)으로 구성
관계
 속성관계(attribute relationship)
 한 개체 내에 속성들간의 관계
 개체관계(entity relationship)
 개체의 외부의 개체간 (inter-entity)의 관계
I am Computer
데이터베이스
데이터베이스 관리자
(DBA; database administrator)
 데이터베이스 시스템 전체
관리 및 운영에 책임을 지
는 사람 또는 단체
 역할







데이터베이스 구성요소 결정
스키마 정의
저장구조와 접근 방법 선정
보안 정책 수립
유효성검사
백업 및 회복 절차 수립
데이터베이스의 무결성 유지
I am Computer
 시스템 재구성
 데이터 사전의 유지 관리
 데이터의 표현과 시스템의
문서화 표준 설정
 사용자 요구 및 불만 해결
 시스템 감시 및 성능분석
 시스템 성능의 관측
 자원 이용도 조사
 병목현상 조사
 장비 성능 확인
 통계 분석
데이터베이스관리자
I am Computer
12장 데이터베이스
12.2 데이터베이스 관리시스템
목적, 특징 및 장단점
스키마
데이터베이스 언어
데이터베이스 관리시스템(DBMS)
데이터 관리의 초기 단계인 파일 시스템의 구조로
부터 시작
사용자의 업무가 복잡, 다양해져서 데이터베이스
관리시스템의 필요성 제기
1960년대에 최초로 계층형(hierarchical) 데이터베
이스 관리시스템이 개발
I am Computer
데이터베이스 관리시스템
데이터베이스 관리시스템의 목적
응용프로그램이 데이터에 종속되지 않는 데이터의
독립성(Data Independence)을 제공하는 것
좋은 데이터베이스의 조건





데이터의 독립성
데이터의 중복을 최소화
데이터의 공유
보안
데이터 무결성(Integrity) 의 유지
I am Computer
데이터베이스 관리시스템
데이터베이스 관리시스템의 장단점
장점







데이터의 중복 최소화
데이터의 공용
데이터의 일관성 유지
데이터의 무결성 유지
데이터 정확성
데이터 유효성 검사
데이터의 보안
I am Computer
데이터베이스 관리시스템
데이터베이스 관리시스템의 장단점
단점
 운영비의 과다 지출
 자료처리의 복잡성
 백업과 복구 기법의 어려움
I am Computer
데이터베이스 관리시스템
데이터베이스관리시스템의 구성요소
데이터 사전
 데이터베이스의 구조에 관한 정보
질의언어(query language)
 질의를 위한 쉬운 컴퓨터 언어
레포트 생성기(report generator)
 화면, 프린터를 통해 데이터베이스의 일부를 출력
보안(security)
시스템 복구(system recovery)
 데이터베이스가 손상되었을 때 대처 방안을 제시
I am Computer
데이터베이스 관리시스템
데이터베이스 시스템
데이터를 데이터베이스로 저장하고 관리해서 필요
한 정보를 생성하는 컴퓨터 중심의 시스템
데이터베이스 관리시스템(DBMS)은 데이터베이스
를 구성하는 주요 요소
I am Computer
데이터베이스 관리시스템
데이터베이스 시스템의 구성요소
I am Computer
데이터베이스 관리시스템
스키마(Schema)
데이터구조에 대한 제약조건에 대해 기술한 것
개체와 관계간의 제약조건 명세
고용정보
직원 정보
업무 정보
스키마의 예
I am Computer
데이터베이스 관리시스템
데이터베이스 언어(database language)
데이터 정의어(DDL : data definition language)
 스키마를 생성하는 언어
 데이터 정의어로 기술된 스키마는 데이터베이스의 논리
적 구조를 나타냄
데이터 조작어(DML : data manipulation language)
 사용자로 하여 주어진 데이터 모형에 근거하여 조직된
데이터를 접근하거나 조작하도록 지원하는 언어
I am Computer
데이터베이스 관리시스템
데이터베이스 언어(database language)
데이터 제어어(DCL : data control language)
 공용 데이터베이스를 위한 자료제어, 연산을 기술
질의어(query language) : 자료 검색어
 단말 사용자들이 이용하는 언어
 비절차어의 일종으로 자연어로 구성
 일반적으로 데이터 조작언어와 같은 의미로 사용
I am Computer
데이터베이스 관리시스템
데이터베이스 언어간 관계
데이터베이스 언어
I am Computer
데이터베이스 관리시스템
파일관리자와 디스크 관리자
파일 관리자
 디스크 관리자의 지원을 받아
디스크를 저장 파일 집단으로
간주
디스크 관리자
 물리적 입출력 연산을 책임지
는 운영 시스템의 일부 요소
사용자
DBMS
파일관리자
디스크관리자
데이터베이스
I am Computer
데이터베이스 관리시스템
I am Computer
12장 데이터베이스
12.3 데이터베이스의 유형
관계형 데이터베이스
계층형 데이터베이스
망형 데이터베이스
객체지향형 데이터베이스
관계형 데이터베이스
특징
 데이터 독립성을 보장하고 데이터의 중복 문제를 해결
하는 기법을 제공
 SQL과 같은 데이터 조작언어가 발달되었으며 확장 가능
I am Computer
관계형 데이터베이스
관계형 데이터베이스
구성요소
 관계(relations)
 테이블과 같은 의미
 속성(attribute)
 필드와 같은 의미
 테이블의 열(column)을 나타내며 자료의 이름을 가진 최소 논리
적 단위
 튜플(tuple)
 테이블의 행(row)을 가르키며 개념 정보의 단위이고 레코드
(record)에 해당
 도메인(domain)
 속성에서 나타낼 수 있는 값의 집합체
I am Computer
관계형 데이터베이스
관계형 데이터베이스의 예
I am Computer
관계형 데이터베이스
관계 연산자(데이터의 조작)
관계 연산자를 사용하여 관계의 정의를 내리고 시
스템은 새로운 관계를 만듦
관계연산자
 관계 대수(relation algebra)
 주어진 관계들로부터 필요한 관계를 만드는 연산자
 순수 관계 연산자(특수 관계 연산자)
 프로젝션(projection), 선택(selection), 조인(join) 등
 일반 집합 연산자
 합집합(union), 교집합(intersection), 차집합(difference)등
I am Computer
관계형 데이터베이스
질의 언어(Query Language)
사용자가 데이터베이스로부터 정보를 요청할 때
사용하는 언어
SQL(Structured Query Language)
 동일한 언어가 두 개의 상이한 인터페이스로 이용될 수
있는 대화형 인터페이스와 응용프로그램 인터페이스임
 대화형 질의 언어이며 데이터베이스 프로그래밍 언어
I am Computer
관계형 데이터베이스
질의 언어
기본구조
 SELECT 절 - 질의의 결과에 나타날 속성들 열거
 FROM 절 - 수행 중에 읽는 관계들의 리스트
 WHERE 절 - FROM 절에 나타난 관계들의 속성들을 포
함하는 술어로 구성
 예) 학생 테이블에서 성별이 여자인 학생의 이름과 학과
를 출력
select 이름, 학과
from 학생
where 성별=‘여자’
I am Computer
관계형 데이터베이스
질의 언어
QBE(Query By Example)
 질의어 및 질의어를 포함하는 데이터베이스 시스템을
지칭
Quel
 관계해석을 순수하게 구현하며 Range of, Retrieve, Where
의 세 형태의 절을 사용하여 표현
I am Computer
관계형 데이터베이스
관계형 데이터베이스 설계
설계방법
설계범위 정의 → 시범데이터 수집 표준안 및 절차
수립 → 사용자 뷰 및 요구사항 수집 → 데이터 사
전 구축 → 데이터량과 사용형태 조사 → 운영 요구
사항 조사
설계 표현
 데이터 정의어, 데이터 사전, E-R다이어그램
I am Computer
관계형 데이터베이스
스키마의 종류
개념적 설계(개념 스키마)
 논리적 설계시의 입력을 작성하고 그 결과는 정보 구조
를 표현한 E-R 다이어그램으로 표현
논리적 설계(논리 스키마, 외부 스키마)
 개념 스키마를 DBMS 기능에 맞게 설계
물리적 설계(물리 스키마, 내부 스키마)
 효율적이고 실현 가능한 물리적 데이터베이스 구조를
개발하는 과정
I am Computer
관계형 데이터베이스
스키마의 설계 순서
I am Computer
관계형 데이터베이스
E-R 모델
E-R(객체-관계 모델, entity-relationship model)모델
 정보 모델링
 정보객체 집합과 이들간의 관계 집합을 이용해서 현실
세계를 개념적으로 표현하는 방법
저장 장치를 고려한 데이터 구조가 아니라 단지 현
실 세계를 사람이 이해할 수 있게 표현한 개념적 구
조
I am Computer
관계형 데이터베이스
E-R 모델의 예
예) 회사 데이터베이스를 설계
I am Computer
관계형 데이터베이스
논리적 설계
직원 정보 논리적 설계
필드
사원번호
성명
주민번호
주소
전화번호
생년월일
자료형
문자
문자
문자
문자
문자
날짜
크기
8
20
13
40
12
I am Computer
직원정보
레코드
관계형 데이터베이스
제약 조건(데이터 무결성)
키 제약 조건
 기본키(primary key)와 외래키(foreign key)와 관련된 제
약 조건
개체 무결성 규칙(entity integrity)
 한 관계의 기본키를 구성하는 속성의 어떤 값도 null값
일 수 없음
I am Computer
관계형 데이터베이스
객체지향 데이터베이스(OODBMS)
객체지향의 개념
 실세계에 존재하는 개념적 엔터티를 중심으로 모델링하
는 방식
객체지향 데이터베이스
 기존의 객체를 사용함으로써 빠른 개발속도를 얻을 수
있으며 이미 증명된 클래스를 재사용하기 때문에 시스
템의 품질이 향상됨
유연성(flexibility)과 관리 용이성(maintainability)이
있고 사실적인 모델링 및 멀티미디어 데이터 관리
능력이 있음
I am Computer
객체지향 데이터베이스
객체지향 데이터베이스의 장단점
장점
 데이터 모델링의 다양성과 재사용성(reusability), 확장성
(extensibility), 개념적 일치성 제공
 질의, 복합 객체, 버전 관리, 스키마 변환, 멀티미디어 자
료 관리 기능, 긴 트랜잭션 처리 등의 기능을 지원
단점




구현 시스템마다 개념적 차이가 존재할 가능성
통합 운영상 장애 가능성
질의 최적화가 곤란
안전성과 신뢰성 부족
I am Computer
객체지향 데이터베이스
객체지향 데이터 모델
객체(entity)
 객체의 상태를 나타내는 속성(attribute)과 속성 객체를
조작하는 연산 집합인 메소드(method)로 구성
메시지(message)
 객체간의 통신 매체
클래스(class)
 유사한 객체들의 구조와 행동을 기술하는 도구
다중성(polymorphism)
 상위 클래스의 메소드 정의가 하위 클래스에 부적절시
하위 클래스의 메소드를 재정의 가능
I am Computer
객체지향 데이터베이스
계층형 데이터베이스와 객체지향형 데
이터베이스 비교
I am Computer
객체지향 데이터베이스
계층구조 데이터베이스
서로 연관된 필드나 레코드들이 트리와 같은 모습
으로 표현
장점
 쉽게 데이터 모델을 이해 가능
 다른 데이터 모델보다 쉽게 구현 가능
 미리 정의된 관계이기 때문에 접근과 갱신이 빠름
단점
 데이터의 구성이 부자연스럽게 될 수 있음
 삽입과 삭제 같은 연산시 전체 데이터베이스를 재정의
해야함
I am Computer
계층구조 데이터베이스
계층구조 데이터베이스의 예
 예약시스템
I am Computer
계층구조 데이터베이스
망구조 데이터베이스
계층구조 데이터베이스와 비슷하며 자식 레코드들
이 부모 레코드들과 N:N 관계를 가짐
I am Computer
망구조 데이터베이스
망구조 데이터베이스의 예
I am Computer
망구조 데이터베이스
발전된 데이터베이스 형태
멀티미디어 데이터베이스
 숫자, 텍스트, 그래픽, 오디오, 비디오를 포함한 여러 가
지 미디어들의 정보를 저장
 정보를 표현할 때 적절한 디스플레이 장치를 사용
 문서와 기록관리
 지식보급
 교육과 훈련
 마케팅, 광고, 소매, 운반
 실시간 제어와 모니터링
I am Computer
발전된 데이터베이스
발전된 데이터베이스 형태
웹 데이터베이스
 웹은 대규모 멀티미디어 정보시스템으로서 많은 우수성
을 가짐
 대량의 자료를 가진 데이터베이스 서비스를 개발하는데
는 많은 문제가 있음
 대규모 서비스 시스템을 구축할 경우, 웹과 데이터베이
스의 결합은 거의 필수적임
I am Computer
발전된 데이터베이스
발전된 데이터베이스 형태(3)
공간 데이터베이스
 데이터베이스에 공간 관리개념을 추가한 형태의 데이터
베이스
활용분야
 지도제작, 지리정보시스템(GIS), 지적도 및 토지대장관
리, 가스관과 통신선로 시설물 관리
 도로망과 교통정보관리, 소방관리등 정보제공
 농업, 수산업 등의 자원관리
 환경오염 방지를 위한 데이터 제공
I am Computer
발전된 데이터베이스
I am Computer
12장 데이터베이스
12.4 데이터 마이닝과 데이터웨어하우스
- 데이터 마이닝
- 데이터웨어하우스
데이터 마이닝(Data Mining)이란?
방대한 양의 데이터 속에서 쉽게 드러나지 않는 유
용한 정보를 찾아내는 과정
데이터간의 숨겨진 관계, 혹은 겉으로 드러나지 않
거나 또는 기존의 통계학적 방법을 통해 뽑아내기
에는 너무나 복잡한 관계를 찾아내고, 이 관계를 바
탕으로 앞날을 예측하는 기술
I am Computer
데이터마이닝
데이터 마이닝 실행 절차
I am Computer
데이터마이닝
데이터 마이닝의 결과
연합
 한 사건이 다른 사건과 상호 관련이 있을 수 있을 때
연속
 한 사건이 뒤의 다른 사건을 유발하는 것
분류
 패턴을 인식하고 새롭게 분류된 데이터를 창출
집단화
 알려지지 않았던 사실 집단을 발견하고 가시화
예측
 데이터 내에서 단순히 발견되는 패턴을 통해 미래에 관
한 예측 가능
I am Computer
데이터마이닝
데이터웨어하우스
주제지향성 (subject oriented), 통합성 (integrated),
비휘발성, 시계열성 (time variant)이란 성격을 지닌
데이터의 집합체
데이터웨어하우징의 목적
 물리적으로 여러 곳에 분산되어 있는 데이터베이스 내
에 존재하는 데이터들에 대하여 하나의 논리적인 뷰
(view)를 창출
I am Computer
데이터웨어하우스
데이터웨어하우스의 특징
주제지향성 (subject oriented)
 데이터웨어하우스내의 데이터는 일정한 주제별 구성을
필요로 함
통합성 (integrated)
 데이터웨어하우스내의 데이터는 고도로 통합되어야만
함
비휘발성 (non-volatile)
 데이터웨어하우스에 일단 데이터가 적재되면 읽기 전용
으로 존재
시계열성 (time variant)
 데이터웨어하우스의 데이터에는 수시적인 갱신이나 변
경이 발생할 수 없음
I am Computer
데이터웨어하우스
데이터웨어하우스 구조
I am Computer
데이터웨어하우스
데이터웨어하우스 구조
메타 데이터 (meta data)
 데이터를 요약하는데 사용되는 알고리즘을 포함
현재의 상세 데이터 (current detail data)
 대개 디스크에 저장되며 가장 최근의 변경사항을 반영
기존의 상세 데이터 (older detail data)
 가끔씩 필요에 의해 액세스되는 데이터로서 테이프와
같은 저장장치에 수록
약간 요약된 데이터 (lightly summarized)
 현재의 상세 데이터를 약간 요약한 데이터
고도로 요약된 데이터 (highly summarized)
 매우 간결하게 요약되어 쉽게 액세스가 가능
I am Computer
데이터웨어하우스