PowerPoint 프레젠테이션
Download
Report
Transcript PowerPoint 프레젠테이션
I am Computer
12장 데이터베이스
12.1 데이터베이스와 데이터베이스 관리자
12.2 데이터베이스 관리시스템
12.3 데이터베이스의 유형
12.4 데이터마이닝과 데이터웨어하우스
I am Computer
12장 데이터베이스
12.1 데이터베이스와 데이터베이스 관리자
- 데이터베이스
- 데이터베이스의 구성요소
- 데이터베이스 관리자
데이터베이스
사람들이 관심을 가지고 있는 데이터를 모아둔 것
백화점의 고객자료의 데이터베이스, 학교에서 사용되는
학생자료 데이터베이스 등
공용의 개념을 기초에 두고, 여러 개의 응용프로그
램들이 쉽게 접근 가능하고 데이터의 중복을 최소
화 할 수 있도록 조직된 파일들의 집합
보통 줄여서, DB(database)라고 함
I am Computer
데이터베이스
데이터베이스와 DBMS
DBMS(Database Management System)
응용프로그램1
응용프로그램2
응용프로그램n
데이터베이스관리시스템
(DBMS)
데이터베이스
데이터베이스와 데이터베이스 관리시스템
I am Computer
데이터베이스
데이터베이스의 예
I am Computer
데이터베이스
데이터베이스의 구성요소
개체
데이터베이스가 표현하고자 하려는 유, 무형의 정보 객
체(object)
하나 이상의 속성(attribute)으로 구성
관계
속성관계(attribute relationship)
한 개체 내에 속성들간의 관계
개체관계(entity relationship)
개체의 외부의 개체간 (inter-entity)의 관계
I am Computer
데이터베이스
데이터베이스 관리자
(DBA; database administrator)
데이터베이스 시스템 전체
관리 및 운영에 책임을 지
는 사람 또는 단체
역할
데이터베이스 구성요소 결정
스키마 정의
저장구조와 접근 방법 선정
보안 정책 수립
유효성검사
백업 및 회복 절차 수립
데이터베이스의 무결성 유지
I am Computer
시스템 재구성
데이터 사전의 유지 관리
데이터의 표현과 시스템의
문서화 표준 설정
사용자 요구 및 불만 해결
시스템 감시 및 성능분석
시스템 성능의 관측
자원 이용도 조사
병목현상 조사
장비 성능 확인
통계 분석
데이터베이스관리자
I am Computer
12장 데이터베이스
12.2 데이터베이스 관리시스템
목적, 특징 및 장단점
스키마
데이터베이스 언어
데이터베이스 관리시스템(DBMS)
데이터 관리의 초기 단계인 파일 시스템의 구조로
부터 시작
사용자의 업무가 복잡, 다양해져서 데이터베이스
관리시스템의 필요성 제기
1960년대에 최초로 계층형(hierarchical) 데이터베
이스 관리시스템이 개발
I am Computer
데이터베이스 관리시스템
데이터베이스 관리시스템의 목적
응용프로그램이 데이터에 종속되지 않는 데이터의
독립성(Data Independence)을 제공하는 것
좋은 데이터베이스의 조건
데이터의 독립성
데이터의 중복을 최소화
데이터의 공유
보안
데이터 무결성(Integrity) 의 유지
I am Computer
데이터베이스 관리시스템
데이터베이스 관리시스템의 장단점
장점
데이터의 중복 최소화
데이터의 공용
데이터의 일관성 유지
데이터의 무결성 유지
데이터 정확성
데이터 유효성 검사
데이터의 보안
I am Computer
데이터베이스 관리시스템
데이터베이스 관리시스템의 장단점
단점
운영비의 과다 지출
자료처리의 복잡성
백업과 복구 기법의 어려움
I am Computer
데이터베이스 관리시스템
데이터베이스관리시스템의 구성요소
데이터 사전
데이터베이스의 구조에 관한 정보
질의언어(query language)
질의를 위한 쉬운 컴퓨터 언어
레포트 생성기(report generator)
화면, 프린터를 통해 데이터베이스의 일부를 출력
보안(security)
시스템 복구(system recovery)
데이터베이스가 손상되었을 때 대처 방안을 제시
I am Computer
데이터베이스 관리시스템
데이터베이스 시스템
데이터를 데이터베이스로 저장하고 관리해서 필요
한 정보를 생성하는 컴퓨터 중심의 시스템
데이터베이스 관리시스템(DBMS)은 데이터베이스
를 구성하는 주요 요소
I am Computer
데이터베이스 관리시스템
데이터베이스 시스템의 구성요소
I am Computer
데이터베이스 관리시스템
스키마(Schema)
데이터구조에 대한 제약조건에 대해 기술한 것
개체와 관계간의 제약조건 명세
고용정보
직원 정보
업무 정보
스키마의 예
I am Computer
데이터베이스 관리시스템
데이터베이스 언어(database language)
데이터 정의어(DDL : data definition language)
스키마를 생성하는 언어
데이터 정의어로 기술된 스키마는 데이터베이스의 논리
적 구조를 나타냄
데이터 조작어(DML : data manipulation language)
사용자로 하여 주어진 데이터 모형에 근거하여 조직된
데이터를 접근하거나 조작하도록 지원하는 언어
I am Computer
데이터베이스 관리시스템
데이터베이스 언어(database language)
데이터 제어어(DCL : data control language)
공용 데이터베이스를 위한 자료제어, 연산을 기술
질의어(query language) : 자료 검색어
단말 사용자들이 이용하는 언어
비절차어의 일종으로 자연어로 구성
일반적으로 데이터 조작언어와 같은 의미로 사용
I am Computer
데이터베이스 관리시스템
데이터베이스 언어간 관계
데이터베이스 언어
I am Computer
데이터베이스 관리시스템
파일관리자와 디스크 관리자
파일 관리자
디스크 관리자의 지원을 받아
디스크를 저장 파일 집단으로
간주
디스크 관리자
물리적 입출력 연산을 책임지
는 운영 시스템의 일부 요소
사용자
DBMS
파일관리자
디스크관리자
데이터베이스
I am Computer
데이터베이스 관리시스템
I am Computer
12장 데이터베이스
12.3 데이터베이스의 유형
관계형 데이터베이스
계층형 데이터베이스
망형 데이터베이스
객체지향형 데이터베이스
관계형 데이터베이스
특징
데이터 독립성을 보장하고 데이터의 중복 문제를 해결
하는 기법을 제공
SQL과 같은 데이터 조작언어가 발달되었으며 확장 가능
I am Computer
관계형 데이터베이스
관계형 데이터베이스
구성요소
관계(relations)
테이블과 같은 의미
속성(attribute)
필드와 같은 의미
테이블의 열(column)을 나타내며 자료의 이름을 가진 최소 논리
적 단위
튜플(tuple)
테이블의 행(row)을 가르키며 개념 정보의 단위이고 레코드
(record)에 해당
도메인(domain)
속성에서 나타낼 수 있는 값의 집합체
I am Computer
관계형 데이터베이스
관계형 데이터베이스의 예
I am Computer
관계형 데이터베이스
관계 연산자(데이터의 조작)
관계 연산자를 사용하여 관계의 정의를 내리고 시
스템은 새로운 관계를 만듦
관계연산자
관계 대수(relation algebra)
주어진 관계들로부터 필요한 관계를 만드는 연산자
순수 관계 연산자(특수 관계 연산자)
프로젝션(projection), 선택(selection), 조인(join) 등
일반 집합 연산자
합집합(union), 교집합(intersection), 차집합(difference)등
I am Computer
관계형 데이터베이스
질의 언어(Query Language)
사용자가 데이터베이스로부터 정보를 요청할 때
사용하는 언어
SQL(Structured Query Language)
동일한 언어가 두 개의 상이한 인터페이스로 이용될 수
있는 대화형 인터페이스와 응용프로그램 인터페이스임
대화형 질의 언어이며 데이터베이스 프로그래밍 언어
I am Computer
관계형 데이터베이스
질의 언어
기본구조
SELECT 절 - 질의의 결과에 나타날 속성들 열거
FROM 절 - 수행 중에 읽는 관계들의 리스트
WHERE 절 - FROM 절에 나타난 관계들의 속성들을 포
함하는 술어로 구성
예) 학생 테이블에서 성별이 여자인 학생의 이름과 학과
를 출력
select 이름, 학과
from 학생
where 성별=‘여자’
I am Computer
관계형 데이터베이스
질의 언어
QBE(Query By Example)
질의어 및 질의어를 포함하는 데이터베이스 시스템을
지칭
Quel
관계해석을 순수하게 구현하며 Range of, Retrieve, Where
의 세 형태의 절을 사용하여 표현
I am Computer
관계형 데이터베이스
관계형 데이터베이스 설계
설계방법
설계범위 정의 → 시범데이터 수집 표준안 및 절차
수립 → 사용자 뷰 및 요구사항 수집 → 데이터 사
전 구축 → 데이터량과 사용형태 조사 → 운영 요구
사항 조사
설계 표현
데이터 정의어, 데이터 사전, E-R다이어그램
I am Computer
관계형 데이터베이스
스키마의 종류
개념적 설계(개념 스키마)
논리적 설계시의 입력을 작성하고 그 결과는 정보 구조
를 표현한 E-R 다이어그램으로 표현
논리적 설계(논리 스키마, 외부 스키마)
개념 스키마를 DBMS 기능에 맞게 설계
물리적 설계(물리 스키마, 내부 스키마)
효율적이고 실현 가능한 물리적 데이터베이스 구조를
개발하는 과정
I am Computer
관계형 데이터베이스
스키마의 설계 순서
I am Computer
관계형 데이터베이스
E-R 모델
E-R(객체-관계 모델, entity-relationship model)모델
정보 모델링
정보객체 집합과 이들간의 관계 집합을 이용해서 현실
세계를 개념적으로 표현하는 방법
저장 장치를 고려한 데이터 구조가 아니라 단지 현
실 세계를 사람이 이해할 수 있게 표현한 개념적 구
조
I am Computer
관계형 데이터베이스
E-R 모델의 예
예) 회사 데이터베이스를 설계
I am Computer
관계형 데이터베이스
논리적 설계
직원 정보 논리적 설계
필드
사원번호
성명
주민번호
주소
전화번호
생년월일
자료형
문자
문자
문자
문자
문자
날짜
크기
8
20
13
40
12
I am Computer
직원정보
레코드
관계형 데이터베이스
제약 조건(데이터 무결성)
키 제약 조건
기본키(primary key)와 외래키(foreign key)와 관련된 제
약 조건
개체 무결성 규칙(entity integrity)
한 관계의 기본키를 구성하는 속성의 어떤 값도 null값
일 수 없음
I am Computer
관계형 데이터베이스
객체지향 데이터베이스(OODBMS)
객체지향의 개념
실세계에 존재하는 개념적 엔터티를 중심으로 모델링하
는 방식
객체지향 데이터베이스
기존의 객체를 사용함으로써 빠른 개발속도를 얻을 수
있으며 이미 증명된 클래스를 재사용하기 때문에 시스
템의 품질이 향상됨
유연성(flexibility)과 관리 용이성(maintainability)이
있고 사실적인 모델링 및 멀티미디어 데이터 관리
능력이 있음
I am Computer
객체지향 데이터베이스
객체지향 데이터베이스의 장단점
장점
데이터 모델링의 다양성과 재사용성(reusability), 확장성
(extensibility), 개념적 일치성 제공
질의, 복합 객체, 버전 관리, 스키마 변환, 멀티미디어 자
료 관리 기능, 긴 트랜잭션 처리 등의 기능을 지원
단점
구현 시스템마다 개념적 차이가 존재할 가능성
통합 운영상 장애 가능성
질의 최적화가 곤란
안전성과 신뢰성 부족
I am Computer
객체지향 데이터베이스
객체지향 데이터 모델
객체(entity)
객체의 상태를 나타내는 속성(attribute)과 속성 객체를
조작하는 연산 집합인 메소드(method)로 구성
메시지(message)
객체간의 통신 매체
클래스(class)
유사한 객체들의 구조와 행동을 기술하는 도구
다중성(polymorphism)
상위 클래스의 메소드 정의가 하위 클래스에 부적절시
하위 클래스의 메소드를 재정의 가능
I am Computer
객체지향 데이터베이스
계층형 데이터베이스와 객체지향형 데
이터베이스 비교
I am Computer
객체지향 데이터베이스
계층구조 데이터베이스
서로 연관된 필드나 레코드들이 트리와 같은 모습
으로 표현
장점
쉽게 데이터 모델을 이해 가능
다른 데이터 모델보다 쉽게 구현 가능
미리 정의된 관계이기 때문에 접근과 갱신이 빠름
단점
데이터의 구성이 부자연스럽게 될 수 있음
삽입과 삭제 같은 연산시 전체 데이터베이스를 재정의
해야함
I am Computer
계층구조 데이터베이스
계층구조 데이터베이스의 예
예약시스템
I am Computer
계층구조 데이터베이스
망구조 데이터베이스
계층구조 데이터베이스와 비슷하며 자식 레코드들
이 부모 레코드들과 N:N 관계를 가짐
I am Computer
망구조 데이터베이스
망구조 데이터베이스의 예
I am Computer
망구조 데이터베이스
발전된 데이터베이스 형태
멀티미디어 데이터베이스
숫자, 텍스트, 그래픽, 오디오, 비디오를 포함한 여러 가
지 미디어들의 정보를 저장
정보를 표현할 때 적절한 디스플레이 장치를 사용
문서와 기록관리
지식보급
교육과 훈련
마케팅, 광고, 소매, 운반
실시간 제어와 모니터링
I am Computer
발전된 데이터베이스
발전된 데이터베이스 형태
웹 데이터베이스
웹은 대규모 멀티미디어 정보시스템으로서 많은 우수성
을 가짐
대량의 자료를 가진 데이터베이스 서비스를 개발하는데
는 많은 문제가 있음
대규모 서비스 시스템을 구축할 경우, 웹과 데이터베이
스의 결합은 거의 필수적임
I am Computer
발전된 데이터베이스
발전된 데이터베이스 형태(3)
공간 데이터베이스
데이터베이스에 공간 관리개념을 추가한 형태의 데이터
베이스
활용분야
지도제작, 지리정보시스템(GIS), 지적도 및 토지대장관
리, 가스관과 통신선로 시설물 관리
도로망과 교통정보관리, 소방관리등 정보제공
농업, 수산업 등의 자원관리
환경오염 방지를 위한 데이터 제공
I am Computer
발전된 데이터베이스
I am Computer
12장 데이터베이스
12.4 데이터 마이닝과 데이터웨어하우스
- 데이터 마이닝
- 데이터웨어하우스
데이터 마이닝(Data Mining)이란?
방대한 양의 데이터 속에서 쉽게 드러나지 않는 유
용한 정보를 찾아내는 과정
데이터간의 숨겨진 관계, 혹은 겉으로 드러나지 않
거나 또는 기존의 통계학적 방법을 통해 뽑아내기
에는 너무나 복잡한 관계를 찾아내고, 이 관계를 바
탕으로 앞날을 예측하는 기술
I am Computer
데이터마이닝
데이터 마이닝 실행 절차
I am Computer
데이터마이닝
데이터 마이닝의 결과
연합
한 사건이 다른 사건과 상호 관련이 있을 수 있을 때
연속
한 사건이 뒤의 다른 사건을 유발하는 것
분류
패턴을 인식하고 새롭게 분류된 데이터를 창출
집단화
알려지지 않았던 사실 집단을 발견하고 가시화
예측
데이터 내에서 단순히 발견되는 패턴을 통해 미래에 관
한 예측 가능
I am Computer
데이터마이닝
데이터웨어하우스
주제지향성 (subject oriented), 통합성 (integrated),
비휘발성, 시계열성 (time variant)이란 성격을 지닌
데이터의 집합체
데이터웨어하우징의 목적
물리적으로 여러 곳에 분산되어 있는 데이터베이스 내
에 존재하는 데이터들에 대하여 하나의 논리적인 뷰
(view)를 창출
I am Computer
데이터웨어하우스
데이터웨어하우스의 특징
주제지향성 (subject oriented)
데이터웨어하우스내의 데이터는 일정한 주제별 구성을
필요로 함
통합성 (integrated)
데이터웨어하우스내의 데이터는 고도로 통합되어야만
함
비휘발성 (non-volatile)
데이터웨어하우스에 일단 데이터가 적재되면 읽기 전용
으로 존재
시계열성 (time variant)
데이터웨어하우스의 데이터에는 수시적인 갱신이나 변
경이 발생할 수 없음
I am Computer
데이터웨어하우스
데이터웨어하우스 구조
I am Computer
데이터웨어하우스
데이터웨어하우스 구조
메타 데이터 (meta data)
데이터를 요약하는데 사용되는 알고리즘을 포함
현재의 상세 데이터 (current detail data)
대개 디스크에 저장되며 가장 최근의 변경사항을 반영
기존의 상세 데이터 (older detail data)
가끔씩 필요에 의해 액세스되는 데이터로서 테이프와
같은 저장장치에 수록
약간 요약된 데이터 (lightly summarized)
현재의 상세 데이터를 약간 요약한 데이터
고도로 요약된 데이터 (highly summarized)
매우 간결하게 요약되어 쉽게 액세스가 가능
I am Computer
데이터웨어하우스