Struktura podatkovne zbirke

Download Report

Transcript Struktura podatkovne zbirke

Uvod v podatkovne zbirke 1
Podatki in informacije,
vrste podatkovnih zbirk,
struktura podatkovnih zbirk,
relacijske zbirke.
Terminologija

Podatkovna zbirka, zbirka podatkov

Podatkovna baza, baza podatkov

Podatkovna banka, banka podatkov

Podatkovno skladišče, skladišče podatkov
dr. Jure Dimec: Podatkovne zbirke 2
2
Podatki in informacije

Podatki so dejstva, predstavljena z vrednostmi
(številkami, znaki, simboli...).

Informacija je pomen, ki ga podatkom pripiše
inteligenten sistem (človek, inteligenten stroj).

Podatkovna zbirka je model okolja, iz katerega
izvirajo podatki in osnova za tvorbo novih
informacij o okolju.
dr. Jure Dimec: Podatkovne zbirke 2
3
Informacije in odločanje
Samo dveh vrst težav imamo z informacijami:
 informacij je premalo,
 ali pa jih je preveč
dr. Jure Dimec: Podatkovne zbirke 2
4
Informacije in odločanje



Informacije so osnova za odločanje.
Če o nekem problemu nimamo “vseh” potrebnih
informacij, se odločamo na osnovi nepopolne
slike realnosti.
Če imamo informacij preveč, moramo med njimi
poiskati le relevantne informacije, kar je lahko
zelo naporno. Nevarno je, da se bomo odločili na
osnovi vtisa, občutka, in ne natančne analize.
dr. Jure Dimec: Podatkovne zbirke 2
5
Podatki in informacije
Povzetek:

Podatki predstavljajo gradnike informacij.

Informacije nastanejo s procesiranjem podatkov.

Informacije potrebujemo za razkrivanje pomena
podatkov.

Točne, relevantne in pravočasne informacije so ključ
za dobro odločanje.

Dobro odločanje je nujno za preživetje organizacije ali
storitve.
dr. Jure Dimec: Podatkovne zbirke 2
6
Vrste podatkovnih zbirk
Sistemi za iskanje informacij, bibliografske zbirke,
zbirke polnih besedil (Information Retrieval Systems).
Shranjevanje in iskanje besedil v naravnem jeziku.
Sistemi za upravljanje s podatki, relacijske zbirke
(Database Management Systems).
Podatki tabelarične narave. Poudarek na relacijah med
podatki in preurejanju podatkov. Transakcije.
Inteligentni informacijski sistemi, sistemi podprti z
znanjem, ekspertni sistemi (Knowledge-based Systems,
Expert Systems).
Zbirka znanja o problemskem področju. Sposobnost
sklepanja in pojasnjevanja sklepov.
dr. Jure Dimec: Podatkovne zbirke 2
7
Struktura podatkovne zbirke

Podatki v zbirki so urejeni po enotnih kriterijih.

Podatki iste vrste morajo biti shranjeni v enakih
“predalih” in zapisani z enakim tipom znakov.

Dogovor o ureditvi podatkov imenujemo
struktura zbirke.
dr. Jure Dimec: Podatkovne zbirke 2
8
Struktura podatkovne zbirke
Gradniki podatkovne zbirke:

Entitete so objekti, o katerih zbiramo podatke,

atributi so lastnosti entitet,

vrednosti atributov so konkretni podatki o
posameznih atributih.
dr. Jure Dimec: Podatkovne zbirke 2
9
Struktura podatkovne zbirke
vsebina zbirke entiteta
atribut
vrednost atributa
obiski v ZD
pacient
leto rojstva
1960
bibliografski
podatki
članek
naslov
Nova dognanja o…
izpiti na FF
študent
priimek
Novak
dr. Jure Dimec: Podatkovne zbirke 2
10
Struktura podatkovne zbirke
Struktura določa
 kateri atributi bodo sestavljali entiteto,
 s kakšnimi znaki bomo zapisovali vrednosti
atributov,
 dolžine posameznih vrednosti atributov,
 povezanost posameznih entitet…
Spoznali bomo strukture
 relacijskih zbirk in
 tekstovnih (bibliografskih) zbirk.
dr. Jure Dimec: Podatkovne zbirke 2
11
Struktura relacijske zbirke
Primerna za urejanje podatkov tabelarične
narave.
 Vsaka vrstica v tabeli predstavlja entiteto, vsak
stolpec atribut entitete, vsaka celica tabele
vrednost atributa.
 Vsaka entiteta mora imeti identifikacijski atribut
(pogosto EMŠO, če je entiteta oseba).
 Primer:
zbirka o napotitvah pacientov v specialistične
ustanove.

dr. Jure Dimec: Podatkovne zbirke 2
12
Relacijska zbirka o napotitvah pacientov v
pacienti
specialistične ustanove
napotitve
spec.
ustanove
dr. Jure Dimec: Podatkovne zbirke 2
13
Struktura relacijske zbirke

Relacijska zbirka shranjuje podatke o različnih
entitetah, smiselno urejene v ločenih tabelah,

entitete so povezane preko unikatnih
identifikacij,

povezave imenujemo relacije,

relacije so osnova za poizvedovanje po
relacijskih zbirkah.
dr. Jure Dimec: Podatkovne zbirke 2
14
Struktura relacijske zbirke

Relacijska struktura je načeloma zelo
ekonomična:

pacient lahko sodeluje v številnih napotitvah,
vendar so njegovi osebni podatki vneseni le
enkrat.

Slabo načrtovana zbirka pogosto vsebuje
redundantne (nepotrebno pomnožene) podatke.

O redundantnosti govorimo, če so isti podatki o
isti entiteti nameščeni na različnih mestih v zbirki.
Redundantni podatki so vir napak, ki jih težko
odkrijemo.
dr. Jure Dimec: Podatkovne zbirke 2
15
Struktura relacijske zbirke

Poizvedovanje s pomočjo relacij lahko poveže
podatke iz različnih tabel.

Primer: v katero zdravstveno ustanovo je bil 12.
7. 1992 napoten Miha Kovač?

Najbolj razširjen jezik za definiranje strukture
zbirke in poizvedovanje po njej je SQL
(Structured Query Language)
dr. Jure Dimec: Podatkovne zbirke 2
16
Vrste relacijskih zbirk
Možna je delitev zbirk na osnovi lokacije podatkov:

Zbirka, ki ima podatke nameščene na enem mestu, je
centralizirana.

Zbirka, ki ima podatke nameščene na različnih mestih, je


pomnožena, če so na različnih mestih nameščene kopije
istih podatkov, ali

porazdeljena (distribuirana) če so na različnih mestih
nameščeni različni deli zbirke.
Centraliziranost ali porazdeljenost nimata nikakršne zveze z
namestitvijo uporabnikov. Tudi centralizirane zbirke lahko
uporabljajo uporabniki z razpršenih lokacij.
dr. Jure Dimec: Podatkovne zbirke 2
17
Vrste relacijskih zbirk
Možna je delitev zbirk na osnovi časovne zahtevnosti postopkov:
Transakcijske zbirke

Namenjene so upravljanju podatkov v realnem času.

Odslikavajo trenutno stanje sistema in sprememb v njem
(npr. bančno poslovanje).

Uporabljajo se v vsakodnevnemu poslovanju.
Podatkovna skladišča

Shranjujejo podatke za daljše časovno obdobje in so
namenjena podpori taktičnim in strateškim odločitvam.

S pomočjo obsežnih manipulacij s podatki omogočajo
kreiranje zbirnega znanja, sledenje in napovedovanje
trendov, nove poglede na podatke...
dr. Jure Dimec: Podatkovne zbirke 2
18