Organizacija podataka i informacija

Download Report

Transcript Organizacija podataka i informacija

VISOKA TEHNIČKA ŠKOLA
ORGANIZACIJA PODATAKA I
INFORMACIJA
INFORMACIONI SISTEMI
Nastavnik:
dr Miroslav Medenica, dipl. inž.
1
ORGANIZACIJA PODATAKA I
INFORMACIJA



Razvoj nove informacione tehnologije zahteva i
uspostavljanje novih oblika strukture i organizacije
podataka. Ovakav zahtev rezultat je u prvom redu
fizičkih karakteristika savremenih nosilaca
podataka i memorija računarskih sistema, te novih
mogućnosti i pogodnosti koje takve memorije
pružaju u procesu obrade i memorisanja podataka.
Objašnjenje i analiza ovakve organizacione
strukture podataka zahteva da se u vezi sa tim
izvrši:
identifikacija strukture sa logičkog i fizičkog
aspekta
objasni međusobna povezanost iskazanih struktura
u okviru date organizacije.
2
BIT BAJT I ENTITET
1/3




Bit- u logičnom smislu predstavlja jediničnu
strukturu za iskazivanje neke količine informacija
po osnovu organizacione jedinke vezano za
fizičko memorisanje podataka. Kod digitalnih
kompjuterskih sistema, bit može zauzeti samo
dva moguća stanja:
dobija strujni impuls i zauzima stanje 1
ne dobija strujni impuls i zauzima stanje 0.
Bit nam prema tome služi i kao memorijski
kapacitet u koji možemo sačuvati samo jedan od
3
dva moguća binarna simbola (1 ili 0).
BIT BAJT I ENTITET 2/3







Za praktične potrebe memorisanja i iskazivanja to nam je u
svakom slučaju nedovoljno, pa se bitovi povezuju u skupove
od:
4 bita koje nazivamo tetrada
8 bita koje nazivamo bajt
16 bita koje nazivamo polureč
32 bita koje nazivamo reč
64bita koje nazivamo dvostruka reč.
Za objašnjenje ovih pojmova najpogodnija jedinica je “bajt”.
Bajt predstavlja dakle u fizičkom smislu skup od osam bita.
Kao takva memorijska jedinica ona nam omogućava da u
logičkom smislu u njemu možemo čuvati jedan znak bilo
koje apstraktne abecede: numerički (0, 1, 2, …)
-alfabetski (A, E, I, …)
-specijalni (., =,-, …)
4
BIT BAJT I ENTITET 3/3



Skup od 4 bita, omogućava nam memorisanje i
predstavljanje samo numeričkih znakova.
Bitno je istaći da bajt predstavlja i najmanju
adresibilnu jedinicu memorije što sa stanovišta
korisnika znači da ne postoji manja jedinica za
upisivanje ili čitanje nekog sadržaja. Sve druge
pomenute jedinice podataka u zavisnosti od toga
koja od njih sa tehničko-tehnološkog stanovništa
čini osnovnu ćeliju u arhitekturi kompjuterskog
sistema razlikujemo:
16 bitne mašine čija je osnova polureč
32 bitne mašine čija je osnova reč
64 bitne mašine čija je osnova dvostruka reč.5
ENTITET 1/3

Entitet je jedan od logičkih pojmova koji se
različito definiše, ali se pod njim najčešće
podrazumeva neki elementarni objekat
posmatranja koji nam je relevantan sa datog
stanovišta. Svaki entitet pri tome ima različita
svojstva ili obeležja koja mogu biti izvorna ili
izvedena. Obeležja entiteta su uvek neki
parametri kojima bliže identifikujemo proučavani
entitet i koji se mogu konkretizovati.
6
Entitet
Izvorna obeležja
Konkretizacija obeležja
a.)skladište
dužina,visina,širina,lokacija
100m, 10m, 40m Mali
Mokri Lug
izvedena obeležja
b.)kupac
broj robe u skladištu kapac.
80 kom, 1500 kom
mesto, adresa, roba
Beograd, Kosovska 15,
TV
izvedena obeležja
učešće u ukupnom prometu, 15%, 15 dana, virmanom
rok plaćanja, način plaćanja
7
ENTITET 3/3
Svaki entitet može imati više obeležja i obrnuto
npr. na jednoj lokaciji može biti više skladišta ili za
jednu robu više kupaca. To znači da se između
entiteta i obeležja u svakom konkretnom slučaju
mogu uspostaviti različite funkcionalne veze i
odnosi.
Ovakav način prikazivanja pogodan je i za
definisanje relacija predhođenja skupova
informacija o čemu će kasnije biti više reči.
Znači da uvek možemo definisati i skupove
obeležja, a konkretizacija obeležja za svaki pojedini
entitet daje nam strukturu koju nazivamo podatak
ili polje.
8
PODATAK 1/3


U teoriji komunikacija pod pojmom podatka se
podrazumeva vest koju je uputio pošiljalac
primaocu, a koja je definisana nazivom, obimom
i vrstom. Drugim rečima može se uopšteno reći
da je podatak sve ono što opisuje neku
činjenicu.
To znači da je podatak logička jedinica koja još
uvek ne predstavlja informaciju, a koja se u
smislu digitalne strukture u kompjuterskoj
organizaciji memorije naziva polje.
9
PODATAK 2/3

Kao što je predhodno pomenuto za
podatak koji je definisan obimom i vrstom,
tako isto i za polje kao njegov sinonim u
kompjuterskoj organizaciji važi da mora
biti dimenziono definisan na isti način kako
je dato na sledećoj šemi. Naziv i obim
polja određuje sam korisnik dok vrsta
polja proizilazi iz samog karaktera znakova
koji ga čine.
10
Naziv polja
Obim (veličina)
Vrsta
-šifra kupca
6 znakova
numerički
-ime kupca
20 znakova
alfabetski
-ulica
18 znakova
alfabetski
-broj
5 znakova
alfa-numerički
-mesto
15 znakova
alfabetski
11
SEGMENT 1/3




Više podataka odnosno polja koji se mogu
svesti pod neki zajednički imenik čine
segment. U primeru takvi segmenti su:
adresa kupca (ulica, broj, mesto)
uslovi plaćanja (rok, račun, konto,
kamata)
stanje računa (duguje, potražuje, saldo).
12
šifra kupca
Ime-naziv
Adresa kupca
ulica
Uslovi plaćanja
rok
broj
mesto
Stanje računa
račun konto kamata duguje potražuje saldo
13
SEGMENT 3/3
Segment je takođe logička jedinica koja kao
struktura predstavlja jednu složenu celinu od
skupa podataka. Ovo upućuje (prema
konkretnom primeru) da sa stanovišta strukture i
segment i slog mogu biti istovremeno informacija.
Segment međutim nije istovremeno i fizička
jedinica podataka što znači da se u organizaciji
memorisanja on defakto ne izdvaja ni u kakvu
fizički zasebnu celinu. Naprosto on je deo celine
koju nazivamo slog.
14
SLOG 1/3
Slog podataka obuhvata sve podatke i segmente
kao njihove podskupove koji su važni za jedinični
aplikativni objekat posmatranja.
Npr.slog kupac objedinjava sve važne podatke o
svakom pojedinom klijentu, dok slog roba sve
važne podatke o artiklima koji su predmet
proučavanja, tj. evitentiranja obrade itd. U
logičkom smislu slog je dakle uvek jedna
zaokružena celina podataka i njegova
identifikacija zahteva, da isti bude konkretizovan
na način kako je to objašnjeno za entitet.
15
SLOG 2/3
To istovremeno znači da se slogovi međusobno
razlikuju po nazivu, logičkom sadržaju i dužini.
Razlike u logičkom sadržaju slogova nastaju kao
posledica konkretizacije obeležja koja su
obuhvaćena slogom. Bitno je stoga da slogom
budu obuhvaćena sva obeležja koja su nam
važna sa stanovišta dobijanja odgovora na
informacione zahteve korisnika. To podrazumeva
da u kreiranju sloga mora učestvovati i projekat i
korisnik sistema kako bi se već u toj fazi
obezbedio željeni sadržaj.
16
SLOG 3/3
Identifikacija nekog sloga u memoriji vrši se (u
momentu potrebe na bazi upitnika, odnosno
infomacionog zahteva) putem odgovarajućeg ključa.
Ključ logičkog sloga vrši funkciju identifikatora i to na
bazi jednog ili više obeležja. U prvom slučaju uloga
ključa obično ima identifikaciona šifra, ali to može
biti i bilo koje drugo polje koje je jednoznačno
određeno. Takav ključ naziva se primarni ključ.
Pored njega moguće je koristiti i tzv. sekundarne
ključeve koji predstavljaju više obeležja u datim
granicama. Slog se identifikuje i kao fizička struktura
i tada je određen načinom memorisanja podataka na
magnetnoj memoriji.
17
BLOK
Više slogova čine blok podataka. Koliko će slogova
činiti blok stvar je proizvoljne ocene ili potrebe
programera pri čemu se obično rukovodimo načelom
što bolje iskorišćenosti magnetne memorije sa kojom
radimo.
Faktor blokiranja, kao faktor, upravo govori koliko
slogova pridružujemo u jedan blok.
Blok je fizička jedinica podataka, što znači da ovakva
struktura podataka defakto egzistira na magnetnoj
memoriji, pri čemu se svaki slog iz sastava te
strukture može zasebno dobiti ili ažurirati.
Organizacija slogova u blokove sprovodi se i zbog
potrebe brže organizacije ulaza/izlaza u kompjuterski
sistem kao i postizanja racionalnijeg prenosa u
18
daljinskoj obradi podataka.
DATOTEKA 1/3



Pod ovim pojmom podrazumeva se skup
svih istovrsnih slogova koji se prikupljaju
ažiriraju i obrađuju na nekom području
aplikacije.
Tako na primer govorimo o datotekama
gotovih proizvoda, sirovina, materijala,
kadrova itd.
Svaka datoteka ima svoj simbolički naziv
(ime) i dimenziono je definisana sa brojem
slogova što predstavlja veličinu datoteke.
19
DATOTEKA 2/3



Možemo istaći sledeće:
datoteka je dvojnog karaktera, što znači da
predstavlja i logičku i fizičku strukturu
podataka
u strukturi podataka datoteke uvek postoji
neki pouzdan red koji omogućava obavljanje
informacionih delatnosti i posebno operacije
na datotekama
u kompjuterskoj organizaciji je redovni oblik
stukture i organizacije podataka, kao i
najpogodniji i najprihvatljiviji oblik čuvanja,
odnosno arhiviranja i memorisanja
podataka.
20
DATOTEKA 3/3





Bitna obeležja po kome se datoteke
međusobno razlikuju su:
vrsta odnosno tip datoteke
veličina datoteke
brzina pristupa do pojedinog sloga
datoteke
uređenost datoteke
povezanost sa drugim datotekama
21
OPERACIJE SA DATOTEKAMA 1/2



Jednom formirane datoteke imaju za cilj da omoguće
laku manipulaciju sa podacima. U tom procesu se
formiraju tri vrste datoteka:
matične koje sadrže slogove sa relativno fiksnim
obeležjima. U njima su uglavnom oni podaci koji se
često ne menjaju npr. ime kupca, adresa itd.
prometne datoteke koje sadrže one slogove čiji je
sadržaj različit od jednog do drugog sloga. Najčešća
namena ovih datoteka je da se pomoću njih izvrši
ažuriranje matičnih datoteka npr. to su datoteke,
fakture, uplate kupca itd.
radne datoteke su one datoteke koje se privremeno
formiraju u procesu neke obrade i koje služe samo u
tom određenom trenutku. Nakon završene obrade one
se ne čuvaju (arhiviraju) za razliku od matičnih i
22
prometnih datoteka.
OPERACIJE SA DATOTEKAMA 2/2




Bez obzira o kojoj vrsti datoteke se radi
postoje sledeće tipične operacije sa
datotekama:
formiranje i kreiranje datoteka
sortiranje
pretraživanje
ažuriranje.
23
BAZE PODATAKA 1/2
Kao najsloženiji oblik strukture i organizacije
podataka, baza podataka u osnovi predstavlja
oblik optimalne povezanosti datoteka (time i
podataka) na nekom području rada poslovanja i
življenja.
Pod optimalnom povezanošću ovde se
podrazumeva odnos na relaciji karakteristike
hardvera-podaci-programi-zahtevi korisnika.
Definicija:
Baza podataka je skup podataka koji su povezani
preko određenih relacija, pri čemu upravljački
sistem BP (DBMS) formira i održava ove relacije.
24
BAZE PODATAKA 2/2



Predpostavke od kojih se polazi pri izradi
baza podataka su:
datoteke koje ulaze u BP memorisane su na
nosiocima koji omogućavaju direktan pristup
podacima.
slogovi podataka različitog tipa i međusobnih
faza imaju malu ili nikakvu redundantnost
kompletne fizičke strukture obeležja možemo
fizički povezati i optimalno realizovati tek
kroz kompleks baze podataka.
25
CILJEVI KOJI SE POSTIŽU BAZOM
PODATAKA 1/2


Ciljevi koji se žele postići organizacijom baze
podataka su brojni, ali se kao najvažniji mogu
označiti sledeći:
nezavisnost podataka odnosi se na razdvajanje
fizičke i logičke strukture podataka u smislu da se
bilo koja od njih može menjati bez uticaja na
drugu. Sama nezavisnost može biti logička (šema
baze podataka se može menjati bez izmene
programa) i fizička (izmena podšeme baze
podataka bez izmene šeme ili programa)
neredudantnost - jedan podatak se samo jednom
obuhvata i unosi u memoriju i bazu podataka 26
CILJEVI KOJI SE POSTIŽU BAZOM
PODATAKA 2/2




fleksibilnost BP - ovim se označava mogućnost
spajanja ranije razvijenih programa i njihovih
viđenja podataka sa novim programima kao i
povezivanje trenutno postojećih različitih vrsta
programa.
integritet podataka-označava zahtev za
potpunošću,ispravnošću i zaštitu podataka od
gubitaka i oštećenja.
zajedničko korišćenje informacija od strane više
korisnika označava sigurnost podataka i pristup u
ovim uslovima.
potpunost podataka - ovim se označava
neophodnost da svi podaci koje zahtevaju programi
budu sadržani u BP.
27
STRUKTURNI ASPEKT BAZE
PODATAKA 1/2
Jedna od osnovnih specifičnosti pristupa BP u odnosu na
konvekcionalno organizovanje datoteke sastoji se upravo u
shvatanju i definisanju tzv. fizičkog i logičkog načina
gledanja na strukturu podataka. Suština je naime u tome da
se pod pojmom fizička struktura označava stvarna struktura
podataka memorisana na konkretnoj fizičkoj jedinici
(magnetnom disku).
Nasuprot tome pojam logička struktura označava poseban
način gledanja na strukturu podataka koji zavisi od samog
subjekta posmatranja, te se stoga opravdano govori o više
tipova logičke strukture podataka.
Logička struktura BP upravo omogućava korisnicima
(uključujući i programere) da svoje zahteve upite i sl.
postavljaju i realizuju u formi informacija, odnosno u obliku
željenog izlaza ne vodeći računa o stvarnoj strukturi i
raspodeli podataka.
28
STRUKTURNI ASPEKT BAZE
PODATAKA 2/2



Ovo je bitna razlika u odnosu na pristup u uslovima
konvekcijalnih datoteka, gde se između fizičke i logičke
strukture postavlja znak jednakosti. Budući da se i suštinski radi
o strukturi podataka na ovaj način definišu se tri aspekta BP i
to:
globalni logički aspekt-aspekt korisnika ili “šema”
programerov logički aspekt -“podšema”
stvarni tj. fizički aspekt.
Povezivanje kojim se spajaju relacije jednog aspekta sa
relacijama drugog aspekta označava se kao konverzija. U vezi
sa tri navedena aspekta BP očigledno je da moraju postojati
najmanje dve konverzije. Prva od njih mora se odnositi na
konvertovanja naredbi (instrukcija upita itd.) korisnika u oblik
programerskog opisa dok će se druga odnositi na
konvertovanje u onaj oblik mašinskih instukcija koji omogućava
stvarnu aktivnost fizičkih slogova ili njihovih delova.
29
UPRAVLJAČKI SISTEM BAZE
PODATAKA (DBMS)1/2






Upravljački sistem BP je komponentni itegralni deo softvera i
informacionog sistema. Njime se u opštem slučaju reguliše
memorisanje, pretraživanje i održavanje podataka u svim a
posebno ON LINE, REAL TIME način rada elektronskog
računara.
Upravljački sistem baze podataka osigurava sledeće
mogućnosti:
razdvajanje fizičke i logičke strukture podataka
različite dužine slogova
potpune mrežne i relacione strukture podataka
proizvoljnu gustinu podataka
zaštićeni način procesiranja podataka
zaštitu na nivou polja.
30
UPRAVLJAČKI SISTEM BAZE
PODATAKA (DBMS)2/2






DBMS uspostavlja, prema tome, vezu između logičke
strukture podataka (šeme i podšema) i fizičkih struktura
na memoriji. Ova veza uspostavlja se putem DBMS
softverskih paketa i različitih metoda pristupa intergrisanih
u operativnom sistemu. Pri izboru softvera za upravljanje
BP obično se vodimo sledećim kriterijumima:
jednostavnost korišćenja
mogućnost programiranja
brzina pretraživanja
mogućnost korišćenja programa koji su proizvod drugih
firmi
mogućnost lakog održavanja
jednostavnost obuke korisnika.
31
MODELI BAZE PODATAKA1/7
Pod ovim pojmom podrazumeva se način
struktuiranja odnosa između entiteta BP
kao i način njihovog povezivanja.
Izložiće se samo osnovni principi do sada
razvijenih modela:



Hijerarhiski model
Model mreže
Model relacija
32
MODELI BAZE PODATAKA
Hijerarhiski model - koncept ovog modela


dopušta samo predstavljanje relacija 1:n
između entiteta što znači da ovaj model
zahteva ispunjenje sledećih uslova:
postoji tačno jedan entitet koji se nalazi
na najvišoj stepenici hijerarhije
svaki entitet na višoj stepenici hijerarhije
ima samo jednog predhodnika
33
MODELI BAZE PODATAKA
Hijerarhijski model
A
B
C
D
E
34
MODELI BAZE PODATAKA
Model mreže - koncept ovog modela dopušta da



jedan entitet ili klasa entiteta može imati više
predhodnika i više sledbenika. To istovremeno
ima i otežavajuću stranu u činjenici da put ka
nekom određenom entitetu nije više jasan kao
kod predhodnog modela. Najvažnije osobine
modela su:
jedan entitet može pripadati velikom broju
logičkih lanaca različitog tipa
između dva entiteta može egzistirati više lanaca
u šemi ne smeju egzistirati nikakve petlje.
35
MODELI BAZE PODATAKA
Mrežni model
a1
b1
a2
b2
a3
b3
b4
36
MODELI BAZE PODATAKA
Model relacija - relacioni model BP polazi
od činjenice da se entitet opisuje
kombinacijom atributa tj. obeležja. Svaki
entitet može da se sastoji od n-obeležja
koji se unose u redove tabele kako je to
predstavljeno na slici. Sva obeležja u istoj
koloni predstavljaju isti tip obeležja.
Redovi jedne relacije identifikuju se putem
tzv. ključnih obeležja.
37
MODELI BAZE PODATAKA
Model relacija
Broj kupca
104
Ime kupca
RO PTT
Adresa kupca
11000 Beograd
118
110
RO TURBINA
RO PROMET
11000 Beograd
24000 Novi Sad
38