Organizacja zapisu danych na dysku

Download Report

Transcript Organizacja zapisu danych na dysku

Organizacja zapisu
danych na dysku
Sposoby organizacji danych
Sposób organizacji danych mówi nam o formacie zapisu
danych na nośnikach lub przesyłanych pomiędzy
różnymi miejscami. Najlepszym przykładem
niewidocznej dla użytkownika organizacji danych jest
umieszczenie ich na dysku twardym. W skrócie
organizacja danych oznacza sposób przechowywania
lub przesyłania informacji uzgodniony przez wszystkie
korzystające z tych danych strony. Sposób ten
zapewnia, iż każda ze stron odczyta te dane w
jednoznaczny (taki sam) sposób niezależnie od miejsca i
kraju.
2
Sposoby adresowania danych na dysku
CHS (cylinder, head, sector)
 LBA (Logical Block Adressing)
 MZR (Multiple Zone Recording)

3
Sposoby adresowania danych c.d.
4
Sposoby adresowania danych c.d.
CHS (ang. Cylinder-Head-Sector, czyli cylinder-głowicasektor) jest metodą adresowania danych na dysku twardym.
Każdy dysk twardy zawiera talerze i głowice do odczytu i
zapisu. Głowice znajdują się po obydwu stronach talerza
tzn. jeżeli dysk zawiera 2 talerze to posiada 4 głowice.
Każdy talerz podzielony jest na ścieżki. Wartość cylindrów
określa liczbę ścieżek znajdujących się po każdej ze stron
talerza. Pojedynczy cylinder jest więc zbiorem ścieżek
będących jedna nad drugą (jest ich tyle samo co głowic).
Wartość sektorów określa liczbę sektorów w każdym
cylindrze, każdy sektor zawiera 512 bajtów.
5
Sposoby adresowania danych c.d.
LBA (ang. Logical Block Addressing) - metoda obsługi
dysku twardego przez system operacyjny.
Dla pokonania granicy 528 MB standard EIDE wykorzystuje
metodę LBA, która powoduje przenumerowanie
wszystkich sektorów, tzn. dokonuje tzw. translacji adresów,
czyli zamiany rzeczywistych numerów głowicy, cylindra i
sektora na ich logiczny odpowiednik; odpada więc
skomplikowana adresacja za pomocą cylindrów, głowic i
sektorów (ang.Cylinder Head Sector) (CHS). Metoda ta
funkcjonuje w każdym systemie operacyjnym oprócz
DOS-a.
6
Sposoby adresowania danych c.d.
MZR (ang.Multiple Zone Recording, czyli nagrywanie wieloma
strefami) - technika formatowania i określania lokacji
sektorów danych na fizycznej przestrzeni takich nośników
magnetycznych, jak na przykład dysk twardy.
W klasycznym modelu dysku twardego, opartym o adresację
CHS, dane zapisywane są wzdłuż cylindrycznych ścieżek.
Każda ścieżka zawiera w sobie fragmenty, należące do
dokładnie takiej samej liczby sektorów. Jest to jednak
negatywne zjawisko, ponieważ - przy takiej samej ilości
bajtów zapisanych w określonym sektorze, na wyznaczonej
ścieżce - zewnętrzne obszary dysku nie są w pełni
wykorzystane. Zawierają one taką samą ilość danych, jak
obszary bliższe środkowi nośnika, a przecież są od nich
znacznie dłuższe.
7
Dyskowy System plików
System plików to jeden z fundamentów
systemu operacyjnego. Odpowiada za sposób
nazywania, przechowywania i organizowania
danych na nośnikach pamięci masowych.
8
System plików c.d.
Innymi słowami system plików to sposób, w jaki
komputer organizuje dane zapisywane na dysku
twardym. Dotyczy to dwóch głównych rzeczy wielkości jednostek alokacji oraz metody, według
której komputer będzie później odnajdował pliki
zapisane na dysku twardym. Najpopularniejsze
systemy plików to FAT16 (stosowany w MS-DOS,
Windows 95/98 i Windows NT), FAT32 (Windows
95 OSR2 i Windows 98) oraz NTFS (Windows NT).
Jedynym wspólnym systemem plików dla Windows
jest FAT16.
9
System plików c.d.
Pierwsze systemy operacyjne Microsoftu
wykorzystywały system plików FAT12 oraz FAT16.
Dla DOS-u 5.0 czy 6.0 FAT był wystarczająco
funkcjonalny i wydajny, ale w miarę rozwoju
technologii informatycznych stawał się balastem dla
systemu operacyjnego. Dobrą tego ilustracją jest
obsługa nazw plików. Standard, w którym nazwa
mogła zawierać maksymalnie osiem znaków plus
trzy znaki rozszerzenia (8.3), przeszkadzał
szczególnie w systemach "okienkowych".
10
System plików c.d.
W Windows 95 (OSR 2) rozbudowano możliwości
systemu plików przez dodanie obsługi FAT32,
który "zadomowił się" we wszystkich następcach
Windows 95, obsługuje go również Windows XP.
11
System plików c.d.
W latach 90. Microsoft wprowadził podział
systemów operacyjnych na dwie oddzielnie
rozwijane grupy. Pierwszą były systemy
przeznaczone do zastosowań domowych.
Drugą grupę stanowiły systemy przeznaczone do
firm. Zapoczątkował je Windows NT. Produkty
do przedsiębiorstw muszą spełniać
zdecydowanie wyższe wymagania i dlatego
powstał projekt nowego rozwiązania. W 1993
roku pojawił się NT 3.1, który zawierał system
plików NTFS (New Techology File System).
12
System plików c.d.
W Windows XP Microsoft połączył linie
produktów do firm z linią systemów
domowych. XP Home oraz Professional
mają te same fundamenty, pochodzące z
Windows NT i oba systemy obsługują
FAT i NTFS.
13
System plików c.d.
Windows XP obsługuje cztery systemów plików:
FAT (wersje FAT12, FAT16, FAT32), NTFS,
CDFS oraz UDF.
Windows automatycznie dobiera wersję systemu
plików do rozmiaru formatowanej partycji lub
formatowanego nośnika, np. dyskietki oraz
woluminy mniejsze niż 16 MB są automatycznie
formatowane w systemie FAT12. Partycje do 2
GB są formatowane w systemie FAT16, a te,
których rozmiar mieści się w zakresie od 2 GB
do 32 GB, w systemie FAT32.
14
System plików c.d.
Podstawowym i zalecanym systemem plików
Windows XP jest NTFS, często jedyny, który
można wybrać, korzystając z dostępnych
narzędzi do zarządzania dyskami.
W XP wbudowano ograniczenie, które nie
pozwala na sformatowanie partycji w systemie
FAT w wypadku woluminów liczących ponad 32
GB.
Jednym ze sposobów zmiany tego faktu jest
formatowanie dysku poleceniem FORMAT z
parametrem /FS.
15
System plików c.d.
W celu odczytania danych z płyt CD i DVD
obsługiwane są systemy CDFS oraz UDF.
Pierwszy jest starszy, a jego główne ograniczenia
to maksymalnie 64-znakowe nazwy plików oraz
najwyżej ośmiopoziomowa struktura
zagnieżdżeń folderów. UDF jest nowszym
standardem. To za jego pomocą można odczytać
dane z płyt DVD, pozwala również na dłuższe
nazwy plików i głębszą strukturę folderów.
16
Podstawy działania FAT
W celu uzyskania dostępu do danych posługuje się
tablicą alokacji plików oraz wpisami
katalogowymi. Zawartość tych elementów
informuje Windows, gdzie znajduje się plik,
który chcesz odczytać lub zmodyfikować.
17
Podstawy działania FAT
Tablica alokacji plików FAT (ang. File Allocation
Table ) to lista wszystkich jednostek alokacji
woluminu. Każda jednostka ma przypisany jeden
z czterech stanów: nieużywany, klaster zajęty
przez plik, klaster uszkodzony i ostatni klaster
pliku. Klastry woluminu FAT mają logiczne
numery. Ponieważ uszkodzenie struktury tablicy
alokacji plików może skutecznie uniemożliwić
dostęp do danych, system FAT przechowuje
dwie kopie tablicy.
18
Podstawy działania FAT
Każdy utworzony plik lub folder otrzymuje
oddzielny, 32-bajtowy wypis z takimi
informacjami, jak nazwa, opis atrybutów, data i
czas utworzenia, data ostatniego dostępu,
identyfikator pierwszego klastra i rozmiar pliku.
Po utworzeniu nowego dokumentu, np. cos.txt,
system doda wpis z wymienionymi wyżej
danymi. Jeśli założysz folder, wpis będzie bardzo
podobny. Katalogi są rozróżniane według
ustawionego odpowiedniego atrybutu. Jedną z
ważniejszych informacji w opisie pliku jest adres
pierwszego zajmowanego przez niego klastra.
19
Podstawy działania FAT
20
Atrybuty plików
-Pliki „tylko – do – odczytu”
Ani system Windows 95, ani system MS-DOS nie
pozwolą usunąć ani zmodyfikować treści pliku z
atrybutem tylko do odczytu. Takie pliki są chronione
przed zmianami, nie można ich edytować bez
uprzedniego usunięcia atrybutu tylko do odczytu. Jeżeli
istnieje szczególnie cenny plik, na przykład ważna kopia
zapasowa czy program, którego nie wolno zmienić ani
usunąć, to warto włączyć jego atrybut tylko do odczytu.
Wtedy żaden inny program nie będzie mógł zmienić
jego treści ani usunąć go z dysku.
21
Atrybuty plików
-Pliki z atrybutem „ukryty”
Ukrytego pliku nie widać w listach pokazywanych przez
Eksplorator i polecenia systemu operacyjnego MSDOS. Czasem ukrywa się pliki systemowe i szczególnie
ważne programy obsługi urządzeń, do których powinny
mieć dostęp jedynie odpowiednio przeszkolone osoby.
Kiedy indziej pliki ukryte zawierają istotne dane, które
nie powinny być widoczne dla przeciętnego
użytkownika. Chociaż ukrycie pliku nie chroni go
całkowicie przed dostępem niepowołanych osób,
nazwa tego pliku nie pojawia się w zwykłych wykazach
plików.
22
Atrybuty plików
-Pliki z atrybutem „systemowy”
Pliki systemowe to ukryte pliki z atrybutem „
tylko-do-odczytu”, które system WINDOWS
Wykorzystuje do własnych potrzeb. W żadnym
wypadku nie należy usuwać pliku systemowego
– taka operacja może uniemożliwić
uruchamianie jakiegoś programu. Można jednak
usunąć atrybut „systemowy” na czas oglądania
zawartości pliku albo jego edycji.
23
Atrybuty plików
-Pliki z atrybutem „archiwalny”
Operacja tworzenia kopii zapasowej pliku polega na
sporządzeniu jego kopii, którą można przechowywać w
bezpiecznym miejscu, na innym dysku lub taśmie
magnetycznej. Kopie zapasowe nazywa się czasem plikami
archiwalnymi.
24
Podstawy działania NTFS
Architektura systemu NTFS różni się zdecydowanie
od sposobu funkcjonowania systemu FAT, którego
najważniejszą zaletą jest prostota. To równocześnie
jego największa wada, bo oznacza ograniczone
możliwości świadczenia dodatkowych usług. W
systemie NTFS informacje potrzebne do
zarządzania danymi są przechowywane w grupie
plików systemowych zwanych plikami
metadanych.
Są one tworzone w czasie formatowania woluminu.
25
Podstawy działania NTFS
Najważniejszym elementem struktury systemu
NTFS jest tablica MFT (Master File Table). To
baza danych zapisana również w postaci pliku i
gromadząca informacje o wszystkich plikach i
folderach przechowywanych przez wolumin.
Rozmiar rekordu opisującego każdy plik wynosi
1 KB.
26
Podstawy działania NTFS
Tablica MFT to główny plik metadanych. Oprócz
niego NTFS posługuje się jeszcze dziesięcioma
innymi plikami systemowymi, w których
gromadzi informacje o zabezpieczeniach,
przydziałach dyskowych, odnalezionych
uszkodzonych sektorach itd. Wśród nich jest
także dziennik operacji woluminu. Windows
wykorzystuje go do przywracania spójności
systemu plików po awarii.
27
Podstawy działania NTFS
Plik MFT jest bardzo ważny dlatego też NTFS
wprowadza specjalne zabezpieczenie by nie uległ
fragmentacji. Mianowicie rezerwuje on wstępnie
jakiś procent przestrzeni dysku by zachować
ciągłość wpisywanych do tego pliku danych, więc
na czystej partycji NTFS już mamy zajętą
przestrzeń pod ten plik dla wpisów które mają się
pojawić w przyszłości. Jeżeli pliki skasujemy z
partycji NTFS to ich wejścia w pliku MFT są
oznaczone jako "wolne" i "do ponownego
wykorzystania" ale rozmiar pliku nie spada.
Wstępnie rozmiar pliku jest określony
proporcjonalnie do rozmiaru partycji jako 12%.
28
Klaster to podstawa
Zarówno FAT, jak i NTFS korzystają z jednostek
alokacji powszechnie nazywanych klastrami.
Typowe rozmiary klastra to np. 512 bajtów, 4 KB,
16 KB lub 32 KB. Wielkość klastra jest równa
wielkości sektora lub stanowi jej wielokrotność.
Sektor to jednostka, którą fizyczny dysk
wykorzystuje do adresowania danych; z reguły ma
512 bajtów.
29
Klaster to podstawa
30