Macierze dyskowe

Download Report

Transcript Macierze dyskowe

Macierze RAID
ang. Redundant Array of Independent Disks,
Nadmiarowa macierz niezależnych dysków
Cele RAID
• zwiększenie niezawodności (odporność na awarie),
• zwiększenie wydajności transmisji danych,
• powiększenie przestrzeni dostępnej jako jedna
całość.
Kontroler RAID
RAID 0 striping
Wydajność w porównaniu do pojedynczego dysku twardego wzrasta nkrotnie, gdzie n to liczba dysków w macierzy RAID 0. Oznacza to, że
macierz RAID 0 składająca się z dwóch dysków twardych, jest
dwukrotnie bardziej wydajna od pojedynczego dysku – macierz
złożona z czterech dysków, jest już czterokrotnie wydajniejsza od
pojedynczego dysku.
Rozmiar całej macierzy równy jest n-krotności najmniejszego z
dysków w tej macierzy, gdzie n to liczba dysków.
– Operacje odczytu i zapisu przeprowadzane są równolegle na wielu
dyskach (jeżeli wielkość danych odczytywanych i zapisywanych jest
większa niż blok danych macierzy)
– Zapisując dane o wielkości mniejszej niż ustalony blok danych
zapisane zostaną tylko na jednym dysku
RAID 0 striping
Zasada działania RAID 0 jest następująca
– Macierz stworzona z kilku dysków widoczna jest dla systemu jako
jeden wolumin. Dane zapisywane na owym woluminie logicznym
dzielone są na bloki danych (wielkość bloku określana jest podczas
tworzenia macierzy), a następnie bloki te przeplatane są pomiędzy
kolejnymi dyskami w macierzy.
RAID 0 striping
Korzyści:
• przestrzeń wszystkich dysków jest widziana jako całość,
• przyspieszenie zapisu i odczytu w porównaniu do
pojedynczego dysku.
Wady:
• brak odporności na awarię dysków,
• N*rozmiar najmniejszego z dysków (zwykle łączy się
jednakowe dyski),
• zwiększenie awaryjności. Awaria pojedynczego dysku
powoduje utratę wolumenu, a szansa na awarię jednego
z N dysków rośnie wraz z N.
RAID 0 striping
Przykład 1
Trzy dyski po 500 GB zostały połączone w RAID 0. Powstała przestrzeń ma rozmiar
1,5TB. Szybkość zapisu i odczytu jest prawie trzykrotnie większa niż na pojedynczym
dysku. Sumaryczna szybkość jest 3-krotnością szybkości najwolniejszego z dysków,
gdyż kontroler raid podczas zapisu/odczytu musi poczekać na najwolniejszy dysk. Stąd
też sugeruje się stosowanie dysków o identycznej szybkości i pojemności.
Przykład 2
Trzy dyski: 160 GB, 500 GB i 80 GB zostały połączone w RAID 0. Powstała w
ten sposób przestrzeń ma rozmiar taki jak N*rozmiar najmniejszego z dysków, czyli 3·80
GB = 240 GB. Szybkość jest ograniczona szybkością najwolniejszego dysku,
analogicznie do poprzedniego przykładu.
RAID 0 striping
Zastosowanie RAID 0:
- amatorzy edycji video, edycji dźwięku,
twórcy grafiki trójwymiarowej lub
posiadacze domowych serwerów.
RAID 1 mirroring
Macierz RAID 1 składa się z przynajmniej dwóch
dysków twardych, przy czym pojemność całej
macierzy wynosi tyle ile pojemność
najmniejszego z dysków w tejże macierzy. RAID
1 ma za zadanie dokonywać na n dyskach
(gdzie n to liczba dysków w macierzy) zmian
identycznych, jakie zachodzą na dysku
woluminie logicznym. Oznacza to, że dane
zapisywane na woluminie logicznym kopiowane
są w locie na wszystkie dyski w macierzy.
RAID 1 mirroring
RAID 1 mirroring
Korzyści:
• odporność na awarię N – 1 dysków przy N-dyskowej macierzy
• możliwe zwiększenie szybkości odczytu
• możliwe zmniejszenie czasu dostępu
• Wady:
• możliwa zmniejszona szybkość zapisu
• utrata pojemności (całkowita pojemność jest taka jak pojemność
najmniejszego dysku)
RAID 10 (1+0)
Konfiguracja RAID 10 to połączenie dwóch poprzednich trybów. Rozwiązanie to
wymaga minimum czterech dysków twardych, ale przy tym zapewnia
podwyższoną wydajność zaczerpniętą z RAID 0 przy zachowaniu
bezpieczeństwa znanego z RAID 1.
Macierz RAID 10 działa w następujący sposób:
– Dane zapisywane na wolumenie logicznym dzielone są na bloki danych o
określonym podczas tworzenia macierzy rozmiarze (jeśli dane mają rozmiar
większy niż pojedynczy blok).
– Bloki danych zapisywane są równolegle, z przeplotem kolejności na
dyskach w macierzy
– Dyski w macierzy RAID 0 posiadają swój mirror dzięki zastosowaniu
„podmacierzy” RAID 1.
RAID 10 to wydajne i bezpieczne rozwiązanie, jednak pojemność macierzy
RAID 10 równa jest połowie pojemności wszystkich dysków w macierzy. Z
uwagi na zastosowanie w konstrukcji macierzy rozwiązań RAID 1, macierz
ta ograniczona jest także wydajnością, która teoretycznie będzie wynosiła
połowę n-krotności najwolniejszego dysku w macierzy (gdzie n to liczba
dysków w macierzy).
RAID 10 (1+0)
RAID 2
•
•
•
•
•
•
Dane na dyskach są paskowane. Zapis następuje po 1 bicie na pasek.
Potrzebujemy minimum 8 powierzchni do obsługi danych oraz dodatkowe
dyski do przechowywania informacji generowanych za pomocą kodu
Hamminga potrzebnych do korekcji błędów. Liczba dysków używanych do
przechowywania tych informacji jest proporcjonalna do logarytmu liczby
dysków, które są przez nie chronione. Połączone dyski zachowują się jak
jeden duży dysk. Dostępna pojemność to suma pojemności dysków
przechowujących dane.
Korzyści:
każdy dowolny dysk (zarówno z danymi jak i z kodem Hamminga) może w
razie uszkodzenia zostać odbudowany przez pozostałe dyski
Wady:
konieczność dokładnej synchronizacji wszystkich dysków zawierających
kod Hamminga (w przeciwnym wypadku dezorganizacja i całkowita
nieprzydatność tych dysków)
długotrwałe generowanie kodu Hamminga przekładające się na wolną
pracę całego systemu
RAID 2
Dane na dyskach są paskowane. Zapis następuje po 1
bicie na pasek. Potrzebujemy minimum 8 powierzchni do
obsługi danych oraz dodatkowe dyski do
przechowywania informacji generowanych za pomocą
kodu Hamminga potrzebnych do korekcji błędów. Liczba
dysków używanych do przechowywania tych informacji
jest proporcjonalna do logarytmu liczby dysków, które są
przez nie chronione. Połączone dyski zachowują się jak
jeden duży dysk. Dostępna pojemność to suma
pojemności dysków przechowujących dane. Żadko
stosowane ze względu na duży stopień skomplikowania.
RAID 3
Dane składowane są na N-1 dyskach. Ostatni dysk służy do przechowywania
sum kontrolnych. Działa jak striping (RAID 0), ale w macierzy jest dodatkowy
dysk, na którym zapisywane są kody parzystości obliczane przez specjalny
procesor.
Korzyści:
• odporność na awarię 1 dysku,
• zwiększona szybkość odczytu
Wady:
• zmniejszona szybkość zapisu z powodu konieczności kalkulowania sum
kontrolnych (eliminowana poprzez zastosowanie sprzętowych kontrolerów
RAID)
• w przypadku awarii dysku dostęp do danych jest spowolniony z powodu
obliczeń sum kontrolnych
• odbudowa macierzy po wymianie dysku jest operacją kosztowną
obliczeniowo i powoduje spowolnienie operacji odczytu i zapisu
• pojedynczy, wydzielony dysk na sumy kontrolne zazwyczaj jest "wąskim
gardłem" w wydajności całej macierzy
RAID 3
RAID 4
• RAID 4 jest bardzo zbliżony do RAID 3, z tą różnicą, że dane są
dzielone na większe bloki (16, 32, 64 lub 128 kB). Takie pakiety
zapisywane są na dyskach podobnie do rozwiązania RAID 0. Dla
każdego rzędu zapisywanych danych blok parzystości zapisywany
jest na dysku parzystości.
• Przy uszkodzeniu dysku dane mogą być odtworzone przez
odpowiednie operacje matematyczne. Parametry RAID 4 są bardzo
dobre dla sekwencyjnego zapisu i odczytu danych (operacje na
bardzo dużych plikach). Jednorazowy zapis małej porcji danych
potrzebuje modyfikacji odpowiednich bloków parzystości dla każdej
operacji I/O. W efekcie, za każdym razem przy zapisie danych
system czekałby na modyfikacje bloków parzystości, co przy
częstych operacjach zapisu bardzo spowolniłoby pracę systemu.
RAID 4
RAID 5
•
•
Poziom piąty pracuje bardzo podobnie do poziomu czwartego z tą różnicą,
iż bity parzystości nie są zapisywane na specjalnie do tego przeznaczonym
dysku, lecz są rozpraszane po całej strukturze macierzy. RAID 5 umożliwia
odzyskanie danych w razie awarii jednego z dysków przy wykorzystaniu
danych i kodów korekcyjnych zapisanych na pozostałych dyskach (zamiast
tak jak w 3. na jednym specjalnie do tego przeznaczonym, co nieznacznie
zmniejsza koszty i daje lepsze gwarancje bezpieczeństwa). RAID 5 oferuje
większą prędkość odczytu niż lustrzany (ang. mirroring) ale przy jego
zastosowaniu nieznacznie spada prędkość zapisu. Poziom piąty jest
bezpieczny dla danych – w razie awarii system automatycznie odbuduje
utracone dane, tak by mogły być odczytywane, zmniejszając jednak bieżącą
wydajność macierzy. Spowolnienie ma charakter przejściowy, zaś jego czas
zależy od obciążenia macierzy i pojemności dysku. Po zamontowaniu
nowego dysku i odbudowaniu zawartości dysku wydajność macierzy wraca
do normy.
Macierz składa się z 3 lub więcej dysków. Przy macierzy liczącej N dysków
jej objętość wynosi N – 1 dysków. Przy łączeniu dysków o różnej
pojemności otrzymujemy objętość najmniejszego dysku razy N – 1. Sumy
kontrolne CRC danych dzielone są na N części, przy czym każda część
składowana jest na innym dysku, a wyliczana jest z odpowiedniego
fragmentu danych składowanych na pozostałych N-1 dyskach.
RAID 5
RAID 6
• Macierz z podwójną parzystością, realizowana
np. jako 5+2, albo 13+2. Kosztowniejsza w
implementacji niż RAID 5, ale dająca większą
niezawodność. Awaria dwóch dowolnych
dysków w tym samym czasie nie powoduje
utraty danych.
• Korzyści:
• odporność na awarię maksimum 2 dysków
• szybkość pracy większa niż szybkość
pojedynczego dysku.
RAID 6
NAS Network Attached Storage
•
technologia umożliwiająca podłączenie zasobów pamięci dyskowych
bezpośrednio do sieci komputerowej.
•
Dzięki takiemu rozwiązaniu można łatwo skonfigurować dostęp do danych
znajdujących się w jednym miejscu z różnych punktów sieci. Zaletą NAS jest
możliwość jego stosowania w heterogenicznych sieciach opartych na różnych
rozwiązaniach klienckich przez co dane są osiągalne bez względu na rodzaj
zainstalowanego systemu operacyjnego.
NAS