Armazenamento Secundário

Download Report

Transcript Armazenamento Secundário

Armazenamento Secundário
Modelo de Von Neumann
Periféricos de
Entrada/Saída
UC
UAL
Registradores
Memória
Memória Principal/Primária
RAM/DRAM/SDRAM
caché
Hierarquia
de
memória
Memória Secundária
Discos magnéticos / ópticos
Memória Terciária
Fitas/cartuchos magnéticos
UCP
- não voláteis
- normalmente magnéticas
- muito lentas (em relação à mem.
principal – solução: caché)
Abordagem nessa aula:
- Discos Magnéticos
- Interfaces
- R.A.I.D.
Enderson Ferreira - [email protected]
memory bus (barramento de memória)
cache L1
cache L2
UCP
Memória
Adaptador de
barramento
I/O bus (barramento de E/S)
Controlador
de disco
Controlador
de vídeo
Controlador
de teclado
Interface
Paralela
Interface
Serial
Enderson Ferreira - [email protected]
Controlador
de barramento
universal
Discos Magnéticos e Interfaces
Enderson Ferreira - [email protected]
Discos Magnéticos e Interfaces
Pratos
Trilhas
Setores
Prato
Trilha
Enderson Ferreira - [email protected]
Discos Magnéticos e Interfaces
Parâmetros de desempenho:
- tempo médio de busca
- atraso rotacional ou latência de rotação
- tempo de transferência
- sobretaxa de transferência
- atraso em fila
Parâmetros de confiabilidade:
- MTBF = MTTF
- taxa de erros de leitura de bit recuperáveis
- taxa de erros de leitura de bit irrecuperáveis
Enderson Ferreira - [email protected]
Discos Magnéticos e Interfaces
Especificações técnicas de confiabilidade de discos magnéticos.
(Seagate, 2002)
Enderson Ferreira - [email protected]
Discos Magnéticos e Interfaces
Mecanismos de Detecção e Predicção de Erros:
- CRC (Cyclic Redundancy Check)
- S.M.A.R.T. (Self-Monitoring, Analysis and
Reporting Technologies)
Interfaces:
- IDE/ATA vs SCSI
- Alternativas:
- USB
- Firewire IEEE-1394
- Canais de fibra (fiber channel)
- Serial ATA
Enderson Ferreira - [email protected]
Topologia das Interfaces (SCSI)
Controladora de
E/S
barramento PCI
Controladora
SCSI
canal 0
ID0
ID1
ID2
canal 1
ID0
ID1
ID2
ID16
Enderson Ferreira - [email protected]
ID16
Tabela de versões da interface SCSI
(DOMINGUEZ; COLLIGAN, 1999)
Padrão SCSI
Tamanho
máximo de
cabo
6m
Velocidade
do
barramento
5 MHz
Largura de
barramento
Taxa de
transf.
SCSI-1
Qtde de
discos
suportados
8
8
5MB/s
Fast SCSI
8
3m
10 MHz
8
10 MB/s
SCSI-2
8
3m
5 MHz
8
5 MB/s
Fast/Wide
Scsi-2
Ultra SCSI
16
3m
10 MHz
16
20 MB/s
8
1,5 m
20 MHz
8
20 MB/s
Ultra/Wide
SCSI
Ultra2 SCSI
(LVD)
Ultra3/160
SCSI
16
1,5 m
20 MHz
16
40 MB/s
16
12 m
40 MHz
16
80 MB/s
16
12 m
40 MHz
16
160
MB/s
Enderson Ferreira - [email protected]
Topologia das Interfaces (ATA / SATA)
Controlador
ATA
Canal ATA
Primário
Mestre
Escravo
Mestre
Escravo
Canal ATA
Secundário
Controlador
Serial ATA
SATA Port
SATA Drive
SATA Port
SATA Drive
- 16 linhas de dados (paralela)
- até 133MB/s (DMA modo 6)
- 2 devices por canal/cabo
- 40 pinos cabo de dados
- 4 pinos cabo de alimentação
- 4 linhas de dados (serial Tx e Rx)
- 1,5Gb/s diferential NRZ serial stream
- 1 device por SATA port
- 7 pinos conector de dados
-15 pinos conector de alimentação
Especificação em : http://www.serialata.org
Enderson Ferreira - [email protected]
Tabela de versões da interface ATA
(DOMINGUEZ; COLLIGAN, 1999)
Modo de Transferência de
Dados
Taxa máxima de
Transferência de Dados
Pinos por
Conector
Quantidade de
Condutores
Versão ATA
PIO Modo 0
3,33 MB/s
40
40
ATA-1
PIO Modo 1
5,22 MB/s
40
40
ATA-1
PIO Modo 2
8,33 MB/s
40
40
ATA-1
PIO Modo 3
11,1 MB/s
40
40
Fast ATA
PIO Modo 4
16,7 MB/s
40
40
ATA-3
DMA Modo 1
11,1 MB/s
40
40
Fast ATA
DMA Modo 1 (Multiword)
13,3 MB/s
40
40
ATA-2
DMA Modo 2 (Multiword)
16,6MB/s
40
40
ATA-3
Ultra ATA DMA Modo 2
33,3 MB/s
40
40
ATA-4
Ultra ATA DMA Modo 3
44,4 MB/s
40
80
ATA-5
Ultra ATA DMA Modo 4
66,6 MB/s
40
80
ATA-5
Ultra ATA 100 DMA Modo 5
99,9 MB/s
40
80
ATA-5
Ultra ATA 133 DMA Modo 6
133 MB/s
40
80
ATA-5
Enderson Ferreira - [email protected]
Topologia das Interfaces (Fiber Channel)
Servidor
Servidor
Discos
Rx
Tx
Tx
Rx
Tx
Rx
Rx
Ponto a Ponto
Tx
Loop Arbitrário
Comutador
Comutação de Malha
Servidores
Matrizes de Disco
Enderson Ferreira - [email protected]
A Importância do Armazenamento
Secundário
(COURTRIGHT, 1997)
processor-centric
data-centric
Enderson Ferreira - [email protected]
Fragmentação de Dados
64KBytes
16KBytes
16KBytes
16KBytes
16KBytes
Enderson Ferreira - [email protected]
Fragmentação de Dados
9GB
9GB
9GB
9GB
9GB
9GB
9GB
1 Disco lógico de 63 GB
Matriz de 7x9GB de discos físicos
Enderson Ferreira - [email protected]
Fragmentação de Dados
- Kim e Salem, 1984
- alto desempenho
- paralelismo de instruções de E/S independentes
- instruções de E/S abrangendo dados fragmentados em
múltiplos discos
- baixa confiabilidade
MTTFdisco
MTTFmatriz 
Número Dis cos
Enderson Ferreira - [email protected]
R. A. I. D.
- David Patterson, 1988 - Universidade Berkeley - Califórnia
- acrônimo de “Redundant Array of Inexpensive Disks”
Matrizes
Redundantes
de Discos de Baixo Custo
Enderson Ferreira - [email protected]
RAIDs Originais
- RAID nível 1 - Espelhamento
- RAID nível 2 - Código de Hamming
- RAID nível 3 - Paridade N+1 - Entrelaçamento nível de byte
- RAID nível 4 - Paridade N+1 - Entrelaçamento nível de bloco
- RAID nível 5 - Paridade N+1 Distribuída - Entrelaçamento
nível de bloco
Enderson Ferreira - [email protected]
RAID nível 1 - Espelhamento
Bit Dados 1
Bit Dados 2
Bit Dados 3
Bit Dados 4
Bit Verificação 1
Bit Verificação 2
Bit Verificação 3
Bit Verificação 4
DISCO 0
DISCO 1
DADOS
ESPELHADOS
Enderson Ferreira - [email protected]
RAID nível 1 - Espelhamento
- Palavra código: 2 bits – 1 dado e 1 verificação
- alto custo - Sobretaxa = 100%
- alto desempenho leitura
- acesso simultâneo em ambos discos
- política de escolha do disco a ser acessado pela
estimativa do tempo de busca para cada instrução de leitura
- alta confiabilidade – simplicidade na implementação
Enderson Ferreira - [email protected]
RAID nível 2 – Código de Hamming
A-D0-3 = Bits de dados
ECC A-Dx, ECC A-Dy, ECC A-Dz = paridades dos subconjuntos de A-D0-3
A0
A1
A2
A3
ECC Ax
ECC Ay
ECC Az
B0
B1
B2
B3
ECC Bx
ECC By
ECC Bz
C0
C1
C2
C3
ECC Cx
ECC Cy
ECC Cz
D0
D1
D2
D3
ECC Dx
ECC Dy
ECC Dz
Enderson Ferreira - [email protected]
Código de Hamming
b1 b2 b3 b4 b5 b6 b7
b1, b2 e b4 = verificação
b3, b5, b6 e b7 = dados (1011)
b1
b3
b2
b1
b7
b4
1
b2
1
0
1
b6
b5
Palavra Código
0 1 1 0 0 1 1
1
1
0
1
b4
Enderson Ferreira - [email protected]
1
0
0
Código de Hamming
Detecção e Correção de Erro
Leitura errada do bit 5
0 1 1 0 1 1 1
1
0
1
b1 e b4 não conferem.
Soma-se os índices para
detectar o bit errado
b5
1
1
1
0
Enderson Ferreira - [email protected]
RAID nível 2 – Código de Hamming
(m  r  1)  2
r
Tamanho msg em
bits (m)
4
Núm. de bits de
redundância (r)
3
Tam. da palavra
código em bits (n)
7
Percentual de
sobretaxa
75
8
4
12
50
16
5
21
31
32
6
38
19
64
7
71
11
128
8
136
6
256
9
265
4
512
10
522
2
1024
11
1035
1
Enderson Ferreira - [email protected]
RAID nível 3 - Paridade N+1
Entrelaçamento nível de byte
B1
B4
B7
B10
...
B2
B5
B8
B11
...
B3
B6
B9
B12
...
P(B1,B2,B3)
P(B4,B5,B6)
P(B7,B8,B9)
P(B10,B11,B12)
...
DISCO 0
DISCO 1
DISCO 2
DISCO 3
bn = bits de dados
P(bx,by,bz) = paridade de bx, by e bz
Enderson Ferreira - [email protected]
RAID nível 3 - Paridade N+1
Entrelaçamento nível de byte
- Palavra Código: N+1 bits – paridade par ou XOR dos N bits
P0  5  D0  D1 D2  D3  D4  D5
- mínimo de 3 discos
- Confiabilidade: detecção simples de erro por paridade
- baixo custo – Sobretaxa = 1/N-1
- Stripe = 1 byte
- alto desempenho em pequenas leituras
- baixo desempenho em grandes leituras/escritas
Enderson Ferreira - [email protected]
RAID nível 4 - Paridade N+1
Entrelaçamento nível de bloco
K0
K1
K2
B0
B1
B2
...
B511
B512
B513
B514
...
B1023
B1024
B1025
B1026
...
B1535
P(B0,B512,B1024)
P(B1,B513,B1025)
P(B2,B514,B1026)
...
P(B511,B1023,B1535
K3
K4
K5
P(K3,K4,K5)
K6
K7
K8
P(K6,K7,K8)
DISCO 1
DISCO 2
DISCO 3
DISCO 0
P(K0,K1,K2)
Bn = byte de dados
Kn = Blocos de dados de 512 Bytes
P(Bx,By,Bz) = paridade de Bx, By e Bz P(Kx,Ky,Kz) = bloco de paridade de Kx, Ky e Kz
Enderson Ferreira - [email protected]
RAID nível 4 - Paridade N+1
Entrelaçamento nível de bloco
- custo e confiabilidade idem RAID 3
- bom desempenho em grandes leituras
- baixo desempenho em escrita
- gargalo: disco de paridade - operações RMW
Enderson Ferreira - [email protected]
RAID nível 5 - Paridade N+1 distribuída
Entrelaçamento nível de bloco
K0
K1
K2
P(K3,K4,K5)
K3
K4
K5
K6
P(K6,K7,K8)
K7
K8
K9
K10
DISCO 0
DISCO 1
P(K9,K10,K11)
DISCO 2
P(K0,K1,K2)
K11
DISCO 3
Bn = byte de dados
Kn = Blocos de dados de 512 Bytes
P(Bx,By,Bz) = paridade de Bx, By e Bz P(Kx,Ky,Kz) = bloco de paridade de Kx, Ky e Kz
Enderson Ferreira - [email protected]
RAID nível 5 - Paridade N+1 distribuída
Entrelaçamento nível de bloco
- custo e confiabilidade idem RAIDs 3 e 4
- baixo desempenho em pequenas escritas
- desempenho aceitável para grandes escritas
- paridade distribuída
Enderson Ferreira - [email protected]
RAIDs Derivados - RAID 0 (Sem Redundância)
K0
K1
K2
K3
K4
K5
K6
K7
K8
K9
K10
K11
K12
K13
K14
K15
DISCO 1
DISCO 2
DISCO 3
DISCO 0
Enderson Ferreira - [email protected]
RAIDs Derivados - Matriz Bi-dimensional de Disco
INFORMAÇÃO
0
1
2
A
3
4
5
B
6
7
8
C
D
E
F
VERIFICAÇÃO
Enderson Ferreira - [email protected]
RAIDs Derivados - Matriz Bi-dimensional de Disco
Sobretaxa % 
M N
.100 | M  1 e N  1
M .N  M  N
Discos
de Dados (D)
4
Discos de
Paridade (P)
4
Total de
discos (N)
8
Sobretaxa
50%
Sobretaxa
Hamming / N
75% / 7
6
5
11
45%
50% / 12
8
6
14
43%
9
6
15
40%
10
7
17
41%
12
7
19
37%
31% / 21
25
10
35
29%
19% / 32
100
20
120
17%
6% / 128
1000
110
1110
10%
1% / 1024
Enderson Ferreira - [email protected]
Falhas de Sistemas
~
MTTF=
123.000
horas
Alimentação
AC - MTTF=4.900 horas
Controladora SCSI
MTTF=120.000 horas
Cabo Scsi
MTTF=21.000.000 horas
Fonte
Ventilação
MTTF=
195.000 horas
Cabo alimentação
MTTF=10.000.000 horas
Discos
MTTFs CARACTERÍSTICOS DE ALGUNS COMPONENTES DE SISTEMA
Enderson Ferreira - [email protected]
Solução para Tolerância a Falhas de Sistema
Solução: Redundância nos Pontos Críticos de Falha
Enderson Ferreira - [email protected]
RAIDs Derivados - Ortogonal
Opção 2
Controladores de
Barramento ou Cadeia
Opção 1
Enderson Ferreira - [email protected]
RAIDs Derivados - RM-2 (Redundant Matrix)
- possibilita dupla falha simultânea de disco sem perda de dados
- utiliza dupla paridade
- sobretaxa com redundância = 1/M e N = 2M+1
D0
D1
D2
D3
P12
P23
P30
P01
Enderson Ferreira - [email protected]
RAIDs Derivados - Dados e Paridade não entrelaçados
A0
A1
A2
B0
B1
B2
C0
C1
C2
A512
A513
A514
B512
B513
B514
C512
C513
C514
P(B0,C0)
P(B1,C1)
P(B2,C2)
P(A0,C512)
P(A1,C513)
P(A2,C514)
P(A512,B512)
P(A513,B513)
P(A514,B514)
DISCO 0
DISCO 1
DISCO 2
- idealizado para sistemas
de Banco de Dados
(Gray et al. apud Gibson, 1991)
- melhor desempenho
em pequenas leituras
-mesmo custo de N+1,
alternativa para mirror
- não fragmenta os dados:
cada disco corresponde
a 1 sistema de arquivos
Enderson Ferreira - [email protected]
RAIDs Derivados - Código Não-Binário
+
*1
*1
A
*1
Modulo 2
+
C2
Binário
C1
*1
*1
B
*1
+
C1
A
Modulo 4
B
*2
*1
+
Não-Binário
C1  C 2  ( A  B ) mod 2
A  f (C1, C 2) ?
B  g (C1, C 2) ?
C1  ( A  B) mod 4
C 2  ( A  2 B) mod 4
A  (2C1  C 2) mod 4
B  (C 2  C1) mod 4
Enderson Ferreira - [email protected]
C2
RAIDs Derivados - RAID em Camadas
RAID 0+1
D0
D3
D0’
D2
D0’
D2’
D2
D4
D1’
RAID 1
RAID 1
RAID 1
D5
D1
D3
D5
Enderson Ferreira - [email protected]
RAID 0
D1’
D0
D4
RAID 0
RAID 0
D1
RAID 1
RAIDs Derivados - RAID em Camadas
RAID 0+3
RAID 0
D0’
D0
D1
D2
D1’
D3
D4
D5
RAID 0
D2’
D6
D7
D8
Enderson Ferreira - [email protected]
RAID 3
RAID 0
Referências
ASHAR, Kanu G. Magnetic Disk Drive Technology: Heads, Media, Channel, Interfaces and Integration. New York, USA: IEEE Press, 1996.
CARDENAS, D. Glen; CATENA, Jose-Maria. SCSI vs. IDE. A Complete Assessment. Site ProRec.com, 2000. Disponível em
<http://www.prorec.com/prorec/articles.nsf/articles/1A37C1C69674D6D786256950005D2C39>. Acesso em 13 dez. 2002.
COURTRIGHT, William V. A Transactional Approach to Redundant Disk Array Implementation. A Dissertation submitted to the
Department of Electrical and Computer Engineering in Partial Fulfillment of the Requirements for the Degree of Doctor of Philosophy.
Pittsburgh: Carnegie Mellon University, 1997.
DOMINGUEZ, Ricardo; COLLIGAN, Tom. SCSI vs. ATA: Interface Comparison. Site da Dell Computer Corporation: Vectors Technology
Information Center, 1999. Disponível em <http://www.dell.com/us/en/gen/topics/vectors_1999-atascsi.htm>. Acesso em 8 ago. 2002.
FERREIRA, Enderson; ALMEIDA JR, Jorge Rady de. Análise de Confiabilidade de Sistemas Redundantes de
Armazenamento em Discos Magnéticos. São Paulo,2003. 145 p. (Mestrado) – EPUSP / PCS
GIBSON, Garth A. Redundant Disk Arrays - Reliable, Parallel Secondary Storage. The MIT Press, 1991.
GILBERT, H. IDE and SCSI Disks. Das Boot, PC Lube and Tune, 1995. Disponível em <http://www.yale.edu/pclt/BOOT/DISKDEV.HTM>.
Acesso em 16 jan. 2003.
HWANG, Kai; JIN, Hai; HO, Roy S. C. Orthogonal Striping and Mirroring in Distributed RAID for I/O-Centric Cluster Computing.
IEEE Transactions on Parallel and Distributed Systems, 2002.
IBM. Self-Monitoring, Analysis and Reporting Technology. How S.M.A.R.T are your hard disk drives? Site da IBM: IBM Personal
Systems Group, 1998. Disponível em <http://www.pc.ibm.com/us/infobrf/ibsmart.html>. Acesso em 12 dez. 2002.
PATTERSON, David A., CHEN, Peter, GIBSON, Garth, KATZ, Randy H. Introduction to Redundant Arrays of Inexpensive Disks.
Berkeley: University of California, 1989.
SEAGATE. Especificações Técnicas HDs. Site da Seagate Technology LLC, 2002. Disponível em
<http://www.seagate.com/cda/products/discsales/index>. Acesso em 18 nov. 2002.
Enderson Ferreira - [email protected]