37
Especialização em Segurança da Informação Segurança no Armazenamento 1. Introdução Márcio Aurélio Ribeiro Moreira [email protected] http://si.uniminas.br/~marcio/ Pós-SI – 3ª Turma – 2008

Segurança no Armazenamento

Embed Size (px)

Citation preview

Page 1: Segurança no Armazenamento

Especialização em Segurança da Informação

Segurança no Armazenamento1. Introdução

Márcio Aurélio Ribeiro [email protected]://si.uniminas.br/~marcio/

Pós-SI – 3ª Turma – 2008

Page 2: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Objetivos do capítulo

Explicitar a necessidade de armazenamentoAvaliar as alternativas de soluçãoRevisar os principais conceitos de

armazenamentoExplorar os tipos de RAIDMostrar as alternativas de redes de

armazenamento

Márcio Moreira 1. Introdução – Slide 2

Page 3: Segurança no Armazenamento

Segurança no Armazenamento de Informações

O armazenamento não está resolvido?

O número total de livros produzidos desde o começo da impressa não passa de 1 bilhão:Se cada livro tiver em média 500 páginas com

2000 caracteres cada. Logo, 1 MB é suficiente para armazenar cada livro sem compressão

Para armazenar todos os livros precisamos de 1 bilhão de MB ou 1 PetaByte (PB)

Considerando Us$20 / GB, 1 PB pode ser comprado por Us$20 milhões

Márcio Moreira 1. Introdução – Slide 3

Page 4: Segurança no Armazenamento

Segurança no Armazenamento de Informações

O armazenamento nas organizações

Banco da Índia:14.000 filiais em todo o país11.000 escritórios conectados ao Data CenterMais de 20 milhões de clientes≈ 100 TB armazenados

Crescimento exponencial

Questões de segurança:Compressão / CifragemAntivírusFirewall e IDS

Márcio Moreira 1. Introdução – Slide 4

Fonte: Ramakrishnan

Page 5: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Demanda de performance e espaço

Márcio Moreira 1. Introdução – Slide 5

1X

2X

3X

4X

5X

6X

7X

8X

Hoje 1 Ano 2 anos 3 anos 4 anos 5 anos

50%

100%

150%

200%

250%

300%

DemandaPerformance

DemandaEspaço

Demanda anual de 50% de espaço e

performance

1X 1.5X2.3X

3.4X

5.1X

7.6X

253%

169%

113%

75%50%

Fon

te:

Ram

akris

hnan

Page 6: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Alternativas para a demanda

Podemos resolver com RAMs?Caras e voláteis só para processamento

Podemos utilizar fitas?Baratas e lentas por serem seqüenciais backups

Podemos resolver com CDs e DVDs?Baratos e aleatórios. Mas, lentos distribuição

Podemos resolver com HDs?Preço justo, aleatórios e rápidos muitos HDsOnde colocar tantos HDs? Fora do gabinete

Márcio Moreira 1. Introdução – Slide 6

Page 7: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Camadas de dados

Márcio Moreira 1. Introdução – Slide 7

ComputadoresNotebooks

Dispositivos

Pessoas e Coisas

Camada de Banco de Dados

Camada web

Camada Aplicações

Camada de StorageFonte: Ramakrishnan

Page 8: Segurança no Armazenamento

Segurança no Armazenamento de Informações

1º dispositivo magnético

Márcio Moreira 1. Introdução – Slide 8

A superfície do disco (ou fita) é coberta com uma substância magnética

Movimento mecânico posiciona cabeça do dispositivo para:

Gravação: definir a polarização. Leitura: testar a polarização

Por ser magnética, a polarização é mantida mesmo sem energia

Page 9: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Armazenamento em discos

Organiza os dados em áreas endereçáveisDevem ser formatados para serem endereçáveis

pelos sistemas operacionaisO acesso direto provê performance adequada para

acessos seqüencial ou randômicoO desempenho do disco é impactado pelo tempo

de posicionamento da cabeça para o acessoOs discos são conectados fisicamente ao sistema:

É inviável movê-los para um novo local ou novo sistemaComo conectar vários discos num mesmo sistema?

Márcio Moreira 1. Introdução – Slide 9

Page 10: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Vamos olhar os discos de perto

Márcio Moreira 1. Introdução – Slide 10

Page 11: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Formatação para acesso direto

Márcio Moreira 1. Introdução – Slide 11

Trilha Cada prato do disco é segmentado em vários anéis concêntricos chamados trilhas

O endereço único de uma área em um drive de O endereço único de uma área em um drive de disco é composto de: Cilindro, Cabeça e Setor.disco é composto de: Cilindro, Cabeça e Setor.

Um setor é a menor parte endereçável de uma trilha

Setor

Fonte: EMC

Cilindro Um cilindro é o conjunto formato por uma trilha específica em todos os pratos juntas

Page 12: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Tempo de acesso ao drive de disco

Seek Time:Tempo de buscaMédia de tempo gasto

para mover o braço do atuador para a posição de leitura ou gravação da cabeça na trilha

Márcio Moreira 1. Introdução – Slide 12

Fonte: EMC

Page 13: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Tempo de acesso ao drive de disco

Latency:Tempo de LatênciaMédia de tempo gasto

para esperar o disco girar e o setor desejado chegar o início da posição de acesso

Também conhecido como espera racional

Márcio Moreira 1. Introdução – Slide 13

Fonte: EMC

Page 14: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Tempo de acesso ao drive de disco

Transfer Rate:Taxa de TransferênciaMédia de tempo gasto

para ler (ou escrever) e enviar (ou receber) os dados do setor para o drive de disco

Márcio Moreira 1. Introdução – Slide 14

Fonte: EMC

Page 15: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Variáveis da performance de discos

Tempo de buscaVelocidade rotação RPM:

RPM Latência RPM tem menor

impacto na Taxa de Transferência

Velocidade da interface do drive:Ultra SCSI: 40 MB/secCanal de fibra:100 MB/sec

Márcio Moreira 1. Introdução – Slide 15

Fonte: EMC

Page 16: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Evolução da tecnologia de discos

A capacidade continua aumentando muito com o aumento da densidade dos dados

A performance aumenta marginalmente com: Aumento da velocidade de rotação (RPM) Aumento do uso da memória e cache no nível de drive

As interfaces são dirigidas por padrões da indústria: ATA (Advanced Technology Attachment) Ultra SCSI (Small Computer System Interface) Canal de Fibra

Desafios da indústria: Aumentar a capacidade por disco reduzindo custo. Mas, … Reduzir o número de atuadores mantendo a capacidade

Márcio Moreira 1. Introdução – Slide 16

Fonte: EMC

Page 17: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Necessidades de armazenamento

Márcio Moreira 1. Introdução – Slide 17

High-EndUs$40/GB

Deman-da do

negócio

Alta Performance

Tempo Crítico Midrange Us$20/GB

SATAUs$5/GB

TapeUs$0.5/GB

Alta Capacidade

Custo Crítico

100%

99.999%

99.9%

Longo PrazoFonte: Ramakrishnan

Page 18: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Tecnologia RAID

Como obter performance e confiabilidade?RAID:

Redundant Array of Independent DisksUm conjunto de HDs é visto pelo SO como uma única unidade

de disco

Vantagens:Grande capacidade de armazenamentoAcesso paralelo melhor performancePermite o espelhamento de dados

Desvantagens:Custo: requer hardware ou software especialSe espelhado: requer o dobro de espaço

Márcio Moreira 1. Introdução – Slide 18

Page 19: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Conexões físicas dos discos

Variáveis para conexões físicas: Tipos de cabos Número de vias Conectores físicos

Regras para conexões lógicas: Identificar os comandos (de leitura e

gravação) e os dados

Formato do drive: Esquema de endereçamento

Sistema

controlador ou

placa de circuito: ESCON para mainframe Host Bus Adapter (placas para fibra

ótica) para sistemas abertos Placas proprietárias para o AS/400

Márcio Moreira 1. Introdução – Slide 19

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Page 20: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Como a operação de I/O ocorre

Márcio Moreira 1. Introdução – Slide 20

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Iniciando uma requisição de leitura:

Page 21: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Como a operação de I/O ocorre

Márcio Moreira 1. Introdução – Slide 21

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Completando a requisição de leitura:

Page 22: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Usando melhor a CPU e a memória

Márcio Moreira 1. Introdução – Slide 22

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

“Vamos ver”:Acessamos o cliente 1Depois o cliente 2Qual será o próximo?Presumo o cliente 3

Técnica:CacheRead ahead

Customer 1 Meter Reading

Customer 2 Meter Reading

Customer 3 Meter Reading

Customer 1Meter Reading

Customer 2Meter Reading

CAC

HE

Customer 3Meter Reading

Page 23: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Usar controladora no RAID:Libera processamentoLibera memória RAM

Melhorando ainda mais

Márcio Moreira 1. Introdução – Slide 23

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Customer 1 Meter Reading

Customer 2 Meter Reading

Customer 3 Meter Reading

Customer 1Meter Reading

Customer 2Meter Reading

Customer 3Meter Reading

CAC

HECPUCPU

Page 24: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Iniciando um comando de escrita:

Como a operação de I/O ocorre

Márcio Moreira 1. Introdução – Slide 24

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Page 25: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Completando o comando de escrita:

Como a operação de I/O ocorre

Márcio Moreira 1. Introdução – Slide 25

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Page 26: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Melhor uso da CPU e memória

Márcio Moreira 1. Introdução – Slide 26

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

HBAHBA

Fonte: EMC

Customer 1 Meter Reading

Customer 2 Meter Reading

Customer 3 Meter ReadingC

ACH

ECPUCPU

Comando de escrita:“Grave a conta mensaldo cliente no disco”.A confirmação de escrita

é emitida assim que os dadose o comando de gravação estão

seguros dentro de uma áreacompletamente tolerante à

falha

Page 27: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Por dentro dos Disk Arrays

Márcio Moreira 1. Introdução – Slide 27

Fault TolerantCache Memory

Array Controller Array Controller

Disk Directors Disk Directors

Host Interface Host Interface

Fonte: EMC

Gaveta do sistemaoperacional

Gavetas de discos

Page 28: Segurança no Armazenamento

Segurança no Armazenamento de Informações

RAID 0 - Striping ou Fracionamento

Os dados são divididos em segmentos e estes são colocados nos HDs Não há redundância

Márcio Moreira 1. Introdução – Slide 28

Fonte: EMC

Volume 1End

Com RAID 0:Os volumes são divididos em blocos e movidos para balancear a carga de atividades.

Volume 1Middle

Volume 1Beginning

Sem RAID:3 HDs num mesmo host.Cada HD contem um volume

Volume 2Volume 2EndEnd

Volume 2Volume 2MiddleMiddle

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3EndEnd

Volume 3Volume 3MiddleMiddle

Volume 3Volume 3BeginningBeginning

Volume 1End

Volume 2Volume 2EndEnd

Volume 3Volume 3EndEnd

Volume 1Middle

Volume 2Volume 2MiddleMiddle

Volume 3Volume 3MiddleMiddle

Volume 1Beginning

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3BeginningBeginning

Page 29: Segurança no Armazenamento

Segurança no Armazenamento de Informações

RAID 1 - Mirroring ou Espelhamento

Os dados de um HD são espelhados em outro gerando redundância

Márcio Moreira 1. Introdução – Slide 29

Fonte: EMC

Sem RAID:3 HDs num mesmo host.

Com RAID 1:Um espelho de cada HD é criado gerando um para de HDs.

Volume 1End

Volume 1Middle

Volume 1Beginning

Volume 2Volume 2EndEnd

Volume 2Volume 2MiddleMiddle

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3EndEnd

Volume 3Volume 3MiddleMiddle

Volume 3Volume 3BeginningBeginning

Volume 1End

Volume 1Middle

Volume 1Beginning

Volume 1End

Volume 1Middle

Volume 1Beginning

Volume 2Volume 2EndEnd

Volume 2Volume 2MiddleMiddle

Volume 2Volume 2BeginningBeginning

Volume 2Volume 2EndEnd

Volume 2Volume 2MiddleMiddle

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3EndEnd

Volume 3Volume 3MiddleMiddle

Volume 3Volume 3BeginningBeginning

Volume 3Volume 3EndEnd

Volume 3Volume 3MiddleMiddle

Volume 3Volume 3BeginningBeginning

Page 30: Segurança no Armazenamento

Segurança no Armazenamento de Informações

RAID 1+0 - Performance e Redundância

Os HDs (volumes físicos) são espelhados e os volumes lógicos divididos

Márcio Moreira 1. Introdução – Slide 30

Fonte: EMC

Sem RAID:3 HDs num mesmo host.

Volume 1End

Volume 1Middle

Volume 1Beginning

Volume 2Volume 2EndEnd

Volume 2Volume 2MiddleMiddle

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3EndEnd

Volume 3Volume 3MiddleMiddle

Volume 3Volume 3BeginningBeginning

Com RAID 1+0:HDs espelhados.Volumes lógicos fracionados para balancear carga. Volume 1

EndVolume 2Volume 2EndEnd

Volume 3Volume 3EndEnd

Volume 1End

Volume 2Volume 2EndEnd

Volume 3Volume 3EndEnd

Volume 1Middle

Volume 2Volume 2MiddleMiddle

Volume 3Volume 3MiddleMiddle

Volume 1Middle

Volume 2Volume 2MiddleMiddle

Volume 3Volume 3MiddleMiddle

Volume 1Beginning

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3BeginningBeginning

Volume 1Beginning

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3BeginningBeginning

Page 31: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Paridade de dados

A paridade é utilizada para tentar recuperar dados perdidos

Márcio Moreira 1. Introdução – Slide 31

Fonte: EMC

Parity for 3rd

Group = 11 LOST DATALOST DATA11

Parity for 2ndParity for 2ndGroup = 1Group = 1 01100

Parity for 1Parity for 1stst

Group = 0Group = 00 11 11Group 1

Group 2

Group 3

Group 1 0 + 1 + 1 = 0

Group 2 0 + 1 + 0 = 1

Group 3 1 + 1 + ? = 1

DATA + DATA + DATA = Parity

Page 32: Segurança no Armazenamento

Segurança no Armazenamento de Informações

RAID 5 - Fracionamento e paridade

Divide os dados no nível de bloco e acrescenta um bloco de paridade Requer no mínimo 3 discos

Márcio Moreira 1. Introdução – Slide 32

Fonte: EMC

Parity for1st Group

Volume 1End

Volume 2Volume 2EndEnd

Volume 3Volume 3EndEnd

Parity for Parity for 2nd Group2nd Group

Volume 1Middle

Volume 2Volume 2MiddleMiddle

Volume 3Volume 3MiddleMiddle

Parity forParity for3rd Group3rd Group

Volume 1Beginning

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3BeginningBeginning

Sem RAID:3 HDs num mesmo host.

Volume 1End

Volume 1Middle

Volume 1Beginning

Volume 2Volume 2EndEnd

Volume 2Volume 2MiddleMiddle

Volume 2Volume 2BeginningBeginning

Volume 3Volume 3EndEnd

Volume 3Volume 3MiddleMiddle

Volume 3Volume 3BeginningBeginning

Com RAID 5:Um grupo de drives são agrupados como um volume físico.

Page 33: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Níveis de RAID

Márcio Moreira 1. Introdução – Slide 33

Nível Técnica MínimoDiscos

Aplicação Comentários

0 Fracionamento em blocos 2 Alta performance Sem redundância

1 Espelhamento 2 Alta disponibilidade e performance Implantação simples

2 Fracionamento em bitsMonitoramento em RAM

2 Alta performance e disponibilidade Nenhum uso comercial

3 Fracionamento em bytesDisco de paridade

3 Alta performance e disponibilidade Menor custo

4 Fracionamento em blocos (Múltiplos I/O)Disco de paridade

3 Processamento de transaçõesAlta disponibilidade

Alta taxa de leituraBaixo uso comercial

5 Fracionamento em blocos (Múltiplos I/O)Discos de paridade independentes

3 Processamento de transaçõesAlta disponibilidade

Alta taxa de leitura

6 Fracionamento em blocos (Múltiplos I/O)Múltiplos discos de paridade independentes

4 Processamento de transaçõesAlta disponibilidade

Alta taxa de leituraBaixo uso comercial

Fonte: EMC, IBM, Wikipedia e experiência.

Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0): Múltiplos I/O Independência de leitura e gravação (acesso múltiplo). Custo comparado para níveis que oferecem mesmos benefícios.

Page 34: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Arquiteturas típicas de storage

DAS:Direct Attached Storage

NAS:Network Attached Storage

SAN:Storage Area Network

Direct Attached Storage (DAS)

Windows NT/2K Linux/UnixNetware

Network Attached Storage (NAS)

Windows NT/2K Linux/UnixNetware

Storage Area Network (SAN)

Netware

Windows NT/2K

Linux/Unix

Storage

FC Switch

NAS

Page 35: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Conexões típicas

HBAHBA

HBAHBA

NICNIC

HBAHBA

System Bus

CPUCPU

MAIN MEMORYMAIN MEMORY(RAM)(RAM)

ROMROM(Read Only Memory)(Read Only Memory)

Storage ArrayStorage Array Tape Drive DeviceTape Drive DeviceNetworkNetworkRouterRouter

SANSANSwitchSwitch

Page 36: Segurança no Armazenamento

Segurança no Armazenamento de Informações

Symmetrix CLARiiON Centera

SAN / NAS

SAN / NAS /Backup-to-Disk CAS

Tape &Tape Emulation

DMX800

DMX1000-M2

DMX1000

DMX2000-M2

DMX2000

DMX3000-M2

DMX3000

CX700

CX500

CX300

Centera

AX 100 Netwin 110

NS700/G

CelerraCNS

ADIC Scalar SeriesDL700

Produtos de Storage da EMC

Page 37: Segurança no Armazenamento

Segurança no Armazenamento de InformaçõesMárcio Moreira 1. Introdução – Slide 37

Referências

EMC. Storage Basics. EMC. Jun-2006. S. Ramakrishnan.

Management of large scale Terabyte Store information servers. IACITS 2007. Jul-2007.

Khattar, Murphy, Tarella e Nystrom. Introduction to Storage Area Network, SAN. IBM. Redbooks. SG24-5470-00. 1999.