13

Click here to load reader

SAN: Storage Area Network

Embed Size (px)

Citation preview

Page 1: SAN: Storage Area Network

Introdução

Uma SAN é, de modo simplificado, uma rede dedicada ao armazenamento de dados,

que conecta dispositivos armazenadores de discos conhecidos por storages aos

servidores da rede. É uma tecnologia relativamente nova e que vem se popularizando

bastante no meio corporativo nos últimos anos, trazendo cada vez mais benefícios para

as empresas que a adotam.

Em linhas gerais, podemos definir SAN como uma infraestrutura que permite que

diversos servidores tenham acesso a discos externos de modo rápido e confiável. O

conceito de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo

cada vez mais adotado. Os discos externos não são limitados em espaço como um disco

interno, são mais fáceis de manusear quando necessário e trazem facilidades para o

compartilhamento por vários servidores. A figura central de uma SAN, de fato, é o

servidor de discos ou, como é popularmente conhecido, o storage.

A centralização das operações de armazenamento de dados e seu gerenciamento são as

razões principais pela popularização das SANs. Administrar todos os recursos de

armazenamento em ambientes críticos e de crescimento elevado não é uma tarefa fácil e

pode ser muito dispendioso. Imagine, por exemplo, uma empresa com centenas de

servidores que possuem importante demanda por espaço em disco. Acompanhar

máquina a máquina e gerenciar seus volumes, com certeza não será um tarefa fácil.

Com a centralização oferecida pela SAN, tanto o tempo quanto o custo de

gerenciamento destes ambientes é muito reduzido. Além disso, uma SAN provê uma

série de outras vantagens para o acesso a áreas de discos, como sua alta escalabilidade e

confiabilidade.

Uma SAN é implementada utilizando-se componentes de hardware e também

importantes softwares, sem os quais a SAN não traria tantos benefícios quanto

conhecemos hoje. Como veremos no decorrer deste trabalho o conjunto de hardware e

software certo é que vai definir a qualidade da SAN.

Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus

equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as

tecnologias não são isoladas, mas se integram.

Page 2: SAN: Storage Area Network

Benefícios

Podemos citar como principais benefícios proporcionados por uma arquitetura de SAN:

Alta performance no acesso aos dados: as taxas de transferência nas SAN mais

modernas podem chegar a até 2 Gb/s. Além disso, dependendo do arranjo dos

discos (RAID), pode haver grande ganho de performance na leitura e/ou escrita,

como veremos adiante neste trabalho;

Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de

aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de

alguns discos, a produção na seja interrompida. Opções como caminhos

redundantes para acesso aos dados e espelhamento de dados em tempo real pode

assegurar a disponibilidade dos dados e aplicações.

Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e

outros recursos à infraestrutura já existente. Isto é feito facilmente dentro de uma

SAN, freqüentemente sem a necessidade de desligar o(s) servidore(s) ou seus

clientes de rede;

Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais

complexos, isto pode ser a única solução para a administração dos recursos de

discos, trazendo grandes economias para as empresas.

Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao

grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é

bastante reduzido, o que alivia a rede local, beneficiando os usuários. Isto

também é muito importante para o backup corporativo, que também pode ser

feito sem utilizar a rede local.

Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e

dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para

backup. Estas facilidades focam em alternativas para aplicações em que não há janela

para backup disponível, já que elas exigem disponibilidade integral. Veremos algumas

destas mais adiante.

Enfim, as características das SAN podem trazer grandes economias, alta disponibilidade

dos dados, fácil expansão do storage, poucas paradas da rede, e redução de seu tráfego.

História

A idéia da SAN nasceu em 1987, quando Patterson, Gibson e Katz, da Universidade da

Califórnia, publicaram o artigo A Case for Redundant Arrays of Inexpensive Disks

(RAID). As idéias apresentadas e explicadas no artigo sugeriam combinar vários

pequenos discos, não muito caros, em uma matriz a fim de obter características que

discos isolados não eram capazes de oferecer. Estas novas características tratavam-se,

principalmente, de melhorar a performance de leitura e escrita e preservar

automaticamente o conteúdo dos discos durante e depois da falha de componentes do

disco. Com os discos em RAID, nasceram os servidores de discos, os storages, que são

o centro de uma SAN.

Page 3: SAN: Storage Area Network

Um acontecimento que também foi muito importante para o surgimento desta

arquitetura foi o desenvolvimento do padrão Fibre Channel (FC), utilizado nas

SANs. Fibre Channel é um protocolo de transferência de dados, que faz uso do meio

físico de fibra ótica. Acompanhando o processo de popularização das SANs, os

diferentes fornecedores começaram a tentar definir seus próprios padrões FC, o que

estava atrapalhando o desenvolvimento do padrão. Assim, foram criadas algumas

organizações para definir as regras para o novo padrão. Entre elas, destacam-se a FCIA

(Fibre Channel Industry Organization) e a SNIA (Storage Networking Industry

Association).

A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre

Channel Community. É uma organização de benefício mútuo, sem fins lucrativos,

formada por fabricantes, integradores de sistemas, desenvolvedores, vendedores,

profissionais da indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia

de infra-estrutura FC, a fim de que várias aplicações dentro dos complicados mercados

de Storage e TI possam ser suportadas.

A SNIA foi criada em Dezembro de 1997 e também é uma associação sem fins

lucrativos e dedica-se a garantir que as redes de armazenamento de dados tornem-se

soluções completas e confiáveis dentro da comunidade de TI.

Protocolos

SANs podem ser implementadas utilizando interfaces de diferentes tipos. Os protocolos

suportados por SAN são os seguintes:

FCP: Fibre Channel Protocol

FCIP: Fibre Channel sobre TCP/IP

IFCP: Internet Fibre Channel Protocol

SCSI: Small Computer System Interface

ISCSI: Internet Small Computer System Interface

ISNS: Internet Storage Name Service

SAS: Serial Attached SCSI

Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs. Fibre Channel é

uma interface serial que possui uma alta largura de banda e permite que um grande

número de dispositivos possam ser anexados a ela de uma vez. Os dispositivos Fibre

Channel são conectados, principalmente, a um cabo de fibra ótica, mas pode ser

utilizado também em cabos de cobre. As velocidades das SANs atuais vão até 2 Gb/s.

A Fibre Channel pode se comunicar com vários protocolos diferentes, incluindo SCSI, e

até mesmo IP. Os dispositivos do Fibre Channel são identificados por um número de ID

fisicamente gravado denominado World Wide Name, análogo a um endereço de

Ethernet MAC.

Page 4: SAN: Storage Area Network

Hardware

Talvez a parte mais importante para a implantação de uma SAN seja referente

ao hardware. É importante selecionar com cuidado os dispositivos de hardware para

uma SAN pois há diferenças muito grandes entre os equipamentos fornecidos por

diferentes empresas do ramo. Além disso, devido às SANs serem bastante dependentes

de alguns softwares para funcionar corretamente, é muito importante garantir as

atualizações de softwares, firmwares e outras questões ligadas a compatibilidade. Os

fabricantes de equipamentos para SAN costumam divulgar matrizes de compatibilidade

para seus produtos em seus sites. Nelas há uma qunatidade muito grande de

informações, contendo diversas combinações de hardware e software,

como storage, switch, HBA, servidor e sistema operacional, que foram homologados

pelo fabricante. Entre as principais empresas do mercado especializadas em projeto de

SAN destacam-se: EMC, Sun Microsystems, IBM, HP, Network Appliance e Brocade.

Os principais componentes de hardware são:

Servidor de discos: Servidores de discos, também chamados

de storages ou frames, são dispositivos que armazenam discos compartilhados

pelos hosts da rede. Eles possuem, em geral, diversas áreas diferentes, com

esquemas de RAID diferentes ou discos específicos para a realização de

espelhamentos para backup, os chamados BCV (business continuance volumes).

Os BCVs facilitam muito tanto o backup quanto a restauração dos dados. O seu

conteúdo é sincronizado com o conteúdo do disco principal, até que se faça uma

quebra do sincronismo, o chamado split. Neste momento, o BCV guarda uma

imagem do disco antes do split, e pode ser usado para backup, enquanto o

servidor continua trabalhando, sem impactos na produção. Este procedimento

pode ser feito com a freqüência mais conveniente para o usuário e, em muitos

casos, o BCV é utilizado também para restauração de dados perdidos, que é

muito mais rápido do que acessar fitas de backup. Muitos storages, além de

discos, possuem também uma espécie de processador e memórias nvram e/ou

flash, onde é armazenado o firmware do equipamento.

Hubs:

Assim como hubs de uma rede local, os hubs FC permite que todos os

dispositivos conectados a ele se enxerguem e possam trocar informações entre

si. Possuem as vantagens de possuir baixo preço e baixa complexidade. Permite

ainda que dispositivos possam ser inseridos ou removidos sem interrupção

alguma, o que torna o ambiente bastante dinâmico. Entretanto, os hubs dividem

a largura de banda por todos os dispositivos conectados a ele, o que pode

representar uma perda muito grande de velocidade. Os hubs podem ser

cascateados, a fim de fornecer mais portas para aumentar ainda mais a

conectividade. Teoricamente, o hub suporta até 127 dispositivos conectados a

ele, mas na prática, deve-se restringir o total de dispositivos a 30, no máximo.

Para pequenos grupos de trabalho os hubs são mais atrativos, pois fornecem um

alto grau de interoperabilidade por um preço menor. Existem hubs fibre

channel de 4 a 16 portas e possuem uma largura de banda de, no máximo, 100

MB por segundo, compartilhado entre os servidores conectados às suas portas.

Page 5: SAN: Storage Area Network

Switches: Switches fibre channel são bem mais complexos que os hubs, tanto em

seu projeto quanto em funcionalidade. Enquanto os hubs são apenas um

concentrador de cabos para um segmento compartilhado, um switch é um

dispositivo de rápido roteamento dos dados e possui uma taxa de transferência

de dados exclusiva para cada porta. As taxas de transferência variam bastante

dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a

velocidade máxima está em 400 MB/s para cada porta. Enquanto os hubs não

participam de atividades no nível do protocolo Fibre Channel,

os switches participam ativamente, tanto para fornecer serviços quanto para

supervisionar o fluxo de frames entre a origem e o destino.

Bridges Fibre Channel-SCSI: As chamadas bridges em uma SAN são

equipamentos que realizam a conversão entre dispositivos SCSI e Fibre

Channel, interfaces de diferentes padrões elétricos e diferentes protocolos. Isto

permite a manutenção dos dispositivos SCSI na SAN, como drives de fita

de backup, integrando-o aos novos ambientes de tecnologia Fibre Channel.

HBA (Host Bus Adapter): Uma HBA é um dispositivo capaz de conectar

dispositivos externos a um servidor. Por exemplo: para conectarmos um disco

SCSI a um micro (barramento interno PCI), será necessário utilizar uma HBA

SCSI-PCI. No caso da SAN, é necessário instalar em todos os servidores

participantes dela uma HBA Fibre Channel, que se encarregará de fazer as

conversões dos diferentes meios internos e externos ao servidor.

As HBAs FC possuem, ainda, uma espécie de processador (um chip) capaz de

fazer a conversão de protocolos para poupar a CPU do servidor deste trabalho.

RAID

A maior parte das SANs atuais utiliza sistemas de RAID em seus principais

equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos

dados, tolerância a falhas, no caso de um componente ou um caminho de I/O falhar, alta

performance, capacidade de armazenamento e escalabilidade. Outras características para

garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de

sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de

monitoramento.

A idéia do RAID é combinar múltiplos discos em uma matriz a fim de obter

características que discos isolados não poderiam fornecer, como alto desempenho e

tolerância a falhas. Os computadores conectados a um servidor RAID enxergam suas

áreas como um disco físico, que, para o servidor RAID é uma unidade lógica de

armazenamento (Logical Storage Unit - LUN). Existem várias maneiras de obter as

características de tolerância a falhas, redundância dos dados e alta performance, que

constituem os chamados níveis de RAID. Existem 6 níveis de RAID, sendo que os

principais são:

Page 6: SAN: Storage Area Network

RAID 0: Os dados são distribuídos através dos discos, método conhecido

por data striping, sem gerar paridade ou redundância. A gravação e a leitura dos

dados é feita paralelamente, uma vez que cada disco possui a sua controladora.

Com isto, há um grande ganho de performance, porém, por não haver

redundância alguma, se um dos discos falhar, os dados são perdidos. RAID 0 é

utilizado quando máxima performance é mais importante do que possíveis

perdas de dados.

RAID 1: Os discos da matriz são divididos em 2 grupos. Na escrita, os dados são

gravados igualmente nos 2 grupos. Na leitura, os dados podem ser lidos de

qualquer um dos grupos. Normalmente, ela é feita alternando-se os discos,

processo conhecido por round robin, mas pode haver um disco preferencial para

leitura, no caso de haver um disco mais rápido que outro. Não há geração de

paridade, mas sim uma redundância completa dos dados. Este método tem se

tornado popular pela sua simplicidade e praticidade em caso de falha de um dos

discos. Porém possui as desvantagens de utilizar apenas metade da capacidade

total de discos, além de não trazer nenhum aumento de performance.

RAID 5: Este nível de RAID também utiliza o conceito de data striping, mais

acrescenta uma forma de obter redundância dos dados, através do gerador de

paridade. Para cada escrita, é gerada uma paridade calculada pela operação de ou

exclusivo dos bits gravados. A paridade fica espalhada pelos 3 discos, ou seja, a

cada gravação ela é gravada em um disco diferente. São necessários, no mínimo,

3 discos para sua implementação, sendo o espaço "desperdiçado" do conjunto

devido ao armazenamento da paridade é equivalente ao espaço de um disco.

Pode-se, com este esquema, perder até um disco que, a partir dos outros e da

paridade, reconstitui-se os dados do disco perdido. Caso mais de um disco falhe

ao mesmo tempo, os dados não poderão ser recuperados. É um método muito

empregado nos storages atuais, porque alia aumento de performance à segurança

oferecida pela redundância com um ótimo aproveitamento de recursos.

Page 7: SAN: Storage Area Network

RAID 0 + 1 ou RAID 10: A combinação de níveis de RAID é uma prática

comum hoje em dia. A mais utilizada é a que combina os níveis 1 e 0, o que alia

a alta performance do RAID 0 com a segurança dos dados do RAID 1.

Software:

Um dos componentes indispensáveis para uma SAN são os softwares envolvidos.

Normalmente, as empresas fornecedoras de SAN são também produtoras de softwares

que gerenciam seus produtos de hardware. Embora não se tenham muitas pesquisas e

estatísticas que meçam o estado deste componente, a parte de software é um campo em

expansão, como pode ser visto em diversas empresas que vêm ampliando sua infra-

estrutura de dados. Estes softwares possuem diversas funções, entre elas:

Organizar o acesso às diferentes áreas do storage por parte dos servidores:

muitos storages hoje em dia possuem diferentes áreas de discos, que possuem

controladoras diferentes, além, de outras características diferentes, como, por

exemplo, o esquema de RAID. O planejamento do local no storage para alocar

discos para os servidores, conforme suas necessidades e características é muito

importante, e os softwares atuais provém cada vez mais facilidades para este

trabalho.

Prover diversos sistemas de contingência para o caso de falhas: como a maioria

dos dados em storage são críticos, há uma preocupação muito grande com um

esquema de contingência em caso de falhas. Um dos principais esquemas deste

tipo é o chamado failover. O failover é um termo genérico utilizado quando há

redundância entre caminhos de acesso e, caso haja falha em um deles, o outro é

automaticamente acionado e passa a ser utilizado, o que é controlado pelo

software.

Aumentar a performance de acesso aos dados: há algumas ferramentas para

aumentar a performance de acesso aos dados em um software de um SAN,

dependendo da arquitetura utilizada. Uma muito utilizada é o balanceamento de

carga (load balance), que utiliza caminhos redundantes de acesso ao storage, e

controla por software a melhor maneira de acessa-lo, o que traz um grande

aumento de performance.

Prover facilidades para o backup de servidores: quanto mais crítico um servidor,

mais complicado é o seu backup. Algumas aplicações não podem parar jamais e

possuem uma janela de backup muito pequena. Além disso, o backup não pode

interferir na performance do servidor, principalmente em casos de aplicações

com alto índice de acesso. Com ferramentas de software como o snapshot, é

possível gravar imagens da área de discos utilizadas pelo servidor, e fazer o

backup em outro horário qualquer, sem impactar em nada a produção. Isto é

feito, em geral, guardando-se ponteiros para os dados e utilizando-se áreas extras

do storage para guardar dados que sejam modificados após o snapshot, quando

Page 8: SAN: Storage Area Network

os ponteiros que apontavam para a área original, passam a apontar para esta área

temporária.

Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra

por linha de comando, o que é extremamente útil para a confecção de scripts para

automatizar alguns processos. Infelizmente, hoje em dia, os softwares envolvidos em

uma SAN estão amarrados aos fabricantes de hardware e não há uma padronização

destes produtos. As diferenças entre eles são muito grandes, e o modo de operá-los

também, e, assim, as empresas que implantam SAN sempre perdem um grande tempo (e

dinheiro) com treinamentos para seus funcionários. Ainda: caso a solução seja migrada,

o modo de operação do novo produto, com certeza, será bem diferente do anterior.

Assim, na hora de escolher qual fabricante de storage adotar, é importante procurar

saber bem como será o seu gerenciamento, quais serão as facilidades que os softwares

proverão, suas compatibilidades e quão fácil será a operação de todo o conjunto.

Topologias:

As SANs atuais são todas construídas em uma topologia física de estrela. Um hub ou

switch é conectado ao storage e neles conectamos todos os outros servidores da rede. A

excessão fica com a ligação ponto-a-ponto, como veremos a seguir.

Assim, analisaremos as topologias existentes:

- Ligação ponto-a-ponto (point-to-point): Para alguns não é considerada uma

topologia de SAN, uma vez que não possui escalabilidade alguma. Neste tipo de

ligação, os servidores são ligados diretamente ao storage, sem nenhum equipamento

intermediário, como hub ou switch. O número máximo de servidores envolvidos é igual

ao número de portas que o storage possui. Comparado com a ligação SCSI, no entanto,

esta topologia, que utiliza Fibre Channel, apresenta uma performance muito melhor e

atinge distâncias maiores.

- Loops ou anéis: são chamados de Fibre Channel Arbitrated Loop (FC-AL): Nesta

topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é

compartilhada por todos os seus membros. Teoricamente suporta loops com até 126

dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito

pouco utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como

uma rede Token Ring, em que a largura de banda é dividida por todos os dispositivos do

Page 9: SAN: Storage Area Network

loop. Esta topologia está sendo muito pouco utilizada nas SANs modernas. Entretanto

há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o modo

em loop.

- Malha (Switched fabric ou apenas fabric): nesta topologia, utiliza-se switches Fibre

Channel, o que permite um grande número de dispositivos interconectados. Dedica

largura de banda integral a cada uma das portas e permite transferências de dados

simultaneamente para um único nó. É a topologia que permite mais escalabilidade e

crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós.

- Topologia mista: Na literatura, encontramos, ainda, a possibilidade de combinar as

duas topologias, o que não é comum de se fazer:

Page 10: SAN: Storage Area Network

Zoneamento

Há algumas formas de se implementar uma SAN. Atualmente, como já falamos, a

topologia mais utilizada é em malha, e, com isto, a técnica do zoneamento (zonning)

tornou-se bastante popular. Esta técnica consiste em definir grupos de dispositivos que

se enxergam, o que chamamos de zona. Isto permite alocar o storage adequadamente

para cada hosts, pois as necessidades de espaço em disco, e mesmo de redundâncias, são

diferentes entre os membros de uma SAN. Entre as diversas formas de se definir uma

zona, a mais comum é utilizando-se os WWNs dos hosts.

O zoneamento é feito no switch. Atualmente, a maioria dos switches possui algum

utilitário gráfico que auxilie a fazer os zoneamentos e outras tarefas próprias de cada

um, mas pode-se fazer também se conectando no switch via telnet e utilizando o sistema

próprio dele.

Storage Área Network versus Network Attached Storage

Como este é um trabalho sobre redes de armazenamento de dados, vale à pena comentar

também uma outra tecnologia para compartilhamento de dados que ganhou

popularidade: a chamada NAS (Network Attached Storage). Trata-se, basicamente, de

um servidor de discos capaz de exportar áreas por protocolos como o NFS, CIFS ou até

mesmo o HTTP. Para isto, é utilizada a rede local, o que traz a vantagem de permitir

que qualquer host da rede tenha acesso a dados comuns, porém possui as desvantagens

de congestionar o tráfego da rede, bem como uma velocidade de acesso pequena, se

comparada à de uma SAN.

Page 11: SAN: Storage Area Network

Uma outra grande vantagem da arquitetura NAS é que os dados podem ser

compartilhados entre diversos hosts, inclusive de sistemas operacionais diferentes,

enquanto em uma SAN os dados são dependentes do sistema operacional.

Bibliografia

Devido à dificuldade de se encontrar livros sobre este assunto no Brasil, a base para este

trabalho foi extraída toda da Internet. Segue abaixo, a lista dos principais links

utilizados por mim.

http://www.dothill.com/tutorial/index.htm

http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf

http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whit

epapers.zoning.pdf

http://www.networkcomputing.com/1109/1109ws1.html

http://www.fibrechannel.org/

http://www.snia.org/

http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17

601008&pgno=2

http://access.globalknowledge.com/tutorials.asp?sort=cat&catID=12&perpage=2

0

http://us-

support.external.hp.com/iv/data/documents/DE_SW_UX_swrec_EN_01_E/Fibr

eChannel.pdf

http://forums1.itrc.hp.com/service/forums/questionanswer.do?admit=716493758

+1081305504552+28353475&threadId=19156

http://www.sun.com/storage/white-papers/fc_comp.html

http://www.javvin.com/protocolSAN.html

http://www.nas-san.com

http://www.chaparralnet.com/supp/support_documentation/JFS226UG.pdf

Além destes sites, foi retirada importantes informações sobre o padrão Fibre Channel do

seguinte livro:

Manual de Administração do Sistema UNIX, 3a edição – Evi Nemeth, Garth

Snyder, Scott Seebass e Trent R. Hein

Questões:

1. Para que serve a bridge em uma SAN?

A bridge, em uma SAN, é um equipamento capaz de converter um meio físico para

outro. Tem sido muto utilizada para conectar dispositivos SCSI a SAN, que utiliza

meios de fibra ótica. É importante não confundir este equipamento com o que

conhecemos como bridge em uma LAN, pois suas funções são totalmente diferentes.

2. De que maneira o RAID 5 consegue recuperar a informação perdida em 1 dos

discos. Dê exemplos.

Page 12: SAN: Storage Area Network

R: O RAID 5 calcula a paridade fazendo-se uma operação de ou-exclusivo com os bits

gravados nos discos. Suponha que um esquema de RAID 5 possua 6 discos (5 para

escrita e 1 para paridade). Se os bits gravados forem 1, 0, 0, 1, 1, então a paridade será

1. Cada um destes bits será gravado em um disco diferente. Se perdermos qualquer um

dos discos, recuperamos o bit perdido fazendo-se o ou-exclusivo dos outros bits,

contando com o de paridade, No exemplo, se perdermos o primeiro disco (bit 1),

faríamos para recuperar: 0 xor 0 xor 1 xor 1 xor 1, que dá exatamente 1, o bit perdido.

Se perdêssemos o segundo disco (bit 0), faríamos para recuperar: 1 xor 0 xor 1 xor 1 xor

1, que dá 0, novamente correto. Para todos os demais, o pensamento é análogo.

3. Explique porque o snapshot é uma boa ferramenta de software de SAN e como

ele funciona.

O snapshot é uma ferramenta de software que permite fazer e armazenar por um certo

tempo uma fotografia dos dados do servidor no storage. Possui a vantagem de quase não

consumir espaço em disco, uma vez que ele guarda um conjunto de ponteiros para os

dados, e não os dados propriamente. Esta imagem pode ser vista pelo servidor como

uma outra área, que pode ser montada como um drive (Windows) ou um filesystem

(Unix) para fins, principalmente, de backup. Em casos de atualização dos dados após o

snapshot, o software copia os dados anteriores à atualização para uma área temporária e

o ponteiro que apontava para os dados que foram atualizados passam a apontar para os

dados preservados nesta nova área, uma vez que a fotografia tirada deve ser mantida a

mesma. Isto limita o snapshot a momentos em que não aja muitas atualizações, ou em

casos em que não interessa guardar a imagem por um tempo muito grande.

4. Uma dada aplicação que utiliza um servidor UNIX de banco de dados deseja

utilizar uma SAN para, entre outras coisas, melhorar sua performance. O servidor

de banco de dados possui 3 áreas principais que podem ser distinguidas: tabelas,

índices e dados. Sabendo que as áreas não devem competir por recursos e que a

característica das áreas de tabelas e índice é mais de leitura, enquanto a área de

dados sofre um pouco mais de escrita, mas também muita leitura, diga como você

utilizaria os recursos de uma SAN para otimizar sua performance. Dica: estas

diferentes áreas correspondem a filesystems diferentes, que são montados no

servidor. Filesystem é como se fosse um pedaço de disco, ou seja, como um drive

para o Windows.

R: Neste caso, devemos fazer com que as diferentes áreas do servidor de banco de dados

acessem discos diferentes, que podem estar no mesmo storage, caso ele possua áreas

separadas (conhecidas como RAID groups), ou em storages diferentes. O importante é

perceber que o acesso aos dados deve ser feito por controladoras de disco diferentes,

uma vez que as 3 áreas não podem competir por recurso. Para melhorar ainda mais a

performance, podemos tentar adequar as características das áreas a um esquema de

RAID adequado, dentro do possível. No caso, uma boa solução seria, para as áreas de

tabelas e índices, seria um esquema de RAID 5 com 5 discos de dados e 1 de paridade,

enquanto para a área de dados, que sofre um pouco mais de escrita, poderíamos usar um

RAID 5 com 7 discos de dados e 1 (que é mais caro que o esquema 5 + 1) para

paridade, o que paralelizaria mais a escrita em disco, tornando mais rápido.

5. O administrador de um servidor de banco de dados de comércio eletrônico de

uma grande multinacional quer otimizar seu backup. Atualmente, para fazer um

Page 13: SAN: Storage Area Network

backup íntegro dos seus dados ele precisa parar o banco de dados do servidor, o

que impossibilita as vendas neste período. Ele deseja que o banco de dados não

precise mais parar para o backup e, além disso, em caso de precisar de uma

restauração, ela deve ser feita o mais rápido possível. Supondo que este servidor

está conectado a uma SAN, diga qual o esquema de backup mais conveniente para

este caso e explique por que.

R: Neste caso, devemos utilizar discos BCV para o backup, pois atenderia tanto os

requisitos de backup quanto de restore. O sincronismo deve ser feito momentos antes de

iniciar o backup, para que os dados anteriores sejam preservados o maior tempo

possível, para o caso de precisar de uma recuperação. Logo após o término do

sincronismo, o quebramos e realizamos o backup do disco BCV, e não do servidor, que

continuará trabalhando e modificando sua base de dados. Para manter os dados por

ainda mais tempo no BCV, para o caso de precisar de uma restauração, pode-se usar

mais de um BCV em esquema de rodízio, conforme a disposição financeira.