36
Trabalho de grupo para a Unidade Tecnologias de Informação II no ano lectivo 2011/2012 Disaster Recovery AUTORES: Jorge das Neves Silva, n.º 50028321 Manuel Capela, n.º 50028257 Mariana Moreira, n.º 50028135 Tiago Alberto, n.º 50028151 REGENTE: Orlando Fontan LISBOA, Maio de 2012

Disaster Recovery

Embed Size (px)

DESCRIPTION

Este trabalho pretende abordar um dos temas principais na área dos Sistemas de Informação e que em muitas empresas nem sempre é levado muito a sério – a Recuperação de Desastres (Disaster Recovery). É uma temática em evolução constante sendo que hoje fala-se e começam a ser utilizados novos sistemas, como os backups na cloud ou mesmo a utilização exclusiva da mesma. Estes serão alguns dos temas que iremos abordar ao longo deste trabalho, uns com maior detalhe e rigor técnico, outros através de uma abordagem mais superficial de modo a poder ser melhor compreendido.

Citation preview

Page 1: Disaster Recovery

Trabalho de grupo para a Unidade Tecnologias de

Informação II no ano lectivo 2011/2012

Disaster Recovery

AUTORES:

Jorge das Neves Silva, n.º 50028321

Manuel Capela, n.º 50028257

Mariana Moreira, n.º 50028135

Tiago Alberto, n.º 50028151

REGENTE: Orlando Fontan

LISBOA, Maio de 2012

Page 2: Disaster Recovery

Dedicatória

A todos aqueles que nos

incentivaram neste novo projecto de

vida, apoiando-nos e perdoando-nos

pela maior quantidade de tempo

despendida e dedicada à faculdade

em detrimento da atenção por eles

merecida.

Às nossas famílias e amigos, bem-

haja.

Page 3: Disaster Recovery

Agradecimentos

A todos os que colaboraram neste

trabalho, aos nossos colegas de

faculdade pela atenção e carinho que

nos dispensaram nas tardes de

sábado,

Page 4: Disaster Recovery

Epígrafe

“In preparing for battle I have

always found that plans are useless,

but planning is indispensable.”

Dwight D. Eisenhower1

1 Dwight D. Eisenhower was the 34th President of the United States from 1953 until 1961.

Page 5: Disaster Recovery

Índice Introdução ........................................................................................................... 6

Enquadramento na Unidade Curricular ................................................................... 7

1. O Impacto dos Desastres na Economia ............................................................. 7

2. Business Continuity ..................................................................................... 10

Certificação - ISO 22301 ................................................................................. 11

3. Disaster Recovery ........................................................................................ 17

4. Metodologias .............................................................................................. 19

Definição de um plano de backup ..................................................................... 25

I. Backup e Arquivo ................................................................................. 27

II. Ser Confiável ....................................................................................... 27

III. Implementação de backup ...................................................................... 28

Reflexão ........................................................................................................ 30

5. Business Case ............................................................................................. 30

6. O Estado da Arte .......................................................................................... 33

O futuro passa pelo Cloud Computing? ............................................................. 33

Conclusão ......................................................................................................... 35

Referência Bibliográfica ..................................................................................... 36

Page 6: Disaster Recovery

Introdução

Este trabalho pretende abordar um dos temas principais na área dos Sistemas de

Informação e que em muitas empresas nem sempre é levado muito a sério – a

Recuperação de Desastres (Disaster Recovery).

Desde o início da informática este foi um tema sempre presente, primeiro numa

área mais limitada através da utilização de backup em suporte não digital (tapes),

evoluindo gradualmente para outro tipo de tecnologias como a replicação de dados para

outros servidores, que a princípio poderiam estar fisicamente lado a lado e que, com a

diminuição dos custos das comunicações, passaram para outros locais ou países.

É uma temática em evolução constante sendo que hoje fala-se e começam a ser

utilizados novos sistemas, como os backups na cloud ou mesmo a utilização exclusiva

da mesma.

Estes serão alguns dos temas que iremos abordar ao longo deste trabalho, uns

com maior detalhe e rigor técnico, outros através de uma abordagem mais superficial de

modo a poder ser melhor compreendido.

A informação, os sistemas que a utilizam e a sua gestão, são hoje um factor de

sucesso ou fracasso de qualquer organização, provenha ela de que sector de actividade

provier. No entanto, e cada vez mais dependentes de sistemas de informação de suporte

à actividade, a falha em qualquer um destes pode ser desde insignificante ou até levar a

organização à falência.

Por isso surge a Gestão da Continuidade, “… um processo holístico que se

expande por todas as unidades de negócio da organização, incluindo o departamento

de Tecnologias de Informação, e muitas vezes propaga-se para além das fronteiras

organizacionais de forma a incluir parceiros tecnológicos.” (SERRANO, JARDIM,

2007, p. XI).

O paradigma que iremos detalhar neste trabalho trata-se do Disaster Recovery

Plan2 em concreto, não abordando outras áreas do Business Continuity

3, no entanto não

deixaremos de abordar o tema genericamente não só para melhor percepção da matéria

bem como pelo facto de um, estar intimamente ligado ao outro.

2 Termo na língua inglesa para “Plano de Recuperação de Desastres” 3 Termo na língua inglesa para “Continuidade de Negócio” ou “Gestão da Continuidade”

Page 7: Disaster Recovery

Para além da abordagem teórica descrita no presente documento tentámos

demonstrar uma aplicação prática no final de todo o enquadramento de forma a melhor

explicar o conceito numa utilização concreta.

Enquadramento na Unidade Curricular

Sendo este um tema acima de tudo ligado à área de Sistemas de Informação e à

sua Gestão, é um tema transversal a toda a Unidade Curricular de Tecnologias de

Informação II, pois aborda desde a Estratégia Empresarial (tema de extrema importância

na definição de um Plano de Recuperação de Desastres) até ao Planeamento,

Desenvolvimento e Exploração de Sistemas de Informação, não esquecendo a Gestão da

Qualidade dos Sistemas e do Plano em causa.

Todas as temáticas em causa podem e devem ser acompanhadas pela Gestão de

Projecto.

1. O Impacto dos Desastres na Economia

A informática ao longo dos anos tem passado por vários desafios,

nomeadamente a viragem do século e no caso da Europa a mudança para o euro.

Estas alterações eram previsíveis e puderam atempadamente ser acauteladas. No

global podemos dizer que tudo ocorreu como o previsto.

“A maioria das pessoas pensa em fogos, inundações ou terramotos como casos de

desastre, ou pior ainda, que desastres são coisas que não acontecem. Mas um desastre do ponto

de vista organizacional em interacção directa com os Sistemas de Informação pode ser

qualquer evento que, de uma forma súbita, interrompa um serviço vital ou corrompa os dados,

negue o acesso à informação ou inviabilize os Sistemas de Informação” (SERRANO, JARDIM,

2007, p.11).

Partindo desta base podemos referir que os desastres podem trazer consequências

catastróficas em termos económicos para as empresas que afectam.

No mercado globalizado em que as empresas fortemente dependentes dos Sistemas de

Informação fazem com que o impacto desse mesmo desastre atinja ainda maiores dimensões.

Segundo um artigo do Professor W. Carl Kester sobre o impacto económico dos

desastres Japoneses dando o exemplo da tragédia de Março de 2011 (terramoto de 8.9 na escala

Richter seguido de um enorme tsunami), em que o desastre provocou um drama social enorme

como seria de esperar, mas que segundo Kester “The direct impact on real economic activity

Page 8: Disaster Recovery

worldwide is already being felt. The destruction will surely cost Japan many times the $132

billion that the 1995 Kobe earthquake did...”45

. Escreve ainda que “The financial consequences

are equally alarming. The Nikkei 225 Stock Average plunged 6.2% at the market's close on

Monday (3/14), erasing more than $300 billion of equity value, and lost another 10.6% on

Tuesday.”6

Sendo os terramotos um fenómeno de alguma forma natural no Japão, pois existe um

factor histórico nesse tipo de desastres naturais, as empresas Japonesas têm de estar preparadas

para novas catástrofes, sendo os valores apresentados de alguma forma já minimizados devido

ao planeamento de prevenção. No entanto existe um outro tipo de desastre igualmente

devastador que tem como epicentro histórico o famoso 11 de Setembro de 2001 onde uma série

de atentados terroristas se sucederam nos Estados Unidos da América, nomeadamente os aviões

que chocaram contra o World Trade Center (Torres Gémeas) bem como contra o Pentágono e

que mudou, para sempre, o conceito de continuidade de negócios.

O acontecimento marcou a

humanidade e quebrou paradigmas no

que toca à segurança de forma geral.

As empresas tiveram de reflectir

sobre o impacto do inesperado sobre

seus negócios.

O ataque terrorista ao World

Trade Center trouxe à tona uma série de

variáveis no que diz respeito à

vulnerabilidade das empresas e aos

acontecimentos que as podem afectar no dia-a-dia.

A realização de uma avaliação de risco, mesmo sendo bem executada, não é por si só

garantia de segurança e nem mesmo um conjunto de planos bem estruturados pode impedir a

ocorrência de catástrofes. Pode sim, no máximo, reduzir os seus impactos. Como exemplo,

citamos o acontecido com a empresa Cantor Fitzgerald, que no evento perdeu 700 funcionários,

perdeu inteligência, talento e experiência, que são variáveis difíceis de substituir e de repor.

4 Tradução do inglês: “O impacto directo na economia real mundial está já a ser sentido. A

destruição irá custar certamente ao Japão muito mais que os 132 mil milhões de dólares que o terramoto

Kobe de 2005.”. 5 O artigo data de 22 de Março de 2011, pelo que a frase sobre “o impacto estar já a ser sentido”

terá de ser interpretada à vista da mesma. 6 Tradução do inglês: “As consequências financeiras são igualmente alarmantes. O índice Nikkei

225 (principal índice económico da Bolsa japonesa) desceu 6,2% na segunda-feira, com prejuízo

patrimonial de mais de 300 mil milhões de dólares, perdendo mais 10,6% na terça-feira.”.

Ilustração 1 - Os Perigos

Page 9: Disaster Recovery

Algumas empresas tinham escritórios em prédios contíguos e neles armazenavam as

cópias de segurança, e mesmo perdendo pessoas (e a sua identidade e cultura) puderam retomar

a sua actividade.

No entanto, muitas empresas perderam tudo, e neste caso restou unicamente o caminho

da extinção. Em alguns casos o impacto não foi maior, pois clientes e fornecedores

desapareceram ou preferiram não divulgar as perdas, assumir os prejuízos, para evitar perdas

maiores.

É inegável que no mundo da informática o conceito de continuidade de negócios foi

alterado para sempre.

O impacto económico interno e global foi astronómico. Com o ataque veio o

encerramento de Bolsas de Valores Americanas e noutros pontos do globo. Bolsas essas que

viriam a abrir mais tarde reflectindo de imediato as consequências da crise: “Gold prices spiked

upwards, from $215.50 to $287 an ounce in London trading. Oil prices also spiked upwards.

Gas prices in the United States also briefly shot up, though the spike in prices only lasted about

one week.

Currency trading continued, with the United States dollar falling sharply against the

Euro, British pound, and Japanese yen. The next day, European stock markets fell sharply,

including declines of 4.6% in Spain, 8.5% in Germany, and 5.7% on the London Stock

Exchange. Stocks in the Latin American markets also plunged, with a 9.2% drop in Brazil, 5.2%

drop in Argentina, and 5.6% decline in Mexico, before trading was halted.”7

Mas o desastre não afecta só os mercados financeiros mas também a economia real tal

como no exemplo do terramoto: “In international and domestic markets, stocks of companies in

some sectors were hit particularly hard. Travel and entertainment stocks fell, (…) Online travel

agencies particularly suffered, as their cater ti leisure travel.” 8

Em conclusão, e não nos sendo possível obter mais informação concreta sobre as

companhias sediadas nas Torres Gémeas para este estudo, será facilmente perceptível também

que todas as que não estivessem preparadas para um eventual desastre dificilmente conseguiram

reduzir o prejuízo de tamanha catástrofe ou mesmo a perda total.

7 Cfr:

http://en.wikipedia.org/wiki/Economic_effects_arising_from_the_September_11_attacks#Indirect_effects

, dia 24 de Maio de 2012 às 23h55m 8 Cfr:

http://en.wikipedia.org/wiki/Economic_effects_arising_from_the_September_11_attacks#Indirect_effects

, dia 24 de Maio de 2012 às 00h16m

Page 10: Disaster Recovery

2. Business Continuity

Business Continuity (BC) é muitas vezes referido e/ou confundido com Disater

Recovery Plan (DR) e embora os dois tenham muito em comum, o Disaster Recovery Plan é

orientado para a recuperação de uma infra-estrutura após o desastre enquanto o Business

Continuity Plan (BC) define como o “negócio” deverá continuar a funcionar até recuperar do

desastre, senão vejamos:

“Plano de Continuidade de Negócios (PCN)

O Plano de Continuidade de Negócios (PCN), o qual é a tradução de Business

Continuity Plan (BCP), é o desenvolvimento preventivo de um conjunto de estratégias e planos

de acção de maneira a garantir que os serviços essenciais sejam devidamente identificados e

preservados após a ocorrência de um desastre*, e até o retorno à situação normal de

funcionamento da empresa dentro do contexto do negócio do qual ela faz parte. Além disso, sob

o ponto de vista do PCN, o funcionamento de uma empresa deve-se a duas variáveis: os

componentes e os processos.

Os componentes são todas as variáveis utilizadas para realização dos processos:

energia, telecomunicações, informática, infra-estrutura, pessoas. Todas elas podem ser

substituídas ou restauradas, de acordo com suas características.

Já os processos são as actividades realizadas para operar os negócios da empresa.

O Plano de Continuidade de Negócios é constituído pelos seguintes planos: Plano de

Administração de Crises (PAC), Plano de Recuperação de Desastres (PRD) e Plano de

Continuidade Operacional (PCO). Todos estes planos têm como objectivo principal a

formalização de acções a serem tomadas para que, em momentos de crise, a recuperação, a

continuidade e a retomada possam ser efectivas, evitando que os processos críticos de negócio

da organização sejam afectados, o que pode acarretar em perdas financeiras.

No que diz respeito à necessidade de actualizações, o Plano de Continuidade de

Negócios deve ser revisado periodicamente, pois mudanças significativas em componentes,

actividades ou processos críticos de negócio podem fazer com que novas estratégias e planos

de acção sejam previstos, evitando assim com que eventuais desastres desestabilizem

profundamente o andamento regular do negócio da empresa."9

Aqui entenda-se “negócio” por todas as áreas estratégicas da organização.

Numa organização bem estruturada, ambos os planos são de suma importância razão

pela qual muitas vezes se encontram associados num único documento.

9 Cfr: http://pt.wikipedia.org/wiki/Plano_de_continuidade_de_neg%C3%B3cios, dia 27 de Maio

de 2012 às 18h35m

Page 11: Disaster Recovery

O primeiro passo para definir um correcto plano de continuidade de negócio será aferir

os potenciais impactos de cada tipo de evento ou desastre em cada área de negócio, uma vez que

este vai para além da projecção de uma infra-estrutura meramente física, projectando acima de

tudo um ciclo ou melhor dizendo, um sistema de comunicação sob o qual o deverá assentar o

Disaster Recovery Plan, a fim de que este garanta a prossecução do funcionamento de todos os

sistemas e consequentemente a troca de informações e processamento de dados necessários ao

bom funcionamento da organização, de acordo com as métricas definidas.

Uma das ferramentas mais utilizadas é o BIA (Business Impact Analysis). Esta

ferramenta permite aferir o grau de potencial perda de dados e os efeitos indesejados de tal

situação.

Ilustração 2 - IT Security Cycle.

Certificação - ISO 22301

Tendo em conta a matéria sensível que ao fim ao cabo é hoje a informação, não será de

forma alguma de estranhar que esta tenha sido alvo de regulamentação a nível de qualidade, a

fim de distinguir as instituições que melhor se organizam no sentido de precaverem qualquer

tipo de eventualidade que possa de alguma forma acarretar consequências danosas ao normal

funcionamento não só da própria empresa mas que possa também vir a influenciar por efeito

dominó o funcionamento de terceiros.

"A ISO 22301, primeira norma internacional a nível mundial para a Gestão de

Continuidade de Negócios (BCM), foi desenvolvida para ajudar as organizações a minimizar o

risco associado a este tipo de acontecimentos disruptivos. A ISO lançou oficialmente a ISO

22301 “Segurança da sociedade – Sistemas de gestão de continuidade de negócios –

Page 12: Disaster Recovery

Requisitos”, a nova norma internacional para Sistemas de Gestão de Continuidade de Negócio

(SGCN). Esta norma vem substituir a actual norma Britânica BS25999.

A ISO 22301 especifica os requisitos para planear, estabelecer, implementar, operar,

monitorizar, rever, manter e melhorar continuamente um sistema de gestão documentado de

modo a preparar para, responder e recuperar de eventos que possam interromper o normal

funcionamento de uma organização, quando os mesmos ocorram.

Os requisitos especificados na ISO 22301 são genéricos e pretende-se que sejam

aplicáveis a todas as organizações, independentemente do tipo, dimensão e natureza da

organização. O campo de aplicação destes requisitos depende do ambiente de trabalho e

complexidade da organização em causa.

A normalização da continuidade do negócio evolui com a norma ISO 22301,

acrescentando:

Maior ênfase na definição dos objectivos, monitorização de desempenho e métricas;

Expectativas mais claras sobre gestão;

Planeamento mais cuidadoso e preparação dos recursos necessários para garantir a

continuidade dos negócios.

A ISO 22301 aplica-se a todas as organizações, independentemente do tipo e dimensão,

que pretendam:

Estabelecer, implementar, manter e melhorar um SGCN;

Assegurar conformidade com a política declarada da organização de continuidade de

negócios;

Demonstrar conformidade a outras partes;

Procura da certificação / registo de seus SGCN por um organismo independente de

certificação acreditado, ou

Demonstrar autodeterminação e realizar uma auto-declaração de conformidade com

esta Norma Internacional

22301:2012

Seguindo a nova estrutura do ISO Guide 83, a ISO 22301 encontra-se organizada nas

seguintes principais cláusulas:

o Cláusula 4: Contexto da organização

o Cláusula 5: Liderança

o Cláusula 6: Planeamento

o Cláusula 7: Suporte

o Cláusula 8: Operação

o Cláusula 9: Avaliação de desempenho

o Cláusula 10: Melhoria

Page 13: Disaster Recovery

Encontram-se listadas abaixo, cada uma destas actividades principais.

Determinar questões internas e externas que são relevantes para a sua finalidade e que

afectam a sua capacidade de atingir os resultados esperados dos seus SGCN, tais como:

Actividades da organização, funções, serviços, produtos, parcerias, cadeias de

abastecimento, relações

com as partes

interessadas, bem como

o potencial impacto

relacionado a um

incidente disruptivo;

Interligações entre a

política de continuidade

de negócios e os

objectivos da

organização e outras

políticas, incluindo a sua estratégia global de gestão de risco;

O apetite de risco da organização;

Necessidades e expectativas das partes interessadas relevantes;

Requisitos legais aplicáveis, regulamentares e outros requisitos que a organização

subscreva

Faz ainda parte desta cláusula, a identificação do âmbito de aplicação do SGCN, tendo

em conta os objectivos estratégicos da organização, produtos e serviços essenciais, tolerância

de riscos, e quaisquer obrigações regulamentares, contratuais ou das partes interessadas.

A gestão de topo deve demonstrar um compromisso contínuo com o SGCN. Através da

sua liderança e acções, a gestão pode criar um ambiente no qual diferentes atores sejam

plenamente envolvidos e em que o sistema de gestão pode operar efectivamente em sinergia

com os objectivos da organização. Eles são responsáveis por:

Assegurar que o SGCN é compatível com a direcção estratégica da organização;

Integrar os requisitos do SGCN nos processos de negócio da organização;

Fornecer os recursos necessários para o SGCN;

Comunicar a importância de uma eficaz gestão de continuidade de negócios;

Assegurar que o SGCN atinge os resultados planeados;

Orientar e suportar a melhoria contínua;

Estabelecer e comunicar uma política de continuidade de negócios;

Assegurar que os objectivos do SGCN e planos são estabelecidos;

Assegurar que as responsabilidades e autoridades para funções relevantes são

atribuídas.

Ilustração 3 - Certificação

Page 14: Disaster Recovery

Esta é uma fase crítica no que se refere ao estabelecimento de objectivos estratégicos e

princípios orientadores para o SGCN como um todo. Os objectivos de um SGCN são a

expressão da intenção da organização para tratar dos riscos identificados e / ou para cumprir

com os requisitos das necessidades organizacionais. Os objectivos de continuidade de negócios

devem:

Ser coerentes com a política de continuidade de negócios;

Ter em conta o nível mínimo de produtos e serviços que é aceitável para a organização

atingir seus objectivos;

Ser mensuráveis;

Ter em conta os requisitos aplicáveis;

Ser monitorizados e actualizados conforme apropriado.

A gestão do dia-a-dia de um sistema de gestão de continuidade de negócios eficaz

baseia-se na utilização dos recursos apropriados para cada tarefa. Estes incluem,

equipas competentes com formação relevante (e demonstrável) e serviços de apoio,

sensibilização e comunicação. Esta, deve ser apoiada por boa e documentada gestão de

informação.

Devem ser consideradas nesta área, comunicações internas e externas da organização,

incluindo o formato, o conteúdo e o momento adequado para tais comunicações.

São também especificadas nesta cláusula as exigências sobre a criação, actualização e

controle da informação documentada.

Após o planeamento do SGCN, a organização deverá operacionalizá-lo. Esta cláusula

incluí:

Análise de Impacto

de Negócios (AIN):

Esta actividade

permite à

organização

identificar os

processos críticos

que sustentam os

seus principais produtos e serviços, as interdependências entre os processos e os

recursos necessários para operar os processos num nível minimamente aceitável.

Avaliação de Riscos: A ISO 22301 propõe a referência à norma ISO 31000 para

implementar este processo. O objectivo deste requisito é o de estabelecer, implementar

e manter um processo formal e documentado de avaliação de riscos que

Ilustração 4- AIN vs. AR

Page 15: Disaster Recovery

sistematicamente identifica, analisa e avalia o risco de incidentes disruptivos para a

organização.

Estratégia de Continuidade de Negócios: Após serem estabelecidos os requisitos

através da AIN e da avaliação dos riscos, podem ser desenvolvidas as estratégias

necessárias e identificados os mecanismos que permitam à organização proteger e

recuperar as suas actividades críticas tendo por base a tolerância ao risco

organizacional e de acordo com os objectivos definidos de tempo de recuperação. A

experiência e as boas práticas indicam claramente que uma implementação antecipada

de uma estratégia global de Gestão de Continuidade de Negócios (GCN), permitirá à

organização garantir que as actividades de GCN são alinhadas com e apoiam a

estratégia global de negócios da organização. A estratégia de continuidade de negócios

deve ser uma componente integral da estratégia corporativa de uma instituição.

Procedimentos de continuidade de negócios: A organização deve documentar os

procedimentos (incluindo os arranjos necessários) para garantir a continuidade das

actividades e gestão de um incidente disruptivo. Os procedimentos têm de:

o Ser específicos sobre as medidas imediatas que devem ser tomadas durante

uma interrupção;

o Ser flexíveis de modo a responderem a ameaças imprevistas e ás alterações das

condições internas e externas;

o Ser focados no impacto de eventos que potencialmente poderão interromper as

operações;

o Ser desenvolvidos com base em pressupostos declarados e em uma análise de

interdependências, e;

o Ser eficientes de forma a minimizar as consequências através da

implementação de estratégias de mitigação apropriadas.

Exercitar e testar: Para assegurar que os procedimentos de continuidade de negócios

são consistentes

com os

objectivos de

continuidade de

negócios, a

organização

terá que testá-

los

regularmente.

Exercitar e

testar são os processos de validação dos planos de continuidade de negócios e

Ilustração 5 - Grelhas de Processos

Page 16: Disaster Recovery

procedimentos de modo a assegurar que as estratégias seleccionadas são capazes de

fornecer as respostas e resultados de recuperação nos prazos acordados pela gestão.

Uma vez implementado o SGCN, a ISO 22301 exige um acompanhamento contínuo do

sistema, bem como revisões periódicas para melhorar o seu funcionamento:

Monitorizar em toda a sua extensão, a política da organização de continuidade de

negócio, objectivos e metas de modo a que os mesmos sejam atingidos;

Medir o desempenho dos processos, procedimentos e funções que protegem as suas

actividades prioritárias;

Monitorizar o cumprimento desta norma e dos objectivos de continuidade de negócios;

Monitorizar evidências históricas de desempenho deficiente do SGCN

Condução de auditorias internas em intervalos planeados e

Avaliar tudo isso na revisão pela gestão em intervalos planeados.

A melhoria contínua pode ser definida como todas as acções tomadas em toda a

organização para aumentar a eficácia (atingir objectivos) e eficiência (uma relação

custo / benefício ideal) dos processos e controlos de segurança para trazer maiores

benefícios para a organização e para as suas partes interessadas. Uma organização

pode melhorar continuamente a eficácia de seu sistema de gestão através da utilização

da política de continuidade de negócios, objectivos, resultados de auditorias, análise de

eventos monitorizados, indicadores, acções correctivas e preventivas e revisão da

gestão.”10

Em resumo, a importância hoje em dia da certificação é tal que em alguns sectores,

nomeadamente banca e seguros, as empresas que demonstrem estar certificadas têm inúmeras

vantagens concorrenciais em termos de mercado usufruindo inclusive de grandes descontos nas

taxas de juros, nos casos de empréstimos bancários e/ou propostas de seguros bem mais

vantajosas.

10 Cfr: http://pecb.org/iso22301pt/, dia 28 de Maio de 2012 às 12h28m

Page 17: Disaster Recovery

Ilustração 6 - Interfaces

Fonte: http://www.enisa.europa.eu, dia 25 de Maio de 2012 às 23h20m

3. Disaster Recovery

“Disaster recovery planning - is the process, policies and procedures related to

preparing for recovery or continuation of technology infrastructure critical to an

organization after a natural or human-induced or technological disaster has occurred.

Disaster recovery is a subset of business continuity.”11

. Esta definição escrita pelo Dr.

Jim Kennedy em ContinuityCentral.com, um website directamente ligado ao BCI12

e

que de forma sucinta mas eficaz dá a entender o que é um Plano de Recuperação de

Desastres.

Os desastres não se restringem aos desastres naturais bem como aos ataques

terroristas. Hoje, temos ameaças como “…ataques com negação de serviços, violência

no local de trabalho e um conjunto adicional de ameaças inimagináveis duas décadas

atrás.” (SERRANO, JARDIM, 2007, p.20).

11 Cfr: http://www.continuitycentral.com/feature0905.html, dia 26 de Maio de 2012 às 10h46m 12

Business Continuity Institute

Page 18: Disaster Recovery

Esta constatação torna perceptível a importância de um efectivo Plano de

Recuperação de Desastres nas organizações, sendo que as ameaças deixam

completamente de “acontecer apenas aos outros”, pois quem não vivenciou já um corte

abrupto de energia na organização, ou mesmo uma cheia devido a um cano rebentado,

ou ainda um corte nas comunicações? São factos relativamente usuais, ou podemos

mesmo dizer, regulares o suficiente para se tornarem de extrema importância.

Em relação à definição anterior falta acrescentar algo de vital interesse: as

pessoas. Sem elas (e seu envolvimento), todo e qualquer esforço para o

desenvolvimento de um plano efectivo, que contenha todos os processos necessários, as

tarefas que os compõem e as suas políticas de forma a atingir o restabelecimento da

“normalidade” após um desastre, falha pela base, pelo elemento chave, pelos

stakeolders.

“Por norma existem apenas alguns passos que todas as organizações devem

executar para criarem o seu próprio plano de recuperação de desastres:

1. O primeiro passo é obter-se o apoio dentro da chefia da organização e a

sua rápida sensibilização para o facto;

2. O segundo passo é a criação do próprio plano de recuperação de

desastres e por fim;

3. O terceiro e último passo é o de se testar e pôr em prática o planeamento

efectuado.” (SERRANO, JARDIM, 2007, p.21-22).

Como vemos no primeiro ponto, percebemos assim a importância das pessoas no

envolvimento, no planeamento, mas ainda mais importante é o facto do suporte da

direcção, do alinhamento estratégico do plano, pois caso contrário, estará sempre

condenado ao fracasso.

Um dos factores a ter em conta logo aquando da análise para a realização do

plano passa precisamente pela identificação de quais são os processos de negócio e

quais serão os de suporte. Devemos ainda identificar a criticidade de cada um deles,

bem como os custos para a empresa em caso de falha. Outro factor importante será o

orçamento para a realização do plano, pois será algo que influenciará todas as escolhas

quer ao nível dos sistemas a serem preservados, quer mesmo em termos das

implementações técnicas que serão escolhidas.

“Finalmente é importante o desenvolvimento de um plano de projecto que

permita durante toda a fase de planeamento um tempo razoável para o seu próprio

desenvolvimento e no qual devem estar definidos todos os recursos disponíveis e

Page 19: Disaster Recovery

orçamentos necessários para se atingirem os vários pontos-chave no decorrer do

projecto, bem como a integração de métricas que permitam medir o grau de sucesso do

projecto.” (SERRANO, JARDIM, 2007, p.23).

Por fim resta-nos acrescentar que este é um processo iterativo pelo que ele nunca

estará finalizado existindo sempre margem para a melhoria contínua.

Tentamos por fim dar uma visão muito high-level dos diversos pontos falados

através de um esquema.

Aprovação do BoardAlinhamento Estratégico

Envolvimento das Pessoas (Stakeolders)

Identificação dos Processos

Implementação do Plano Testes à Qualidade do PlanoPLANO DE RECUPERAÇÃO DE DESASTRES

ANÁLISE PLANEAMENTO EXECUÇÃO

ß MELHORIA CONTÍNUA à

Ilustração 7 – Visão Geral do Planeamento de Recuperação de Desastre

4. Metodologias

Representando nos dias de hoje um departamento fundamental no

desenvolvimento das organizações o departamento de TI, tendo como base o suporte de

Business Operations, deverá interna e externamente assegurar que os serviços de

suporte se mantenham online,

Esta decisão estratégica, deverá ser elaborada de uma forma Vertical, partindo

sempre do início da pirâmide organizacional, e tendo como decisão sua as áreas de core

da empresa que deverão ser cobertas por este plano.

Page 20: Disaster Recovery

Algumas empresas subestimam os riscos de um desastre e não investem em BCP

(Business Continuity Plan). Os planos de continuidade de negócios podem ser

classificados em dois tipos: os Planos de Continuidade das áreas de negócios e os

Planos de Recuperação de Desastres (Disaster Recovery Plan) do Centro de

Processamento de Dados.

A terminologia usada como Disaster Recover, não se deverá confundir com a

possibilidade única de existência de grandes catástrofes, pois ocorrem por vezes

pequenos incidentes para os quais qualquer departamento de TI deve estar preparado.

Aqui então é premente pensar que com uma matéria tão sensível deverá obedecer como

já descrito acima a um plano estratégico onde é imperativo que as esferas mais altas

sejam cooperantes e partes interessadas uma vez que serão elas que deverão definir o

que fazer em caso de algo acontecer.

Devido aos custos e a afectação de todas as estruturas de uma empresa,

associados à concepção e implementação de um plano de Disaster Recover, é

fundamental tal como já foi referido, a obtenção de todo o suporte por parte da

administração da empresa, Não nos podemos esquecer que um investimento

considerado elevado, pode ser visto como um custo, em que a probabilidade de

ocorrência pode ser nula, ou que seguindo um dos aspectos do pensamento grupal,

descrito como algo que somente acontece aos outros partindo sempre do pressuposto

errado que estamos preparados para qualquer eventualidade,

Sendo que na maior parte das vezes não se poderia estar mais longe da realidade,

é aqui que o Gestor de TI tem de ter sensibilidade e arte para conseguir passar a

mensagem de que os custos financeiros e impactos na organização podem representar

por vezes o fecho da mesma. As estatísticas do ”U.S. Bureau of Labor (2002) mostram

que das companhias que sofrem um desastre convencional apenas 6% sobrevivem a

longo prazo, 43% nunca voltam ao activo e 51% acabam por fechar em menos de dois

anos”

Assim é essencial que o plano de Disaster Recovery a elaborar contemple

respostas aos seguintes pontos:

Responsáveis pela Determinação e Arranque do Plano de Contingência.

o Gestor do Processo de Continuidade;

o Coordenador da Recuperação.

Page 21: Disaster Recovery

O gestor do processo de contingência tem como papel fulcral não só assegurar o

perfeito funcionamento do plano em si, mas também assegurar a comunicação com a

administração da mesma e fazer a integração do processo em todas as áreas de negócio

da empresa que se tenham definido como fulcrais.

Por outro lado é ao coordenador do processo de Recuperação que é atribuída a

responsabilidade pela operacionalidade efectiva de todo o processo e suas vertentes.

Este deverá coordenar os diversos processos, as simulações, desenvolver o plano,

formação das equipas intervenientes nas diversas áreas e manter uma ligação estreita

com o gestor de continuidade.

Funções e Responsabilidades:

o Determinação Das Equipas de Recuperação.

Análise de Ameaças;

Custos de paragem;

Definição de Níveis de Desastre e suas respostas;

Fornecer á administração uma compreensão detalhada do esforço total

requerido para tornar e manter um plano de recuperação eficaz;

Obter o compromisso apropriado da administração para suportar e

participar no esforço de recuperação;

Criação de cenários;

Tipos de Implementação;

Escolha de Locais de Contingência:

o Especial Atenção a Aspectos Geológicos:

o Fácil Acesso:

o Temperatura Ambiente.

Definição de StakeHolders do processo e Parcerias;

Estarei disposto a aceitar Quebras, percas, Perdas?;

Qual o Tempo de RTO (Recover Time Object)13

;

Qual o Recovery Point Objective (RPO):

o Qual a quantidade de dados que uma organização pode considerar ser

aceitável perder ou que o tempo de reposição seja superior.

Qual o Tempo de Arranque de contingência;

13

Margem temporal considerado aceitável para um processo estar inactivo

Page 22: Disaster Recovery

Que implicação terá isso no meu negócio?

o Custos Financeiros;

o Custos de Imagem;

o Reputação;

o De teorização da Marca.

Vamos Segurar;

O que vamos Segurar (Tipo de Aplicações/dados);

Que Métodos usarão;

Manutenção, Monitorização, Testes, Simulações;

Ilustração 8 - Riscos Associados

Depois de identificada e bem definida a estratégia, temos pela frente então o

enorme desafio de criar uma infra-estrutura de suporte que em caso de algo acontecer se

transforme não num problema mais sim na oportunidade contínua de melhoria criando e

tornando esse problema num acesso ininterrupto à informação da organização.

O desenvolvimento de uma estratégia viável de recuperação não deve ser uma

iniciativa exclusiva da área de IT, mas de toda a organização para proteger os interesses

da empresa.

O objectivo inicial de um plano de recuperação (DRP) é permitir que uma

organização sobreviva a um desastre e que possa restabelecer as operações dos

Page 23: Disaster Recovery

negócios. A fim de sobreviverem, as empresas devem assegurar que as operações

críticas possam recomeçar o seu normal processamento dentro de um espaço de tempo

razoável.

Nos objectivos de um plano eficaz de recuperação de desastres devem-se

representar por metodologias que tenham como base os seguintes aspectos:

Estruturação de Datacenters.

o É Fundamental que ao projectar um Datacenter seja ele local ou remoto

se comece por ter um acesso físico controlado diminuindo dessa forma

alguns riscos de origem Humana.

o Redundância em Termos de Fornecimento de Energia eléctrica e ou

geradores

o Redundância de Sistemas de Arrefecimento.

o Controlo de Temperaturas

A escolha de um local para implementação ou até mesmo de subcontratação de

infra-estruturas para Disaster Recovery deve ser uma escolha bem sensata e reflectida.

As condições geológicas devem ser em primeiro lugar atendidas, não faz sentido

implementar uma solução de backup num local que é extremamente sujeito a tremores

de terra ou outras catástrofes de grande monta ou então em que a sua periocidade se

mostre de alguma forma elevada.

O acesso a essas instalações deve ser de uma forma geral, fácil e rápido

permitindo dessa forma que as diversas equipas intervenientes no processo se

movimentem com rapidez e célere de modo a assegurar o normal desenrolar do

processo.

Estruturas de Hardware

o Deverão ser pensadas e implementadas soluções de redundância em

servidores, diminuindo dessa forma os tempos de Offline. Logo aqui

poder-se-á definir que os nós de um cluster poderão ter localizações

internas ou externas.

Page 24: Disaster Recovery

Quando se fala em sistemas de “High Available” estamos perante sistemas

pensados e concebidos para que o tempo de interrupção/downtime de processos seja

controlado e o mais baixo possível resultando assim num melhor nível de utilização e

disponibilidade para os utilizadores.

Este conceito de alta disponibilidade só é possível com a conjugação de novas

tecnologias de hardware e software, que permite uma distribuição de carga e

disponibilidade de serviços ou então uma redundância dos mesmos, onde a informação

circula e está armazenada em soluções de storage partilhadas e que podem ser acedidas

a partir de qualquer ponto do sistema esteja onde estiver.

Existem soluções em que estes conjuntos de sistemas de alta disponibilidade

(denominados de Cluster) possam assumir configurações não só locais mas regionais,

nacionais ou internacionais, disponibilizando em casos extremos de necessidade de

continuação de serviço, uma total transferência de processamento em caso de falha

completa de um Datacenter.

Estruturas de Comunicações

o Este é um aspecto fundamental e fulcral, pois como é facilmente

perceptível, em caso de falha todo o nosso projecto cai por terra. Desta

forma há que pensar em soluções redundantes não só em termos de

fornecedor de serviço como de tecnologia.

A ligação entre os datacenters que dispusermos, deverá ter em consideração que

em caso de catástrofe o serviço deverá ser sempre assegurado. Para isso as linhas de

comunicação não só deverão ser dedicadas, eliminando desse modo, os problemas de

sobrecarga nas linhas, bem como os circuitos deverão ser de diferentes operadores e de

diversas tecnologias, redundantes, de saída por locais opostos, se possível em direcções

diferentes precavendo deste modo várias situações de ruptura.

Em termos de software as organizações deverão dispor de ferramentas que lhes

assegurem as replicações de bases de dados de uma forma rápida e consistente,

permitindo deste modo que em caso de necessidade extrema a continuidade de serviço

se encontra assegurada.

Estruturação da Rede

Page 25: Disaster Recovery

o Rede física e seus componentes, routers, switchs, serviços de Rede,

Armazenamento de dados replicação ou backups.

Rápido restabelecimento do acesso à informação redundante

o Este rápido restabelecimento poderá ser respondido através ou da criação

de soluções redundantes em que o utilizador nem se apercebe que algo

aconteceu ou então, pondo em marcha um plano de deslocalização de

recursos humanos para local seguro ou ainda dando permissão de acesso

a partir de alguma outra localização (homeworking) usando ligações

VPN SSL .

Sistema de Comunicação com terceiros.

o É importante nunca esquecer que uma organização não vive só, assim

sendo deverá ser contemplado também um plano de comunicação com a

envolvente de tarefa;

Tipo de Recuperação.

o Recuperação Online ou Assistida, A organização deverá decidir se opta

por um processo de recuperação através do restauro de backups

estruturados ou uma solução sempre online.

Ferramentas de Centralização e monitorização remoto.

Ferramentas de Suporte remoto.

Definição de um plano de backup

A reposição do serviço não é somente em casos de maiores problemas como

catástrofes ambientais, incêndios, inundação mas também deve reflectir a forma de

resolução de pequenos incidentes do dia-a-dia que por vezes os tratamos como eles são

mesmo, ou seja pequenos incidentes, mas que no fundo podem afetar no normal

funcionamento das organizações tais como um vírus, um ficheiro ficar corrupto, ou um

apagar de um ficheiro de forma inadvertida.

Na maior parte dos casos acima descritos a solução passa pelo departamento de

TI implementar uma simples solução de backups tradicionais, onde apenas será factor

decisório a rapidez de restauro.

Page 26: Disaster Recovery

Grande parte do foco de planeamento de recuperação de dados ou

implementação de planos de disaster recover passa por uma das muitas alternativas que

hoje existem:

- Quer seja através da criação de um sistema eficaz de backups usando por

exemplo a tecnologia de D2D2T (Disk to Disk to Tape), mais em voga nos dias de

hoje;

- Ou pela criação de sites redundantes onde se fazem depois a implementação

dos backups;

- Ou ainda sites completamente autónomos com replicação de dados online ou

em “batch” do datacenter principal assentes em soluções físicas baremetal;

- Ou então e cada vez mais recorrendo a soluções de Virtualização. Nesta área o

conceito de Cloud é um tema abordado noutro capítulo e que pode ser um conceito

muito interessante podendo trazer uma mais-valia às organizações.

A virtualização de servidores devido à enormíssima facilidade de

implementação, maneabilidade, facilidade de migração e poupança de recursos

financeiros, é hoje em dia uma solução extremamente usada em Disaster Recovery pois

os modelos de transacção de máquinas e informação são extremamente rápidos e

eficazes podendo uma Direcção de TI escolher de entre este dois modelos o que mais se

adequa à sua estrutura de Datacenter primário ou de contingência.

Para que se mostre totalmente eficaz um plano de Disaster Recovery deve

requerer extensos testes de funcionalidade, pessoal especializado e execução de testes

de recuperação periódicos, pois de nada serve um bom plano se depois na realidade não

funcionar quando necessário.

Hoje mais importante do que o ter backup, é assegurar a qualidade do backup e o

tempo de reposição do mesmo assegurando assim que a espinha dorsal da organização

seja reposta o mais rapidamente possível e nos prazos previstos.

Page 27: Disaster Recovery

Ilustração 9 - P2V

I. Backup e Arquivo

Reconhecido como um sistema de segurança inicial utilizado como protecção de

um simples PC até um mainframe de uma rede local é sem dúvida um sistema eficaz

contra situações que quase sempre caiem no esquecimento: - falhas de hardware, erros

de software, erro humano, desastres naturais, intrusão ou até roubo.

Então porque falamos em sistema de Backup e Arquivo? Backup é a protecção

dinâmica dos sistemas, onde a informação é regularmente actualizada segundo

estratégias bem definidas que incluem, normalmente, backups incrementais,

diferenciais, e totais. Arquivo, é simplesmente uma cópia total que é guardada num

determinado suporte e aí permanece estática, durante algum tempo, até que seja

substituída por outro. As cópias devem ser guardadas em locais distantes, num cofre

com humidade e temperatura controlada, resistente a 1500º centigrados.

II. Ser Confiável

Quando se escolhe uma solução desta natureza o mínimo que se pode exigir é

que seja efectivamente eficaz e fiável, é expectável que de forma a minimizar tempos de

paragem se invista em sistemas de grande disponibilidade com o objectivo de poupar o

tempo que leva a concluir um backup, mas convém não esquecer que esse investimento

Page 28: Disaster Recovery

se torna completamente absurdo se os processos de recuperação continuarem a ser

morosos e a inspirar pouca confiança.

Uma solução desta dimensão deverá ser sempre estudada, dimensionada em

função de uma previsão de crescimento dos sistemas, sendo que a arquitectura, as

estratégias, tecnologias e métodos de backup, deverão optimizar as facilidades do

sistema numa solução de compromisso entre vários pontos.

III. Implementação de backup

Quando passamos à implementação de uma solução deste género, não nos

deverá ser suficiente garantirmos a sua eficiência, devemos ter em linha de conta os

processos a desenvolver, as estratégias e cada caso a seguir. Aí é extremamente comum

pensar em algumas questões já aqui faladas:

Que informação é que realmente carece de protecção? – Informação Crítica.

Quando executo as rotinas de backup? – Periodicidade.

Por quanto tempo devo guardar a informação em backup? – Prazo de validade.

A informação Crítica

Aspecto fundamental a ter em linha de conta, quantas vezes damos com

informação que pouco interesse tem, desactualizada, repetida em vários locais. Não

querendo com isto dizer que a mesma não poderá ter importância aferindo-se que não

sendo vital esta deverá então figurar num sistema de arquivo, não sobrecarregando desta

forma os sistemas mais vitais.

Periodicidade das operações de backup

Aqui haverá a necessidade de avaliar a rapidez e importância, para além da taxa

de crescimento de informação a salvaguardar e do esforço que será necessário

despender para repor a informação, desde a última operação de backup.

Poderá em alguns casos se a organização assim o entender e aceitar como

correcto, optar por fazer um backup semanal, em especial se a informação que foi

gerada durante uma semana poder ser de novo recriada sem grandes custos. Claro que

em organizações onde o volume de dados gerado é enorme e que vivem da informação

ao momento, o ponto de partida terá de ser outro, mas achamos que deve ser guardado

Page 29: Disaster Recovery

diariamente a informação do dia, durante 15 dias, uma tape por cada semana do mês,

uma tape mensal e uma tape por ano, durante pelo menos 5 anos.

Prazo de validade da informação em backup

O tempo durante o qual se pode guardar um backup está condicionado pela

capacidade de armazenamento atribuída ao sistema de backup.

Numa situação ideal seria praticável guardar todo o histórico por um período

infinito. A operação de reposição de um ficheiro é normalmente a consequência de um

pedido de um utilizador que se recorda que, afinal a versão do mês passado ainda

continha informação que agora é crítica. Infelizmente há que considerar que a

capacidade de armazenamento on-line dum sistema de backup não é infinita.

Ilustração 10 - Office Recovery

Page 30: Disaster Recovery

Reflexão

Actualmente quando se verifica que os desastres naturais, as ameaças terroristas,

ou as pandemias têm vindo a aumentar e que no mundo dos negócios dos nossos dias, o

acesso à informação é fundamental para a sobrevivência das organizações, a

necessidade de um plano de continuidade é mais crítica do que nunca.

Para manter o negócio operacional, as relações com os clientes, e dar suporte aos

empregados, é essencial ter uma solução tecnológica que facilite o acesso rápido,

simples e seguro à informação e às pessoas.

A informação hoje ganhou um cariz de dependência extrema e com uma

qualidade tremenda, Hoje em dia a paragem por mais de uma hora em determinadas

áreas de negócio pode ser fatal, como por exemplo instituições financeiras, gerando um

impacto profundo e nefasto.

Assim sendo, a dependência dos Sistema de informação é cada vez maior. daí

que se possam considerar os seguintes níveis de disponibilidade:

“Disponibilidade Básica ou elementar (99,5, a 99,8%);

Alta disponibilidade (99,8 a 99,95%, downtime < 4 Horas/ano.);

Disponibilidade Continua (99,999%, downtime < 5 minutos/ano);

Tolerância a Desastres:

Aumento da Disponibilidade;

Providencia o faillover automático em caso de desastres;

Recuperação de Desastres:

Não existe aumento de disponibilidade “per se”;

Minutos, Horas, em vez de dias ou semanas para a recuperação ou extinção.”

Podemos desta forma então dizer que a maior base de sustentação para a Gestão

da Continuidade assenta na diminuição máxima possível dos riscos inerentes à perca de

disponibilidade dos sistemas de informação.

5. Business Case

Começamos por chamar a atenção para o facto de este Business Case, assentar numa

premissa de total confidencialidade, não sendo por isso possível identificar o nome da empresa.

Por esse motivo não nos será possível também identificar os locais que mais adiante serão

Page 31: Disaster Recovery

referidos no texto, nem iremos aprofundar muito o plano de Contingência utilizado dada a

sensibilidade da matéria em apreço.

A Organização em questão opera na área da indústria farmacêutica, com localizações

dispersas pelo mundo, foi escolhida esta organização pois o plano de Disaster Recovery está

perfeitamente enquadrado não só na estratégia da empresa mas perfeitamente aliado e alinhado

com o plano de continuidade de negócio.

Este plano foi pensado na perspectiva abrangente de continuidade de negócio não só

replicando os Sistemas Informáticos na Área de IBO (International Business Operation) mas

acima de tudo passando pelos seus laboratórios de investigação e desenvolvimento.

Começando pelo pleonasmo, em princípio, houve a necessidade de compreensão das

percas e da análise de risco inerentes ao negócio, resposta a pequenos incidentes e a grandes

catástrofes, uma vez que, e compreendendo a dimensão da empresa e sua importância na vida

social das populações havia que garantir que a produção, investigação e desenvolvimento de

substâncias não sofresse constrangimentos na sua continuidade normal.

Não foram replicadas as fábricas na sua plenitude, no entanto foram escolhidas áreas de

negócio dentro do negócio que se entendiam como mais importantes e então posteriormente

definidos os planos de contingência.

De realçar que também foram assegurados outras áreas consideradas chave pois o grupo

opera em 4 grande áreas económicas a saber:

1. Farmacêutica;

2. Retalho;

3. Logística e distribuição;

4. Healthcare Information.

Para a criação do plano foram convidadas a estar presentes entidades e organismos

oficiais do país na área de meteorologia, geologia e segurança interna uma vez que era

fundamental a presença de tais entidades para o perfeito conhecimento de situações possíveis de

terramotos, e sua frequência, abatimentos de terra, células de terrorismo, entre outras, fatores

essenciais a ter em linha de conta, aquando do planeamento de um "Disaster Recovery Plan".

Poder-se-ia ter equacionado porque não a escolha de instalações já existentes como

grandes DataCenters, como por exemplo da IBM, ISP’s etc, mas essas infra-estruturas apenas

responderiam em termos de Sistemas Informáticos o que de alguma forma obrigaria a um

investimento para as outras áreas. Dessa forma foi decido que seriam criados 3 “bunkers” que

albergariam todas as vertentes, sendo dessa forma mais fácil fazer deslocar meios que também

partilhariam das mesmas unidades de controlo, arrefecimento, comunicações e energia eléctrica.

Foram criadas então equipas de estudo e planeamento, com áreas bem definidas e

atribuídas responsabilidades dentro de cada uma delas, equipas essas responsáveis por:

Page 32: Disaster Recovery

Edifícios

Acessos

Transportes

Infra-estruturas

Sistemas

Redes

Comunicações

Public Relations

Destas mesma equipas fazem parte membros do:

LST, ( Leadership Team)

IBO (International Business Operation),

GIS ( Global Information System),

STO (Support Team Operation)

ID ( Investigation and Development)

HRM ( Human resource management)

RA ( Regulatory Affairs)

QM ( Quality Management)

Os três “Security Sites” espalhados pelo mundo, em parte incerta mas com localização

estratégica e com acesso relativamente rápido, com localização apenas conhecida por alguns

membros das equipas (respeitando assim acordos de confidencialidade, defendendo-se ou

tentando minimizar possíveis situações de chantagem e ou sabotagem) encontram-se preparados

com sistemas autónomos e capazes de satisfazer e responder de imediato a três Níveis de

acontecimento”.

Destes três apenas é conhecido o último, sendo os restantes de alta confidencialidade e

trato.

Em termos de TI, os sites são compostos por Edifícios Seguros sem identificação e com

controlo de acesso restritos, Circuitos de Alimentação eléctrica redundante e com capacidade de

geração própria através de geradores, Estruturas de Servidores em Cluster recorrendo a

tecnologia de virtualização estando em ambiente online, ou seja replicação a cada transacção

para os diversos locais, as comunicações estão asseguradas em cada site por dois operadores

distintos, com linhas de propriedade separada, possuem capacidade de arranque e controlo local

ou remoto.

Estes sites são conhecidos as elevadíssimas capacidades de resposta e eficiência

estando apenas por ano parados 48 horas para manutenção preventiva ou de recurso.

Page 33: Disaster Recovery

6. O Estado da Arte

Na abordagem em particular deste tema procurou-se que o mesmo fosse escrito numa

linguagem leve de modo a ser acessível aos diversos elementos da turma, tentando desmitificar

um pouco o mundo da Informática em que os jargões andam em todo o lado.

Os gestores de sistemas de informação estão actualmente perante um dilema, por um

lado o controlo de custos e do outro como responder com rapidez às solicitações do dia-a-dia

A evolução tecnológica é cada vez mais rápida, não existindo soluções a longo prazo.

Perante esse dilema aparece o paradigma da Cloud Computing ou Computação nas Nuvens, que

mais não é que basicamente a utilização de qualquer aplicação, em qualquer lugar, com

qualquer dispositivo que tenha acesso á Internet, independentemente da plataforma e como se

estivesse localmente instalada no dispositivo que temos, PC, portátil, telemóvel, Iphone, Ipad,

televisão, frigorífico, em suma tudo o que tenha software de acesso à Internet.

Poder-se-á perguntar o que tem este tema a ver com o nosso trabalho, na nossa opinião,

em tudo, pois com as ofertas existentes no mercado as empresas podem não só controlar melhor

os custos bem como estas ofertas passam também por construir sistemas com soluções mais

robustas, aumentando a segurança e cumprindo as normas de qualidade inerentes à solução

adoptada e ao país de alojamento.

Actualmente os fornecedores de soluções informáticas apresentam diversas soluções

para o armazenamento de informação:

- Construção de datacenters nas empresas com soluções de replicação de dados para

outros locais;

- Colocação da solução informática em datacenters de fornecedores espalhados por

diversos locais;

- Servidores dedicados nos datacenters de fornecedores;

- Disponibilidade de espaço para alojar servidores;

- SaaS, solução de software há medida da nossa necessidade.

O futuro passa pelo Cloud Computing?

Em qualquer jornal ou revista de informática este tema vem sempre mencionado, e a

IDC estima que o negócio a nível mundial passe por 1,1 mil milhões de dólares em 2015, com a

criação de 14 milhões de empregos a nível global.

Page 34: Disaster Recovery

São as pequenas e médias empresas que estão a adoptar mais rapidamente este tipo de

solução passando por soluções híbridas (existem 3 tipos de soluções híbridas – aplicações

dentro e fora da empresa, públicas e privadas), uma vez que as grandes empresas estão

condicionadas aos grandes investimentos que efectuaram no passado, às validações efectuadas e

às normas que têm de cumprir, pois muitas delas certificaram os seus sistemas e a mudança é

mais lenta. Ainda subsistem muitas dúvidas com a segurança da informação e às leis norte

americanas de acesso à informação que está alojada nos Estados Unidos.

Segundo a Computer World, que menciona um estudo do Aberdeen Group, em caso de

desastre, as empresas de média dimensão baseadas em serviços de Cloud Computing voltam a

funcionar 4 vezes mais rapidamente do que as outras organizações.

Actualmente as soluções de CRM têm sido aquelas que evoluíram mais rapidamente

neste universo e a solução da Salesforce tem-se revelado como sem uma das de maior sucesso

através da sua flexibilidade, robustez, parametrização ajustável a cada cliente e disponibilidade

de serviço.

Em qualquer revista da especialidade podemos ainda encontrar ofertas de

disponibilização de espaço, construção de soluções à medida em servidores privados ou

públicos.

Também as políticas de qualidade implementadas nas empresas vão ser um factor

motivador do desenho de planos de continuidade do negócio e de políticas de recuperação em

caso de desastre.

Como as empresas querem ser cada vez mais inovadoras e centradas no seu negócio, ou

seja no que melhor fazem, tendem a deixar os serviços de infra-estrutura dos sistemas de

informação, também para quem o sabe fazer e gerir bem, provocando uma economia de escala e

adoptando soluções SaaS, (utilização de software conforme a necessidade), permitindo desta

forma saber exactamente qual é o custo real dos sistemas de informação, uma vez que existem

actualmente alguns os custos que tendem em ser dissimulados.

Este tipo de soluções permitem migrações mais fáceis de novas versões de software,

aumento e melhor adaptação às reais necessidades das empresas, no entanto muitos

fornecedores deste tipo de soluções não são tão permeáveis à diminuição de utilizadores.

Oferecem logo de raiz soluções de disponibilidade de uma infra-estrutura idêntica em caso

desastre mas não incluem logo de raiz a salvaguarda de informação o que se pode vir a revelar

ser um factor muito condicionador.

Existem ainda novos desafios no mundo dos sistemas de informação o “big data”, este

termo é utilizado para denominar o crescimento exponencial dos dados que as empresas

precisam ou podem tratar para extrair informação útil e prevê-se que o volume de informação

digital cresça no mundo inteiro a uma taxa anual de 59%.

Page 35: Disaster Recovery

O aumento da velocidade das comunicações também é uma realidade. Neste momento

em Portugal está a começar a ser instalada a tecnologia 4g para a rede móvel.

Existem 3 tipos de serviços oferecidos na nuvem, IaaS (serviços de infra-estrutura) SaaS

(plataforma como serviço) actualmente são os mais procurados e PaaS (housing, a informação

está nos meus servidores mas fora da minha casa e hosting, informação está na nuvem).

É neste contexto em que as empresas se encontram e para nós as soluções de Disaster

Recovery começam logo na definição da solução e do grau de importância que a mesma tem

para a empresa. Ao definir a sua missão, o plano de actividades e o seu plano de continuidade

terá de ter em conta as soluções informáticas que suportam o negócio.

As economias de escala, de infra-estrutura, aplicacional e manutenção permitem

apresentar preços muito concorrenciais, permitindo às soluções disponibilização de sistemas de

informação na nuvem como uma solução alternativa, desde que se respeitem os princípios

essenciais de uma solução de Disaster Recovery atrás mencionados. Estes permitem evoluir a

nível de armazenamento, licenciamento, crescimento das soluções, recuperação, devendo no

entanto ter em atenção o SLA (contrato que define os tempos mínimos e máximo da

disponibilidade dos serviços, salvaguarda de informação, site alternativo, coimas, acesso à

informação, ou outras especificações que se achem necessárias) e construídas em soluções de

alta disponibilidade.

Conclusão

Existe uma sem número de soluções disponíveis para cada caso, cada empresa tem de

adoptar aquela que melhor se adequa às suas necessidades, tendo em conta a sua disponibilidade

financeira, os seus objectivos e os planos definidos,

Como acontece na natureza, só os mais fortes conseguem sobreviver, tendo em atenção

a sua capacidade de adaptação às realidades existente, neste mundo que anda cada vez mais

depressa, em que a colaboração é vital. O Mundo está em mudança, o efeito de estufa é cada vez

mais acentuado, o clima está cada vez mais diferente e por vezes mais violento, pelo que as

empresas que não se adaptarem podem desaparecer de um momento para o outro.

É pena que a maioria das empresas portuguesas ainda não tenha definido o seu plano de

continuidade em caso de desastre, mas felizmente as soluções de mercado cada vez apontam

mais para soluções cada vez mais robustas.

Page 36: Disaster Recovery

Referência Bibliográfica

Livros:

Serrano e Jardim, António e Nuno – Disaster Recovery. 1.ª Edição. Lisboa: FCA- Editora de

Informática, 2007. ISBM: 978-972-722-539-2

Sites Consultados:

http://www.thebci.org/index.php?option=com_content&view=article&id=93&Itemid=143, dia

09 de Maio de 2012 às 14h00m.

http://ismspt.blogspot.pt/2006/11/continuidade-de-negcio.html, dia 09 de Maio de 2012 às

14h15m.

http://www.disaster-recovery-guide.com/, dia 09 de Maio de 2012 às 14h30m.

http://www.virtutechindia.com/disasterrecovery.php, dia 09 de Maio de 2012 às 14h30m.

http://en.wikipedia.org/wiki/Business_continuity_planning, dia 10 de Maio de 2012, às 00h12m.

http://blog.ngrnetwork.com.br/?p=1011, dia 10 de Maio de 2012, às 00h15m.

http://www.efagundes.com/artigos/Disaster_Recovery_Plan.htm, dia 10 de Maio de 2012, às

10h15m.

http://www.disasterrecovery.org/the_right_start.html, dia 10 de Maio de 2012 às 11h00m.

http://en.wikipedia.org/wiki/Business_continuity, dia 10 de Maio de 2012 às 14h55m.

http://www.computerworld.com.pt/2009/03/04/bsi-publica-guia-dedicado-continuidade-do-

negcio/, dia 12 de Maio de 2012 às 15h34m.

http://searchcio-midmarket.techtarget.com/feature/Making-the-business-case-for-a-disaster-

recovery-plan, dia 13 de Maio de 2012 às 21h51m.

http://www.virtualizationadmin.com/articles-tutorials/general-virtualization-articles/high-

availability-disaster-recovery-virtual-environments.html, dia 21 de Maio de 2012 às 11h15m.

http://en.wikipedia.org/wiki/Economic_effects_arising_from_the_September_11_attacks#Indire

ct_effects, dia 24 de Maio de 2012 às 23h55m.

http://www.enisa.europa.eu, dia 25 de Maio de 2012 às 23h20m.

http://www.continuitycentral.com/feature0905.html, dia 26 de Maio de 2012 às

10h46m.

http://pt.wikipedia.org/wiki/Plano_de_continuidade_de_neg%C3%B3cios, dia 27 de Maio de

2012 às 18h35m.

http://pecb.org/iso22301pt/, dia 28 de Maio de 2012 às 12h28m.

http://www.continuitycentral.com/feature0412.htm, dia 28 de Maio de 2012 às 21h11m.