15
Uma vista de computação em nuvem Eliminando as nuvens para longe da verdade potenciais e os obstáculos colocados por este capacidade de computação. Por Michael Armbrust, Armando raposa, Rean Griffith, Anthony D. José, Randy Katz, Andy KonWinSKi, Gunho LEE, David Patterson, Ariel Rabkin, ion Stoica, AnD Matei Zaharia Uma Vista de Computação em Nuvem A computação em nuvem, o sonho de longa data de computação como um serviço público, tem o potencial de transformar uma grande parte da indústria de TI, tornando o software ainda mais atraente como um serviço e moldar a forma como hardware de TI é projetado e comprado. Desenvolvedores com ideias inovadoras para novos serviços de Internet já não exigem grandes investimentos de capital em hardware para implantar o seu serviço ou a despesa humano para operá-lo. Eles não precisam se preocupar sobre o provisionamento de um serviço cuja popularidade não satisfaz as suas previsões, desperdiçando assim recursos onerosos, ou sob provisionamento para aquele que se torna popular, faltando, assim, potenciais clientes e receita. Além disso, as empresas com grandes tarefas orientadas para o lote pode obter resultados tão rapidamente quanto seus programas podem escalar, desde 1000 usando os servidores para uma hora custa não mais do que usar um servidor para 1000 Horas. ] Esta elasticidade de recursos, sem pagar um prémio para a grande escala, é sem precedentes na história da TI. Como resultado, a computação em nuvem é um tema popular para blogs e informes oficiais e tem sido destaque no título de oficinas, conferências e até mesmo revistas. No entanto, a confusão permanece sobre exatamente o que é e quando é útil, causando o CEO da Oracle Larry Ellison para desabafar sua frustração: "A coisa interessante sobre a computação em nuvem é que temos redefiniu a computação em nuvem para incluir tudo o que já fazemos... Eu não entendo o que faria diferente à luz da computação em nuvem diferente de alterar a redação de alguns de nossos anúncios. "Nosso objetivo neste artigo é reduzir essa confusão, esclarecendo termos, fornecendo figuras simples para quantificar as comparações entre

Uma Vista de Computação Em Nuvem

Embed Size (px)

DESCRIPTION

Uma Vista de Computação Em Nuvem

Citation preview

Uma vista de computao em nuvem

Eliminando as nuvens para longe da verdade potenciais e os obstculos colocados por este capacidade de computao.

Por Michael Armbrust, Armando raposa, Rean Griffith, Anthony D. Jos, Randy Katz, Andy KonWinSKi, Gunho LEE, David Patterson, Ariel Rabkin, ion Stoica,

AnD Matei Zaharia

Uma Vista

de Computao em NuvemA computao em nuvem, o sonho de longa data de computao como um servio pblico, tem o potencial de transformar uma grande parte da indstria de TI, tornando o software ainda mais atraente como um servio e moldar a forma como hardware de TI projetado e comprado. Desenvolvedores com ideias inovadoras para novos servios de Internet j no exigem grandes investimentos de capital em hardware para implantar o seu servio ou a despesa humano para oper-lo. Eles no precisam se preocupar sobre o provisionamento de um servio cuja popularidade no satisfaz as suas previses, desperdiando assim recursos onerosos, ou sob provisionamento para aquele que se torna popular, faltando, assim, potenciais clientes e receita. Alm disso, as empresas com grandes tarefas orientadas para o lote pode obter resultados to rapidamente quanto seus programas podem escalar, desde 1000 usando os servidores para uma hora custa no mais do que usar um servidor para 1000 Horas.

]

Esta elasticidade de recursos, sem pagar um prmio para a grande escala, sem precedentes na histria da TI.

Como resultado, a computao em nuvem um tema popular para blogs e informes oficiais e tem sido destaque no ttulo de oficinas, conferncias e at mesmo revistas. No entanto, a confuso permanece sobre exatamente o que e quando til, causando o CEO da Oracle Larry Ellison para desabafar sua frustrao: "A coisa interessante sobre a computao em nuvem que temos redefiniu a computao em nuvem para incluir tudo o que j fazemos... Eu no entendo o que faria diferente luz da computao em nuvem diferente de alterar a redao de alguns de nossos anncios. "Nosso objetivo neste artigo reduzir essa confuso, esclarecendo termos, fornecendo figuras simples para quantificar as comparaes entre de nuvem e computao convencional, e identificar os principais obstculos e oportunidades da computao em nuvem tcnica e no tcnicos. (Armbrust et al uma verso mais detalhada deste artigo.)

Definindo computao em nuvem

A computao em nuvem refere-se a ambos os aplicativos entregues como servios atravs da Internet e do software de hardware e sistemas nos centros de dados que fornecem esses servios. Os prprios servios tm sido referido como Software as a Service (SaaS Alguns fornecedores usam termos como IaaS (Infrastructure as a Service) e PaaS (Platform as a Service) para descrever seus produtos, mas que evitam estas definies, porque aceitas por eles ainda variam muito. A linha entre a infraestrutura "de baixo nvel" e uma "plataforma" de nvel superior no ntido. Acreditamos que os dois so mais parecidos do que diferentes, e ns consider-los juntos. Da mesma forma, o

Termo relacionado "a computao em grade", da comunidade de computao de alto desempenho, sugere protocolos para oferecer computao e armazenamento compartilhado em longas distncias, mas esses protocolos no conduziram a um ambiente de software que cresceu alm de sua comunidade.O hardware e software de centro de dados o que chamamos de uma nuvem. Quando uma nuvem feito disponvel em um como voc vai pagar maneira para o pblico em geral, chamamos isso de uma nuvem pblica; o servio que est sendo vendido computao utilitria. Ns usamos a nuvem privada termo para se referir aos centros de uma empresa ou outra organizao, no colocados disposio do pblico em geral, quando eles so grandes o suficiente para beneficiar das vantagens da computao em nuvem que discutimos aqui de dados internos. Assim, a computao em nuvem a soma de SaaS e computao utilitria,

mas no inclui os centros de dados pequenas ou mdias, mesmo que estes dependem de virtualizao para a gesto. As pessoas podem ser usurios ou provedores de SaaS, ou usurios ou provedores de computao utilitria. Ns nos concentramos em fornecedores de SaaS (usurios de nuvem) e provedores de nuvem, que receberam menos ateno do que os usurios de SaaS. Figura 1 torna as relaes fornecedor-utilizador claro. Em alguns casos, o mesmo ator pode desempenhar vrios papis. Por exemplo, um provedor de nuvem tambm podem hospedar seus prprios servios voltados para o cliente em infraestrutura de nuvem.A partir de um provisionamento de hardware e ponto de vista de preos, trs aspectos so novos na computao em nuvem. A aparncia dos recursos de computao infinitas disponveis sob demanda, de forma rpida o suficiente para acompanhar carga surtos, eliminando assim a necessidade de os usurios de computao em nuvem para planejar muito frente de provisionamento. A eliminao de um compromisso frente por usurios da nuvem, permitindo assim que as empresas a comear pequeno e aumentar os recursos de hardware apenas quando h um aumento em suas necessidades.

A capacidade de pagar pelo uso dos recursos de computao em uma base de curto prazo, conforme necessrio (por exemplo, processadores por hora e armazenagem por dia) e liber-los conforme necessrio, conservao, assim, gratificante por mquinas arrendamento e armazenamento de ir quando eles no so mais til.

Argumentamos que a construo e operao de extremamente grande escala, das matrias-primas - centros de dados de computador em locais de baixo custo foi

o facilitador necessrio chave da computao em nuvem, para que eles descobriram os fatores de 5-7 diminuio no custo da eletricidade, largura de banda de rede, operaes, software e hardware disponveis para estas grandes economias de escala. Esses fatores, combinados com multiplexao estatstica para aumentar a utilizao em comparao com os centros de dados tradicionais, significava que a computao em nuvem pode oferecer servios abaixo dos custos de um centro de dados de mdio porte e ainda fazer um bom lucro.Nossa definio proposta permite identificar claramente determinada instalaes como exemplos e no exemplos de computao em nuvem. Considere um servio de Internet voltado para o pblico hospedado em um provedor que pode alocar mais mquinas para o servio dado quatro horas de antecedncia. Desde carga surtos na Internet pblica pode acontecer muito mais rapidamente do que (Animoto viu sua carga dobram a cada 12 horas para quase trs dias), esta no a computao em nuvem. Em contraste, considere um entro de dados corporativos internos, cujos pedidos so modificados somente com antecedncia significativa para os administradores. Neste cenrio, grande carga picos na escala de minutos altamente improvvel, por isso, enquanto a alocao pode acompanhar os aumentos de carga esperadas, este cenrio satisfaz uma das condies necessrias para operar como uma nuvem. O centro de dados da empresa ainda pode falhar para atender outras condies para ser uma nuvem, no entanto, como o aparecimento de recursos infinitos ou faturamento de gro fino. Um centro de dados privados tambm podem no se beneficiar das economias de escala que fazem nuvens pblicas financeiramente atraente.

Omitindo nuvens privadas de computao em nuvem levou a um considervel debate na blogosfera. Acreditamos que a confuso e ceticismo ilustrado pela citao de Larry Ellison ocorre quando as vantagens de nuvens pblicas tambm so reivindicados para data centers de mdio porte. Com exceo de extremamente grandes centros de dados de centenas de milhares de mquinas, tais como aqueles que podem ser operados pelo Google ou Microsoft, a maioria dos centros de dados desfrutar de apenas um subconjunto de as potenciais vantagens de nuvens pblicas, como mostra a Tabela 1. Portanto, acreditamos que a incluso de centros de dados tradicionais na definio de computao em nuvem vai levar a reivindicaes exageradas para menores, chamadas nuvens privadas, o que por isso que ns exclumos. No entanto, aqui ns descrevemos como chamadas nuvens privadas podem obter mais dos benefcios da computao em nuvens pblicas atravs de aumento ou computao em nuvem hbrida.Classes de computao utilitriaQualquer aplicativo precisa de um modelo de computao, um modelo de armazenamento, e um modelo de comunicao. A multiplexao estatstica necessria para atingir a elasticidade e o aparecimento de infinita capacidade disponvel sob demanda exige atribuio e gesto automtica. Na prtica, isso feito com a virtualizao de algum tipo. Nossa viso que diferentes ofertas de computao utilitria sero distinguidos com base no nvel de softwares do sistema de nuvem da abstrao e do nvel de gesto dos recursosAmazon EC2 , numa extremidade do espectro. Uma instncia EC2 parece muito com hardware fsico, e os usurios podem controlar cedo toda a pilha de software, a partir do ncleo para cima.Este nvel baixo torna inerentemente difcil para a Amazon para oferecer escalabilidade e failover (ativao ps-falha) automtico porque a semntica associada com problemas de replicao e outra de gerenciamento de estado so altamente dependentes de aplicativos. No outro extremo do espectro esto as plataformas de domnio de especificaes de aplicao, como o Google AppEngine, que direcionado exclusivamente em aplicativos da Web tradicionais, impondo uma estrutura de aplicao da separao clara entre uma camada de computao aptrida e uma camada de armazenamento com informaes de estado. Impressionante escala do AppEngine automtica e mecanismos de alta disponibilidade, e o armazenamento de dados MegaStore proprietria disponvel para aplicativos AppEngine, todos contam com essas restries. Os pedidos de Azure da Microsoft so escritos usando as bibliotecas. .NET e compilado para a linguagem comum de tempo de execuo um ambiente gerenciado independente de linguagem.

O quadro significativamente mais flexvel do que AppEngine de, mas ainda restringe a escolha do utilizador de modelo de armazenamento e estrutura de aplicao. Assim, Azure intermediria entre frameworks de aplicativos, como AppEngine e hardware mquinas virtuais como o EC2.

A computao em nuvem EconomiaVemos trs casos de uso particularmente atraentes que favorecem computao utilitria sobre hospedagem convencional. Um caso punho quando a demanda por um servio varia com o tempo. Por exemplo, a proviso de um centro de dados para o pico de carga deve sustentar alguns dias por ms leva subutilizao em outros momentos.

Em vez disso, a computao em nuvem permite que uma organizao pagar por hora para recursos de computao, potencialmente levando reduo de custos, mesmo que a taxa horria para alugar uma mquina de um provedor de nuvem superior taxa de possuir um.Um segundo caso quando a demanda conhecida com antecedncia. Por exemplo, uma inicializao Web ter de suportar um pico de demanda, quando se torna popular, seguido por uma reduo potencialmente uma vez alguns visitantes se virar. Finalmente, as organizaes que realizam anlises de lote pode usar a associatividade custo" da computao em nuvem para concluir clculos mais rpidos: usando 1.000 EC2 mquinas durante uma hora custa o mesmo que usar uma mquina para 1.000 horas.

Embora o apelo econmico de a computao em nuvem frequentemente descrito como "converter as despesas de capital para despesas operacionais" (CapEx para OpEx), ns acreditamos que a frase "como voc vai pagar" capta mais diretamente o benefcio econmico para o comprador. Horas comprados atravs de computao em nuvem pode ser distribudo de maneira no uniforme no tempo (por exemplo, usar 100 Server-horas de hoje e no h servidor de horas de amanh, e ainda pagar apenas para 100); na comunidade de rede, esta forma de vender largura de banda j conhecido como fixao de preos com base em uso. Alm disso, a ausncia de despesas de capital na frente permite que o capital a ser redirecionado para o ncleo investimento empresarial.Portanto, mesmo se pagamento de acordo da Amazon que voc v preos foi mais caro do que comprar e depreciando um servidor comparvel durante o mesmo perodo, ns argumentamos que o custo compensado pela nuvem extremamente importante computados benefcios econmicos da elasticidade e transferncia de risco, especialmente o riscos de mais de provisionamento (subutilizao) e sob provisionamento (saturao)Comeamos com elasticidade. A observao fundamental a capacidade que a computao em nuvem de adicionar ou remover recursos a um gro fino (um servidor de cada vez com o EC2) e com um prazo de execuo de minutos em vez de semanas permite que os recursos correspondentes carga de trabalho muito mais de perto. Estimativos mundos reais da utilizao mdia do servidor em centros de dados variam de 5% a 20%. 15,17. Isso pode soar

chocantemente baixa, mas consistente com a observao de que, para muitos servios de pico da carga de trabalho superior mdia por fatores de 2 a 10. Uma vez que poucos usurios deliberadamente proviso para menos do que o pico esperado, os recursos esto ociosos em horrios de pico. Quanto mais pronunciada variao, mais o desperdcio.Por exemplo, a Figura 2 assume nosso servio tem uma demanda previsvel, onde o pico requer 500 servidores ao meio-dia, mas o cocho requer apenas 100 servidores meia-noite. Enquanto a utilizao mdia ao longo de um dia inteiro de 300 servidores, o custo real por dia (rea sob a curva) de 300 x 24 = 7200 horas do servidor; mas desde que deve provisionar para o pico de 500 servidores, ns pagamos por 500 24 = 12.000 servidores horas, um fator de 1,7 mais. Portanto, enquanto o como voc vai pagar(pay-as do-you) custo por servidor de horas durante trs anos (tempo tpico amortizao) inferior a 1,7 vezes o custo de compra o servidor, a computao utilitria mais barato.De fato, este exemplo subestima os benefcios da elasticidade, porque, alm de padres diurnos simples, a maioria dos servios tambm experimentam variao da demanda peridica sazonal ou outra (por exemplo, e-commerce em sites de compartilhamento de fotos e dezembro, aps as frias), bem como alguns inesperados rajadas de demanda devido a eventos externos (por exemplo, eventos de notcias). Uma vez que pode levar semanas para adquirir e acumular novos equipamentos, para lidar com esses picos Voc deve proviso para eles com antecedncia. J vimos que, mesmo que os operadores de servios prever os tamanhos pico corretamente, a capacidade desperdiado, e se eles superestimar o pico de proviso para eles, ainda pior.Eles tambm podem subestimar o pico (Figura 2b), no entanto, acidentalmente

distncia utilizadores em excesso. Enquanto o custo de mais de provisionamento facilmente medido, o custo de menos de provisionamento mais difcil de medir, mas potencialmente igualmente grave: os usurios no s rejeitaram gerar receita zero, eles podem nunca mais voltar. Por exemplo, Friendster declnio na popularidade em relao aos concorrentes Facebook e MySpace acreditado para ter resultado em parte da insatisfao dos usurios com tempos de resposta lentos (at 40 segundos). 16 Figura 2c visa captar esse comportamento: Os usurios iro abandonar um servio sob provisionados at que a carga do usurio de pico igual a capacidade utilizvel do centro de dados, em que os usurios de ponto de novamente receber o servio aceitvel.Para um exemplo simplificado, suponha que os usurios de uma queda hipottica local em duas classes: de usurios ativos (aqueles que usam o site regularmente) e desertores (aqueles que abandonam o site ou so afastados do local devido ao mau desempenho). Alm disso, suponha que 10% dos usurios ativos que recebem servio de m qualidade devido ao provisionamento sob so "permanentemente perdidas" oportunidades (tornar-se desertores), ou seja, os usurios que teriam permanecido visitantes regulares com uma experincia melhor. O site inicialmente provisionado para lidar com um pico esperado de 400 mil usurios (1.000 usurios por servidor 400 servidores), mas a imprensa positivo inesperado impulsiona 500.000 usurios na primeira hora. Dos 100.000 que so afastados ou receber mau servio, por nossa suposio 10.000 deles esto perdidos para sempre, deixando uma base de usurios ativos de 390 mil. A prxima hora v 250.000 novos usurios nicos. O primeiro 10,000 fazer muito bem, mas o site ainda o excesso de capacidade por 240 mil usurios. Isto resulta em 24.000 deseres adicionais, deixando 376 mil usurios permanentes. Se esse padro continuar, depois de lg (500.000) ou 19 horas, o nmero de novos usurios vai se aproximar de zero eo site estar em capacidade em estado estacionrio. Claramente, o operador de servio coletou vale menos do que 400.000 usurios 'de receita estvel durante essas 19 horas, no entanto, mais uma vez ilustra o argumento de que a subutilizao no falar da m reputao dos usurios descontentes.

No tais cenrios realmente ocorrer na prtica? Quando Animoto(3) fez o seu servio disponvel via Facebook, que experimentou um aumento de demanda que resultou em crescimento de 50 servidores para 3.500 servidores em trs dias. Mesmo se a mdia

utilizao de cada servidor foi baixo , ningum poderia ter previsto que as necessidades de recursos de repente dobrasse a cada 12 horas durante trs dias. Aps o pico diminuiu, o trfego caiu para um nvel inferior. Assim, neste exemplo do mundo real, ampliar a elasticidade no era uma otimizao de custos, mas uma exigncia operacional e escala - para a baixa elasticidade que permitiu a despesas de estado estacionrio para combinar mais de perto a carga de trabalho de estado estacionrio.10 principais obstculos e oportunidades para computao em nuvem A Tabela 2 resume a nossa lista de classificao dos obstculos crticos para o crescimento da computao em nuvem. Os trs primeiros afetam a adoo, nos prximos cinco afetar o crescimento, e os dois ltimos so polticas e empresariais obstculos. Cada obstculo emparelhado com uma oportunidade de superar esse obstculo, que vo desde o desenvolvimento de produtos para projetos de pesquisa.Nmero 1. Continuidade de Negcios e Servio de DisponibilidadeAs organizaes preocupar em saber se os servios de computao utilitria ter disponibilidade adequada, e isso faz algum cuidado com a computao em nuvem. Ironicamente, produtos SaaS existentes estabeleceram um padro elevado a este respeito. Google Search tem uma reputao de ser altamente disponvel, a tal ponto que at mesmo uma pequena interrupo captado pelas principais fontes de notcias (11)

Os usurios esperam disponibilidade semelhante a partir de novos servios, o que difcil de fazer. A Tabela 3 mostra gravadas interrupes para o Amazon Simple Storage Service (S3), App Engine e do Gmail em 2008, e explicaes para as quedas. Note-se que, apesar da publicidade negativa devido a estas interrupes, algumas infraestruturas de TI empresariais so to bons. As questes tcnicas de disponibilidade de lado, um provedor de nuvem pode sofrer interrupes, por razes no tcnicas, incluindo sair do negcio ou ser alvo de uma ao regulamentar (um exemplo recente deste ltimo ocorreu no ano passado, como descrevemos mais tarde).

Embora eles no tenham feito, fornecedores de nuvem poderiam oferecer tcnicas de hardware e software especializados, a fim de oferecer maior confiabilidade, presumivelmente a um preo elevado. Esta confiabilidade poderia, ento, ser vendido para usurios como um acordo de nvel de servio. Mas esta abordagem s vai to longe. A comunidade de computao de alta disponibilidade seguiu por muito tempo o mantra "nenhum ponto nico de falha", mas a gesto de um servio de computao em nuvem por uma nica empresa de fato um ponto nico de falha. Mesmo que a empresa tem vrios centros de dados em diferentes regies geogrficas utilizando diferentes provedores de rede, pode ter sistemas de infraestrutura de software comum e de contabilidade, ou a empresa pode mesmo sair do negcio.Grandes clientes

sero relutantes a migrar para a computao em nuvem sem uma estratgia de continuidade de negcios para tais situaes. Acreditamos que a melhor chance de pilhas de software independente para que sejam fornecidos por empresas diferentes, como tem sido difcil para uma empresa para justificar a criao e manuteno de duas pilhas em nome da confiabilidade do software. Assim como prestadores de servios de grande Internet usar vrios os prestadores de rede de modo a que a falha de uma nica empresa no vai lev-los fora do ar, ns acreditamos que a nica soluo plausvel muito alta disponibilidade mltiplos provedores de nuvem da Computao.Nmero 2 bloqueio. DadosPilhas de software tm melhorado a interoperabilidade entre plataformas, mas as APIs de armazenamento para a computao em nuvem ainda so essencialmente proprietrio, ou pelo menos no foram objeto de normalizao ativa. Assim, os clientes no podem facilmente extrair seus dados e programas de um site para ser executado em outro. A preocupao com a dificuldade de extrair dados a partir da nuvem est impedindo que algumas organizaes para a adoo da computao em nuvem. Cliente de aprisionamento pode ser atraente para computao em nuvem. Prestadores, mas seus usurios esto vulnerveis a aumentos de preos, a problemas de confiabilidade, ou mesmo para prestadores de sair do negcio.

Por exemplo, um servio de armazenamento on-line chamado O desligamento link ativo em 08 de agosto de 2008, depois de perder o acesso, tanto quanto 45% dos dados do cliente. (6) O link ativo, por sua vez, tem contado com o servio de armazenamento online Nirvanix para armazenar dados de clientes, o que levou a apontar o dedo entre as duas organizaes a respeito de porque os dados do cliente foram perdidos. Enquanto isso, Conectar 20. 000 usurio foi disse o servio no estava mais disponvel e foram instados a experimentar outro local de armazenamento.Uma soluo seria a padronizao do APIsd de tal forma que um desenvolvedor SaaS pode implantar servios e dados entre vrios provedores de computao em nuvem de modo que a falha de uma nica empresa no iria tomar todas as cpias de dados de clientes com ele. Pode-se preocupe que isso levaria a uma "corrida para o fundo" de preos em nuvem e achatar os lucros dos fornecedores de computao em nuvem. Oferecemos dois argumentos para dissipar esse medo.Em primeiro lugar, a qualidade de uma matria de servios, bem como o preo, para que os clientes no podem saltar para o servio de menor custo. Alguns provedores de servios de Internet custam hoje um fator de mais de 10 outros, porque eles so mais confiveis e oferecer servios adicionais para melhorar a usabilidade.Em segundo lugar, para alm de atenuar dados aprisionados as preocupaes, a normalizao de APIs permite que um novo modelo de utilizao em que a mesma infraestrutura de software pode ser utilizada num centro de dados interna e em uma nuvem pblica. Tal opo poderia permitir nuvem hbrida ou computao em computao onda em que a nuvem pblica usada para capturar as tarefas adicionais que no podem ser facilmente executados no centro de dados (ou nuvem privada) devido a cargas de trabalho pesadas temporariamente. Esta opo poderia expandir significativamente o mercado de computao em nuvem. Na verdade, as implementaes de cdigo aberto de APIs nuvens proprietrias, tais como eucalipto e HYPERTABLE, so os primeiros passos para possibilitar computao surto

Nmero 3. Confidencialidade de Dados / capacidade de auditoria

Apesar de a maioria das empresas de terceirizao de folha de pagamento e muitas empresas que utilizam servios de e-mail externos para armazenar informaes sensveis, a segurana uma das objees mais frequentemente evocadas para a computao em nuvem; analistas e empresas cticos perguntam "quem iria confiar em seus dados essenciais l fora em algum lugar?" H tambm requisitos para a possibilidade de fiscalizao, no sentido de Lei Sarbanes Oxley Sade e Servios Humanos e a sade, seguro portabilidade e a Lei da Responsabilidade (HIPAA) regulamentos que devem ser fornecidos para dados corporativos a serem movidos para a nuvem.

Usurios da nuvem enfrentar ameaas de segurana tanto de dentro e fora da nuvem. Muitas das questes de segurana envolvidas na proteo nuvens de ameaas externas so semelhantes aos que j enfrenta grandes centros de dados. Na nuvem, no entanto, essa responsabilidade dividida entre potencialmente muitas partes, incluindo o usurio nuvem, o fornecedor de nuvem, e quaisquer fornecedores de terceiros que os usurios dependem de software ou configuraes de segurana sensveis.O usurio nuvem responsvel pela segurana de nvel de aplicativo. O provedor de nuvem responsvel pela segurana fsica, e provavelmente para impor polticas de firewall externo. Segurana para as camadas intermedirias da pilha de software compartilhada entre o usurio e o operador; quanto mais baixo o nvel de abstrao expostos ao usurio, mais responsabilidade vai com ele. Usurios do Amazon EC2 tem mais responsabilidade tcnica (isto , deve implementar ou adquirir mais a funcionalidade necessria em si) para a sua segurana do que os usurios Azure, que por sua vez tm mais responsabilidades do que os clientes do Google App Engine. Esta responsabilidade do usurio, por sua vez, pode ser terceirizada que vendem.

servios de segurana especiais. As interfaces de homogeneidade e padronizadas de plataformas como o EC2 torn-lo possvel para uma empresa para oferecer, por exemplo, gerenciamento de configurao ou anlise regra de firewall como servios de valor agregado.Enquanto a computao em nuvem pode tornar a segurana externa virada mais fcil, ele representar o novo problema de segurana virado para o interno. Os provedores de nuvem deve se proteger contra roubo ou de negao de servio-ataques por usurios. Os utilizadores necessitam de ser protegidos uns dos outros.O mecanismo de segurana primria em nuvens de hoje a virtualizao. uma poderosa defesa, e protege contra a maioria das tentativas por usurios para atacar um ao outro ou a infraestrutura de nuvem subjacente. No entanto, nem todos os recursos so virtualizados e nem todos os ambientes de virtualizao so livre de bugs. O software de virtualizao tem sido conhecido por conter bugs que permitem cdigo virtualizado para "libertar-se" em certa medida. Virtualizao de rede incorreta pode permitir o acesso cdigo de utilizador a partes sensveis de infraestrutura do provedor, ou para os recursos de outros usurios. Estes desafios, no entanto, so semelhantes aos envolvidos na gesto de grandes centros de dados no-nuvem, onde diferentes aplicaes precisam ser protegidos um do outro. Qualquer servio de grande Internet ser necessrio para assegurar que uma nica falha de segurana no comprometa tudo o resto.Uma ltima preocupao de segurana proteger o usurio contra o provedor de nuvem. O provedor, por definio, controlar a "camada inferior" da pilha de software, que contorna eficazmente tcnicas de segurana mais conhecidos. Melhorias radicais ausentes em tecnologia de segurana; esperamos que os usurios vo usar contratos e tribunais, ao invs de engenharia de segurana inteligente, para se proteger contra provedor de prevaricao. A nica exceo importante o risco de perda de dados acidental. difcil imaginar Amazon espionagem sobre o contedo da memria da mquina virtual;

fcil imaginar um disco rgido a ser eliminados sem que est sendo limpado, ou um erro permisses tornar os dados visveis indevidamente

Este um problema em contextos no-nuvem tambm. A criptografia padro defesa, em nvel de usurio, tambm eficaz na nuvem. Este j comum para dados de alto valor fora da nuvem, e ambas as ferramentas e conhecimentos esto prontamente disponveis. Esta abordagem foi utilizada com sucesso por TC3, uma empresa de cuidados de sade com acesso a registros de pacientes sensveis e reivindicaes de cuidados de sade, quando se deslocam a sua aplicao compatvel com HIPAA para AWS. (3)Da mesma forma, a capacidade de auditoria poderia ser adicionada como uma camada adicional para alm do alcance do sistema operacional convidado virtualizado, fornecimento de instalaes sem dvida mais segura do que aqueles construdos nas prprias aplicaes e centralizar as responsabilidades software relacionados confidencialidade e capacidade de auditoria em uma nica camada lgica. Essa nova funcionalidade refora a perspectiva de computao em nuvem de mudar nosso foco de hardware especfico para os recursos virtualizados sendo fornecidoNmero 4. Os gargalos de transmisso de dados

nmero 4. Os gargalos de transmisso de dados

Aplicaes continuar a tornar-se mais-intensivo de dados. Se assumirmos os pedidos podem ser "separadas" atravs das fronteiras das nuvens, que podem complicar a colocao de dados e transporte. Por US $ 100 a US $ 150 por terabyte transferidos, estes custos podem acrescentar-se rapidamente, tornando a transferncia de dados custa uma questo importante. Usurios da nuvem e provedores de nuvem tem que pensar sobre as implicaes da colocao e do trfego em todos os nveis do sistema, se eles querem minimizar os custos. Este tipo de raciocnio pode ser visto no desenvolvimento da Amazon de seu novo servio frente nuvem.Uma oportunidade para superar o alto custo das transferncias da Internet a discos navio. Jim Gray encontrou o caminho barato de est para enviar uma grande quantidade de dados enviar discos ou at mesmo todo computador. (10) Embora esta no aborde cada caso de uso, ele efetivamente lida com o caso de grandes transferncias de atraso tolerante ponto-a-ponto, tais como a importao de grandes conjuntos de dados.

Para quantificar o argumento, suponha que queremos enviar 10 TB de UC Berkeley para a Amaznia em Seattle, WA. Garfinkel medida largura de banda para S3 a partir de trs locais e encontrou uma largura de banda mdia escritor de 5 Mbits / seg a 18 Kbits / s. Suponha que tem 20 Mbits / s sobre um link WAN. Seria preciso 10 * 1012 Bytes / (20 106 bits / segundo) = (8 1013) / (2 107) segundos = 4000000 segundo, o que mais do que 45 dias. Se em vez enviou 10 discos de 1TB via transporte de noite, levaria menos de um dia para transferir 10TB, dando origem a uma largura de banda efetiva de cerca de 1,500Mbit / seg. Por exemplo, a AWS (8) recentemente comeou a oferecer tal servio, chamado de importao / exportao.Nmero 5. Desempenho imprevisibilidadeNossa experincia que vrias mquinas virtuais (VMs) podem compartilhar CPUs e memria principal surpreendentemente bem na computao em nuvem, mas que o compartilhamento de rede e disco I / O mais problemtico. Como resultado, diferentes instncias do EC2 variar mais em seu desempenho I / O do que no desempenho da memria principal. Medimos 75 instncias de EC2 executando a memria STREAM benchmark.14 A largura de banda mdia 1,355Mbytes / seg., Com um desvio padro em casos de apenas 52MBytes / seg. inferiores ou cerca de 4% da mdia. Ns tambm mediu a largura de banda mdia de disco por 75 instncias de EC2 cada gravao de arquivos de 1 GB para o disco local. A largura de banda mdia de gravao de disco quase 55Mbytes por segundo com um desvio padro em casos de pouco mais de 9MBytes / seg. ou cerca de 16% da mdia. Isto demonstra o problema de E / S de interferncia entre as mquinas virtuais.Outra possibilidade que a memria flash vai diminuir a interferncia I / O. Flash memria de semicondutor que preserva informaes quando desligado como discos rgidos mecnicos, mas, uma vez que no tem partes mveis, muito mais rpido para o acesso (microssegundos milissegundos) vs. e utiliza menos energia. A memria flash pode sustentar muitos mais I / Os por segundo por gigabyte de armazenamento de discos, para que vrias mquinas virtuais com cargas de trabalho de E / S aleatria em conflito poderiam coexistir melhor no mesmo computador fsico, sem a interferncia vemos com discos mecnicos.Outro obstculo diz respeito imprevisibilidade de agendamento de mquinas virtuais para algumas classes de programas de processamento em lote, especificamente para computao de alto desempenho. Dado que a computao de alto desempenho (HPC) usada para justificar compras governamentais de US $ 100 milhes centros de supercomputadores com 10.000 a 1.000.000 processadores, h muitas tarefas com paralelismo que pode se beneficiar de computao elstica. Hoje, muitas destas tarefas so executadas em pequenos grupos, que so muitas vezes mal utilizados. No poderia haver uma economia significativa na execuo dessas tarefas em grandes aglomerados na nuvem em vez disso. Custo associatividade significa que no h pena de custo para usar 20 vezes mais de computao para 1 / 20th o tempo. As aplicaes potenciais que poderiam se beneficiar incluem aqueles com muito elevados retornos potenciais-financeira Anlise Financeira, explorao de petrleo, animao-filme que seria valorizam um aumento de velocidade de 20x, mesmo que houvesse um prmio custo.O obstculo para atrair HPC no a utilizao dos aglomerados; hoje computao mais paralelo feito em grandes aglomerados usando a interface MPI passagem de mensagens. O problema que muitos aplicativos HPC precisa garantir que todos os tpicos de um programa esto rodando simultaneamente e mquinas virtuais de hoje e sistemas operacionais no fornecem uma maneira programador-visvel para garantir isso. Assim, a oportunidade de superar este obstculo oferecer alguma - coisa como "gangue de agendamento" para a computao em nuvem. A coordenao tempo relativamente apertado esperado na programao quadrilha tradicional pode ser um desafio para alcanar em um ambiente de computao em nuvem devido imprevisibilidade de desempenho que acabamos de descreverNmero 6: armazenamento escalvel

Mais cedo, ns identificamos trs propriedades cuja combinao oferece a computao em nuvem seu recurso: o uso de curto prazo (o que implica dimensionamento para baixo, bem como at quando a demanda gotas), nenhum custo inicial, e infinita capacidade sob demanda. Embora seja simples o que isso significa quando aplicado ao clculo, menos claro como aplic-lo para o armazenamento persistente.

Assim como grandes ISPs utilizam mltiplos

provedores de rede, de modo que a falta de

uma nica empresa no vai lev-los fora do ar, ns acreditamos que a nica soluo plausvel muito alta disponibilidade mltipla

provedores de computao em nuvem.Tem havido muitas tentativas de responder a esta pergunta, variando na riqueza da API de busca e armazenamento de, as garantias de desempenho oferecido, e a semntica de consistncia resultantes. A oportunidade, que ainda um problema de pesquisa aberta, criar um sistema de armazenamento que no s atender s expectativas programador existentes no que diz respeito durabilidade, alta disponibilidade e capacidade de gerenciar e consulta de dados, mas combin-los com as vantagens da nuvem de ampliao arbitrariamente cima e para baixo na demanda.Nmero 7: Erros em larga escala de Sistemas Distribudos

Um dos desafios difceis em computao em nuvem a remoo de erros em grandes escala nesses sistemas distribudos. Uma ocorrncia comum que esses erros no podem ser reproduzidos em configuraes menores, de modo que a depurao deve ocorrer em escala nos centros de dados de produo.Uma oportunidade pode ser a dependncia de mquinas virtuais em computao em nuvem. Muitos provedores de SaaS tradicionais desenvolveram a sua infraestrutura sem o uso de VMs, ou porque precedeu a recente popularidade de VMs ou porque eles sentiram que no podiam pagar o hit de VMs desempenho. Desde VMs so de rigor em computao utilitria, que o nvel de virtualizao pode tornar possvel para capturar informaes valiosas de maneira que so implausveis sem VMs.Nmero 8: Dimensionamento Rapidamente

Pay-as-you-go (pr-pago) certamente se aplica ao armazenamento e largura de banda de rede, sendo que ambos contam bytes usados. Computao ligeiramente diferente, dependendo do nvel de virtualizao. Google App Engine dimensiona automaticamente em resposta a carga aumenta e diminui, e os usurios so cobrados pelos ciclos utilizados. Encargos da AWS por hora para o nmero de instncias que ocupam, mesmo se sua mquina est ociosa.A oportunidade , em seguida, para dimensionar automaticamente rapidamente para cima e para baixo em resposta carga, a fim de economizar dinheiro, mas sem violar os acordos de nvel de servio. De fato, um foco da UC Berkeley confiava adaptveis Sistemas Distribudos do laboratrio a utilizao generalizada e agressiva de aprendizado de mquina estatstica como uma ferramenta de diagnstico e preditivo para permitir dimensionamento dinmico, a reao automtica de desempenho e correo de problemas, e automaticamente gerenciar muitos outros aspectos destes sistemas.

Outra razo para o dimensionamento para conservar os recursos, bem como dinheiro. Uma vez que um computador ocioso usa cerca de dois teros do poder de um computador ocupado, uso cuidadoso de recursos poderia reduzir o impacto dos centros de dados sobre o meio ambiente, que est atualmente a receber uma grande quantidade de ateno negativa. Fornecedores de computao em nuvem j realizam contabilidade cuidadosa e baixa sobrecarga de consumo de recursos. Ao impor custos de gro fino, computao utilitria incentiva programadores a prestar ateno eficincia (ou seja, liberao e aquisio de recursos apenas quando necessrio), e permite a medio mais direta de ineficincias operacionais e de desenvolvimento.

Estar ciente dos custos o primeiro passo para de conservao, mas dificuldades de configurao tornam tentador para deixar mquinas noite inteira de inatividade para que o tempo de inicializao zero quando os desenvolvedores retornar ao trabalho no dia seguinte. Uma ferramenta snapshot / reinicializao fcil de usar e rpido pode incentivar ainda mais a conservao dos recursos de computao

Nmero 9: Compartilhando destino Reputao mau comportamento Um cliente pode afetar a reputao de outras pessoas usando a mesma nuvem. Por exemplo, a lista negra de endereos IP 13 EC2 por servios de preveno de spam pode limitar quais aplicaes podem ser eficazmente hospedado. Uma oportunidade seria a criao de servios de guarda de reputao semelhante aos servios de e-mail "site oferecido atualmente (para uma taxa) para servios hospedados em provedores menores, que experimentam um microcosmo deste problema.

Outra questo legal a questo da transferncia de provedores de computao em nuvem responsabilidade legais que quer que os clientes se responsabilizem e no eles (tais como, a empresa de envio de spam deve ser responsabilizada, no Amazon). Em maro de 2009, o FBI invadiu um centro de dados de Dallas porque uma empresa cujos servios foram hospedados l estava sendo investigado por possvel atividade criminosa, mas uma srie de empresas espectador inocente hospedados no mesmo local sofreu dias de inatividade inesperado, e alguns foram fora do negcio. (7)Nmero 10: Licenciamento de Software

Licena de software atual comumente restringir os computadores em que o software pode ser executado. Os usurios pagam para o software e, em seguida, pagar uma taxa de manuteno anual. Na verdade, a SAP anunciou que iria aumentar a sua taxa de manuteno anual de, pelo menos, 22% do preo do software, que est perto de preos da Oracle compra. 17 Por isso, muitos provedores de computao em nuvem inicialmente invocada software de fonte aberta em parte porque o modelo de licenciamento para o software comercial no um bom jogo para a computao utilitria.A principal oportunidade tanto para o cdigo aberto para permanecer popular ou simplesmente para empresas de software comercial para mudar sua estrutura de licenciamento para melhor ajuste computao em nuvem. Por exemplo, Microsoft e Amazon j oferecem pay-as-you-go (pr-pago) de licenciamento de software para Windows Server e SQL do Windows Servidor no EC2. Uma instncia EC2 executando a Microsoft Windows custa US $ 0,15 por hora em vez de US $ 0,10 por hora para a alternativa de cdigo aberto. A IBM tambm anunciou pay-as-you-go (pre-pago) de preos para software IBM hospedado em conjunto com EC2, a preos que variam de US $ 0,38 por hora para o DB2 Express para 6,39 dlares por hora para IBM WebSphere com o Lotus Web Gerenciamento de Contedo do servidorConcluso

Prevemos a computao em nuvem vai crescer, para que os desenvolvedores devem ter isso em conta. Independentemente de saber se uma nuvem fornecedor vende servios a um baixo nvel de abstrao como EC2 ou um nvel mais elevado como AppEngine, acreditamos que a computao, armazenamento e rede devem todos foco em escalabilidade horizontal de virtualizado recursos, em vez de em um nico n desempenho. Alm disso:1. Os pedidos de software precisa tanto reduza rapidamente, bem como intensificar, o que um novo requisito. Esse software tambm precisa de um modelo de pagamento por utilizao de licenciamento para atender s necessidades de computao em nuvem2. Software de infraestrutura deve estar ciente de que j no est em execuo em metal nu, mas em VMs. Alm disso, medio e faturamento precisam ser construdos em do comeo.3. Os sistemas de hardware devem ser desenhados escala de um recipiente (de pelo menos uma dezena de cremalheiras), que ser o tamanho mnimo de compra. Custo de operao combinar o desempenho e o custo de compra em importncia, recompensandoproporcionalidade energia (5), colocando pores inteis de memria, disco e rede em modo de baixa energia. Processadores devem funcionar bem com VMs e memria flash deve ser adicionada hierarquia de memria e switches LAN e roteadores de WAN deve melhorar a largura de banda e custoAgradecimentos

Esta investigao apoiada em parte por doaes de Google, Microsoft, a Sun Microsystems, a Amazon Web Services, Cisco Systems, Cloudera, eBay, livro da cara, Fujitsu, Hewlett Packard, Intel, dispositivos de rede, SAP, VMWare, Yahoo! e por correspondncia fundos da Universidade da Califrnia Indstria / Universidade Programa Cooperativo de Pesquisa (UC Discovery) concesso COM07-10240 e pela Fundao Nacional de Cincia (concesso CNS-0509559)_________________________________Os autores esto associados com a UC Berkeley adaptativa Laboratrio de sistemas distribudos (Lab rad) confivel.References1. amazon.com Ceo Jeff bezos on animoto (apr. 2008); http://blog.animoto.com/2008/04/21/amazon-ceo-jeff- bezos-on-animoto/.2. amazon s3 team. amazon s3 availability event (July 20, 2008); http://status.aws.amazon.com/s3- 20080720.html.3. amazon Web services. tC3 health Case study; http:// aws.amazon.com/solutions/case-studies/tc3-health/.4. armbrust, M., et al. above the clouds: a berkeley view of cloud computing. tech. rep. UCb/eeCs-2009-28, eeCs department, U.C. berkeley, Feb 2009.5. barroso, L.a., and holzle, U. the case for energy- proportional computing. IEEE Computer 40, 12 (dec. 2007).6. brodkin, J. Loss of customer data spurs closure of online storage service the Linkup. Network World (aug. 2008).7. Fink, J. FbI agents raid dallas computer business (apr. 2009); http://cbs11tv.com/local/Core. IP.networks.2.974706.html.8. Freedom oss. Large data set transfer to the cloud (apr. 2009); http://freedomoss.com/clouddataingestion.9. garfinkel, s. an evaluation of amazons grid Computing services: eC2, s3 and sqs. tech. rep. tr-08-07, harvard University, aug. 2007.10. gray, J., and Patterson, d. a conversation with Jim gray. ACM Queue 1, 4 (2003), 817.11. helft, M. google confirms problems with reaching its services (May 14, 2009).12. Jackson, t. We feel your pain, and were sorry (aug. 2008); http://gmailblog.blogspot.com/2008/08/we- feel-your-pain-and-were-sorry.html.13. Krebs, b. amazon: hey spammers, get off my cloud!Washington Post (July 1 2008).14. McCalpin, J. Memory bandwidth and machine balance in current high performance computers. IEEE Technical Committee on Computer Architecture Newsletter (1995), 1925.15. rangan, K. the Cloud Wars: $100+ billion at stake. tech. rep., Merrill Lynch, May 2008.16. rivlin, g. Wallflower at the Web Party (oct. 15, 2006).17. siegele, L. Let It rise: a special report on Corporate It. The Economist (oct. 2008).18. stern, a. Update from amazon regarding Fridays s3 downtime. Centernetworks (Feb. 2008); http://www. centernetworks.com/amazon-s3-downtime-update.19. Wilson, s. appengine outage. CIo Weblog (June 2008); http://www.cio-weblog.com/50226711/appengine\ outage.php.

Cloud Provider

SaaS Provider/ Cloud user

figure 1. users and providers of cloud computing. We focus on cloud computings effects

on cloud providers and SaaS providers/cloud users. the top level can be recursive, in that SaaS providers can also be a SaaS users via mashups.

Utility

computing

Web

applications

SaaS user

table 1. Comparing public clouds and private data centers.

Advantage

Appearance of infinite computing resources on demand

elimination of an up-front commitment by Cloud users

Ability to pay for use of computing resources on a short-term basis as needed

economies of scale due to very large data centers

higher utilization by multiplexing of workloads from different organizations

Simplify operation and increase utilization via resource virtualization

Public Cloud

Yes

Conventional Data Center

no

Yes

no

Yes

no

Yes

Yes

Yes

Usually not

Depends on company size

no

figure 2. (a) Even if peak load can be correctly anticipated, without elasticity we waste resources (shaded area) during nonpeak times.

(b) underprovisioning case 1: potential revenue from users not served (shaded area) is sacrificed. (c) underprovisioning case 2: some users desert the site permanently after experiencing poor service; this attrition and possible negative press result in a permanent loss of a portion of the revenue stream.

Capacity

Capacity

Capacity

demand

demand

demand

1

2

3

1

2

3

1

2

3

time (days)time (days)time (days)

(a) Provisioning for peak load(b) underprovisioning 1(c) underprovisioning 2

table 2. top 10 obstacles to and opportunities for growth of cloud computing

OBSTACLEOPPORTUNITY

Availability/business ContinuityUse Multiple Cloud Providers

Data Lock-inStandardize APis; Compatible SW to enable Surge or hybird Cloud Computing

Data Confidentiality and Auditability Deploy encryption, vLAns, Firewalls

Data Transfer bottlenecksFedexing Disks; higher bW Switches

Performance Unpredictabilityimproved vM Support; Flash Memory;

Gang Schedule vMs

Scalable Storageinvent Scalable Store

bugs in Large Distributed Systemsinvent Debugger that relies

on Distributed vMs

Scaling Quicklyinvent Auto-Scaler that relies on ML; Snapshots for Conservation

Reputation Fate SharingOffer reputation-guarding services like those for email

Software LicensingPay-for-use licenses

table 3. outages in AWS, AppEngine, and gmail service and outage duration date.

Service and outageDuration Date

S3 outage: authentication service overload leading to unavailability17 2 hours 2/15/08 S3 outage: Single bit error leading to gossip protocol blowup1868 hours 7/20/08

Appengine partial outage: programming error195 hours 6/17/08

Gmail: site unavailable due to outage in contacts system111.5 hours 8/11/08

ACM

Jornal de Computao e Patrimnio Cultural

ACM

Journal on Computing and Cultural Heritage

JOCCH publica artigos de valor significativo e duradouro em todas as reas relacionadas com a utilizao das TIC em apoio do Patrimnio Cultural, que procuram combinar o melhor da cincia de computao com real ateno a qualquer aspecto do sector do patrimnio cultural.

JOCCH publishes papers of significant and lasting value in all areas relating to the use of ICT in support of Cultural Heritage, seeking to combine the best of computing science with real attention to any aspect of the cultural heritage sector.

HYPERLINK "http://www.acm.org/jocch" www.acm.org/jocch HYPERLINK "http://www.acm.org/subscribe" www.acm.org/subscribe

Para os fins deste artigo, usamos o termo Software as a Service para significar aplicaes entregues atravs da Internet. A definio mais ampla englobaria qualquer software em demanda incluindo aqueles que executarem o software localmente, mas o uso de controle via licenciamento de software remoto.

Notar, no entanto, que os compromissos iniciais ainda pode ser usados para reduzir tarifas por uso. Por exemplo, a Amazon Web Services tambm oferece aluguer de longa durao de servidores, o que eles chamam de instncias reservadas.

Preo baseado no uso no est alugando. Aluguel um recurso envolve o pagamento de um custo negociado ter o recurso durante algum perodo de tempo, mesmo que voc no use o recurso. - como voc vai Paga envolve o uso de medio e cobrana com base no uso real, independentemente do perodo de tempo durante o qual o uso ocorre.