Uma Proposta de Arquitetura de Data Center Para Implantação de Nuvens Publicas

Embed Size (px)

DESCRIPTION

Uma Proposta de Arquitetura de Data Center Para Implantação de Nuvens Publicas

Citation preview

  • FACULDADE INTEGRAL DIFERENCIAL

    CURSO DE SISTEMAS DE INFORMAO

    CLEITON RODRIGUES SOUSA

    UMA PROPOSTA DE ARQUITETURA DE DATA CENTER PARA IMPLANTAO DE NUVENS PBLICAS

    TERESINA

    2012

  • CLEITON RODRIGUES SOUSA

    UMA PROPOSTA DE ARQUITETURA DE DATA CENTER PARA IMPLANTAO DE NUVENS PBLICAS

    Trabalho de Concluso de Curso apresentado Faculdade Integral Diferencial como requisito para concluso do Curso de Graduao de Sistemas de Informao. Orientador: Prof. Me. Ricardo Gomes de Queiroz.

    TERESINA

    2012

  • Sousa, Cleiton Rodrigues

    S725u

    Uma proposta de arquitetura de data center para

    implantao de nuvens pblicas. / Cleiton Rodrigues Sousa.

    Teresina, 2012.

    61p

    Monografia (Graduao) Faculdade Integral Diferencial.

    Curso de Sistema de Informao, 2012.

    Orientao: Ricardo Gomes de Queiroz.

    1. Arquitetura. 2. Data center. 3. Nuvens pblicas. I. Ttulo.

    CDD 005

  • CLEITON RODRIGUES SOUSA

    UMA PROPOSTA DE ARQUITETURA DE DATA CENTER PARA IMPLANTAO DE NUVENS PBLICAS

    Trabalho de Concluso de Curso apresentado Faculdade Integral Diferencial como requisito para concluso do Curso de Graduao de Sistemas de Informao.

    Monografia aprovada em ____ / ____ / ____

    BANCA EXAMINADORA

    __________________________________________

    Prof. Me. Ricardo Gomes de Queiroz Orientador

    __________________________________________

    Prof. Esp. Helton Grio Matos Faculdade Integral Diferencial

    __________________________________________

    Prof. Me. Leonardo Saraiva e Silva Faculdade Integral Diferencial

  • SOUSA, C. R. Uma proposta de arquitetura de data center para implantao de nuvens pblicas, 2012. 61 p. Trabalho de Concluso de Curso (Graduao em Sistemas de Informao). Orientado por Prof. Me. Ricardo Gomes de Queiroz. Faculdade Integral Diferencial, 2012.

    RESUMO

    A computao em nuvem surge como um novo paradigma para hospedagem e

    prestao de servios por meio da internet e trs consigo a incluso de novos

    conceitos, benefcios e desafios que envolvem muitas questes. Alguns desafios

    esto relacionados aos modelos de arquitetura para data centers, uma vez que os

    modelos baseados em arquiteturas e tecnologias para data centers convencionais

    representam um gargalo diante do universo de possibilidades deste novo modelo

    computacional. Com isso, novas arquiteturas tm surgido a fim de atender aos

    requisitos estabelecidos pela computao em nuvem. Esta pesquisa apresenta a

    simulao de uma proposta de arquitetura de data center para implantao de

    nuvens pblicas. Para tanto, utilizou-se o CloudSim, um framework de simulao de

    ambientes de computao em nuvem. A definio da arquitetura a ser simulada foi

    feita por meio de pesquisas e anlise de algumas das principais arquiteturas

    utilizadas atualmente (Fat Tree, BCube e DCell). A partir deste estudo, pode-se

    concluir que a arquitetura Fat Tree representa o modelo mais indicado para

    implantao em data centers para nuvens pblicas.

    Palavras chave: Arquitetura. Data Center. Nuvens Pblicas.

  • SOUSA, C. R. A proposed architecture for data center deployment public cloud, 2012. 61 p. Completion of course work oriented by Prof. MSc. Ricardo Gomes de Queiroz (Undergraduate Information Systems) - Faculdade Integral Diferencial, Teresina, 2012.

    ABSTRACT

    Cloud computing emerges as a new paradigm for hosting and services through the

    internet and brings with it the inclusion of new concepts, benefits and challenges

    involving many issues. Some challenges are related to architectural models for data

    centers, since models based architectures and technologies for conventional data

    centers represent a limitation before the universe of possibilities of this new

    computational model. Consequently, new architectures have emerged to meet the

    requirements established by cloud computing. This research presents the simulation

    of a proposed data center architecture for deploying public clouds. For this, we used

    the CloudSim, a simulation framework for cloud computing environments. The

    definition of the architecture being simulated was made through research and

    analysis of some of the main architectures used today (Fat Tree, and BCube DCell).

    From this study, we can conclude that the architecture Fat Tree represents the model

    most suitable for deployment in data centers to public clouds.

    Keywords: Architecture. Data Center. Public Cloud.

  • LISTA DE FIGURAS

    Figura 1 - Viso geral da computao em nuvem ..................................................... 18

    Figura 2 - Classificao de alguns servios de Computao em Nuvens ................. 19

    Figura 3 - Mega data center Azure da Microsoft ....................................................... 27

    Figura 4 - Modelo convencional de rede hierrquica de trs nveis .......................... 29

    Figura 5 - Arquitetura Fat Tree .................................................................................. 33

    Figura 6 - Algoritmo gerador das tabelas de roteamento da arquitetura Fat Tree ..... 34

    Figura 7 - Algoritmo de distribuio das tabelas da arquitetura Fat Tree .................. 34

    Figura 8 - B com .................................................................................... 35

    Figura 9 Topologia da Arquitetura DCell ................................................................ 38

    Figura 10 - Arquitetura do CloudSim ......................................................................... 43

    Figura 11 CloudSim incorporado ao Eclipse .......................................................... 43

    Figura 12 - Classe gerada (Public_Cloud) ................................................................ 44

    Figura 13 - Criao do data center e hosts ............................................................... 45

    Figura 14 - Criao da mquina virtual (small instance EC2) ................................... 46

    Figura 15 Cdigo de criao da CloudLet .............................................................. 47

    Figura 16 - Cdigo de criao do Broker ................................................................... 48

    Figura 17 - Representao da topologia de acordo com o arquivo brite ................... 49

    Figura 18 - Gerando o arquivo brite .......................................................................... 50

    Figura 19 - Cdigo de carregamento do brite no CloudSim ...................................... 50

    Figura 20 - Resultado da execuo (forma bruta) ..................................................... 51

    Figura 21 - Cenrio simulado .................................................................................... 52

    Figura 22 - Quantidade de cloudlets executadas por mquina virtual ....................... 53

    Figura 23 - Consumo de energia ............................................................................... 54

    Figura 24 - Migrao provocada pela estratgia de alocao do CloudSim ............. 55

    file:///C:/Users/Cleiton/Dropbox/TCC/TCC%20CLEITON.docx%23_Toc343872858file:///C:/Users/Cleiton/Dropbox/TCC/TCC%20CLEITON.docx%23_Toc343872859file:///C:/Users/Cleiton/Dropbox/TCC/TCC%20CLEITON.docx%23_Toc343872862file:///C:/Users/Cleiton/Dropbox/TCC/TCC%20CLEITON.docx%23_Toc343872865file:///C:/Users/Cleiton/Dropbox/TCC/TCC%20CLEITON.docx%23_Toc343872866
  • LISTA DE ABREVIATURAS E SIGLAS

    BSR BCube Source Rourting

    GPL General Public License

    IAAS Infrastructure as a Service

    IBM International Business Machines

    IP Internet Protocol

    MAC Media Access Control

    MDC Modular Data Center

    MIPS Milhes de instrues por segundo

    NHI Next Hop Index

    P2P Peer to Peer

    PAAS Platform as a Service

    RAM Random Acess Memory

    SAAS Software as a Service

    TI Tecnologia da Informao

    VLAN Virtual Local Area Network

    VM Virtual Machine

  • SUMRIO

    1 INTRODUO ....................................................................................................... 15

    2 REFERENCIAL TERICO ..................................................................................... 17

    2.1 Computao em nuvem .................................................................................... 17

    2.1.1 Caractersticas sssenciais ............................................................................. 18

    2.1.2 Modelos de servios ...................................................................................... 19

    2.1.2.1 Software como um servio (Software as a Service - SaaS) ..................... 19

    2.1.2.2 Plataforma como servio (Platform as a Service - PaaS) ........................ 20

    2.1.2.3 Infraestrutura como um servio (Infrastructure as a Service IaaS) ........ 20

    2.1.3 Modelos de implantao ................................................................................ 21

    2.1.3.1 Nuvem pblica ............................................................................................. 21

    2.1.3.2 Nuvem privada ............................................................................................. 21

    2.1.3.3 Nuvem hbrida ............................................................................................. 22

    2.1.3.4 Nuvem comunitria ..................................................................................... 22

    2.2 Tecnologias relacionadas ................................................................................. 22

    2.2.1 Clusters ........................................................................................................... 22

    2.2.2 Grid computing (Computao em grade) ..................................................... 23

    2.2.3 Virtualizao ................................................................................................... 25

    2.2.4 Data centers .................................................................................................... 26

    2.3 Arquiteturas ....................................................................................................... 28

    2.3.1 Limitaes das Arquiteturas de Rede Convencionais ................................ 29

    2.3.2 Novas propostas de arquiteturas ................................................................. 31

    2.3.3 Fat Tree ........................................................................................................... 32

    2.3.4 BCube .............................................................................................................. 34

    2.3.5 DCell ................................................................................................................ 37

    3 METODOLOGIA .................................................................................................... 39

    3.1 Caracterizao do Estudo ................................................................................ 39

    3.2 Delimitao do escopo da simulao .............................................................. 39

    3.3 A ferramenta de simulao CloudSim ............................................................. 42

    3.4 Preparando a simulao ................................................................................... 43

    3.5 Gerando o cdigo de simulao ...................................................................... 44

    3.5.1 Data center e hosts ........................................................................................ 45

  • 3.5.2 Mquina virtual............................................................................................... 45

    3.5.3 CloudLet ......................................................................................................... 47

    3.5.4 Broker ............................................................................................................. 48

    3.5.5 Aplicao do modelo de arquitetura fat tree ............................................... 48

    4.0 RESULTADOS E DISCUSSO ......................................................................... 51

    4.1 Cenrio simulado .............................................................................................. 52

    4.2 Simulao .......................................................................................................... 53

    5.0 CONCLUSO ..................................................................................................... 57

    REFERNCIAS ........................................................................................................ 59

    APNDICES ............................................................................................................. 63

  • 15

    1 INTRODUO

    Com o objetivo de reduzir custos operacionais e permitir a otimizao do

    uso dos Cloud Computing)

    emerge como uma nova tendncia, um novo modelo de computao que altera a

    forma como as pessoas e/ou empresas utilizam e adquirem recursos de Tecnologia

    de Informao (TI).

    Benefcios como aqueles obtidos pela possibilidade de no se fazer

    necessria gerncia local de hardware, software e dados em geral, deixando de

    lado a necessidade de investimentos em aquisio e manuteno de equipamentos

    para implantar e/ou manter uma infraestrutura prpria, provocaram uma verdadeira

    corrida por pesquisas com intuito de responder a alguns questionamentos e atender

    a demanda que surge relacionada a este novo modelo computacional. Nesse

    contexto, observa-se uma transformao no modelo econmico da Tecnologia da

    Informao, seja do lado consumidor ou do lado fornecedor de TI e servios, abrindo

    espao para tecnologias que contemplam aspectos que visam melhoria da

    eficincia dos servios em nuvens.

    Assim sendo, vale ressaltar que, principalmente no que diz respeito

    arquitetura dos data centers, ainda h muito que se fazer. Os grandes provedores de

    servios de nuvens ainda possuem, em sua infraestrutura, caractersticas herdadas

    de modelos baseados em arquiteturas e tecnologias para data centers

    convencionais, inadequadas para o novo cenrio estabelecido pela computao em

    nuvem. Por conta disto, tm se observado surgir novas propostas de arquiteturas.

    Dentre os diversos modelos de arquiteturas para data centers surgidos

    recentemente, optou-se neste trabalho, por discutir aqueles de maior relevncia,

    que, de acordo com Couto et al. (2010), so: Fat Tree, BCube e DCell.

    O principal objetivo do estudo foi identificar e em seguida simular a

    proposta de arquitetura de data center mais indicada para implantao de nuvens

    pblicas. Alm disso, durante a etapa de identificao, fazer um levantamento das

    arquiteturas para data centers preexistentes no mercado e buscar, na bibliografia,

    avaliaes destes modelos de acordo com parmetros como custo, escalabilidade e

    tolerncia a falhas.

  • 16

    A motivao para a realizao deste trabalho adveio, sobretudo, do

    interesse pessoal do pesquisador em compreender o tema que tem revolucionado o

    planejamento estratgico das empresas e considerado a principal mudana na

    infraestrutura de internet dos ltimos anos.

    Este estudo mostra ser importante na medida em que, a identificao do

    melhor modelo de arquitetura de data centers para nuvens pblicas, favorece a

    melhoria dos servios oferecidos pelos provedores. Alm disso, seus resultados

    podem contribuir para estudos futuros no campo da simulao e anlise de

    arquiteturas para data centers, principalmente aqueles desenhados para o novo

    cenrio da Computao em Nuvem.

  • 17

    2 REFERENCIAL TERICO

    2.1 Computao em nuvem

    A necessidade de ambientes capazes de armazenar, gerenciar e distribuir

    enormes quantidades de dados, gerados pela crescente utilizao da internet,

    servios web, redes sociais, etc., apontada como razo principal para o surgimento

    do que hoje chamamos de Computao em Nuvem (VERDI et al., 2010).

    Cloud Computing sem dvida um dos assuntos que sempre iro figurar

    nas atuais discusses sobre tecnologias de informao, haja vista que a aparente

    caraterstica abstrata, sob a qual era anteriormente definida, passou a ser vista

    como uma tecnologia palpvel e apontada como a principal mudana no cenrio

    computacional dos ltimos tempos. importante, porm, deixar bem claro que cloud

    computing no trata de uma tecnologia especfica, entend-la da forma correta s

    possvel quando enxergamos toda a sua multidisciplinaridade, na qual esto

    presentes elementos de tecnologias como grades computacionais, clusters e

    virtualizao que, por esta razo, foram inseridas nesta pesquisa.

    Na literatura, existem diversos estudos que apresentam definies para o

    que seria a Computao em Nuvem. Vaquero et al. (2009, p.2), baseados na

    anlise de algumas dessas definies sugerem o seguinte conceito:

    Nuvens so grandes reservatrios de recursos virtualizados facilmente utilizveis e acessveis (como hardware, plataformas de desenvolvimento e/ou servios). Esses recursos podem ser dinamicamente reconfigurados para se ajustar a uma carga (escala) varivel, permitindo tambm um uso timo dos recursos. Este reservatrio de recursos geralmente explorado por um modelo pay-per-use (pagar para usar) no qual as garantias so oferecidas por um Provedor de Infraestrutura por meio de SLAs (Service Level Agreement - Acordo de Nvel de Servio). (Traduo nossa

    1)

    A Computao em Nuvem um modelo composto por cinco

    caractersticas essenciais, trs modelos de servios e quatro modos de implantao,

    todos descritos nos tpicos seguintes (MELL; GRANCE, 2009).

    1 Clouds are a large pool of easily usable and accessible virtualized resources (such as hardware, development

    platforms and/or services). These resources can be dynamically reconfigured to adjust to a variable load (scale), allowing also for an optimum resource utilization. This pool of resources is typically exploited by a pay- per-use model in which guarantees are offered by the Infrastructure Provider by means of customized SLAs.

  • 18

    A figura 1 apresenta uma viso geral das definies propostas para a

    computao em nuvem.

    Fonte: VERDI (2010, adaptado)

    2.1.1 Caractersticas essenciais

    De acordo com Mell e Grance (2009), as cinco caractersticas essenciais

    podem ser definidas como:

    a) Self-Service sob demanda (On-demand self-service): O cliente pode, mesmo

    sozinho, provisionar recursos computacionais sem requisitar nenhuma interao

    humana com o provedor de servios;

    b) Amplo acesso rede (Broad network acess): Os recursos da infraestrutura

    computacional so acessados por meio de protocolos padro. Assim, o acesso

    aos servios pelo cliente independe da plataforma que ele utiliza, possibilitando o

    uso dos mais diferentes dispositivos (celulares, tablets, notebooks, etc.);

    c) Pooling de recursos (Resource pooling): O provedor mantm um conjunto de

    recursos fsicos e virtuais, como armazenamento, processamento, memria e

    largura de banda de rede, a fim de atender dinamicamente a demanda do usurio.

    Neste caso o usurio pode ser capaz de determinar uma localizao em um nvel

    de abstrao maior (por exemplo, pas, estado ou data center), mas no pode

    determinar a localizao exata da origem do servio que est utilizando.

    d) Elasticidade (Elasticity): Dependendo da utilizao, os recursos podem ser

    liberados ou alocados rapidamente. O usurio tem o poder de aumentar ou

    diminuir a quantidade de recursos utilizados de acordo com sua convenincia, o

    que transmite a ideia de que ele tem a sua disposio um conjunto de recursos

    ilimitados.

    Figura 1 - Viso geral da computao em nuvem

  • 19

    e) Medio de servios (Measured service): Tanto o usurio como o provedor tem

    acesso a detalhes do nvel de utilizao dos servios, o que permite a cobrana

    de acordo com o grau de utilizao dos recursos.

    2.1.2 Modelos de servios

    Diferentes servios visam diferentes tipos de cenrios, que por sua vez

    variam de acordo com o tipo de negcio alvo. Conforme Caytilis et al. (2012), os

    modelos de servios em nuvens podem ser classificados em trs modelos de

    entrega: SaaS (Software as a Service), PaaS (Platform as a Service) e IaaS

    (Infrastructure as a Service).

    A figura 2 relaciona alguns servios de computao em nuvens

    conhecidos e os classificam de acordo com os modelos citados anteriormente.

    Fonte: CAYTILES (2012, adaptado)

    2.1.2.1 Software como um servio (Software as a Service - SaaS)

    Este modelo de servio trata da parte da Computao em Nuvens que

    representa uma nova forma de comercializao e distribuio de softwares. De

    acordo com Caytilis et al. (2012), uma nica instncia do software executado na

    nuvem. Ainda segundo o autor, neste modelo, um aplicativo hospedado na internet

    oferecido como servio aos clientes. Nessa modalidade de servio no existe

    nenhuma necessidade de instalao, atualizao ou manuteno do aplicativo por

    parte do cliente, essas funes passam a ser atribuio do fornecedor da aplicao

    Figura 2 - Classificao de alguns servios de Computao em Nuvens

  • 20

    que tambm deve manter toda a infraestrutura necessria para a sua

    disponibilizao (CAYTILES et al., 2012).

    2.1.2.2 Plataforma como servio (Platform as a Service - PaaS)

    Neste modelo de servio de computao em nuvem, o prprio cliente

    desenvolve o software utilizando ferramentas/bibliotecas oferecidas pelo provedor do

    servio. Este provedor deve oferecer a plataforma de software que servir para rodar

    a aplicao (VAQUERO et al., 2009).

    Um dos grandes problemas enfrentados por desenvolvedores que utilizam

    a forma tradicional de desenvolvimento justamente a necessidade de projetar suas

    aplicaes em um cenrio hipottico de utilizao, muitas vezes atrelado ao poder

    de processamento da infraestrutura local. O PaaS, por sua vez, proporciona uma

    infraestrutura robusta e elstica, alm de facilidades necessrias ao suporte do ciclo

    de vida completo da aplicao, permitindo que o desenvolvimento seja inteiramente

    focado no negcio do cliente. Tais fatores proporcionam um ganho significativo em

    produtividade, j que no existe a necessidade de se preocupar com projetos

    relacionados a balanceamento de carga, instalao e configurao de servidores,

    banco de dados, etc. (CHAPPELL, 2008).

    2.1.2.3 Infraestrutura como um servio (Infrastructure as a Service - IaaS)

    Caytilis et al. (2012), descrevem IaaS (Infra estrutura como Servio) como

    a entrega direta de processamento, armazenamento e outros recursos

    computacionais aos usurios finais.

    Segundo Caytilis et al. (2012), o princpio bsico da IaaS fornecer ao

    cliente um grande poder de processamento e armazenamento em um ambiente

    altamente escalvel e seguro. Tais servios so oferecidos utilizando-se uma

    robusta infraestrutura de hardware virtualizada, o que proporciona um melhor

    aproveitamento dos recursos, atravs do compartilhamento da mquina fsica com

    as diversas mquinas virtuais. Assim, o cliente recebe mquinas virtuais com

    sistemas operacionais instalados prontas para executar suas aplicaes.

  • 21

    2.1.3 Modelos de implantao

    A classificao para os principais modelos de implantao de nuvens foi

    feita levando em considerao, principalmente, aspectos como a necessidade das

    aplicaes que iro ser implementadas. De acordo com Reese (2009), existem

    quatro modelos principais: Pblica, Privada, Hbrida e Comunitria.

    2.1.3.1 Nuvem pblica

    Nuvem Pblica o modelo de implantao de nuvens que melhor define o

    conceito de cloud computing. Neste modelo, o provedor de servios disponibiliza os

    recursos computacionais (por meio da internet), gratuitamente ou usando o modelo

    pay-to-use, para o pblico em geral. Neste caso, qualquer usurio que conhea a

    localizao do servio ter acesso nuvem. Para Taurion (2009), esta caracterstica

    da Nuvem Pblica dificulta a implementao de ferramentas de gerenciamento,

    autenticao e autorizao, uma vez que a nuvem disponibilizada para qualquer

    usurio.

    2.1.3.2 Nuvem privada

    Nuvem Privada o modelo no qual o data center interno a uma

    organizao, no disponvel ao pblico em geral. Segundo Sotomayor et al. (2009),

    o objetivo principal deste modelo proporcionar aos usurios locais uma

    infraestrutura gil e flexvel com capacidade de suportar workloads de servios

    dentro de seu prprio domnio administrativo.

    Diferente do que acontece com a Nuvem Pblica, para implantar uma

    Nuvem Privada necessria tambm uma infraestrutura prpria. O benefcio

    adquirido com o aumento do controle e segurana dos dados contidos na Nuvem

    Privada vem acompanhado da necessidade de manter a infraestrutura necessria ao

    seu funcionamento. Outro ponto importante que deve ser considerado o fato de

    que a nuvem sempre vai estar limitada capacidade dos equipamentos da

    organizao/empresa que a mantm. (SOTOMAYOR et al., 2009).

  • 22

    2.1.3.3 Nuvem hbrida

    Este modelo a combinao de Nuvens Pblicas com Nuvens Privadas.

    Neste caso, apenas parte dos servios est disponibilizado publicamente (FENILLI

    et al., 2011). A comunicao entre as nuvens feita por meio de interfaces

    padronizadas a fim de permitir o compartilhamento de recursos. Esta relao entre

    os dois modelos garante infraestrutura da Nuvem Privada o rpido

    provisionamento de recursos atravs da Nuvem Pblica.

    2.1.3.4 Nuvem comunitria

    Neste modelo, a infraestrutura de nuvem de uso exclusivo de uma

    comunidade de usurios/organizaes com interesses comuns (MELL, P; GRANCE,

    T, 2009). O gerenciamento e hospedagem dos recursos computacionais pode ou

    no ser feito por um ou mais membros. Os exemplos mais comuns da aplicao

    deste modelo de nuvem podem ser observados em comunidades acadmicas.

    2.2 Tecnologias relacionadas

    De acordo com Garcia (2010), a Computao em Nuvem resultado da

    herana combinada de diversas outras tecnologias. Esta caracterstica reflete a

    complexidade do ambiente computacional que prope suprir um vasto conjunto de

    necessidades corporativas. Nas quatro sees seguintes so discutidos conceitos e

    caractersticas das principais tecnologias relacionadas cloud computing.

    2.2.1 Clusters

    Neste modelo o hardware subjacente composto por conjunto de

    estaes de trabalho ou PCs semelhantes, conectados por meio de uma rede local

    de alta velocidade, ou seja, clusters so agrupamentos de servidores trabalhando

    em conjunto de modo que possam atuar como um nico sistema (TANENBAUM;

    STEEN, 2007).

    A ideia surgiu do resultado da convergncia de uma srie de tendncias

    da computao, incluindo a disponibilidade de microprocessadores de baixo custo,

  • 23

    as redes de alta velocidade e software de alto desempenho. A soma da capacidade

    de processamento de cada um dos computadores permite que este modelo

    organizacional se torne uma soluo mais rentvel quando comparada ao

    investimento em supercomputadores com velocidade e disponibilidade semelhantes

    quelas adquiridas pela utilizao de clusters.

    Clusters diferem de outras abordagens como peer to peer ou grid

    computing, que tambm usam muitos ns, por possurem uma natureza muito mais

    distribuda. As atividades dos ns de computao so gerenciadas por uma camada

    de software (middleware clurstering). Acima dos ns, essa camada transmite ao

    usurio a viso de uma unidade coesa.

    No que ser refere a cloud computing, Hwang, Dongarra e Geoffrey (2012)

    destacam a utilizao de clurster combinada com tcnicas de virtualizao a fim de

    possibilitar a criao de clusters virtuais para Computao em Nuvem. Segundo

    eles, comparado com os clusters fsicos, os clusters virtuais oferecem vantagens em

    variveis importantes como velocidade, flexibilidade e armazenamento.

    2.2.2 Grid computing (Computao em grade)

    Apesar da ideia por trs da Grid Computing e Clusters ser a mesma (unir

    o poder de processamento de um grupo de computadores) existem alguns aspectos

    que permitem estabelecer conceitos diferentes. O principal deles que enquanto um

    clurster possui um controlador central, um ponto nico do qual possvel utilizar

    todo o poder de processamento do grupo de computadores, a Computao em

    Grade utiliza uma arquitetura mais flexvel que, mesmo utilizando alguma espcie de

    controle centralizado, prevalece a natureza cooperativa da Grid que tem como

    fundamento principal o compartilhamento do ciclo de processamento ocioso dos

    equipamentos que dela fazem parte.

    Nesta linha de pensamento Bote-Lorenzo et al. (2009), realizam um

    estudo sobre Grid Computing que detalha caractersticas, usos e, baseados em

    vrias outras definies, estabelecem que Computao em Grade pode ser definida

    como uma infraestrutura de hardware e software distribuda geograficamente,

    composta de recursos de rede autnomos, compartilhados por diversas

    organizaes a fim de fornecer, de acordo com sua disponibilidade, o suporte para

    uma grande variedade de aplicaes.

  • 24

    Segundo Foster et al. (1998), estas aplicaes podem ser classificadas

    em cinco classes principais que so: supercomputao distribuda, alto rendimento,

    computao sob demanda, computao intensiva de dados e computao

    colaborativa.

    De acordo com Vaquero et al. (2009), existe uma confuso em torno da

    relao de Grid com cloud computing pois ambas compartilham vises semelhantes:

    reduzir custos de computao e aumentar a flexibilidade e confidencialidade,

    utilizando hardwares mantidos por terceiros. Em seu trabalho, usando vrias

    definies atribudas a Computao em Grade por outros atores, o autor estabelece

    itens comparativos com Computao em Nuvens. Vejamos algumas delas logo

    abaixo:

    Compartilhamento de Recursos: O objetivo principal da grid proporcionar o

    compartilhamento justo dos recursos entre as organizaes, enquanto a cloud

    computing visa fornecer recursos, sob demanda, aos usurios, fazendo com que

    estes tenham a impresso de uma fonte de recursos nica e dedicada.

    Virtualizao: Utilizada para ocultar a heterogeneidade dos recursos existentes, a

    tecnologia de virtualizao usada tanto em Cloud quanto em Grid. No entanto,

    em Cloud a virtualizao aplicada tambm em recursos de hardware.

    Segurana: Por permitir o isolamento de recursos, a virtualizao tambm esta

    diretamente relacionada segurana. Enquanto nas Nuvens cada usurio tem

    acesso exclusivo ao seu ambiente individual virtualizado, as Grades, na maioria

    das vezes, no lidam com a segurana do usurio final.

    Escalabilidade e Autogerenciamento: A escalabilidade presente nos dois

    modelos computacionais, a diferena reside na forma como ela acontece. Em

    Grades ela se d de forma manual, pois necessrio o aumento do nmero de

    ns utilizados. Em Nuvens, a escalabilidade acontece dinamicamente, por meio

    do redimensionamento do hardware virtualizado. No que se refere ao

    gerenciamento, pesa o fato de que as nuvens computacionais geralmente so

    administradas por uma nica empresa ou organizao, enquanto nas grades, o

    gerenciamento dificultado por no haver, geralmente, um nico proprietrio.

    Padronizao: O principal objetivo da padronizao alcanar a perfeita

    interoperabilidade. Nas Grades Computacionais, este objetivo parece estar cada

    vez mais prximo de ser alcanado, uma vez que os esforos conjuntos de

  • 25

    pesquisadores visando obter uma padronizao das interfaces (interfaces dos

    usurios e interface interna) tm trazido excelentes resultados. Apesar das

    interfaces de acesso aos servios da Computao em Nuvem serem muito

    parecidas com as interfaces das Grades Computacionais, a interface interna, por

    serem proprietrias, tem dificultado a sua padronizao.

    Modelo de pagamento: Geralmente, o modelo de cobrana das Grades

    Computacionais (quando existe), baseado no pagamento de taxas fixas. Na

    computao em Nuvem o usurio s paga pelos recursos que de fato utilizar (pay-

    per-use).

    2.2.3 Virtualizao

    Para Zhang, Cheng e Boutaba (2010), a Virtualizao uma tecnologia

    que abstrai os detalhes do hardware e fornece recursos virtualizados para

    aplicaes de alto nvel. Introduzida pela IBM por volta de 1960, a Tecnologia de

    Virtualizao s veio a se firmar por volta de 1990, quando demonstrou ser a forma

    mais eficiente de aproveitar toda a capacidade dos recursos computacionais. De

    acordo com Rego (2012), a virtualizao tem sido definida como uma abstrao

    destes recursos ou como uma tcnica para esconder suas caractersticas.

    No cenrio atual da TI, a virtualizao uma tcnica cada vez mais

    presente, pois se observa um sucessivo aumento de investimentos na rea, o que

    tem feito surgir um grande nmero de empresas com solues de gerncia de

    ambientes virtualizados. Como consequncia imediata destas novas solues,

    podemos citar o aumento da capacidade de aproveitamento dos recursos que antes

    ficavam ociosos (MATTOS, 2008).

    Complementando a definio de computao em nuvem j abordada

    neste trabalho e a fim de estabelecer uma conexo mais direta com a Tecnologia de

    Virtualizao, podemos citar a definio encontrada no trabalho de Rimal et al.

    (2009), onde a mesma afirma que a computao em nuvem aborda uma nova fase

    evolucionria da computao distribuda, que tem como objetivo proporcionar um

    maior aproveitamento dos recursos distribudos, reunindo-os a fim de obter um

    melhor rendimento e capacidade de resolver problemas computacionais de larga

    escala. Portanto, dentro do contexto da Computao em Nuvem, a virtualizao se

    apresenta como o meio para alcanar estes objetivos, pois, graas a ela, possvel

  • 26

    reunir recursos computacionais de um conjunto de servidores e distribuir,

    dinamicamente, on-demand, recursos virtuais para as aplicaes (ZHANG, CHENG;

    BOUTABA, 2010).

    Diante do exposto, fica caracterizado que a virtualizao oferece a

    flexibilidade necessria ao paradigma da computao em nuvem que, por sua vez,

    utiliza as diversas modalidades de virtualizao como ferramenta, a fim de garantir a

    diminuio dos custos referentes a infraestrutura, refrigerao e energia,

    principalmente quando consideramos sua aplicao em data centers de grande

    porte.

    2.2.4 Data centers

    Data center uma modalidade de servio de valor agregado que oferece

    recursos de processamento e armazenamento de dados para seus usurios, a fim

    de proporcionar a estes uma estrutura de grande capacidade, flexibilidade e

    segurana (TANENBAUM; STEEN, 2007).

    Projetados para concentrar os equipamentos que fazem parte da

    infraestrutura de hardware, como servidores, storages, switches, roteadores, etc., os

    ambientes nos quais os data centers so construdos visam garantir de forma

    ininterrupta a disponibilidade destes equipamentos e dos servios por ele oferecidos.

    Para tornar isso possvel, a maior parte dos data centers possui estruturas e

    tecnologias que fornecem desde alternativas de redundncia para a segurana dos

    sistemas hospedados e fornecimento de energia, a preveno e combate a

    incndios e controle de temperatura, alm da segurana fsica que inclui um rgido

    controle de acesso (TANENBAUM; STEEN, 2007).

    Nas nuvens, todas as modalidades de servios oferecidas dependem de

    uma base fsica, uma infraestrutura de rede que ser responsvel por abrigar os

    servidores, interlig-los e estabelecer a comunicao necessria aos servios de

    Nuvens. Esta infraestrutura formada por data centers, que dentro do contexto da

    cloud computing tambm chamada de DCloud.

    Para Verdi et al. (2010), de acordo com o tamanho da infraestrutura fsica

    e sua localizao, os data centers podem ser classificados como mega, micro, nano

    ou baseados em contineres:

  • 27

    Mega data centers: equipados com milhares de servidores (figura 3),

    estes data centers ocupam reas que ultrapassam centenas de milhares de metros

    quadrados, chegando alguns a ocupar aproximadamente 1(um) milho de metros

    quadrados. A escolha do local de construo destes data centers depende do

    preenchimento de uma srie de pr-requisitos bsicos que visam garantir a sua

    funcionalidade e a segurana. Alguns destes requisitos contemplam aspectos

    diretamente ligados eficincia energtica, uma vez que esta condio de

    sobrevivncia para qualquer organizao. Mas, para grandes consumidores de

    energia como os mega data centers, este o principal diferencial competitivo - e um

    grande desafio. Mais ainda quando considerada a implantao de iniciativas que

    combinam com a ideia de sustentabilidade. Grandes provedores de nuvens pblicas,

    geralmente, oferecem seus servios por meio deste modelo de data center. (VERDI

    et al., 2010).

    Figura 3 - Mega data center Azure da Microsoft

    Fonte: AZURIS (2012)

    Micro data centers: micro data centers so ideais para suportar aplicaes

    altamente interativas como, e-mail e aplicaes de escritrio como Google Docs.

    Neste modelo tambm existem cuidados com a escolha do local das instalaes, a

    fim de diminuir a latncia e os custos da rede de trnsito. Por essa razo,

    geralmente, estes data centers se encontram localizados prximos a grandes

    centros populacionais (VERDI et al., 2010).

    Nano data centers: O modelo cliente-servidor tm moldado a internet e

    todas as suas aplicaes. Na ltima dcada observamos o surgimento de diversas

  • 28

    solues de distribuio de contedo, que evoluram a partir deste modelo, atravs

    de cache distribudo, para redes de compartilhamento, e, mais recentemente, as

    redes peer-to-peer (P2P). Nessa linha evolutiva, os nano data centers se

    apresentam como o prximo passo na hospedagem de dados para distribuio de

    contedo, uma vez que este modelo considera a migrao de servios dos data

    centers tradicionais para equipamentos do usurio final. O Projeto NanoDataCenters

    (2012) aponta uma srie de benefcios adquiridos com utilizao deste modelo de

    data center, entre eles, e talvez o principal, a reduo significativa do consumo de

    energia na infraestrutura do provedor de servios. Por outro lado, um sistema to

    distribudo como o que sugere este modelo, gera grandes desafios no que diz

    respeito garantia de desempenho, confiabilidade e segurana (VERDI et al., 2010).

    Data centers baseados em contineres: Em 2007, um modelo de data

    center modularizado, composto por uma grande quantidade de servidores

    organizados em um container ganhou notoriedade. Dotados de sistemas de energia

    altamente eficientes, podendo economizar de 40% a 50% das despesas

    operacionais de data centers tradicionais, este modelo mostrou ser uma tima

    alternativa para infraestruturas provisrias ou locais remotos e passaram a ser

    oferecidos por muitos fornecedores como uma garantia de economia eficiente de

    energia e soluo para aumento de infraestrutura em curto prazo (VERDI et al.,

    2010).

    2.3 Arquiteturas

    Geralmente, a infraestrutura que possibilita a oferta de servios de

    computao em nuvem (principalmente nuvens pblicas) consiste em data centers

    compostos por milhares de servidores fsicos, conectados atravs de switches,

    roteadores e outros dispositivos de rede. Os gastos envolvidos com estas

    gigantescas infraestruturas e os crescentes requisitos necessrios oferta dos

    servios justificam a importncia do papel da arquitetura utilizada, uma vez que esta

    pode influenciar diretamente no desempenho, rendimento, consumo de energia e

    outras variveis tratadas nos tpicos subsequentes.

    Como forma de prover maior eficincia, melhor aproveitamento da largura

    de banda, flexibilidade e escalabilidade, os data centers convencionais adotam

  • 29

    modelos de multicamadas. Tais modelos podem ser entendidos com o uma estrutura

    hierrquica de dois ou trs nveis (figura 4).

    Figura 4 - Modelo convencional de rede hierrquica de trs nveis

    Fonte: CISCO (2009)

    Segundo Verdi et al. (2010), os modelos de trs nveis so comumente

    utilizados em mega data centers, providos com um grande nmero de servidores.

    Este modelo composto pelas seguintes camadas: 1) Acesso ou Agregao; 2)

    Distribuio ou Comutao; 3) Core ou Ncleo. Na camada de acesso esto

    localizados os servidores conectados fisicamente rede, pois ela que fornece as

    interfaces com para conexo com os dispositivos finais.

    A camada de distribuio ou agregao responsvel por definir o

    domnio de broadcast, prover servios de localizao e balanceamento de carga dos

    servidores, entre outras funes. Esta camada agrega os dados provenientes da

    camada de acesso antes de transmiti-los camada de ncleo a fim de proporcionar

    o roteamento at o destino final (VERDI et al., 2010).

    A camada de ncleo possui a indispensvel tarefa de estabelecer a

    conexo entre os diversos mdulos de agregao.

    2.3.1 Limitaes das arquiteturas de rede convencionais

    A arquitetura atual sobre o qual definido o modelo organizacional dos

    data centers, em especial, a organizao hierrquica (L2/L3), se baseia em tcnicas

    convencionais como Spanning Tree, VLAN, ou criao de sub-redes e por isso

  • 30

    apresenta algumas limitaes. Estas limitaes provocaram o surgimento de

    problemas que comprometem a eficincia e aproveitamento dos recursos

    computacionais dos data centers. Verdi et al. (2010), apresenta algumas destas

    limitaes:

    Fragmentao dos recursos: os modelos tradicionais de arquiteturas utilizam

    mtodos de roteamento que, geralmente, consistem na atribuio de endereos

    IP com valor topolgico (aderentes organizao da rede) divididos em VLANS.

    A consequncia negativa desta fragmentao o aumento da dificuldade de

    migrao de mquinas virtuais entre as VLANS criadas. Isso explicado pela

    necessidade de alterao do endereo IP da mquina virtual, uma vez que

    existe um isolamento lgico entre elas. Tal isolamento, apesar de fornecer mais

    segurana, impede a alocao dinmica de recursos ociosos em servidores que

    fazem parte de domnios diferentes quele utilizado por alguma aplicao que

    venha precisar destes recursos.

    Alocao esttica de servios: O isolamento entre as VLANS provoca um

    aumento do trfego nos enlaces do topo da hierarquia, gerando

    congestionamento e sobrecarga, provocando um efeito cascata sobre todos os

    servios que compartilham a mesma sub-rede sob a qual o servio

    sobrecarregado esta alocado.

    Vazo e latncia entre os servidores: os modelos convencionais de arquiteturas

    no so capazes de preencher os requisitos recentes de transmisso de dados

    entre os servidores. As sobrecargas causadas pela utilizao da topologia em

    forma de rvore faz com que haja uma diferena na concentrao do trfego,

    que tende a ser maior nos nveis mais altos. Como reflexo disso, dependendo do

    par de servidores envolvidos na aplicao, a latncia e a vazo deixam de ser

    uniformes, influenciando negativamente o desempenho das aplicaes,

    considerando as variveis relacionadas s medidas de trfego do data center.

    Escalabilidade: atualmente os protocolos de roteamento, encaminhamento e

    gerenciamento no promovem escalabilidade suficiente para data centers de

    grande capacidade.

    Custo dos equipamentos de rede: a arquitetura convencional adota o modelo de

    escalabilidade vertical (scale-up). Este modelo parte do princpio de que a

    escalabilidade obtida com o aumento dos recursos em um nico n da

  • 31

    arquitetura. Equipamentos caros como balanceadores de carga (LB-load

    balance) e switches do tipo high-end de alto desempenho, so substitudos

    utilizando o modelo scale-up, ou seja, quando um equipamento no suporta

    mais a carga de trabalho ao qual est submetido, substitudo por um novo

    equipamento de maior capacidade.

    Eficincia energtica: esta caracterstica tem sido alvo das principais discusses

    que envolvem as arquiteturas, principalmente quando o data center alvo de sua

    aplicao um data center de grande porte. O gigantesco consumo de energia

    necessrio para manter estas enormes infraestruturas gerado, em sua maioria,

    pelo sistema de refrigerao que, no caso dos modelos convencionais de

    arquitetura, adota o princpio de que os equipamentos de refrigerao so

    aumentados medida que o data center cresce. Alm disso, a relao entre

    consumo energtico e carga de trabalho no varia proporcionalmente, j que o

    consumo o mesmo, independente da carga de trabalho sob a qual o data

    center esta submetido.

    2.3.2 Novas propostas de arquiteturas

    O surgimento do paradigma da Computao em Nuvem trouxe novos

    requisitos para diversas reas da TI, principalmente para os modelos

    organizacionais responsveis por estabelecer o desenho da arquitetura dos data

    centers. Como foi visto anteriormente, existem muitos desafios a serem superados e

    se levarmos em conta todas as variveis presentes no universo da cloud computing

    podemos justificar o surgimento dessas novas propostas arquiteturais. Algumas

    dessas arquiteturas foram concebidas a fim de atender determinados grupos de data

    centers, respeitando uma classificao que, na maioria das vezes, feita de acordo

    com o tamanho da infraestrutura a qual ela se aplica ou de acordo com os custos

    envolvidos, seja ele proveniente dos equipamentos utilizados ou da manuteno

    necessria ao funcionamento da prpria infraestrutura (VERDI et al., 2010).

    PortLand, VL2, Fat Tree, DCell e BCube so alguns dos principais

    modelos de arquiteturas surgidos recentemente. Exclumos VL2 e Portland do

    escopo de nosso projeto, pois ambas so implementadas por meio da utilizao da

    base estrutural definida pela Fat Tree. Neste sentido, nosso trabalho apresenta as

    trs arquiteturas (Fat Tree, BCube e DCell) que, de acordo com os trabalhos de

  • 32

    Guo et al. (2009), Couto et al. (2010) e Popa et. al. (2010), possuem maior

    relevncia no cenrio dos novos data centers para Computao em Nuvem.

    2.3.3 Fat tree

    Alguns estudos, como o realizado por Ludovici et al. (2009), apresentam

    as principais diferenas existentes entre o modelo de trs camadas convencional e a

    topologia Fat Tree. De acordo com os autores, uma delas fato de que o novo

    modelo apresenta uma alternativa diferente daquela em que so necessrios novos

    investimentos em switches mais rpidos (com custos relativamente altos) para

    aumento do desempenho das redes dos grandes data centers. Tal alternativa parte

    do pressuposto de que o mesmo aumento de desempenho tratado anteriormente

    pode ser obtido por meio da aquisio e incluso de switches Ethernet mais baratos.

    Outro aspecto importante a reorganizao das conexes proposta pela

    topologia Fat Tree. Nela, os links se tornam mais numerosos medida que se

    direcionam raiz, enquanto na rvore hierrquica do modelo convencional a

    com Al-Fares et al. (2008), esta reorganizao acontece sob a forma de uma rvore

    que por sua vez, composta por uma camada de Pods (conjunto de

    switches edge, switches de agregao e servidores dos data centers) e outra de

    ncleo (switches que se ligam aos Pods por meio de suas portas na razo de 1/1). O

    nmero de portas ( ) o mesmo em todos os switches da rede. Como cada porta

    dos switches de ncleo responsvel por estabelecer a comunicao com um Pod

    (relao 1/1), conclui-se que o nmero de Pods sempre vai estar limitado a .

    Internamente, os Pods esto organizados em duas camadas (camadas de borda e

    camada de agregao). Nestas camadas esto localizados switches de borda e

    switches de agregao. Metade das portas dos comutadores da camada

    de borda so usadas para estabelecer a conexo com os servidores, enquanto a

    outra metade estabelece a conexo com a camada superior (camada de

    agregao). A mesma lei de formao obedecida pela camada de agregao, na

    qual seus comutadores tambm estabelecem as conexes com os switches do core

  • 33

    ( portas) e com os switches de borda ( portas). No final, a quantidade total de

    servidores que podem ser conectados a uma topologia Fat Tree pode ser obtida por

    meio da aplicao da seguinte frmula: * * , ou seja, .

    A figura 5 facilita o entendimento. A mesma representa uma rvore Fat

    Tree com .

    . Considerando, hipoteticamente, que uma rvore Fat Tree utiliza switches

    de 48 portas, teremos: 48 Pods, cada um contendo 24 switches de borda e 24 de

    agregao, alm de 27.648 servidores

    De acordo com Al-Fares et al. (2008), existe um agente central

    responsvel por carregar as tabelas de roteamento dos switches enquanto a rede se

    estabelece. Ainda segundo o autor, a topologia segue a lgica definida por dois

    algoritmos diferentes, o primeiro (figura 6) gera as tabelas de roteamento dos

    switches de agregao enquanto o segundo (figura 7) promove a distribuio dessas

    tabelas.

    Fonte: AL-FARES (2008)

    Alm disso, de acordo com Abelm et al. ( 2012 ), a arquitetura Fat Tree,

    como forma de obter um melhor aproveitamento da capacidade oferecida, faz uso de

    extenses que envolvem alteraes nos switches de core. Estes, por meio de um

    enlace, encaminham os pacotes recebidos para o seu Pod de destino. Em seguida,

    os pacotes so enviados ao seu comutador de sub-rede de onde finalmente

    enviado ao servidor.

    Figura 5 - Arquitetura Fat Tree

  • 34

    Figura 6 - Algoritmo gerador das tabelas de roteamento da arquitetura Fat Tree

    Fonte: AL-FARES et al. (2008)

    Figura 7 - Algoritmo de distribuio das tabelas da arquitetura Fat Tree

    Fonte: AL-FARES (2008)

    Segundo Couto et al. (2010), a Fat Tree possibilita a comunicao de

    todos os servidores ao mesmo tempo utilizando a capacidade mxima de suas

    interfaces de rede.

    2.3.4 BCube

    Apesar de apresentar algumas semelhanas com a Fat Tree no que diz

    respeito a objetivos relacionados a custos e desempenho, a topologia BCube

    apresenta uma abordagem diferenciada em suas solues (ABELM et al., 2012 ).

    Esta arquitetura adota o modelo server-centric no qual toda a inteligncia necessria

    ao funcionamento do MDC (modular data center) implantada nos servidores, o que

    permite a utilizao de switches comoditizados (VERDI et al., 2010).

    Alm disso, a mesma foi desenvolvida para atender especificamente ao

    modelo de data center baseado em contineres ou MDC (Modular Data Center).

    Esta caracterstica favorece a economia no que diz respeito aos gastos necessrios

  • 35

    refrigerao dos equipamentos, facilita a migrao para outras localidades

    geogrficas, mas, por outro lado, dificulta sua manuteno, uma vez que os

    contineres so selados antes de serem colocados em operao (COUTO et al.,

    2010).

    Por conta disso, desejvel que a infraestrutura de rede seja dotada de

    alta tolerncia a falhas. Como no possvel garantir que as falhas no aconteam

    e, considerando a dificuldade de manuteno j mencionada, o BCube foi projetado

    para, no caso de falhas, lentamente permitir uma queda de desempenho (GUO et

    al., 2009).

    Outro aspecto importante contemplado pela BCube, o suporte a todos

    os modelos de cardinalidade da comunicao, o que permite atender ao mesmo

    tempo grandes demandas, de aplicaes, por banda passante.

    O BCube corresponde a uma estrutura definida de forma recursiva e sua

    lei de formao obedece a seguinte lgica:

    . Um BCube de nvel , denominado (B ), consiste de servidores conectados a um comutador de portas. J um B composto por

    B s e por n comutadores de n portas. De uma maneira geral, um

    B formado por B s e comutadores de portas. Os

    B s so numerados de a e os servidores em cada

    B so numerados de a . A porta do nvel do -simo

    servidor localizado no -simo B conectada -sima porta do -simo comutador de nvel . (ABELM et al., 2012, p. 22).

    Um exemplo de um B com pode ser observado na figura 8.

    Fonte: ABELM (2012)

    Figura 8 - B com

  • 36

    De acordo com Abelm et al. (2012), a BCube adota endereos de 32 bits

    e armazena um ndice de prximo salto (Next Hop Index NHI) e o caminho

    completo (array de NHIs) no cabealho de todos os pacotes. Alm disso, uma

    verso do NHI com apenas 8 bits, chamada NHA, pode ser usada para diminuir o

    tamanho do cabealho. Esta dividida em duas partes: DP e DV. A primeira (DV)

    corresponde indicao de qual dgito do prximo salto difere do atual servidor de

    retransmisso, enquanto a segunda (DP) indica o valor daquele dgito.

    Outro aspecto importante da arquitetura esta relacionado incluso do

    protocolo de roteamento BSR (BCube Source Routing). A utilizao do mesmo tem

    como objetivo, permitir que a fonte controle o caminho de forma independente dos

    servidores intermedirios, fazendo com que estes participem somente do

    encaminhamento de pacotes, alm disso o BSR tem a capacidade de realizar um

    monitoramento do trfego na rede e reagir a fim de evitar a difuso de estados de

    enlaces, que possui um problema de escalabilidade no momento em que milhares

    de servidores esto operando simultaneamente (GUO et al., 2009).

    O principal benefcio adquirido com a utilizao do BSR o aumento

    significativo na capacidade de realizar balanceamento de trfego e tratamento de

    falhas, que por sua vez, acontece sem que haja necessidade de distribuio dos

    estados dos enlaces. Alm disso, este protocolo a ferramenta utilizada para

    garantir que a queda da capacidade do BCube acontea lentamente, conforme foi

    descrita inicialmente (ABELM et al., 2012 ).

    O funcionamento do BSR pode ser descrito da seguinte forma:

    Quando um fluxo deve ser transmitido, a fonte envia sondas em mltiplos caminhos. Os servidores intermedirios incluem informaes nesses pacotes que sero utilizadas para selecionar um dos mltiplos caminhos, por exemplo, mnima banda passante disponvel. Quando uma sonda chega ao destino, o destino envia uma resposta para a fonte. Ao receber as respostas, a fonte seleciona o melhor caminho baseado em alguma mtrica, por exemplo, a mxima banda passante disponvel. (ABELM et al., 2012, p.23 ).

    Para determinar o encaminhamento a BCube utiliza uma tabela na qual

    esto armazenados todos os status dos vizinhos. Cada entrada faz referncia a

    apenas um vizinho e composta de trs campos, todos descritos na quadro 1.

    Cada uma das entradas da tabela indexada pelo valor NHA do vizinho.

    Dessa forma, um hospedeiro intermedirio consegue obter o NHA do prximo salto

  • 37

    por meio da leitura do cabealho do pacote que recebeu. Em seguida, obtm o

    status e o endereo MAC do prximo salto, usando o NHA como ndice e ento

    atualiza (somente no caso da checagem do status retornar um valor funcional) os

    endereos MAC, o NHA e o cheksum do cabealho do BCube e ento encaminha o

    pacote pela porta de sada. (ABELM et al., 2012).

    Quadro 1 - Tabela de status dos vizinhos

    NeighborMAC OutPort StatusFlag

    Endereo MAC do vizinho

    Porta de conexo com o

    vizinho

    Disponibilidade do vizinho

    Fonte: SOUSA (2012)

    2.3.5 DCell

    Segundo Guo et al. (2008), a DCell surgiu com o intuito de atingir trs

    objetivos. O primeiro criar uma estrutura de rede altamente escalvel, o segundo

    utilizar um algoritmo de roteamento que gere ambientes eficientes e distribudos e

    por ltimo, que este ambiente seja tolerante a falhas. Para isso, DCell utiliza

    servidores equipados com vrias interfaces de rede que por sua vez, esto ligados a

    vrios outros servidores e um mini comutador por meio de links de comunicao

    bidirecional.

    De um modo geral, um comparativo entre DCell e BCube revela uma srie

    de caractersticas semelhantes, que vo desde a forma como as mesmas so

    implementadas proposta de padres de equipamentos utilizados. O modelo

    recursivo sob o qual as duas arquiteturas so definidas uma delas.

    A construo da DCell iniciada a partir dos nveis mais baixos, ou seja,

    a DCell de maior nvel construda a partir da DCell de menor nvel (GUO et al.,

    2008). Uma rede DCell0 que formada por um switch ligado a n servidores. A

    DCell1 construda utilizando n+1 redes DCell0. Neste caso, a DCell1 ser

    composta por duas DCell0 conectadas entre si por meio de um enlace gerado por

    um de seus servidores. A figura 9 trs a representao grfica desta topologia.

    Na imagem podemos notar que as comunicaes entre as clulas so

    feitas localmente por meio de um switch. Em destaque, podemos observar a

  • 38

    representao de comunicaes entre servidores que fazem parte da mesma clula

    (servidores 2 e 3 da DCell00) e de servidores localizados em clulas diferentes da

    DCell1 (servidores 1 DCell020 e servidores 2 DCell30).

    Fonte: COUTO (2010)

    Uma caracterstica especfica DCell o fato de seus switches estarem

    conectados apenas aos servidores de sua prpria clula. A ligao entre clulas

    DCell diferentes feita por meio dos servidores. Essa caracterstica faz com que a

    BCube sempre apresente um desempenho superior DCell (considerando a

    utilizao do mesmo nmero de portas de servidores) (COUTO et al., 2010).

    Figura 9 Topologia da Arquitetura DCell

  • 39

    3 METODOLOGIA

    3.1 Caracterizao do Estudo

    Este trabalho caracteriza-se como uma pesquisa aplicada de carter

    experimental cujo propsito foi simular a proposta de arquitetura de data center mais

    indicada para implantao de nuvens pblicas.

    Neste trabalho utilizou-se o CloudSim, incorporado ao Eclipse SDK (IDE

    com suporte a desenvolvimento em java). Segundo Calheiros et al. (2010), o

    CloudSim um framework desenvolvido em java que oferece os recursos

    necessrios para realizao de simulaes de ambientes de nuvens

    computacionais. Licenciado pela (GPL), o framework extensvel, adaptvel e

    possibilita a criao de simulaes em grande escala, com um elevado grau de

    customizao (CALHEIROS et al., 2010).

    Estas ferramentas tornaram possvel a modelagem e simulao de todo o

    ambiente computacional da nuvem pblica, incluindo suas tecnologias e recursos.

    3.2 Delimitao do escopo da simulao

    Com base no levantamento bibliogrfico realizado no decorrer desta

    pesquisa, foi possvel observar que, alguns trabalhos utilizados como referncia,

    foram fundamentados em resultados obtidos por meio da aplicao das arquiteturas

    em uma infraestrutura fsica, real.

    O trabalho de Couto et al. (2010) um deles. Nesse trabalho, os autores

    avaliam a robustez das arquiteturas sob o ponto de vista do tamanho da rede e da

    variao do comprimento de seus caminhos, considerando situaes nas quais a

    rede submetida a falhas. A avaliao se d por meio da comparao do

    desempenho, das trs arquiteturas estudadas (Fat Tree, BCube e DCell) em uma

    mesma infraestrutura de data center que, neste caso, era composta por um nmero

    de servidores sempre prximo de 3.400 (trs mil e quatrocentos).

  • 40

    Levando em conta o estudo apresentado por Couto et al. (2010),

    elaborou-se um quadro com a sntese dos resultados dessa comparao. O mesmo

    apresentado no quadro 2.

    Quadro 2 - Resumo dos resultados obtidos por Couto et al. (2010)

    Fat Tree BCube DCell

    Esca

    lab

    ilidad

    e

    Maior escalabilidade

    entre as trs

    arquiteturas

    Alta escalabilidade

    Alta escalabilidade

    To

    ler

    ncia

    a F

    alh

    as

    Continua

    Caminhos redundantes

    favorecem a tolerncia

    a falhas que, neste caso

    independe da

    quantidade de falhas

    ocorridas.

    Implementa o protocolo BSR

    que permite uma queda

    lenta do desempenho da

    rede na ocorrncia de

    falhas. Quando submetida a

    um pequeno nmero de

    falhas apresenta

    desempenho superior Fat

    Tree. Situao vai se

    invertendo medida que as

    falhas aumentam.

    Vrios links

    associado a um

    protocolo de

    roteamento

    distribudo

    tolerante a falhas

    Ob

    jetivo

    Modelo desenvolvido

    para permitir a

    utilizao de um grande

    nmero de servidores

    (data centers de grande

    porte)

    Modelo desenvolvido para

    data centers baseado em

    containers (pequeno e

    mdio porte)

    Modelo

    desenvolvido para

    permitir a utilizao

    de um grande

    nmero de

    servidores (data

    centers de grande

    porte)

    Fonte: COUTO (2010, baseado)

    No que se refere a custo, principalmente queles relacionados ao

    consumo de energia e valor dos equipamentos, um estudo comparativo entre as trs

  • 41

    arquiteturas foi apresentado por Popa et al, (2010). De acordo com os autores, nos

    primeiros testes realizados, a arquitetura DCell apresentou os maiores custos

    quando comparada s demais, por isso, passou a no ser mais considerada no

    restante da pesquisa.

    A exemplo do trabalho de Couto et al, (2010), os resultados da pesquisa

    de Popa et al, (2010), puderam ser resumidas de acordo com o que pode ser

    observado no quadro 3.

    Quadro 3 - Resumo dos resultados obtidos por Popa et al, (2010)

    Fat Tree BCube

    Esca

    lab

    ilidad

    e

    Alta escalabilidade

    Alta escalabilidade

    Custo

    Custo superior BCube.

    Menor custo (A diferena, neste caso, se

    deu por conta do menor consumo de

    energia da infraestrutura de refrigerao,

    mais eficaz em data centers modulares).

    To

    ler

    ncia

    a F

    alh

    as

    O grande nmero de percursos

    entre quaisquer dois pontos

    finais torna a Fat Tree um

    modelo altamente tolerante a

    falhas.

    O mesmo acontece com a BCube, a

    diferena entre o desempenho no quesito

    tolerncia a falhas entre as duas

    arquiteturas, esta diretamente

    relacionado tamanho do data center. Em

    data centers de grande porte a BCube

    tem desempenho inferior na ocorrncia

    de falhas.

    Fonte: POPA (2010, baseado)

    De uma forma geral, os resultados das pesquisas acima deixam claro que

    as arquiteturas Fat Tree e BCube se destacam. No entanto, algumas das variveis

    envolvidas nos testes contemplam caractersticas essenciais em ambientes de

  • 42

    nuvem pblicas, fazendo com que estas tenham um peso maior na deciso de qual

    arquitetura escolher no momento de sua implantao. Entre elas, esto

    escalabilidade e tolerncia a falhas (VAQUERO et al., 2009), nas quais a Fat Tree

    demonstrou ter um maior desempenho.

    Alm disso, o fato de que os maiores provedores de servios de nuvens

    pblicas esto abrigados em data centers de grande porte, refora a deciso de que

    a arquitetura mais indicada para implantao de nuvens pblicas a Fat Tree, uma

    vez que esta, durante os testes, demonstrou ser a mais estvel e tolerante a falhas

    entre aquelas desenvolvidas para grandes data centers.

    3.3 A ferramenta de simulao CloudSim

    Apesar de j existem uma grande variedade de aplicativos desenvolvidos

    e rodando em ambientes de nuvens, durante esta pesquisa foi possvel constatar

    que ainda no foi estabelecido um padro para testes dos ambientes que formam a

    cloud. O acesso infraestrutura das nuvens necessariamente implica em custos

    que, considerando as inmeras dificuldades em quantificar e detalhar as

    caractersticas da infraestrutura real a ser criada ou consumida (iaas), podem estar

    sendo utilizados para alocar ou adquirir uma infraestrutura acima do necessrio ou,

    abaixo dos requisitos para a aplicao e/ou servio que se deseja oferecer/utilizar.

    Uma soluo vivel para este problema a simulao.

    Optou-se ento, por usar o CloudSim nesta pesquisa. De acordo com

    Buyya et al, (2009), este framework extensvel permite a modelagem, simulao e

    experimentao de toda a infraestrutura que forma o ambiente de computao em

    nuvem. Com isso, os clientes/fornecedores, os usurios da cloud de uma forma

    geral, podem utilizar a ferramenta para testar os servios num ambiente sem custos,

    ajustar este ambiente a fim de adquirir o desempenho desejado antes de implantar o

    servio ou adquirir a infraestrutura real.

    Desenvolvido na universidade de Melbourn na Austrlia, o CloudSim

    encontra-se disponvel para download no site2 do projeto. Segundo Buyya et al,

    (2009), o framework composto por trs camadas: motor de simulao; classes

    2 Disponvel em:

  • 43

    funcionais e cdigos do usurio. Os detalhes e a composio de cada uma delas

    podem ser observados na figura 10.

    Figura 10 - Arquitetura do CloudSim

    Fonte: BUYYA (2009)

    3.4 Preparando a simulao

    Inicialmente, baixou-se a verso mais atual do CloudSim (v 3.0.1).

    Depois, utilizando-se do Eclipse SDK (v 4.2.1), importou-se a pasta contendo toda a

    biblioteca da ferramenta a fim de permitir a modificao e execuo dos cdigos em

    funo dos propsitos deste estudo.

    A figura 11 mostra toda a base da biblioteca do CloudSim.

    Figura 11 CloudSim incorporado ao Eclipse

    Fonte: SOUSA (2012)

  • 44

    No pacote examples do CloudSim h inmeras classes. Cada uma delas

    contm algoritmos prontos para execuo e simulao de vrios modelos de

    ambientes de nuvens diferentes. Por conta disso, buscou-se uma classe com as

    caractersticas mais prximas quelas desejveis simulao realizada. Com isso, o

    trabalho de criao do cdigo de simulao foi facilitado, uma vez que passou a ser

    necessrio somente o entendimento dos cdigos (mtodos, entidades, etc) para que

    estes pudessem ser adaptados de acordo com a necessidade da simulao.

    Assim, a nova classe (Public_Cloud.java) foi gerada (figura 12). Em

    seguida foram feitas as modificaes necessrias para que esta obedecesse aos

    padres estabelecidos pela instncia escolhida para simulao.

    Figura 12 - Classe gerada (Public_Cloud)

    Fonte: SOUSA (2012)

    3.5 Gerando o cdigo de simulao

    Esta seo descreve os cdigos criados ou modificados para simulao

    dos componentes bsicos de um data center, assim como as instncias e mtodos

    envolvidos na simulao do uso da arquitetura Fat Tree em um ambiente de nuvem

    pblica.

  • 45

    3.5.1 Data center e hosts

    O trecho do cdigo apresentado na figura 13 permite a modelagem do

    data center, elemento base da infraestrutura da nuvem simulada.

    Na imagem, pode-se observar que a criao do data center permite

    encapsular um conjunto de hosts homogneos ou heterogneos, respeitando as

    configuraes individuais de memria, ncleo, capacidade e armazenamento.

    Figura 13 - Criao do data center e hosts

    Fonte: SOUSA (2012)

    3.5.2 Mquina virtual

    Como forma de tornar a simulao mais fiel realidade, adotou-se a

    estratgia de incluir instncias3 oferecidas por um provedor de servios de nuvens

    pblicas real. Neste caso, o provedor escolhido foi o Amazon EC2 (Amazon Elastic

    Comput Cloud) e as instncias relacionadas para fazer parte da simulao foram:

    m1.small (pequena), m1.medium (mdia) e m1.large (grande), todas descritas na

    quadro 4.

    3 Mquinas virtuais prontas que obedecem a um padro de classificao. (Calheiros et al., 2010).

  • 46

    Esta estratgia, alm do benefcio j citado, proporcionou uma viso mais

    ampla da nuvem, pois incluiu a perspectiva do usurio/cliente na simulao de

    utilizao de uma nuvem pblica que adota a Fat Tree como arquitetura interna.

    Quadro 4 Instncias EC2

    Instncia

    Pequena

    Instncia

    Mdia

    Instncia

    Grande

    Instncia

    Extra Grande

    Memria 1,7 GB 3,75 GB 7,5 GB 15GB

    Processador 1 unidade

    computaciona

    l ec2

    2 unidades de

    processament

    o ec2

    4 unidades de

    processament

    o ec2

    8 unidades de

    processament

    o EC2

    Armazenamento

    160 Gb 410 GB 850 GB 1690 GB

    Plataforma 32 ou 64 bits 32 ou 64 bits 64 bits 64 bits

    Desempenho

    E/S

    moderado moderado alto alto

    Nome da API m1.small m1.medium m1.large m1.xlarge

    Fonte: AMAZON (2012, baseado)

    Para criar a mquina virtual conforme os padres estabelecidos pela

    instncia m1.small da EC2, utilizou-se o trecho do cdigo mostrado na figura 14.

    Figura 14 - Criao da mquina virtual (small instance EC2)

    Fonte: SOUSA (2012)

  • 47

    Na imagem, possvel observar que os valores para as variveis da VM

    esto de acordo com a descrio da instncia presente no quadro 4.

    3.5.3 CloudLet

    O CloudSim implementa uma classe que possibilita a representao do

    perfil de utilizao. De acordo com Calheiros et al, (2010), esta classe modela os

    servios baseados em aplicativos de nuvens (como a entrega de contedo, redes

    sociais, e fluxo de trabalho).

    Por meio da figura 15, possvel observar o trecho do cdigo responsvel

    pela criao e definio das caractersticas de quatro, das oito cloudlets criadas para

    nossa simulao.

    Figura 15 Cdigo de criao da CloudLet

    Fonte: SOUSA (2012)

    As cloudlets so descritas por meio de caratersticas como: quantidade de

    ncleos envolvidos no processamento, tamanho dos arquivos de I/O que sero

    transferidos entre clientes e data centers e o modelo de utilizao, que determina o

    padro de processamento sob o qual o processador da mquina virtual vai estar

    submetido. Dessa forma, a fim de favorecer a visualizao das diferentes

    capacidades de processamento das mquinas virtuais simuladas, definimos que

  • 48

    todas as cloudlets envolvidas em nossa simulao teriam as mesmas

    caractersticas.

    importante ressaltar que, apesar da cloudlet fazer uma referncia direta

    ao usurio/cliente, aps sua criao ela deve ser vinculada a uma das mquinas

    virtuais definidas no cdigo. Neste caso, a mquina virtual que carrega a

    responsabilidade de estabelecer a relao entre a cloudlet e o usurio.

    3.5.4 Broker

    O Broker uma classe (figura 16) que implementa a poltica de escolha

    do data center a ser utilizado para alocao das mquinas virtuais.

    Figura 16 - Cdigo de criao do Broker

    Fonte: SOUSA (2012)

    O CloudSim permite a adoo de quatro lgicas diferentes para utilizao

    do broker. A mudana entre uma lgica e outra, diz respeito somente aos critrios de

    escolha do data center para alocao das mquinas virtuais. Estes critrios esto

    relacionados a custo, poder de processamento e latncia de rede.

    3.5.5 Aplicao do modelo de arquitetura fat tree

    Por meio da anlise dos cdigos de simulao existentes na biblioteca do

    framework, pode-se concluir que h duas formas de inserir o modelo de arquitetura

    interna de um data center na simulao realizada pelo CloudSim.

  • 49

    A primeira, adota a configurao manual atravs da adaptao dos

    cdigos encontrados em algumas classes que representam exemplos de simulao,

    mais especificamente, aqueles que fazem parte do pacote network.datacenter. De

    acordo com Beloglazov et al, (2011), a este pacote foram adicionadas novas classes

    que, por sua vez, oferecem suporte a criao de switches dentro de modelos

    arbitrrios de topologias de rede.

    A segunda maneira, escolhida para ser utilizada neste estudo, consiste na

    utilizao BRITE

    Segundo Medina et al, (2009), o arquivo brite um gerador de topologia

    flexvel que oferece suporte a mltiplos modelos de arquitetura. Este arquivo carrega

    as informaes, importadas de outras arquiteturas ou definidas pelo prprio usurio,

    e as organiza, utilizando um formato que pode ser melhor entendido por meio da

    observao da figura 17.

    Figura 17 - Representao da topologia de acordo com o arquivo brite

    Fonte: MEDINA (2010)

    Na imagem, podemos observar que este arquivo contm as informaes

    referentes ao modelo organizacional definido pela topologia escolhida. Com isso, no

    momento da execuo do cdigo, o arquivo que foi previamente gerado lido e suas

    informaes so

    simulao desta pesquisa, foi gerado por meio do BriteGenerator4. Esta ferramenta

    carrega uma biblioteca de configuraes de diversas topologias armazenas em

    arquivos de configurao (figura 18).

    4 Desenvolvido pela Universidade de Boston, BriteGenerator uma ferramenta de gerao de topologia

    parametrizada que pode ser usada de forma flexvel para controlar vrios parmetros e estudar propriedades das topologias. (MEDINA et al., 2010).

  • 50

    Figura 18 - Gerando o arquivo brite

    Fonte: SOUSA (2012)

    De posse do brite gerado, o passo seguinte foi inserir o trecho do cdigo

    que corresponde aos comandos de seu carregamento na base de simulao desta

    pesquisa (figura 19).

    Figura 19 - Cdigo de carregamento do brite no CloudSim

    Fonte: SOUSA (2012)

  • 51

    4 RESULTADOS E DISCUSSO

    A execuo dos cdigos descritos na seo anterior apresentam

    resultados que podem tornar complexa a tarefa de interpretao. Por conta disso,

    optou-se por, partir deles, gerar grficos ou figuras com informaes especficas a

    cada uma das variveis envolvidas. Na figura 20, podemos observar um exemplo do

    resultado da execuo de uma das simulaes realizadas durante esta pesquisa,

    ainda na sua forma bruta de exibio.

    Figura 20 - Resultado da execuo (forma bruta)

    Fonte: SOUSA (2012)

    As maiores dificuldades encontradas para realizao deste trabalho dizem

    respeito principalmente simulao proposta. Isso se deve ao fato de que o

    CloudSim, a principal ferramenta usada para tal fim, possui pouca documentao.

    Apesar de existirem outras ferramentas que se apoiam na biblioteca do CloudSim

    para fornecer interfaces grficas ao usurio e com isso facilitar a simulao,

    nenhuma delas proporciona a flexibilidade desejada na modificao dos atributos

    dos componentes envolvidos em nosso estudo, principalmente aqueles relacionados

    com a implementao da arquitetura.

  • 52

    Nas sees seguintes, apresentamos os resultados da simulao

    realizada e a descrio deste do cenrio, assim como a anlise dos dados gerados

    por eles, sempre considerando a utilizao da arquitetura Fat Tree.

    4.1 Cenrio simulado

    O cenrio simulado (figura 21) composto por um data center, dois

    servidores e um usurio com quatro mquinas virtuais diferentes, cada uma delas

    configurada de acordo com os padres definidos pelas instncias da Amazon

    relacionadas no quadro 4. As cloudlets, representam um conjunto de tarefas

    demandadas pelos usurios.

    Figura 21 - Cenrio simulado

    Fonte: SOUSA (2012)

    Para este estudo, considerou-se que todas as cloudlets possuam as

    mesmas caractersticas. Essa deciso favoreceu a visualizao das diferenas de

    poder de processamento das demandas dos usurios nas diferentes instncias

    simuladas.

    O Broker, apesar de ter sido includo no cdigo, no representa uma

    atividade relevante, uma vez que, nesta simulao, foi considerada a existncia de

    apenas um data center, que neste caso, utiliza a arquitetura Fat Tree.

  • 53

    Para os servidores (hosts), adotou-se a seguinte configurao: 16

    processadores, 5000 MIPS, 40GB de memria RAM e capacidade de

    armazenamento de 50TB.

    4.2 Simulao

    Conforme ficou definido anteriormente, cada uma das mquinas virtuais

    simuladas obedece a um dos padres das instncias da EC2, ou seja, as mquinas

    virtuais vm0, vm1, vm2 e vm3 foram configuradas com as caractersticas definidas

    pelas instncias m1.small, m1.medium, m1.large e m1.xlarge respectivamente.

    A figura 21 representa o resultado das execues das demandas do

    usurio (Costumer1) em suas quatro mquinas virtuais. Ela estabelece uma relao

    entre a quantidade de cloudlets executadas e as mquinas virtuais do usurio. Com

    isso foi possvel comprovar a diferena entre o poder de processamento das

    instncias oferecidas pela EC2.

    Figura 22 - Quantidade de cloudlets executadas por mquina virtual

    Fonte: SOUSA (2012)

    Outros aspectos importantes, presentes nos resultados da simulao,

    dizem respeito ao consumo de energia e custo, que neste caso, est representado

    por um valor de referncia, podendo ser utilizado para o clculo do valor real de

    cobrana do servio de nuvem pblica utilizado.

  • 54

    Para o cenrio simulado, o consumo de energia apresentou pequenas

    variaes, mas na mdia, uma infraestrutura com as caractersticas iguais que

    formou o ambiente de simulao desta pesquisa, consume entre 70 a 75KW/min

    (figura 22).

    Figura 23 - Consumo de energia

    Fonte: SOUSA (2012)

    No entanto, observou-se que todo o consumo de energia estava

    relacionado apenas utilizao do servidor 1, ou seja, o segundo servidor no teve

    nenhuma participao no consumo energtico. Isso se deveu ao fato de que todas

    as mquinas virtuais inseridas na simulao, foram alocadas no mesmo servidor.

    Este fato caracteriza uma importante demonstrao dos benefcios oferecidos pela

    utilizao da tecnologia de virtualizao que, neste caso proporcionou o melhor

    aproveitamento dos recursos computacionais do servidor 1, fazendo com que no

    fosse necessrio a utilizao do segundo servidor.

    A fim de comprovar a observao feita em torno do consumo de energia e

    testar a eficincia da estratgia de alocao de mquinas virtuais adotada pelo

    CloudSim, inseriu-se um segundo usurio no cenrio de simulao. Este usurio

    (Costumer2) foi criado com as mesmas caractersticas do primeiro, ou seja, cloudlets

    idnticas e mquinas virtuais de acordo com as instncias EC2.

  • 55

    A insero do novo usurio fez com que a poltica de alocao das

    do CloudSim reorganizasse a distribuio das . A vm0 foi migrada do servidor1

    (host0) para o Servidor 2 (host1).

    Figura 24 - Migrao provocada pela estratgia de alocao do CloudSim

    Fonte: SOUSA (2012)

    Neste cenrio modificado, o consumo de energia do data center ficou um

    pouco acima de 135KW/min.

    Contudo, importante deixar claro que, toda a referncia a consumo

    energtico feita nos resultados do CloudSim, no incluem a energia eltrica

    necessria infraestrutura de refrigerao existe em um data center real que, de

    acordo com Verdi et al, (2010), gera custos comparveis aos investimentos em

    equipamentos de TI da infraestrutura do data center.

  • 56

  • 57

    5 CONCLUSO

    Por meio dos resultados das diversas simulaes realizadas no decorrer

    desta pesquisa, foi possvel demonstrar a eficincia dos servios de nuvens pblicas

    providos por data centers que utilizam a arquitetura Fat Tree.

    Alm disso, esses resultados permitiram concluir que a utilizao dessa

    arquitetura favorece caractersticas desejveis como: distribuio eficiente de

    mquinas virtuais, execuo bem sucedida das demandas do usurio e a alta

    escalabilidade, principalmente em data centers de grande porte, onde o consumo

    energtico, a tolerncia a falhas e a escalabilidade so requisitos essenciais

    garantia da qualidade de entrega dos servios providos por nuvens.

    A utilizao do CloudSim possibilitou a simulao de toda a infraestrutura

    do data center, alm de detalhes operacionais como, demandas de usurios e

    processamento das mquinas virtuais.

    Composta por uma biblioteca extensvel, a ferramenta abre um

    precedente para as inmeras possibilidades de simulao. Com base nisso, sugere-

    se como possveis trabalhos futuros, a simulao de diferentes polticas de alocao

    de mquinas virtuais.

    Por fim, propem-se, um estudo comparativo, por meio da simulao, das

    arquiteturas que utilizam a Fat Tree como modelo de referncia (VL2 e Portland).

  • 58

  • 59

    REFERNCIAS

    AMAZON. Site oficial da empresa. Disponvel em: . Acesso em: 11 OUT 2012. AZURIS. Site oficial do data center. Disponvel em: . Acesso em: 09 OUT 2012. ABELM, A. J. G.; NETO, D. O. G.; ALMEIDA, J. M. (Org.) Minicursos / XXX Simpsio Brasileiro de Redes de Computadores e Sistemas Distribudos Porto Alegre: SBC, 2012. Disponvel em: Acesso em: 25 de OUT 2012. AL-FARES, M.; LOUKISSAS, A.; VAHDAT, A. A scalable, commodity data center network architecture. Disponvel em: Acesso em: 09 de SET de 2012. BELOGLAZOV, Anton; BUYYA, Rajkumar. Optimal Online Deterministic

    Algorithms and Adaptive Heuristics for Energy and Performance Efficient

    Dynamic Consolidation of Virtual Machines in Cloud Data Centers,

    Concurrency and Computation: Practice and Experience, ISSN: 1532-0626, Wiley

    Press, New York, USA, 2011, DOI: 10.1002/cpe.1867. Disponvel em:

    Acesso em: 27 de

    OUT de 2012.

    BOTE-LORENZO, M. L., DIMITRIADIS, Y. A.; GOMEZ-SANCHEZ, E. Grid Characteristics and Uses: a Grid Definition. Disponvel em: Acesso em: 24 OUT 2012 BUYYA, R.; RANJAN, R.; CALHEIROS, R. N. Modeling and Simulation of Scalable Cloud Computing Environments and the CloudSim Toolkit: Challenges and Opportunities. Proceedings of the International Conference on High Performance Computing & Simulation, Nova Jersey, p. 1-11, 2009. Disponvel em: Acesso em: 01 de NOV de 2012. CALHEIROS ,R.N. et al. CloudSim: A Toolkit for Modeling and Simulation of Cloud Computing Environments and Evaluation of Resource Provisioning Algorithms. Disponivel em: Acesso em: 07 DEZ 2012 CAYTILES, R. D.; LEE S.; PARK, B. Cloud Computing: The Next Computing Paradigm. International Journal of Multimedia and Ubiquitous Engineering Vol. 7, No. 2, April, 2012. Disponvel em:

  • 60

    Acesso em: 11 de NOV de 2012 CHAPPELL,D. A short introduction to cloud platforms. Disponvel em: Acesso em : 10 OUT 2012 CISCO. Site oficial da empresa: Disponvel em: Acesso em: 05 SET 2012 COUTO, R .S; CAMPISTA, M. E. M; COSTA, L. H. M. K. Uma Avaliao da Robustez Intra Data Centers Baseada na Topologia da Rede. Disponivel em: Acesso em : 09 DEZ 2012 FENILLI, A.T.R., MARCHIL, K. R.C. Computao em nuvem: Um futuro presente. Disponvel em: Acesso em : 25 OUT 2012 FOSTER, I. et al. Cloud Computing: state of the art and research challenges. Disponvel em: Acesso em: 12 OUT 2012. GARCIA, M. A. B. A. Definies, funcionamento e aplicaes da computao em nuvem 2010 (Cloud Computing). Disponvel em: Acesso em: 22 SET 2012 GUO, C.et al. BCube: A High Performance, Server-centric Network Architecture for Modular Data Centers. Disponvel em: Acesso em: 18 NOV 2012 GUO, C., WU, H., TAN, K., SHI, L., ZHANG, Y. e Lu, S. (2008). DCell: a scalable and fault-tolerant network structure for data centers. Em ACM SIGCOMM. Disponvel em: < http://research.microsoft.com/pubs/81063/comm136-guo.pdf> Acesso em: 13 de OUT de 2012 HWANG, K., DONGARRA, J.; FOX, G. - Cloud Computing: Virtual Clusters Disponvel em: Acesso em: 18 OUT 2012 LUDOVICI, D. et al. Assessing Fat-Tree Topologies for Regular Network-on Chip Design under Nanoscale Technology Constraints. Disponvel em: Acesso em: 08 NOV 2012 MATTOS, D. M. F. Virtualizao: VMWare e Xen . Disponvel em: Acesso em: 07 NOV 2012

  • 61

    MEDINA, A. et al. BRITE: Technical Report BUCS-TR-2001-003, Boston University, 200. Disponvel em: < www.cs.bu.edu/brite/publications/BriteMascots.ps.gz> Acesso em: 17 de AGO de 2012 MELL, P.; GRANCE T. The NIST Definition of Cloud Computing. NIST Special Publication 800-145, 2009. Disponvel em: < http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf> Acesso em: NANODATACENTER. Projeto NanaDatacenter2012. Acesso em: ] - http://www.nanodatacenters.eu/ ? POPA, L., RATNASAMY, S., IANNACCONE, G., KRISHNAMURTHY, A. e STOICA, I. (2010). A cost comparison of datacenter network architectures. REESE, G. - Cloud Application Architectures: Building Applications and Infrastructure in the Cloud. E-book Safari Books Online, 2009. Acesso em: 21 OUT 2012 REGO, P. A. L.. FairCPU: uma arquitetura para provisionamento de mquinas virtuais utilizando caractersticas de processamento. 2012. 81f. Dissertao (Ps-Graduao em Cincia da Computao) - Universidade Federal do Cear, Departamento de Computao, Fortaleza, 2012. Acesso em: 02 NOV 2012 RIMAL, B.P.; CHOI,E.; LUMB,I. Toxonomy and Suervey of Cloud Computing Systems. Disponvel em: Acesso em: 11 OUT 2012> SOTOMAYOR, B;. KEAHEY, K.; FOSTER, I. Overhead Matters: A Model for Virtual Resource Management, Distributed Computing (VTDC 06), IEEE CS Press, 2006, p. 5. TANENBAUM, A. S.; STEEN, M, V. Sistemas Distribudos: Princpios e Paradigmas. 2. ed. So Paulo: Pearson Prentice Hall, 2007. TAURION, C., Cloud Computing: computao em nuvem: transformando o mundo

    Rio de Janeiro: Editora Brasport, 2009. VAQUERO, L.M. et al. A Break in the Clouds: Towards a Cloud Definition . ACM SIGCOMM Computer Communication Review. Volume 39, Number 1, January 2009 VERDI, F., ROTHENBERG, C., PASQUINI, R. E MAGALHES, M.(Org.). Novas arquiteturas de data center para cloud computing. Em Minicursos do XXVIII SBRC, 2010 ZHANG, Q.; CHENG, L.; BOUTABA, R. Cloud computing: state-of-the-art and research challenges. Journal of Internet Services and Applications. Springer London, v. 1, n. 1, 2010.

  • 62

  • 63

  • 64

    APNDICES

  • 65