Click here to load reader

Cluster x Grid

  • View
    204

  • Download
    0

Embed Size (px)

DESCRIPTION

Trabalho de Arquitetura de Computadores 2.

Text of Cluster x Grid

CLUSTER X GRID

Alunos: Andr Campos Bruno Henrique Thiago de Paula

Goinia, 29/06/2009

ContedoCLUSTER...............................................................................................................................1 X..............................................................................................................................................1 GRID.......................................................................................................................................1 Contedo.................................................................................................................................2 Cluster x Grid .........................................................................................................................3 Computao distribuda..........................................................................................................3 Cluster.....................................................................................................................................6 Grid.......................................................................................................................................22 Referncias............................................................................................................................29

2

Cluster x Grid

Computao distribudaA computao distribuda, ou sistema distribudo, uma referncia computao paralela e descentralizada, realizada por dois ou mais computadores conectados atravs de uma rede, cujo objetivo concluir uma tarefa em comum. Um sistema distribudo uma coleo de computadores independentes que se apresenta ao usurio como um sistema nico e consistente, geralmente estas mquinas so interligadas por uma rede de computadores e equipados com software que permita o compartilhamento dos recursos do sistema: hardware, software e dados. Organizar a interao entre cada computador primordial. Visando poder usar o maior nmero possvel de mquinas e tipos de computadores, independendo da plataforma, do Sistema Operacional ou do Banco de Dados. O protocolo ou canal de comunicao no pode conter ou usar nenhuma informao que possa no ser entendida por certas mquinas. Cuidados especiais tambm devem ser tomados para que as mensagens sejam entregues corretamente e que as mensagens invlidas sejam rejeitadas, caso contrrio, levaria o sistema a cair ou at o resto da rede. Outro fator de importncia a habilidade de mandar softwares para outros computadores de uma maneira portvel de tal forma que ele possa executar e interagir com a rede existente. Isso pode no ser possvel ou prtico quando usando hardware e recursos diferentes, onde cada caso deve ser tratado separadamente com cross-compiling ou reescrevendo software. Existem vrios modelos de computao distribuda, dentre eles destaca-se: Cliente/Servidor: O cliente manda um pedido para o servidor e o servidor o retorna o resultado processado. Ex.: Servidores web (HTTP) , FTP, DNS, Proxy, e-mail... 3

Peer-to-peer (P2P): Unidades de processamento no possuem um papel fixo de cliente ou servidor, hora so clientes, hora servidores. Ex.: Servios de compartilhamento de arquivos (Napster, BitTorrent, eMule), DNS, OpenFT, JXTA

Objetos distribudos: Semelhante ao peer-to-peer, mas com um software intermediando o processo de comunicao. Ex.: CORBA, RemoteSync, Ginga Em geral os sistemas de processamento distribudo ou paralelo que

interligam vrios ns de

processamento

(computadores individuais, no

necessariamente homogneos) de maneira que um processo de grande consumo seja executado no n "mais disponvel", ou mesmo subdividido por vrios ns. Conseguindo-se, portanto, ganhos considerveis nestas solues: uma tarefa qualquer, se dividida em vrias subtarefas pode ser realizada em paralelo. Este um assunto muito vasto e, embora com alguma idade, somente a pouco tempo comeou a se falar em padres para estas solues, que so utilizadas (em larga escala) geralmente nos meios cientficos e outros de clculo intensivo pela sua extensibilidade. So bastante flexveis, j que permitem a coexistncia de sistemas desenhados especificamente para isso e de sistemas desktop, e mesmo de sistemas considerados obsoletos, mas no o suficiente para permitir a coexistncia de solues semelhantes.

Arquitetura BsicaA figura abaixo ilustra as vrias camadas de interoperabilidade de um sistema distribudo. Atravs do gateway a rede pblica tem acesso a um supercomputador, sem ter conhecimento disso, dado que s conhece o gateway.

4

Figura 1 - Arquitetura bsica de um sistema distribudo

Qualquer

aplicao

executada

no

gateway

(preparada

para

ser

paralelizada) pode ser distribuda por vrios ns, entregando os resultados mais rpido do que se fosse processada por apenas um n.

5

ClusterUm cluster um conjunto de computadores, interligados como um sistema distribudo. Muitas vezes construdo a partir de computadores convencionais (personal computers), os quais so ligados em rede e comunicam-se atravs do sistema, trabalhando como se fossem uma nica mquina de grande porte.

HistricoA idia inicial da congregao do "PC SHOW" da Microsoft, era que um buffer entre a memria e o processador fosse chamado de cluster. Mas foi desenvolvida na dcada de 1960 pela IBM como uma forma de interligar grandes mainframes, visando obter uma soluo comercialmente vivel de paralelismo no Paquisto. Nesta poca o sistema HASP (Houston Automated Spooling Program) da IBM e seu sucessor o JES (Job Entry System) proviam uma maneira de distribuir tarefas nos mainframes interligados. A IBM ainda hoje (2001) suporta o cluster de mainframes atravs do Parallel Sysplex System, que permite ao hardware, sistema operacional, middleware e software de gerenciamento do sistema prover uma melhora dramtica na performance e custo ao permitir que usurios de grandes mainframes continuem utilizando suas aplicaes existentes. Entretanto, o cluster ganhou fora at que trs tendncias convergiram nos anos 1980: microprocessadores de alta performance, redes de alta velocidade, e ferramentas padronizadas para computao distribuda de alto desempenho. Uma quarta tendncia possvel a crescente necessidade de poder de processamento para aplicaes cientficas e comerciais unida ao alto custo e a baixa acessibilidade dos tradicionais supercomputadores. No final de 1993, Donald Becker e Thomas Sterling iniciaram um esboo de um sistema de processamento distribudo construdo a partir de hardware convencional como uma medida de combate aos custos dos supercomputadores. No incio de 1994, trabalhando no CESDIS, com o patrocnio do projecto HTPCC/ESS, criaram o primeiro cluster desse tipo, o projecto Beowulf. O prottipo inicial era um cluster de 16 processadores DX4 ligados por dois canais Ethernet 6

acoplados (Ethernet bonding). A mquina foi um sucesso instantneo e esta idia rapidamente se espalhou pelos meios acadmicos, pela NASA e por outras comunidades de pesquisa.

Performance de ClustersEm computao, FLOPS (ou flops) um acrnimo que significa Floating point Operations Per Second que, em portugus, quer dizer operaes de ponto flutuante por segundo. Isto usado para determinar o desempenho de um computador, especificamente no campo de clculos cientficos, que fazem grande uso de clculos com ponto flutuante; similar a instrues por segundo. Dispositivos de computao possuem uma enorme capacidade de processamento, ento faz sentido utilizar unidades maiores que FLOPS. Para isso colocado um prefixo que determina o mltiplo da unidade, assim como acontece com outras unidades de medida. Os mltiplos mais utilizados so: megaflops (MFLOPS), gigaflops (GFLOPS), teraflops (TFLOPS), petaflops (PFLOPS) e exaflops (EFLOPS). Em 2007 o mais rpido supercomputador, criado para empresa japonesa Riken, atingiu 1 petaflop. O supercomputador resultado de uma parceria da Hitachi, da Intel e da NEC, e nele foram associados 4808 processadores Xeon Dual-Core (Dempsey). Uma calculadora bsica de 4 operaes possui um desempenho de 10 FLOPS. H muitos fatores na performance do computador para medir da velocidade do calculo de pontos-flutuantes, como a performance de Entrada/Sada, comunicao do interprocessador, coerncia de cache, e a hierarquia de memria. Isso significa que supercomputadores, em geral, so apenas capazes duma pequena frao do seu desempenho terico(obtido adiconando junto o pico de performance terico de FLOPS de todos os elementos do sistema). Mesmo quando operando em paralelo clculos muito grandes, o seu desempenho ser lento, principalmente devido ao efeito residual da Lei de Amdahl. A Lei de Amdahl a lei que governa o ganho na utilizao de processadores paralelos em relao ao uso de apenas um processador. Seu nome deriva do arquiteto de computadores Gene Amdahl.O ganho de 7

desempenho que pode ser obtido melhorando uma determinada parte do sistema limitado pela frao de tempo que essa parte utilizada pelo sistema durante a sua operao. O ganho depende de dois fatores: Frao de melhoria (Fm): frao de tempo da computao que pode tirar proveito da melhoria feita. Esta frao sempre menor ou igual a 1. Ganho de execuo (Ge): ganho obtido com a melhoria na parte especfica modificada do sistema. Este ganho sempre maior que 1.

Frmula da Lei de Amdahl

Tipos de ClusterExistem Vrios tipos de cluster, dentre eles destacam-se: Cluster de Alto Desempenho Tambm conhecido como cluster de alta performance ele funciona permitindo que ocorra uma grande carga de processamento com um volume alto de gigaflops em computadores comuns, alguns utilizando sistema operacional gratuito o que diminui seu custo. Cluster de Alta Disponibilidade So clusters os quais seus sistemas conseguem permanecer ativos por um longo perodo de tempo e em plena condio de uso, sendo assim, podemos dizer que eles nu