1 a jecompp 1 Computação de Alto Desempenho Tecnologias de Alta Velocidade de Operação...

View
106
Download
2
Category

Documents

Preview:

Citation preview

1a jecompp

Computação de Alto Desempenho

• Tecnologias de Alta Velocidade de Operação– Exemplos: 750 MHz, 1 GHz

• Exploração de Paralelismo– Alta Granulosidade

• Programas

• Processos

– Baixa Granulosidade• Instruções

1a jecompp

Paralelismo no Nível de Programas e Processos

• Arquiteturas de Processamento com Diversos Processadores (máquinas paralelas)

• Arquiteturas de Processamento com Diversos Computadores (rede de computadores)

1a jecompp

Paralelismo no Nível de Instruções(ILP - Instruction Level Parallelism)

• Processador que Executam Instruções em Paralelo

– Pipelining

– Superpipelining

– Superscalar

– VLIW - Very long Instruction Word

– Vetorial

– etc.

1a jecompp

Desempenho

• Desempenho final depende de vários fatores

– Características da Aplicação

– Mecanismo de Comunicação

– Qualidade do Código Gerado pelo Compilador

– Arquitetura dos Processadores

– Arquitetura dos Computadores

1a jecompp

Modelos de Computadores Paralelos

• Classificação de Flynn

– Classifica as várias arquiteturas de computadores baseado nos fluxos de Instruções e de Dados que ocorrem no interior dos computadores

– SISD - Single Instruction, Single Data stream

– SIMD - Single Instruction, Multiple Data stream

– MIMD - Multiple Instruction, Multiple Data stream

– MISD - Multiple instruction, Single Data stream

1a jecompp

SISD

Exemplos: Estações de trabalho e Computadores pessoais com um único processador

1a jecompp

SIMD

Exemplos: ILIAC IV, MPP, DHP,

MASPAR MP-2 e CPU Vetoriais

1a jecompp

MIMD

Exemplos: Cosmic Cube, nCube 2, iPSC, FX-2000,Paragon XP/S e Redes de Computadores

Mais difundidaMemória CompartilhadaMemória Distribuída

1a jecompp

MISD

Exemplos: Array Sistólicos

1a jecompp

Resumo

• MIMD– Maioria dos sistemas paralelos existentes

– Mais adequado à computação paralela de “propósito geral”

• SIMD e MISD– Computação específica

• SISD– Computação Seqüencial

1a jecompp

Máquinas MIMD

• Multiprocessadores de Memória Compartilhada (shared-memory multiprocessors)

– UMA (Uniform-Memory-Access)

– NUMA (NonUniform-Memory-Access)

• Multicomputadores (message-passing multicomputers)

– Redes de Computadores

1a jecompp

Multiprocessadores - UMA

1a jecompp

Multiprocessadores - NUMA

1a jecompp

Multiprocessadores - NUMA

1a jecompp

Multicomputarores

1a jecompp

Interconexão

Anel Grafo Completo

1a jecompp

Interconexão

HiperCubo

1a jecompp

Interconexão

Árvore Estrela

1a jecompp

Interconexão

1a jecompp

Programação ParalelaExemplo

• Somar 16 valores, utilizando-se 16 processadores

• Quantas operações soma são realizadas?

• Qual o ganho em relação à solução usando um único processador?

1a jecompp

Programação ParalelaUma Solução

1a jecompp

Programação ParalelaSpeedup

• Somar 16 valores, utilizando-se 16 processadores

• Quantas operações soma são realizadas?– Solução seqüencial = 15 operações de Soma

– Solução paralela = 4 operações de Soma

• Qual o ganho em relação à solução usando um único processador?

75.34

15ganho OBS.: 15 Comunicações

1a jecompp

Desempenho

• Speedup - Ganho apresentado pela máquina paralela em relação a uma máquina seqüencial

• Qual o comportamento do speedup com o aumento do número de processadores?– Ideal: N

– Realidade: menor que N

1a jecompp

Lei de Ahmdahl

•

• Exemplo: Qual a fração paralelizável necessária para se alcançar um speedup de 200 usando-se 256 processadores?

fspeedup

)1(

1 Onde: f - fração melhorada (paralelizável)

P - número de processadores

2562562561

256)1(

1200

ffff

1a jecompp

Lei de Ahmdahl

256255256

1200

f255256

256200

%89.999989.0 f

1a jecompp

Multiprocessors

• Idea: create powerful computers by connecting many smaller ones

– good news: works for timesharing (better than supercomputer) vector processing may be coming back

– bad news: its really hard to write good concurrent programsmany commercial failures

Cache

Processor

Cache

Processor

Cache

Processor

Single bus

Memory I/ONetwork

Cache

Processor

Cache

Processor

Cache

Processor

Memory Memory Memory

1a jecompp

Questions

• How do parallel processors share data?— single address space (SMP vs. NUMA)— message passing

• How do parallel processors coordinate? — synchronization (locks, semaphores)— built into send / recieve primitives— operating system protocols

• How are they implemented?— connected by a single bus — connected by a network

1a jecompp

Some Interesting Problems

• Cache Coherency

• Synchronization— provide special atomic instructions (test-and-set,

swap, etc.)

• Network Topology

Cache tagand data

Processor

Single bus

Memory I/O

Snooptag

Cache tagand data

Processor

Snooptag

Cache tagand data

Processor

Snooptag

1a jecompp

Cache Coherency

• Most popular protocol - Snooping

• Multiple Copies– read - processors must have the most recent copy– write - exclusive access

• write-invalidate (write-back)• write-update (write-through)

1a jecompp

Cache Coherency

Invalid(not valid

cache block)

Read/Write(dirty)

Read Only(clean)

)tihfietadilavnidneS(

(Writ

e back dirty

block to

memory)

Processor read miss

Processor write

Processor write miss

Processorread miss

Processor write(hit or miss)

Cache state transitions using signals from the processora.

Invalid(not valid

cache block)

Read/Write(dirty)

Read Only(clean)Invalidate or

another processorhas a write miss

for this block(seen on bus)

Another processor has a readmiss or a write miss forthis block (seen on bus);

write back old block

Cache state transitions using signals from the busb.

1a jecompp

Synchronization using Coherency

Succeed?(= 0?)

Unlocked?(= 0?)

Load lockvariable

Yes

Try to lock variable using swap:read lock variable and then set

variable to locked value (1)

Begin updateof shared data

Finish updateof shared data

Unlock:set lock variable to 0

Yes

1a jecompp

Concluding Remarks

• Evolution vs. Revolution“More often the expense of innovation comes from being too

disruptive to computer users”

• “Acceptance of hardware ideas requires acceptance by software people; therefore hardware people should learn about software. And if software people want good machines, they must learn more about hardware to be able to communicate with and thereby influence hardware engineers.”

Cach

Virtu

al m

emor

RIS

Para

llel p

roce

ssin

g m

ultip

roce

ssor

Pip

elin

ing

Mass

ive

SIM

Mic

ropr

ogr

min

Tim

esha

red

multi

proce

ssor

-UM

A m

ultip

roce

ssor

-NU

multi

proce

ssor

Not

-CC

-NU

multi

proce

ssor

Mess

age

-pass

ing m

ultip

roce

ssor

Evolutionary Revolutionary

Recommended

Paralelismo a Nível de Instrução

Documents

Agilent PSA - file.yizimg.comfile.yizimg.com/388147/2012043023172612.pdfAgilent PSA&' 13 10 Hz = 0 Hz ACP FFT 1 GHz 10 kHz 1 MHz 10 MHz DANL 10 MHz-3 GHz 3 GHz-20 GHz 20 GHz-26.5 GHz

Documents

Transparência 1/49 Paralelismo, ferramentas e aplicações 03/maio/2002 Paralelismo, ferramentas e aplicações Celso Carneiro Ribeiro Noemi Rodriguez Sérgio

Documents

CLUSTERS COMPUTACIONAIS DE ALTO DESEMPENHO 2... · DANIEL VAHID LIMA TOLOUEI ... Figura 2 - Exemplo de um cluster de alta disponibilidade ... Historicamente, o uso do paralelismo

Documents

Prof.ª Dr.ª Fatima Salete Correra · Banda Ku 12-18 GHz Banda K 18-26 GHz ... Banda W 75-110 GHz Banda D 110-170 GHz ... Satélites de observação da Terra

Documents

Paralelismo em nível de instruções eprofessor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/5587/... · Paralelismo em nível de instrução e paralelismo de máquina + Política

Documents

Paralelismo Alexandre Mota (acm@cin.ufpe.br). Paralelismo Representam a execução paralela de dois ou mais processos: fluxos de controles independentes

Documents

PowerBook G4 Aluminum 15 'LCD de substituição 1,67 GHz · PowerBook G4 Aluminum 15 "LCD de substituição 1,67 GHz Substitua o LCD em seu PowerBook G4 Aluminum 15 "1,67 GHz. Redigido

Documents

ZoneFlex R610a030f85c1e25003d7609-b98377aee968aad08453374eb1df3398.r40.… · 2,4 GHz SSID de voz 2,4 GHz 5 GHz 5 GHz 2,4 GHz 2,4 GHz 2,4 GHz 2,4 GHz 802.11n 802.11g 802.11g 802.11ac

Documents

Paralelismo em Máquinas Multiprocessadas

Documents

A TELEVISÃO VIA SATÉLITEamalia.img.lx.it.pt/~mpq/st04/ano2002_03/trabalhos... · modulação de portadoras de muito alta frequência, bandas VHF(30 a 300MHz) e UHF(0,3 a 3 GHz)

Documents

Função do paralelismo nas cantigas (trovadorismo)

Education

Dell G3 3590...Velocidade de transferência Até 433 Mbps Até 1,73 Gbps Até 2,4 Gbps Bandas de frequência suportadas Banda dupla de 2,4 GHz/5 GHz Banda dupla de 2,4 GHz/5 GHz Banda

Documents

Clear wave 1,5 Ghz

Documents

MA092 Geometria plana e analítica - Paralelismo e ...chico/ma092/ma092_2_geo_paral_perpend.pdf · MA092 { Geometria plana e anal tica Paralelismo e perpendicularidade. Tri^angulos

Documents

[Artigo]-Paralelismo Em Nivel de Thread

Documents

1 a jecompp 1 Computação de Alto Desempenho Tecnologias de Alta Velocidade de Operação...

Documents

Paralelismo a Nível de Instrução

Agilent PSA - file.yizimg.comfile.yizimg.com/388147/2012043023172612.pdfAgilent PSA&' 13 10 Hz = 0 Hz ACP FFT 1 GHz 10 kHz 1 MHz 10 MHz DANL 10 MHz-3 GHz 3 GHz-20 GHz 20 GHz-26.5 GHz

Transparência 1/49 Paralelismo, ferramentas e aplicações 03/maio/2002 Paralelismo, ferramentas e aplicações Celso Carneiro Ribeiro Noemi Rodriguez Sérgio

CLUSTERS COMPUTACIONAIS DE ALTO DESEMPENHO 2... · DANIEL VAHID LIMA TOLOUEI ... Figura 2 - Exemplo de um cluster de alta disponibilidade ... Historicamente, o uso do paralelismo

Paralelismo ao Nível da Instrução

Roteador Externo de 5 GHz Manual do Usuário

Instalacao ODU MPT - 7_8 GHz

Faça sua própria antena Omni 2.e Ghz

Prof.ª Dr.ª Fatima Salete Correra · Banda Ku 12-18 GHz Banda K 18-26 GHz ... Banda W 75-110 GHz Banda D 110-170 GHz ... Satélites de observação da Terra

Paralelismo em nível de instruções eprofessor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/5587/... · Paralelismo em nível de instrução e paralelismo de máquina + Política

Paralelismo Alexandre Mota (acm@cin.ufpe.br). Paralelismo Representam a execução paralela de dois ou mais processos: fluxos de controles independentes

PowerBook G4 Aluminum 15 'LCD de substituição 1,67 GHz · PowerBook G4 Aluminum 15 "LCD de substituição 1,67 GHz Substitua o LCD em seu PowerBook G4 Aluminum 15 "1,67 GHz. Redigido

ZoneFlex R610a030f85c1e25003d7609-b98377aee968aad08453374eb1df3398.r40.… · 2,4 GHz SSID de voz 2,4 GHz 5 GHz 5 GHz 2,4 GHz 2,4 GHz 2,4 GHz 2,4 GHz 802.11n 802.11g 802.11g 802.11ac

Paralelismo em Máquinas Multiprocessadas

A TELEVISÃO VIA SATÉLITEamalia.img.lx.it.pt/~mpq/st04/ano2002_03/trabalhos... · modulação de portadoras de muito alta frequência, bandas VHF(30 a 300MHz) e UHF(0,3 a 3 GHz)

Função do paralelismo nas cantigas (trovadorismo)

Dell G3 3590...Velocidade de transferência Até 433 Mbps Até 1,73 Gbps Até 2,4 Gbps Bandas de frequência suportadas Banda dupla de 2,4 GHz/5 GHz Banda dupla de 2,4 GHz/5 GHz Banda

Clear wave 1,5 Ghz

MA092 Geometria plana e analítica - Paralelismo e ...chico/ma092/ma092_2_geo_paral_perpend.pdf · MA092 { Geometria plana e anal tica Paralelismo e perpendicularidade. Tri^angulos

[Artigo]-Paralelismo Em Nivel de Thread