9
PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa [email protected] Instituto de Computação Universidade Estadual de Campinas

PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa [email protected] Instituto de Computação

Embed Size (px)

Citation preview

Page 1: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

PARALELISMO EM NÍVEL DE THREAD

Disciplina MO401 :: 1s2010R.A.: 107006

Camila Satsu de Amorim [email protected]

Instituto de ComputaçãoUniversidade Estadual de Campinas

Page 2: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

SMT - Simultaneous MultiThreading

• Explora TLP e ILP;• Ganho de desempenho

relacionado ao melhoramento de Throughput;

• Garantir a integridade e o desempenho apesar dos conflitos de cachê e TLB representa um desafio.

1 - 8

Page 3: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

CMP – Chip MultiProcessor

• Grupo de núcleos integrados dentro de um único chip de processamento.

• Possui metade do tamanho de cachê L2 de SMT.

• Comportamento térmico e custo de refrigeração são preocupações importantes.

Conjunto de Benchmark com miss rate baixo na L2

Conjunto de Benchmark com miss rate alto na L2

Power4

2 - 8

Page 4: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

Hyper-Threading

• Tecnologia Intel baseada no paradigma SMT.

• Consiste em um processador físico trabalha em nível lógico como se fosse vários.

• Implementado pelos processadores da família Xeon da Intel.

3 - 8

Page 5: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

BenHyper-ThreadingMáquina Power 4

Benchmark de OLTP

Benchmark de Servidor

Observado ganho de desempenho em uma média de 25% para Hyper-Threading ativado.

4 - 8

Page 6: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

Niagara

• Adota o paradigma CMT.

• Possui 8 núcleos, capazes de executar 4 threads cada.

• Cada núcleo tem frequência de 1.4GHz.

• Consome em média 72W.

• Possui uma unidade de ponto flutuante. 5 - 8

Page 7: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

NiagaraBenchmark Specjjb2005 Benchmark Specwe2005

Benchmark Sap-2Tier

6 - 8

Page 8: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

OpenMP

• Conjunto de bibliotecas C, C++ e Fortran que provê uma interface flexível para o desenvolvimento de aplicações paralelas em multiprocessadores shared memory.

Gráfico de análise de duas simples aplicações de cálculo de π . Com uma

delas com implementação de OpenMP.

7 - 8

Page 9: PARALELISMO EM NÍVEL DE THREAD Disciplina MO401 :: 1s2010 R.A.: 107006 Camila Satsu de Amorim Yokoigawa camila.satsu@gmail.com Instituto de Computação

8 - 8