33
AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC. http://www.cic.unb.br/docentes/ juliana/cursos/oac

AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

Embed Size (px)

Citation preview

Page 1: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

AOC II

UD I.3 : MEDIDAS DE DESEMPENHOReferências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005.

STALLINGS, W., cap 11 – AOC.

http://www.cic.unb.br/docentes/juliana/cursos/oac

Page 2: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

2

Tipos de Desempenho

. Tempo de Execução (Latência). - Tempo total para o computador executar

(rodar) um programa ou completar uma tarefa. - Desempenho da UCP, E/S, etc. . Vazão (Throughput) - Quantidade total de trabalhos (programas)

feitos (executados) em um determinado tempo. - Desempenho de servidores (processadores, SO,

etc.)

Page 3: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

3

Definições de Desempenho

TEX : Tempo de Execução de um programa de teste em uma máquina X

DX = DesempenhoX = 1/TEX

DX/Y = Desempenho relativo de X em relação a Y

DX/Y = DX /DY = TEY/TEX

Page 4: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

4

Temporização: relógio (clock)

Page 5: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

5

Medidas em ciclos de clock (relógio)

T (período) = duração do ciclo de máquina (clock: relógio) em segundos

f (freqüência) = ciclos/segundo = Hertz = 1/T

NCC: número de ciclos de clock por programaDCC: duração do ciclo de clock

NCC = TE/DCC = TE*f

Page 6: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

6

Ciclos por instrução (CPI)

Cada Programa Várias instruçõesCada instrução # (número) diferente de

ciclosCPI: Média de ciclos por instruçãoNIPP: # (número) de instruções por

programa NCC = NIPP*CPI TE = NCC/f = (NIPP*CPI)/f

Page 7: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

7

Latência da instrução: LI• Cada instrução completa leva em média CPI ciclos de

máquina (clock).• Cada ciclo de máquina (clock) tem a duração de T

unidades de tempo• A Latência LI é o tempo gasto para executar uma

instrução sem pipeline, ou seja,

LIsp= CPI*T

• Um processador gasta um tempo TEsp para executar n instruções sem usar pipeline:

TEsp= n*CPI*T

Page 8: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

8

Fatores de Desempenho

TE = segundos/programa = (NIPP*CPI)/f = NIPP*CPI*T

NIPP = instruções/programa CPI = ciclos de clock/ instrução T = segundos/ ciclo de clock

Page 9: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

9

Banda Passante

• Taxa de rendimento ou vazão (“throughput”) do processador: ips (instruções por segundo), mips ou mflops.

• Memória: MB/s (Megabytes por segundo)

• Entrada e Saída (E/S): MB/s ou

Mb/s (Megabits por segundo)

Page 10: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

10

Banda Passante do Processador (VAZÃO)

• É a taxa na qual as instruções são executadas, ou seja é número de instruções executadas por unidade de tempo. Exemplos:

- ips (instruções por segundo)

- mips (milhões de instruções por segundo)

- mflops (milhões de instruções de ponto flutuante por segundo)

• Sem usar o pipeline a vazão V de um processador pode ser dada por

V = 1/LI

Page 11: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

11

Banda passante de memória (BPM)

LB = largura do barramento de dados (memória)

fBM : freqüência da banda de memória

BPM = LB * fBM

Medido em MB/s (Megabytes por segundo)

Page 12: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

12

Banda passante de E/S (BPES)

LB = largura do barramento de dados de E/S

fBES : freqüência do barramento de E/S

BPES = LB * fBES

Medido em MB/s ou Mb/s (Megabits por segundo)

Page 13: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

13

BenchMarksBenchMarks

- programas que permitem comparar o desempenho de computadores.

- Melhor programa de “benchmark”: aplicações reais

Page 14: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

14

Conjuntos de BenchMarksConjuntos de BenchMarks

- Sintéticos: Whetstone e o Dhrystone. - SUPER-PI - SPEC (89, 92, 95, 2000 e 2005)

- Sandra 2005 (System ANalyser, Diagnostic and Reporting Assistant)

• PCMARK05, 3DMARK05, SYSmark (www.futuremark.com))

• DiskBench V2.4.3 (para HD)

Page 15: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

15

SPECSPEC: : System Performance System Performance Evaluation CorporationEvaluation Corporation

Consórcio de empresas, criado em 1989, com o objetivo de melhorar a medida e as informações disponíveis sobre o desempenho de proces-sadores e computadores (http://www.spec.org)

Page 16: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

16

Membros do consórcio SPECMembros do consórcio SPEC3DLabs * Acer Inc. * AMD * Apple * ATI * Azul Systems

* BEA Systems * Borland * Bull * Dell * EMC * Exanet * Fabric* Freescale * Fujitsu * HP * Hitachi * IBM * Intel * ION * JBoss * Microsoft * Mirapoint * NEC * Network Appliance * Novell * NVIDIA * Openwave Systems * Oracle * Panasas * PathScale * Portland Group * S3 Graphics Co., Ltd. * SAP AG * SGI * Sun* Super Micro * Sybase * Symantec* Unisys * Verisign *

Page 17: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

17

Programas do SPEC 95 (1) Programas do SPEC 95 (1) - 8 programas inteiros na linguagem C (medida SPECint95)

go : Inteligência Artificial, joga o Go

M88ksim: Simulador do chip Motorola 88k (executa um programa de teste)

gcc: Compilador C Gnu gerando código para o SPARC

compress: Compressão e descompressão de arquivos na memória

li : Interpretador Lisp

ijpeg: Compressão e descompressão gráficas

perl: Manipula strings e números primos na linguagem Perl

vortex: Programa de banco de dados

Page 18: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

18

Programas do SPEC 95 (2) Programas do SPEC 95 (2) - 10 Programas de ponto flutuante na linguagem F77 (medida SPECfp95):

tomcatv : Programa gerador de malhas

swim: Modelo para águas rasas com uma grade 513 x 513

su2cor: Física quântica (simulação do método de Monte Carlo)

hydro2d: Astrofísica (equações hidrodinâmicas de Naiver Stokes)

mgrid: Potenciais de campo (solução em 3-D)

applu: Equações diferenciais parciais parabólicas e elípticas

trub3d : Simula uma turbulência isotrópica homogênea em um cubo

apsi : Resolves problemas envolvendo temperatura, vento e poluição

fpppp : Química quântica

wave5: Física do plasma (simulação de partícula eletromagnética)

Page 19: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

19

Exemplo 1 de Benchmark – Programas

3DMark2001 SE

PCMark04

Sandra 2004 versão 9.89

SYSmark2002

Page 20: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

20

Exemplo 1 de Benchmark – Configuração

Configuração de Hardware Athlon 64 : Chaintech ZNF3-150(nForece3-150, BIOS de 13 /10/2003) Pentium 4 : Soyo P4I875P (Intel 875P, BIOS de 19/10/2003) Pentium 4 "Prescott": Intel D875PBZ (Intel 875P, BIOS P21) Memória: Dois módulos 256 MB PC3200 TwinMOS em configuração DDR Dual Channel. Disco rígido: Maxtor DiamondMax 9 Plus (60 GB, ATA-133) Placa de Vídeo: Gigabyte Radeon 9800 Pro Resolução de vídeo: 800x600x32

Configuração de Software Windows XP Professional em português, instalado em NTFS Service Pack 1A Direct X 9.0B Versão do driver nForce: 3.13 Versão do driver Inf Intel: 5.0.2.1003 Versão do driver de vídeo ATI: 7.95 (6.14.10.6396)

Page 21: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

21

Exemplo 1 de Benchmark: Sandra 2004 (processador)

Mede a quantidade de instruções por segundo que o processador é capaz de executar, não considera como o processador é usado, isto é, não simula seu uso em programas comerciais.

Page 22: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

22

Benchmark : Unidade de Ponto Flutuante (FPU)

O teste Inclui os cálculos necessários para a renderização de imagens tridimensionais, com os resultados do teste dados em instruções de ponto flutuante por segundo.

Page 23: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

23

Simula a utilização de aplicativos reais

Benchmark: Desempenho Geral ( SYSmark2002)

Page 24: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

24

Benchmark : 3DMark2001 SE (programas 3D)

Jogos 3D exigem o máximo de processamento matemático, vídeo 3D, disco e memória .

Page 25: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

25

Exemplo 2 de Benchmark – Configuração

Processador Clock Interno Clock Externo Dados por Clock Cache L1 Cache L2 Cache L3

Athlon 64 3200+ 2 GHz 200 MHz 2 128 KB 1 MB Não

Athlon 64 3400+ 2,2 GHz 200 MHz 2 128 KB 1 MB Não

Athlon XP 3200+ 2,2 GHz 200 MHz 2 128 KB 512 KB Não

Pentium 4 3,2 GHz 3,2 GHz 200 MHz 4 158 KB 512 KB Não

Pentium 4 3,2 GHz "E" 3,2 GHz 200 MHz 4 166 KB 1 MB Não

Pentium 4 3,4 GHz 3,4 GHz 200 MHz 4 158 KB 512 KB Não

Pentium 4 Extreme Edition 3,2 GHz 3,2 GHz 200 MHz 4 158 KB 512 KB 2 MB

Pentium 4 Extreme Edition 3,4 GHz 3,4 GHz 200 MHz 4 158 KB 512 KB 2 MB

Page 26: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

26

Exemplo 2 de Benchmark – Sandra 2005

Page 27: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

27

Exemplo 3 de benchmark : PCMark04 (1)

SO : SO : MS Windows XP – Configuração de HW:

Processador Pentium 4 2.66GHz Pentium 4 2.80GHzPentium 4 Mobile

HT 3.06 GHz

VídeoNVIDIA GeForce FX

5200 Intel 82865GATI MOBILITY RADEON 9000

Memória 510 502 446

Page 28: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

28

Exemplo 3 de benchmark : PCMark04 (2)

1736

1906,0

1795,0

570,0

2795

3406,0

3179,0

590,0

3405

4353,0

2371,0

876,0

0 1000 2000 3000 4000 5000

PCMark

CPU

Memory

Graphics

P4 3.06 HT

P4 2.8

P4 2.66

Page 29: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

Exemplo 4 de benchmark AMD Opteron 250 2.4 GHz x Intel Xeon 3.6 GHz

  Opteron 100 Series Opteron 200 Series Opteron 800 Series

HyperTransport channels 2x 200 MHz quad-pumped 3x 200 MHz quad-pumped 4x 200 MHz quad-pumped

Total bandwidth I/O 6.4 GB/s 9.6 GB/s 12.8 GB/s

Applications Single-processor Single-processorDual-processor

Single-processorDual-processorMulti-Processor( up to 8)

Page 30: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

30

Processadores AMD Opteron -características

Page 31: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

31

Page 32: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

32

Page 33: AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC

33