30
Introdução Os mais avançados processadores da Intel e da AMD têm agora 6 núcleos. A AMD usa oficialmente o termo “six-core”, mas é comum encontrar entre os usuários, referências como “hexacore” ou “hex- core”, todas são aceitas. Antes dos novos processadores, o modelo mais avançado da AMD era o Phenom II X4 modelo 965, de 3,4 GHz. Os novos modelos de 6 núcleos são oferecidos com as velocidades de 2.8 e 3.2 GHz, e trazem uma novidade, o recurso “Turbo Core”, em resposta ao Turbo Boost da Intel. Figura 1 – Phenom II X6 de 3.2 GHz, modelo HDT90ZFBK6DGR A AMD enviou para testes um modelo comercial de 3,2 GHz, ao contrário das amostras de engenharia comuns em reviews. São os seguintes os primeiros modelos lançados. Os preços citados são os médios das lojas do Centro do Rio de Janeiro, que constam no site www.boadica.com.br . Tabela 1: Modelos do Phenom II X6 Os três modelos possuem as seguintes características comuns:

AMD Phenom

Embed Size (px)

Citation preview

Page 1: AMD Phenom

IntroduçãoOs mais avançados processadores da Intel e da AMD têm agora 6 núcleos. A AMD usa oficialmente o termo “six-core”, mas é comum encontrar entre os usuários, referências como “hexacore” ou “hex-

core”, todas são aceitas. Antes dos novos processadores, o modelo mais avançado da AMD era o Phenom II X4 modelo 965, de 3,4 GHz. Os novos modelos de 6 núcleos são oferecidos com as velocidades de 2.8 e 3.2 GHz, e trazem uma novidade, o recurso “Turbo Core”, em resposta ao

Turbo Boost da Intel.

Figura 1 – Phenom II X6 de 3.2 GHz, modelo HDT90ZFBK6DGR

A AMD enviou para testes um modelo comercial de 3,2 GHz, ao contrário das amostras de engenharia comuns em reviews. São os seguintes os primeiros modelos lançados. Os preços citados

são os médios das lojas do Centro do Rio de Janeiro, que constam no site www.boadica.com.br.

Tabela 1: Modelos do Phenom II X6

Os três modelos possuem as seguintes características comuns:

Tabela 2: Características do Phenom II X6

Note que existem dois modelos 1055T (2.8 MHz). O segundo deles mostrado na tabela (HDT55TWFGRBOX) leva duas vantagens sobre o primeiro: Dissipa apenas 95 watts, contra 125

Page 2: AMD Phenom

watts do outro, e suporta temperatura máxima de 71°C, contra apenas 62°C do outro. Para quem está interessado neste processador, é bom anotar este código para checar na ocasião da compra. Observe

ainda que o modelo de 3.2 GHz é “Black Edition”, ou seja, suporta programação do seu multiplicador interno por software, o que é muito útil para quem pretende fazer overclock.

Preço e performanceO Phenom II X6 é uma opção interessante para quem usa muitas aplicações que sejam beneficiadas por múltiplos núcleos. As principais são edição de vídeo e geração de conteúdo de multimídia. Nem

sempre é o caso dos jogos, já que a maioria deles opera bem com dois núcleos, e são muito mais beneficiados por uma placa de vídeo veloz que por um super processador. As opções de 6 núcleos da Intel (Core i7 Extreme 980X e 970X) ainda são muito caras. A AMD ainda não consegue competir

com esses processadores mais velozes da Intel, pois ainda usa o processo de 45 nm. Os modelos mais novos da Intel já usam 32 nm. Esse problema resulta em limitações de compromisso entre

clock, potência máxima e custo.

Ainda assim, os modelos mais avançados da AMD apresentam boa relação custo-benefício se comparados com os modelos de quatro núcleos da Intel, ou seja, dada uma quantia fixa, é quase

sempre possível conseguir um processador mais rápido da AMD que se fosse escolhido um modelo da Intel.

Figura 2 – Pastilha de silício do Phenom II X6

A figura 2 mostra o die do Phenom II X6. Nele podemos identificar facilmente os seis núcleos, cada um com sua cache L2 de 512 KB, e a grande área à direita, que corresponde à cache L3 de 6 MB,

compartilhada entre os núcleos. Em relação aos jogos, podemos constatar que muitos deles, mesmo modernos, operam bem com um ou dois núcleos.

As razões são óbvias: os desenvolvedores de jogos sofrem duas pressões de lados opostos. De um lado, querem melhorar o realismo gráfico. De outro lado, querem que seus produtos possam ser

usados na maioria dos computadores atuais. Muitos deles possuem processadores de dois núcleos, não podemos ainda considerar os processadores de quatro núcleos como populares. Já as placas de

vídeo velozes são bem mais comuns. Por isso a maioria dos benchmarks publicados sobre desempenho para processadores diferentes apresenta variações pequenas em função do processador,

como o benchmark do GTA 4 publicado no Toms’s Hardware Guide.

Page 3: AMD Phenom

Figura 3 – Na maioria dos casos, o desempenho em jogos depende mais da placa de vídeo que do processador (GTA 4).

Sabemos que para a maioria dos jogos, o desempenho para execução de jogos 3D é mais influenciado pela placa de vídeo que pelo processador. Existem algumas exceções, como os jogos

que usam intensamente inteligência artificial e física de movimentos, o que deixa o processador mais ocupado.

Page 4: AMD Phenom

Figura 4 – Em alguns casos o desempenho do processador afeta mais o desempenho 3D (Far Cry)

Como os processadores de 6 núcleos são hoje considerados “topo de linha”, a maioria dos jogos ainda levam em conta que podem usar na média, entre 2 e 4 núcleos. A figura 5 mostra o gráfico de

uso da CPU durante a execução do jogo DIRT 2 durante uma corrida.

Observamos que todos os núcleos foram usados, mas a soma das taxas de utilização ficou em torno de 300%, portanto tenderia a usar 3 núcleos ao máximo. Podemos considerar que um processador de

6 núcleos tem plenas condições para executar com eficiência os jogos mais avançados atuais e a nova geração dos próximos anos.

Page 5: AMD Phenom

Figura 5 – Uso dos núcleos em um Phenom X6 pelo jogo DIRT2

Não podemos estabelecer uma regra geral infalível entre desempenho 3D, placa de vídeo e processador. Na maioria dos casos, o trabalho maior é da placa de vídeo, portanto seria melhor

comprar um processador moderado e gastar mais em uma placa de vídeo mais avançada. Em alguns casos, o processador mais avançado será mais aproveitado.

Cada um é responsável por descobrir a demanda de CPU dos seus jogos prediletos para decidir se investe em um processador mais avançado, ou economiza um pouco aqui para comprar uma placa de

vídeo melhor. Uma coisa é certa, em qualquer caso: uma placa de vídeo avançada sempre será um bom investimento para quem gosta de jogos 3D. Um processador super avançado e caro nem sempre

será um bom investimento.

Turbo Boost e Turbo CoreQuando todos os núcleos estão operando com carga de trabalho de 100%, o processador atinge seu máximo valor de potência elétrica, ou seja, é máximo o seu aquecimento. Como sabemos, são dois

os fatores que limitam o clock máximo de um processador: estabilidade em altas freqüências e dissipação de calor. O uso de coolers avançados é a solução para o problema do calor, mas ainda

existe a questão do correto funcionamento dos circuitos em altas freqüências. Os núcleos dos processadores AMD atuais podem funcionar com até 3,6 GHz, e em alguns casos até 4.0 GHz. O problema é que quando todos os núcleos operam com essa velocidade, o processador fica muito

quente e pode “fritar”, apesar dos circuitos internos terem tempo de resposta suficientemente rápido para operar corretamente nessas velocidades, se não fosse o problema do calor.

O Turbo Core é um recurso introduzido pela AMD no Phenom II X6 que já estava presente nos modelos de 6 núcleos do Core i7 Extreme. Quando três ou mais núcleos estão com baixa carga de trabalho (e portanto, gerando pouco calor), os núcleos restantes (1, 2 ou 3) poderão aumentar seu

clock (e aquecer mais) sem entretanto ultrapassar a máxima potência permitida. Esse aumento é feito dinamicamente, de forma automática. Os modelos de 2.8 GHz terão seu clock aumentado para 3.2

GHz, e os modelos de 3.2 GHz terão o clock aumentado para 3.6 GHz.

A partir do momento em que existem quatro núcleos com utilização intensa (o mesmo vale para 5 ou 6), o Turbo Core é desativado momentaneamente, e o clock volta ao seu valor normal. Isso resulta

em um aumento de desempenho de pouco mais que 10% nas aplicações que exigem no máximo três núcleos. Podemos considerar este recurso como uma espécie de overclock oficial controlado.

Dificuldades com o novo processadorTivemos algumas dificuldades (solucionadas de forma simples) com este novo processador. São dificuldades típicas que ocorrem quando é instalado um novo processador em uma placa mãe já existente. Antes de testar o Phenom II X6, montamos um sistema para testar o Phenom II X4, baseado na placa mãe MSI 790GX-G65. Com a chegada do novo processador, bastaria fazer a

substituição e repetir os testes de benchmark.

Entretando, foi necessário fazer uma atualização de BIOS e instalar o driver do processador (apenas para testes sob o Windows XP, pois o Windows 7 já tem driver de processador apropriado). Sem

fazer a atualização de BIOS, o processador era reportado como um modelo desconhecido. A placa mãe reduzia automaticamente a velocidade do processador para 800 MHz.

Page 6: AMD Phenom

Figura 6 – Sem atualizar o BIOS, nem o Windows 7 mostra o processador corretamente

A princípio não notamos problema no fato do Gerenciador de dispositivos do Windows 7 ter mostrado o processador como “model unknown” (figura 6), pois isso é comum nas amostras de

engenharia. Entretanto, o processador que recebemos não era uma amostra de engenharia, mas um modelo comercial. O Windows precisa de alguma informação do BIOS a respeito do processador

para reconhecê-lo corretamente e usar seus recursos. Depois da atualização do BIOS, o processador passou a ser reconhecido corretamente no Windows 7. O problema não ocorria com a placa Asus

CrossHair, enviada pela AMD junto com o processador, pois seu BIOS já estava atualizado.

Outra dificuldade encontrada no sistema com a placa MSI foi uma queda de desempenho em comparação com o Phenom II X4 965 nas aplicações que usam até 4 núcleos. Este Phenom II X4

tem clock de 3.4 GHz. O Phenom II X6 tem clock de 3.2 GHz, mas nas aplicações para até 3 núcleos, o clock é aumentado para 3,6 GHz graças ao Turbo Core, o que resultaria em um aumento

de desempenho de aproximadamente 5% para essas aplicações. O que ocorreu entretanto foi o contrário: o desempenho diminuiu 9% ao invés de aumentar 5%, nas aplicações com 1 ou 2 núcleos.

Para fazer essas comparações, usamos valores obtidos em review anterior, baseado no programa PCMark 2005, que analisa processadores de até 4 núcleos. Ocorre que este programa opera sob o Windows XP, e por isso tivemos que usar este sistema. O driver de processador que acompanha o

Windows XP é de 2004. O Windows 7 já vem com o driver mais novo da AMD para processadores multicore, que é de 2007 (não existe versão mais nova por enquanto). Devido ao uso do driver

antigo, o processador teve seu desempenho reduzido, independentemente do BIOS estar atualizado ou não. O problema ocorreu com ambas as placas mãe usadas no teste.

Pior ainda foi o que ocorreu nas medidas que envolviam quatro núcleos. Quando quatro ou mais núcleos do Phenom II X6 estão em plena atividade, o Turbo Core é desligado, fazendo com que seu clock seja reduzido para a velocidade normal, no caso 3.2 GHz. Deveria reduzir em 5%, entretanto a

redução no desempenho foi de cerca de 15%. A instalação do “AMD Processor Driver” de versão

Page 7: AMD Phenom

mais recente, obtida no site da AMD, resolveu os problemas, e as medidas de desempenho passaram a apresentar os valores esperados.

O computador com o Phenom II X6 também apresentou problemas de desligamento enquanto não era feita a atualização de BIOS e a instalação do driver do processador. O micro simplesmente não desligava com o comando normal de desligamento do Windows, mesmo esperando vários minutos. Era preciso desligar “na marra” (chave power ou pressionar o botão Power por mais de 4 segundos).

Com a atualização de BIOS e de driver, o problema foi resolvido.

Tudo isso confirma a importância de regras cruciais em upgrade: verificar no site do fabricante da placa mãe se é necessário fazer uma atualização de BIOS, verificar se a placa mãe suporta o novo

processador, e verificar se é necessário atualizar o driver do processador.

Comparação com o Phenom II X4Sempre que é lançado um novo processador é importante fazer a sua comparação com modelos da

geração anterior. Existem alguns casos históricos de modelos novos que eram piores que os anteriores:

AMD K6-2/550 era só 30% mais rápido que o K6-2/300

Pentium 4 era mais lento que o Pentium III de mesmo clock

Pentium 4 Prescott tinha o mesmo desempenho do Pentium 4 Northwood de mesmo clock

Especificamente nos testes com o Phenom II, temos testado se a geração nova trazia vantagens em relação à anterior. Não gostaríamos de ver coisas do tipo “é mais lento que o anterior quando usa dois núcleos, mais quando usa todos os núcleos é bem veloz…”. No nosso primeiro artigo sobre o

Phenom, feito no seu lançamento, mostramos que é bem mais veloz nas aplicações para um ou dois núcleos em comparação com o Athlon 64 X2 de mesmo clock. Nas aplicações para quatro núcleos, o

desempenho mais que dobra, em comparação com o uso de dois núcleos. Quando analisamos o Phenom II X4, mostramos que é sensivelmente mais veloz que o Phenom X4 de mesmo clock.

Agora, ao analisar o Phenom II X6, precisamos responder duas perguntas importantes:

1) Nas aplicações que usam até 4 núcleos, o Phenom II X6 tem desempenho maior ou igual ao do X4? A resposta é SIM, totalmente, como mostraremos a seguir.

2) Nas aplicações que usam 6 núcleos, o Phenom II X6 é 50% mais rápido (6 contra 4) que o Phenom II X4 de mesmo clock? A resposta é SIM, porém ainda são poucas as aplicações que tiram o máximo proveito de todos os núcleos do processador. As principais aplicações que aproveitam todos

os núcleos são as que lidam com codificação de vídeo.

Comparação com o X4, usando até 4 núcleos

O Phenom II X6 é realmente um processador superior ao Phenom II X4 de mesmo clock. Tomemos como exemplo o Phenom II X4 mais veloz, que é o modelo 965, de 3.4 GHz, e o Phenom II X6 mais

veloz até o momento, que é o modelo 1090T, de 3.2 GHz. Graças ao Turbo Core, o X6 tem seu clock aumentado automaticamente para 3,6 GHz em aplicações que usam até 3 núcleos, o que de

certa forma tornaria a comparação injusta.

Page 8: AMD Phenom

Vejamos os resultados dos benchmarks realizados com o programa PCMark 2005, sob o Windows XP. A versão mais nova deste programa é o PCMark Vantage, que roda sob Windows Vista e

Windows 7, porém não apresenta resultados tão detalhados quanto a versão 2005. Por outro lado, a versão 2005 apresenta testes apenas para processadores de até quatro núcleos. Como nosso objetivo nesse teste é avaliar o desempenho do X6 nas aplicações que usam até 4 núcleos, este é o programa

mais indicado.

A tabela abaixo mostra os resultados. Os testes foram feitos em uma placa MSI 790GX-G65 com 4 GB de memória DDR3/1600. Testes feitos com memória mais lentas (1333) apresentaram resultados

praticamente idênticos, graças à cache L3.

PC Mark 2005

Tabela 3: Medidas de desempenho com o PCMark 2006 no Phenom II X5 e Phenom II X6

Os resultados foram muito interessantes e dentro do esperado. Nos testes de 1 a 6 (processamento com um núcleo) e 7 (processamento com dois núcleos), o ganho de desempenho foi de cerca de

5,2%. É praticamente igual à proporção entre os clocks (3,6 GHz / 3,4 GHz = 1,059, ou seja, +5,9%).

Nas aplicações que usam quatro núcleos, o Phenom II X6 desativa o Turbo Core e volta a operar com seu clock normal de 3,2 GHz. A queda média de desempenho em relação ao X4 foi de 5,4 %, que é aproximadamente a mesma queda correspondente à proporção entre os clocks (3,2 GHz / 3,4 GHz = 0,941, que corresponde a uma queda de 5,9%). Concluímos que o X6 apresenta ganho de

desempenho proporcional à variação de clock, isso comprova a sua escalabilidade, ou seja, termos um desempenho maior na mesma proporção do aumento de clock. Parece algo óbvio, mas é bom sempre conferir essas medidas nos novos processadores devido ao histórico de “inflação de GHz” (aumento de desempenho não acompanhava o aumento de clock). ocorrida em alguns casos nos

últimos anos.

Com 5 núcleos em uso, o ganho de desempenho será hipoteticamente 25%, e com 6 núcleos será também hipoteticamente 50%, como checaremos mais adiante. Portanto o Phenom II X6 de 3,2

GHz, em comparação com o Phenom II X4 de 3,4 GHz apresentará ganhos de cerca de 5% quando operar com até 3 núcleos, queda de 5% ao operar com 4 núcleos, e ganhos de 25% e 50% ao operar

com 5 ou 6 núcleos.

Note que esses são resultados de um benchmark sintético. Na prática cenários diferentes podem ocorrer. Se usaremos por exemplo um disco rígido lento, pouca memória ou no caso de jogos, uma

Page 9: AMD Phenom

placa 3D simples, os resultados serão comprometidos. Não haverá diferença entre os dois processadores nas operações que envolvem o uso da Internet, pois o fator limitante nesse caso é a

velocidade da conexão, não do processador.

Ainda saindo dos limites das análises sintéticas, o processamento no mundo real com 6 núcleos poderá ser mais vantajoso que com 4 núcleos. Considere a realização de duas tarefas pesadas:

codificação de múltiplos arquivos de vídeo e o uso de um jogo 3D pesado. Usamos no nosso teste o jogo DIRT2, considerado um dos mais pesados em termos de gráficos e de uso do processador.

Medidas feitas com o Gerenciador de Tarefas do Windows 7 mostraram que este jogo usa somente dois núcleos do processador, mesmo que existam mais núcleos disponíveis.

Suponha que você vai usar este jogo ao mesmo tempo em que faz uma codificação de múltiplos arquivos de vídeo (por exemplo, converter múltiplos arquivos AVI, WMV, MOV e outros para formato de iPOD). Se o jogo está usando 2 núcleos, um Phenom II X4 ficará com dois núcleos

disponíveis para fazer a conversão de vídeo, enquanto o Phenom II X6 ficará com 4 núcleos disponíveis para o mesmo trabalho. Leve em conta que outros jogos modernos poderão usar mais

núcleos, daí seria maior ainda a vantagem em usar um modelo X6 ao invés de um modelo X4. Note que estamos fazendo análises com o Phenom II, mas princípio semelhante se aplica aos modelos da

Intel.

O problema é que os modelos de 6 núcleos da Intel são muito mais caros, e os núcleos HT não são reais e não aumentam o desempenho. Um Core i7 com 4 núcleos HT não é equivalente a um

processador de 8 núcleos, vamos considerar que seja equivalente a um de 5 núcleos, levando em conta um aumento de 25% no desempenho graças aos “núcleos virtuais” do HT. A análise de

desempenho X núcleos nos processadores Intel é assunto interessante para outro artigo.

Voltando à comparação com o X4, fizemos também testes sem o Turbo Core, que seriam mais “justos”. Desativamos o Turbo Core no CMOS Setup, o que deixaria os núcleos do X6 operando a 3.2 GHz em qualquer caso. Como o X4 do nosso teste é de 3.4 GHz, seria mais justo reduzir seu clock para 3,2 GHz para ficar igual ao do X6. Optamos por manter o X4 a 3.4 GHz e aumentar o

clock do X6 para 3.4 GHz pelo CMOS Setup, o que é permitido pois trata-se de um modelo Black Edition. Aqui estão os resultados obtidos, com ambos a 3,4 GHz:

Tabela 4: Medidas de desempenho com o PCMark 2005 no Phenom II X4 e Phenom II X6

Page 10: AMD Phenom

As diferenças obtidas foram inferiores a 1%, para mais ou para menos, usando sistemas idênticos. Podemos então considerar que a AMD não “estragou” o X4 com overhead na sua arquitetura ao

desenvolver o modelo de 6 núcleos.

Falta agora mostrar o ganho obtido com 6 núcleos em comparação com o modelo de 4 núcleos nas aplicações que aproveitam todos os núcleos. Façamos inicialmente as medidas de desempenho com

o programa PCMark Vantage sob o Windows 7.

6 núcleos contra 4Infelizmente a maioria dos programas atuais não estão otimizados para aproveitar 6 núcleos. Na

verdade muitos deles nem mesmo chegam a aproveitar 4 núcleos com todo o seu potencial. Isso era diferente na época do lançamento dos primeiros processadores de dois núcleos. Graças ao

lançamento do Hyper-Threading, dois anos antes, os fabricantes de software tiveram tempo para otimizar seus programas.

Quando chegaram os processadores de dois núcleos, a maioria deles conseguiu dobrar ou quase dobrar o desempenho nas aplicações mais beneficiadas pela velocidade do processador, como o

processamento de imagem, vídeo e áudio, sobretudo os CODECs de vídeo. Hoje isso nem sempre é verdade. Para aproveitar melhor os vários núcleos do processador é preciso instalar versões mais

novas dos programas, ou esperar pelas versões otimizadas.

Veja por exemplo o caso do programa XiliSoft Vídeo Converter Ultimate. Esse programa converte vídeos entre formatos diferentes. Por exemplo, podemos baixar arquivos WMV, RMVB, AVI ou

mesmo usar arquivos VOB de DVDs, e convertê-los para praticamente qualquer formato existente. Fizemos um teste convertendo 270 arquivos AVI codificados em DIVX 6.8, todos com resolução de 640×480, para formato 320×240 codificados em H.264, compatível com iPOD. As conversões foram

feitas na mesma máquina, mas usando dois processadores diferentes:

Tabela 5: Nesta tarefa o X6 teve pequena vantagem sobre o X4

Como o Video Converter Ultimate pode usar todos os núcleos do processador, deveria fazer o trabalho de conversão com uma velocidade 50% maior com 6 núcleos que com o uso de 4 núcleos. Ao invés de 9 minutos, deveria operar na faixa de 6 minutos, entretanto o tempo total de conversão

foi de 8 minutos e meio. O motivo da discrepância é que este programa, assim como a maioria deles, não usa plenamente todos os núcleos do processador, como podemos aferir com o Gerenciador de

Tarefas.

Page 11: AMD Phenom

Figura 7 – Programa não usa totalmente os núcleos do processador.

O histórico de uso do processador durante a execução dos programas apresentou uma utilização média de 70% em cada núcleo. Daí vem a diferença pequena no desempenho com 4 e com 6

núcleos.

Mais uma vez lembramos que essa análise se aplica ao caso de um só programa “pesado” usando todos os núcleos do processador. Em um cenário mais comum, podemos ter dois ou mais programas

pesados. Com mais núcleos disponíveis, um sistema com 6 núcleos levaria vantagem sobre um sistema com 4 núcleos, independentemente dos programas utilizados.

Figura 8 – Conversão de DVD para AVI com FlaskMPEG e DIVX 7.0

A figura 8 mostra medidas de utilização dos núcleos do Phenom II X6 durante uma conversão de vídeo (DVD para AVI com os programas FlaskMPEG e DIVX 7.0). Nesse tipo de conversão, a

maior parte do trabalho cabe ao DIVX, que faz a codificação, tarefa que é muito mais pesada que a decodificação dos arquivos MPEG-2 do DVD. Para a medida ser justa, temos que descartar a lenta operação de leitura do DVD. Por isso antes de iniciar a conversão, fizemos a cópia do conteúdo do

DVD para o disco rígido usando o programa DVD Decrypter.

Observe que a taxa de utilização do processador não chega a 100%, fica com a média de 80%, ou seja, o programa não é totalmente otimizado para usar todos os núcleos do processador ao máximo, por isso não podemos obter um o ganho máximo teórico para uso de 6 núcleos contra 4 núcleos, que

seria +50% (considerando clocks iguais).

Codificação de vídeo com o HandbrakeJá sabemos que nem todos os programas pesados aproveitam todos os núcleos do processador.

Também sabemos que, mesmo entre os que usam todos os núcleos disponíveis, nem sempre são otimizados para que seu uso seja 100%, o que resultaria na maior velocidade. Devemos levar em conta que quando usamos certos programas pesados como codificadores de vídeo, nem sempre

desejamos deixar o computador voltado apenas para esta tarefa, e sim, continuar a usá-lo normalmente enquanto a conversão é feita em segundo plano.

Page 12: AMD Phenom

Talvez por isso os fabricantes de programas nem sempre dão prioridade a usar todos os núcleos do processador ao extremo. Seja como for, seria muito bom testar um programa que use ao extremo os

núcleos do processador para checar se o modelo de 6 núcleos “escala” em comparação com o modelo de 4 núcleos, ou seja, se o ganho de performance é proporcional ao aumento de clock e ao

aumento do número de núcleos. Para um programa que obedeça esta regra, o ganho de performance obtido em um Phenom II X6 em comparação com um Phenom II X4 deveria ser igual a:

Ganho = (clock do x6 x 6) / (clock do x4 x 4)

Comparando o Phenom II X6 de 3.2 GHz com o Phenom II X4 de 3.4 GHz ficaria:

(3.2 x 6) / (3.4 x 4) = 1,41, ou seja, 41% mais veloz

Seria 50% mais veloz se ambos os processadores operassem com o mesmo clock.

Usamos para verificar o ganho de performance com o uso dos 6 núcleos o programa Handbrake, obtido em http://handbrake.fr. Este programa é um conversor de vídeo gratuito. Não é um conversor universal. Aceita vários formatos de arquivos de vídeo como entrada, mas gera apenas arquivos de

saída nos formatos MP4 e MKV.

Figura 9 – Medida de desempenho com o programa HandBrake

Nosso teste é mostrado na figura 9. Fizemos a conversão de um arquivo AVI com duas horas de duração e 6000kbps (5,8 GB) e resolução de 720×480. O arquivo gerado tem formato MP4. Note

que o gerenciador de tarefas mostra ao longo do tempo, uma taxa de utilização de quase 100% para os seis núcleos. É mostrada na janela de CMD.EXE acima a taxa instantânea e a taxa média de

conversão. A média ficou em 159 fps com 6 núcleos. Fizemos as mesmas medidas com 6 núcleos (3.2 GHz) e com 4 núcleos (3.4 GHz) e foram obtidos os seguintes resultados:

Tabela 6: X6 teve ganho de 38%

O ganho observado foi:

159 / 115 = 1,38, ou seja, 38% mais veloz

É um resultado bem próximo dos 41% teóricos. O fato de não ter sido alcançado o resultado esperado (41%) pode ter várias explicações:

Page 13: AMD Phenom

a) O programa não está totalmente otimizado para os 6 núcleosb) O fato da cache L3 ser 6 MB nos dois casos pode prejudicar a escalabilidade

c) O tempo gasto na leitura do arquivo de entrada pode afetar o resultado

O tempo gasto na leitura de um arquivo a ser convertido pode afetar o desempenho total, caso este arquivo seja grande. No teste realizado, o tempo total de conversão foi de 20 minutos. Como o

arquivo tem quase 6 GB, seria gasto cerca de um minuto na sua leitura, supondo uma taxa efetiva de 100 MB/s. De fato, somente a operação de cópia deste arquivo a partir de um HD externo demorou 3

minutos.

Isso nos motivou a repetir a medida usando um arquivo de vídeo menor. Dessa vez escolhemos um filme com 1 hora e meia de duração, resolução de 640×480 e 700 MB. Os testes de conversão deste arquivo para MP4 foram feitos duas vezes, no mesmo computador, inicialmente com um Phenom II de 4 núcleos, depois com o de 6 núcleos. As medidas em andamento podem ser vistas nas figuras 10

e 11.

Figura 10 – Conversão de vídeo no Phenom II X4

Figura 11 – Conversão de vídeo no Phenom II X6

Nesses testes observamos que a taxa de utilização dos núcleos do processador ficou acima de 97%, o que mostra que o tamanho grande do arquivo de entrada no teste anterior impedia que o processador

ficasse 100% do tempo ocupado, já que pesava um pouco o tempo de leitura do arquivo.

Os resultados são resumidos na tabela abaixo:

Tabela 7: X6 teve ganho de 40,8%

Page 14: AMD Phenom

Ganho = 197,40 / 140,13 = 1,408

O ganho obtido agora foi 1,408, valor praticamente idêntico ao 1,41 calculado de forma teórica. Isso prova que o novo processador realmente escala o seu desempenho com a utilização de todos os

núcleos, mas é preciso levar em conta:

1) Programas que usam todos os núcleos devem ser otimizados para aproveitamento máximo. Enquanto os fabricantes não os otimizam, o ganho será inferior ao valor teórico.

2) Mesmo quando programas não foram otimizados, sempre ocorrerá ganho de desempenho quando usamos múltiplos programas pesados simultaneamente.

3) Outras partes do computador também precisam ser rápidas. No exemplo acima, vimos que o tempo gasto na leitura do arquivo do disco rígido afetou o desempenho total. Para o computador ser

rápido como um todo, não podemos ter partes causando “gargalos”.

Testes com o PCMark Vantage sob o Windows 7

O PCMark 2005 é um programa antiquado. Tem mais de 5 anos, só funciona sob o Windows XP e não avalia corretamente processadores com mais de 4 núcleos. Apesar disso, suas medidas de

desempenho são perfeitamente válidas, e também é um benchmark sintético. Este tipo de benchmark é o mais adequado quando queremos testar individualmente módulos do computador: processador,

memória, disco rígido, placa de vídeo.

Além dos benchmarks sintéticos, existem também os benchmarks de sistema. Nesse tipo de teste, o resultado final depende não só do processador, mas também do disco rígido, memória e placa de

vídeo. Dá uma idéia do desempenho do computador como um todo, mas é ineficiente para avaliar individualmente cada módulo, como o processador, por exemplo.

A versão mais recente de programa de benchmark da Futuremark (produtora do PCMark 2005) é o PCMark Vantage. Apesar de ser aceito no meio técnico, este programa é atualmente menos um

benchmark sintético e mais um benchmark de sistema. Por exemplo, em um dos testes de CPU existe o “web page rendering”, no qual páginas de Internet são escritas na tela com máxima velocidade. O

desempenho depende do processador, mas também da placa de vídeo.

Diferenças relativamente grandes são observadas quando usamos placas de vídeo diferentes ou discos rígidos diferentes. Como resultado, cada processador recebe um índice “CPU Test” que não depende somente do processador, mas de outros módulos. Para comparar processadores diferentes

seria preciso, em todos os testes, usar placas de vídeo idênticas e discos rígidos idênticos. Além disso, se a placa de vídeo e o disco rígido não tiverem altíssimo desempenho, penalizarão os

resultados obtidos pelos processadores mais velozes.

Fizemos o teste do Phenom II X6 1090T e do Phenom II X4 965 no mesmo sistema, trocando apenas o processador. A configuração em ambos os testes foi:

Memória: 4 GB (2 x 2GB) DDR3/1600 em dual channelHD de 1.5 TB Seagate ST31500541AS

Placa de vídeo HIS Radeon HD 5850 com 1 GB de memóriaWindows 7 Ultimate

PCMark Vantage, 64 bits

Page 15: AMD Phenom

Tabela 8: Testes do X4 e do X6 com o PCMark Vantage

O PCMark Vantage realiza oito bateria de testes, com duração total de 1 hora e meia (no nosso caso, pois o tempo total depende da velocidade dos componentes testados). De todos os testes, aquele mais

importante para comparação de processadores é o primeiro (índice PCMark). Nos nossos testes o índice obtido pelo Phenom II X6 foi 6,5% mais veloz. Note que esse é um benchmark de sistema, e

não sintético.

A maioria dos testes realizados pelo PCMark exige trabalho pesado de menos de quatro núcleos, quando o desempenho fica realmente cerca de 6% maior (3,6 GHz / 3,4 GHz). Nos testes que exigem o uso de todos os núcleos o Phenom II X6 leva vantagem maior, entretanto o índice

apresentado é a média de todos os testes. Como este programa não é mais um benchmark sintético, não é dada prioridade aos testes individuais, e sim à média geral.

Nos demais conjuntos de testes, o ganho do Phenom II X6 foi também pequeno em comparação com o Phenom II X4, e em alguns casos o desempenho foi até um pouco menor. Note que todos esses

testes são influenciados por outros fatores, como o desempenho do disco rígido e da placa de vídeo. As operações com arquivos no disco rígido sofrem variações de velocidade, dependendo da

localização dos arquivos no disco (trilhas externas apresentam taxa de transferência mais alta).

A simples comparação numérica dos resultados que o Pcmark Vantage apresenta para os modelos X4 e X6 nos levaria à conclusão de que estaríamos comprando um processador quase duas vezes mais caro para ter um desempenho apenas 6,5% maior. É uma conclusão equivocada. O ganho

máximo do modelo X6 em relação ao X4 ocorrerá apenas em duas situações:

a) Com programas pesados que aproveitem todos os núcleos ao mesmo tempo, e que sejam otimizados para usar ao máximo todos os núcleos, como é o caso do Handbrake

b) Quando forem usados vários programas pesados, os núcleos tendem a ficar todos com máxima utilização, então o modelo de 6 núcleos ganhará do modelo de 4 núcleos. Por exemplo, rodar um jogo 3D moderno ao mesmo tempo em que é feita a codificação de um lote de arquivos de vídeo.

Fora esses dois casos, o modelo de 6 núcleos (e o de 4 também) estará sub-aproveitado. É também verdade que:

a) Para um computador parado, um modelo avançado é 0% mais veloz que um modelo simples.

b) Para digitação de texto e tarefas simples, um modelo avançado é 0% mais veloz que um modelo simples.

Page 16: AMD Phenom

De fato, ao realizar seus testes, o programa PCMark Vantage não utiliza todos os núcleos do processador. Muitas das suas tarefas dependem mais do desempenho do vídeo e do disco rígido, e

em grande parte de tempo não mantém todos os núcleos do processador ocupados. Veja por exemplo o gráfico de uso da CPU durante a execução do PCMark Vantage, na figura 9.

Figura 12 – PCMark Vantage, uso da CPU monitorado com o Gerenciador de Tarefas

No exato instante mostrado na figura 9, o uso total do processador está marcando 99%. Realmente os gráficos dos seis núcleos, na sua parte direita, estão próximos a 100%. Entretanto ao longo do tempo,

considerando os gráficos por completo, vemos que quase sempre os núcleos estão apenas parcialmente ocupados. Sendo assim, o processador de 6 núcleos não mostra todo o seu potencial.

O índice de desempenho é uma média obtida nos vários testes, e naqueles que usam menos núcleos, a pontuação será igual à dos processadores mais simples. Por um lado isso é correto, pois nem

sempre um usuário utilizará tarefas pesadas que demandam trabalho de todos os núcleos. Por outro lado, é injusto usar este método para fazer a avaliação de um processador, já que o usuário pode estar

interessado exatamente nas aplicações de atividade mais intensa, que aproveitam ao máximo todos os núcleos. Como vemos a coisa é complexa, e não devemos levar em conta somente o índice final

obtido para comparar processadores.

Tabela 9: Testes do X4, X6 e i7 com o PCMark Vantage

O programa PCMark Vantage, infelizmente, não pode ser considerado um software totalmente preciso para avaliar a performance individual de um processador. Vamos justificar porque,

aproveitando para comentar um concorrente Intel do Phenom II X6 1090T, o Core i7 930. Este processador ocupa a mesma faixa de preço que o Phenom II X6 1090T. Apesar dos clocks dos seus

núcleos serem 2.8 GHz, apresenta desempenho sensivelmente maior, de acordo com o PCMark Vantage.

Page 17: AMD Phenom

Nos testes realizados, usamos o mesmo disco rígido (Seagate 1,5 TB) e a mesma placa de vídeo (HIS 5850) dos testes do Phenom II. De acordo com o PCMark Vantage, o sistema da Intel

apresentou ganho de desempenho na maioria dos testes. O índice geral PCMark apresentou ganho de 11,2%. O problema é que esses resultados variam de acordo com a configuração de hardware usada

no teste. Veja por exemplo os resultados apresentados para esses três processadores nos nossos testes e em testes feitos pelo Tom’s Hardware Guide, que são considerados bastante precisos. Adicionamos

na tabela os índices relativos ao processador Phenom II X4 965.

Tabela 10: Testes do ForumPCs e do Tom’s Hardware Guide

Em veículos diferentes, com placas de vídeo e HDs diferentes, o Phenom II X6 1090T mostrou-se 6,5% mais rápido ou 0,2% mais lento que o X4. O Core i7 930 mostrou ser 18,5% ou 12,7% mais rápido. É correto afirmar que cada núcleo do Core i7 é mais veloz que cada núcleo do Phenom II com mesmo clock. A vantagem do Core i7 é mais acentuada quando lembramos que o clock do

Phenom II X6 do nosso exemplo é 3,2 GHz (3,6 com Turbo Core) contra 2,8 GHz (3,06 com Turbo Boost) do Core i7.

Mas nosso objetivo aqui não é iniciar mais uma das discussões Intel x AMD, já bastante populares. Antes de festejar o ganho de performance do i7, é preciso também comparar o seu preço, o preço da

placa mãe, levar em conta que estão sendo usados 3 módulos (triplo canal, com 6 GB que talvez raramente sejam necessários, quando 4 GB com duplo canal atenderia muito bem e apresentaria

custo menor).

O que queremos mostrar aqui é a dificuldade do PCMark Vantage em apresentar medidas realistas para a velocidade do processador. Veja por exemplo o que acontece nos testes do Core i7 quando trocamos a placa de vídeo. Fizemos os testes em condições semelhantes, mas usando placas com

chips GeForce 7600 GTS e ATI 5850.

Page 18: AMD Phenom

Tabela 11: A placa de vídeo afeta os resultados dos testes do processador

O mesmo Core i7 930 recebeu do PCMark Vantage um índice de performance 9% maior quando executou os testes com uma placa de vídeo veloz. Observe na penúltima linha da tabela o motivo

disso: o índice GPU Gaming com a ATI 5850 foi 58,883 FPS, enquanto com a placa GeForce 7600 apresentou apenas 7,054 FPS. Com a placa mais rápida, o índice PCMark Gaming foi quase 3 vezes

maior (304,49 contra 106,82) e daí veio o ganho de 9,2% sobre o mesmo sistema com a placa de vídeo mais simples.

De um modo geral, usar placas de vídeo e discos rígidos mais velozes tendem a acentuar as diferenças entre processadores diferentes, enquanto usar placas de vídeo e discos rígidos mais lentos tendem reduzir as diferenças. Por tudo isso é difícil avaliar com precisão, quanto um processador é

mais veloz que outro, pelo menos com o PCMark Vantage.

Outro problema do PCMark Vantage na avaliação de processadores é que os resultados apresentam valores bem diferentes a cada vez que os testes são executados. É preciso executar a bateria

completa de testes várias vezes para que o programa apresente os valores médios. O conjunto total de testes do PCMark Vantage dura cerca de uma hora e meia, seriam então quatro horas e meia para

repetir os testes três vezes. Isso torna o trabalho de avaliação bastante demorado.

Por tudo isso, consideramos que o velho programa PCMark 2005, para Windows XP e limitado a testar quatro núcleos, apresenta resultados mais precisos na avaliação de processadores. É também um programa que apresenta resultados que não dependem da velocidade do disco rígido e da placa

de vídeo, e sim, do processador e da memória. Apresentamos então as medidas feitas nos dois processadores Phenom II e no Core i7 930, todos com o HD Seagate de 1,5 TB e placa de vídeo HD

5850.

Page 19: AMD Phenom

Tabela 12: Comparação com o i7, feita com o PCMark 2005

O resultado obtido com este velho programa mostra uma vantagem dos processadores Phenom II X4 e X6 na maioria das aplicações que usam um ou dois núcleos. Já nas aplicações que usam quatro

núcleos, existe alguma vantagem no Core i7.

Os resultados acima são bem interessantes. É bem sabido no meio técnico que o Core i7 leva vantagem sobre o Phenom II X4 e o Phenom II X6 em uma comparação clock por clock. As medidas

realizadas entretanto mostram que nem sempre isso é assim. Com o Turbo Core, o Phenom II X6 1090T tem seu clock elevado para 3,6 GHz nas aplicações que demandam esforço de até 3 núcleos,

enquanto o Core i7 930 vai para 3,06 GHz com o Turbo Boost. Uma vantagem de quase 20% no clock faz os núcleos do Phenom II levarem vantagem sobre o Core i7.

Essa discussão deve levar os leitores a refletirem sobre a questão de desempenho. Cada usuário individualmente nem sempre tem dois processadores rivais para comparar, em sistemas semelhantes.

Nós que temos os processadores em mãos, nem sempre temos os programas que interessam ao usuário. Um meio termo interessante é o realizado no Tom’s Hardware Guide, que faz testes

exaustivos em praticamente todos os modelos de processadores (já que os recebe para avaliação com mais facilidade).

Replicamos aqui os resultados de alguns testes de benchmark feitos com alguns processadores Intel e AMD. Todos os da tabela são de 4 núcleos, exceto o Phenom II X6, de 6 núcleos. Não foram feitos

testes com o i7-930, mas replicamos os resultados do i7-920 e do i7-940, que são modelos próximos. Mostramos também os resultados do i5-750, que tem se mostrado uma excelente opção de 4 núcleos. As tabelas mostram que em alguns casos o Phenom II X6 leva vantagem, em outros tem dificuldades

para competir com o i7, e algumas vezes até com o i5 de 4 núcleos (lembre-se que existem vários modelos de i5 com 2 núcleos).

Page 20: AMD Phenom

Tabela 13: Comparação de processadores

Fonte: Tom’s Hardware Guide, www.tomshardware.com

Page 21: AMD Phenom

Tabela 14: Comparação de processadores

TemperaturaAssim como ocorre com o Phenom II X4, o Phenom II X6 1090T é um processador bem quente.

Dissipa 125 watts e suporta uma temperatura máxima de 62°C. Em caso de uso extremo, esta temperatura máxima é facilmente atingida. Devemos tomar os cuidados usuais com a refrigeração do

processador e do gabinete.

Fizemos um teste visando a levar o Phenom II X6 à sua temperatura limite. Ao invés de instalar o cooler que o acompanha na versão BOX, usamos inicialmente um cooler simples, típico de

processadores AMD que dissipam 65 watts ou menos.

Page 22: AMD Phenom

Figura 13 - Cooler inadequado para o Phenom II X6

Usamos no gabinete um cooler traseiro de 12 cm expulsando o ar quente para fora, uma fonte de alimentação com ventilador interno e duto lateral de ventilação no gabinete, apesar do cooler ser

inadequado. O ambiente estava à temperatura de 27°C. Depois de alguns minutos com o computador inativo, o interior do gabinete estabilizou sua temperatura em 42°C, com processador estabilizado a

44°C. Colocamos em execução o programa Handbrake para fazer uma codificação de vídeo, mantendo os seis núcleos com taxa de utilização acima de 95%. O gabinete permaneceu a 42°C ao

longo do teste, mas o processador esquentou bastante em poucos minutos:

Tabela 15: Temperatura do processador com cooler inadequado

Em apenas quatro minutos o processador atingiu sua temperatura máxima permitida. Interrompemos o teste para evitar danos. Na verdade o processador tem uma proteção interna, reduzindo o seu clock

quando a temperatura máxima é atingida. Ainda assim, como o processador foi emprestado pela AMD para o teste, resolvemos exagerar no cuidado.

Fizemos a seguir a instalação do cooler correto para este processador, mostrado na figura abaixo. Na verdade a AMD enviou o processador sem cooler, usamos então o cooler de um outro Phenom II X6

disponível em nosso laboratório.

Page 23: AMD Phenom

Figura 14 - Cooler correto do Phenom II X6 1090T

Repetimos os testes nas mesmas condições, e dessa vez a temperatura ficou estabilizada em 51°C. As condições de temperatura desse segundo teste foram:

Temperatura ambiente: 27°C.Temperatura interna do gabinete: 36°C

Temperatura do processador em repouso: 35°C

A tabela abaixo mostra a evolução da temperatura do processador ao longo do teste.

Tabela 16: Temperatura do processador com cooler adequado

Apesar da sua elevada dissipação de 125 watts, o processador teve sua temperatura estabilizada em 51°C, ficando apenas 12°C acima da temperatura interna do gabinete. Ainda temos uma margem de

11°C até chegar à temperatura máxima suportada pelo processador, mesmo com quase 100% de ocupação nos 6 núcleos. Isso tudo só pode ser conseguido com o uso do cooler correto e com os

cuidados usuais com a ventilação do gabinete.

Page 24: AMD Phenom

ConclusãoÉ fato que um núcleo de processador moderno Intel é mais veloz que um núcleo de processador moderno da AMD de mesmo clock. A AMD compensa essa diferença oferecendo processadores com custo menor. Há poucos anos atrás, os processadores mais novos recém lançados, tanto da

AMD quanto da Intel, custavam cerca 1000 dólares em lotes de 1000 peças (E.U.A). O Phenom II X6 1090T custa menos que 300 dólares, também em lotes de 1000 peças.

Apesar de não competirem diretamente com os modelos mais velozes da Intel, que são bem mais caros, os novos processadores de 6 núcleos da AMD não fazem feio quando comparados a

processadores Intel de custo semelhante. Como podem ter desempenho similar com clocks menores, os processadores Intel que rivalizam com o Phenom II X6 em preço e desempenho apresentam outro

ponto favorável: a baixa dissipação de calor.

Isso é em parte conseqüência do uso do processo de fabricação Intel com transistores de 32 nm, enquanto a AMD ainda está usando o processo de 45 nm. Com a adoção do processo de 32 nm, a AMD poderá oferecer outras vantagens, como redução de dissipação de calor e redução de custo.

Bibliografia: http://blogs.forumpcs.com.br/laercio_vasconcelos/2010/08/06/editando-review-phenom-ii-x6/7/