Upload
israelcunha
View
81
Download
0
Embed Size (px)
Citation preview
ISRAEL JOSÉ DA CUNHA
PROCESSADORES MULTI-CORE
UNIVERSIDADE DO VALE DO SAPUCAÍ
POUSO ALEGRE
2010
ISRAEL JOSÉ DA CUNHA
PROCESSADORES MULTI-CORE
Projeto de Processadores multicores.
Arquitetura e Organização de Computadores,
apresentado ao curso de Sistema de
Informação da Universidade do Vale do
Sapucaí como requisito para obtenção de nota
parcial da disciplina Arquitetura e
Organização de Computadores.
UNIVERSIDADE DO4 VALE DO SAPUCAÍ
POUSO ALEGRE
2010
RESUMO
O processador multicores (que possui vários núcleos) tem como finalidade integrar a
teoria adquirida com a realidade de uma arquitetura.
Para tanto, foram pesquisadas todas as informações necessárias para o
desenvolvimento deste trabalho, com o objetivo de diagnosticar os aspectos com relevância
diante das disciplinas estudadas.
1 INTRODUÇÃO
Este tem como objetivo detalhar e identificar nos conhecimentos das
arquiteturas e organizações dos processadores novos e antigos.
As modificações nos decores dos anos e as novas tecnologias usadas para
melhoramento dos núcleos dos processadores.
A Intel e a AMD vêm aprimorando seus conhecimentos e inovando suas
tecnologias no mercado.
2 História do Core Duo
O processamento duplo é adotado há tempos. Essa ferramenta é mais perceptível nos
computadores de grande porte, servidores ou estações de trabalho mais conhecido como
Mainframes, em que se trabalha com dois ou mais processadores acoplados a uma placa mãe.
O interessante a ser frisado é que esses processadores são alocados em soquetes diferentes na
placa e não em uma mesma pastilha, como realizado nos modelos Core Duo atuais.
Antigamente uma das principais preocupações dos fabricantes desses produtos era com a
velocidade (frequência do clock) de processamento, mas os mesmos perceberam que essa
busca poderia sim ser alcançada, contudo o processo resultaria em um consumo de energia
muito alto e em consequência também uma dissipação alarmante de calor. Para um
consumidor utilitário de desktop seria inviável a refrigeração desse processador, além do
custo final ficar bastante elevado.
Deixando o raciocínio de elevar o clock, a lógica agora é duplo processamento e redução
de energia. Esta técnica consiste em acoplar dois processadores em uma mesma pastilha.
Estes trabalharam ao mesmo tempo para a realização da mesma tarefa, logo o trabalho será
concluído bem mais rápido que apenas.com um processador. Este ganho de performance é
melhor visualizado ao se trabalhar com várias tarefas.
Pensando desta forma os dois principais fabricantes desses componentes, Intel e AMD,
lançaram seus produtos com essa tecnologia. Os primeiros lançamentos da Intel baseados
nessa tecnologia foi o Pentium D e o Pentium Extreme Edition, ocorrido em 2005. Ambos são
baseados em uma tecnologia de núcleo denominada NetBurst, herdada do Pentium, tem o
objetivo de proporcionar maior frequência de clock. A principal diferença entre os dois é que
o segundo além de ter dois núcleos, possui também tecnologia Hyper Treading armazenada
nesses núcleos, se comporta como dois processadores reais, no entanto, são processadores
virtuais. Portanto o Sistema operacional irá reconhecê-lo como quatro processadores. Em
2006 a Intel lança novos processadores: o Core 2 Duo, o Core 2 Quad e o Core 2 Extreme,
estes com sua nova versão baseados em uma nova tecnologia criada pela mesma e batizada de
Core. Esta visa redução do consumo de energia concomitante a um maior poder de
processamento. Esta tecnologia permite desativar parte do processador que não esta sendo
utilizado, desta forma usa somente o potencial necessário a realização da tarefa.
O período de lançamento dos processadores Duo da AMD foi também em 2005. Esses
modelos foram o Opteron e o Athlon X2, o primeiro é pra servidor e o segundo para desktop.
A AMD também planeja projetar processadores com quatro núcleos. Nesta nova proposta
serão implantadas duas pastilhas em socketes diferentes, sendo que cada pastilha conterá dois
processadores, assim totalizando quatro processadores. Logo, seu desempenho será bem
acentuado.
De acordo com as informações colhidas, observa-se que esses processadores são tão
recentes que não há muito o que contar. O que se percebe, na verdade, é um constante
aparecimento de novos modelos de processadores, tanto Intel quanto AMD, com
características diferentes e mais poderosos que os anteriores, contribuindo assim para que
possamos adquirir produtos excelentes a preços acessíveis. O modelo Core 2 Duo é
atualmente, segundo avaliações feitas por instituições competentes, o mais poderoso,
entretanto os da AMD também são espetaculares a um custo mais baixo, portanto a segunda
opção pode ser mais indicada, visto que a relação custo benefício é ressaltada.
3 Processadores da Intel
3.1 Pentium 4
Diante de tantos aplicativos e softwares cada vez mais exigentes, a Intel viu se em uma
determinada situação em que trabalhar com processadores de núcleo único já não era mais tão
eficaz quanto ela imaginava. Devido a isso, no final de 2003 (4° período em que a Intel divide
como sendo seu último trimestre), a Intel lançou o Pentium 4 usando a microarquitetura x86
de sétima geração, chamada Netburst. Os processadores Pentium 4 podem encontrados em
três versões de núcleos: Willamette, Northwood e Prescott.
Os primeiros modelos de Pentium 4 utilizavam soquete 423, que, como o próprio nome já
sugere, possuía 423 terminais. Depois foram lançados modelos de Pentium 4 com soquete
478, que, apesar de possuírem mais contatos do que os modelos anteriores (soquete 423),
eram fisicamente menores. Os modelos atuais utilizam um novo tipo de soquete, chamado
Soquete 775.
Os primeiros modelos de Pentium 4 foram baseados no núcleo Willamette, que possuia
256 KB de cache L2, trabalhava externamente a 400 MHz (100 MHz transferindo quatro
dados por pulso de clock), suporte a instruções SSE2, Tecnologia de construção de 0,18 µm e
42 milhões de transistores ocupando uma área de 217 mm2. O metal utilizado para fazer a
conexão dos transistores e de outros componentes dentro do núcleo é o alumínio.
Em seguida veio o modelo de Pentium 4 baseado no núcleo Northwood. Este núcleo é
cerca de 60% menor do que o núcleo Willamette devido ao seu processo de fabricação de 0,13
µm. O núcleo Northwood pode ser encontrado em versões de 512 KB, barramento externo
rodando a 400 MHz, 533 MHz ou 800 MHz (100 MHz, 133 MHz e 200 MHz transferindo
quatro dados por pulso de clock, respectivamente), suporte a instruções SSE2 e uso de 55
milhões de transistores, ocupando uma área de 131 mm2. O metal utilizado para fazer a
interconexão dos transistores e de outros componentes dentro do núcleo é o cobre.
O núcleo Prescott é construído com Tecnologia de 90 nanômetros (0,09 µm) e é utilizado
nos Processadores Pentium 4 modernos. Pode ser encontrado com 512 KB, 1 MB ou 2 MB de
cache L2, trabalha externamente a 533 MHz ou 800 MHz (133 MHz e 200 MHz transferindo
quatro dados por pulso de clock, respectivamente), suporte às novas instruções SSE3 e uso de
125 milhões de transistores, ocupando uma área de 112 mm2. O metal utilizado para fazer a
interconexão dos transistores e de outros componentes dentro do núcleo é o cobre.
O Pentium Extreme Edition foi lançado em novembro de 2003 e foi o primeiro
processador para Desktop a possuir o cache L3 Integrado, característica esta presente apenas
em processamento voltado ao mercado corporativo. Esse processador possui 2 MB de cache
L3 sendo acessado na mesma freqüência de operação interna do processador. Os primeiros
modelos de Pentium 4 Extreme Edition eram baseados no núcleo Gallatin, que tinha 512 KB
de cache L2 e 2 MB de cache L3, trabalhava externamente a 800 MHz ou 1066 MHz (200
MHz e 266 MHz transferindo quatro dados por pulso de clock, respectivamente), suporte às
instruções SS2, tecnologia Hyper-Threading, tecnologia de construção de 0,13 µm e 178
milhões de transistores. Os modelos de Pentium 4 Extreme Edition atuais são baseados no
núcleo Prescott 2M com tecnologia de 90 nanômetros.
Enquanto o núcleo Prescott possui 125 milhões de transistores, o núcleo Prescott 2M
possui 169 milhões. A diferença no número de transistores fica por conta do cache L2 de 2
MB presente no núcleo Prescott 2M.
Até o momento a Intel lançou apenas um modelo de Pentium 4 Extreme Edition baseado
no núcleo Prescott 2M. Esse processador possuía 2 MB de cache L2, suporte às instruções
SSE3, tecnologia Hyper-Threading e extensões de 64 bits. Voltado para aplicações de alto
nível e com um rendimento muito bom, trabalhava com instruções MMX, SSE, SSE2 e SSE3.
Nessa versa, Intel simulava um núcleo duplo a partir da tecnologia Hyper Treading, que
visava dividir o processador em dois processadores lógicos. Contudo a Intel, não estava mais
conseguindo aliar o clock, ficando com ele até algo mais de 3.8Ghz e um pipeline de 31
estágio devido aos problemas, pois acima desse clock, a eletricidade perdida pelos transistores
era alta, tornando assim o Pentium 4, um processador com o consumo e dissipação térmica
altas demais.
3.2 Celeron
Desde o seu lançamento, em abril de 1998, até os dias atuais, o processado Celeron da
Intel vem sofrendo modificações. O nome Celeron é utilizado pela Intel para designar sua
linha de processadores de baixo custo. Na verdade, o Celeron é uma versão econômica dos
processadores top de linha da Intel. Ou seja, o Celeron é uma versão “encapada” do Pentium
II, Pentium III, Pentium 4 ou do Core 2 Duo, com algumas características reduzidas ou
removidas.
O Celeron diferencia-se do Pentium II, Pentium III, Pentium 4 ou do Core 2 Duo em
basicamente três aspectos:
Tamanho do cache L2;
Clock interno;
Clock do barramento externo.
Essas diferenças fazem com que o Celeron seja mais barato e tenha um desempenho
menor do que os processadores Pentium II, Pentium III, Pentium 4 ou Core 2 Duo, sendo,
portanto, destinado para o mercado de usuários domésticos ou para aqueles que não
necessitam de grande poder computacional.
3.2.1 Celeron D
O Celeron D é baseado no Pentium 4 com núcleo Prescott e é fabricado com tecnologia
de 90 nanômetros ou de 65 nanômetros.
O Celeron D possui 16 KB de cache L1 de dados (o dobro do tamanho encontrado nos
Celeron “Willamette” e “Northwood”), 256 KB ou 512 KB de cache L2, trabalha
externamente a 533 MHz (133 MHz transferindo quatro dados por pulso de clock), suporta as
instruções multimídia SSE3, possui encapsulamento FC-PGA2, utiliza o padrão de pinagem
soquete 478 ou 775 e pode ser encontrado com clocks de 2,13 GHz a 3,2 GHz. Por ser uma
versão “capada” do Pentium 4 Prescott, o Celeron D não suporta a Tecnologia Hyper-
Threading presente no Pentium 4, que permite simular em um único processador físico dois
processadores lógicos.
As principais características do Celeron D são:
Baseado no Pentium 4 com núcleo Prescott;
Tecnologia de Fabricação: 90 nm ou 65 nm;
Cache L1: 16 KB para dados e cache de execução de 150 KB;
Cache L2: 256 KB ou 512 KB;
Clock externo: 533 MHz (133 MHz transferindo quatro dados por pulso de clock);
Encapsulamento: FC-PGA2 (soquete 478) ou FC-LGA (soquete 775);
Soquete: 478 ou 775;
Passou a suportar as instruções SSE3, além das instruções SSE e SSE2;
Tecnologia Execute Disable em alguns modelos;
Tecnologia EM64T (tecnologia de 64 bits) em alguns modelos.
3.2.2 Celeron Série 400
Os processadores Celeron da série 400 são baseados na microarquitetura Core, a
mesma usada pelos processadores Core 2 Duo tendo, porém, apenas um núcleo
(processadores Core 2 Duo possuem dois núcleos). As principais características técnicas dos
processadores Celeron Série 400 são:
Baseado no núcleo Conroe-L, o mesmo do Core 2 Duo porém com apenas um único
núcleo de processamento.
Tecnologia de Fabricação: 65 nm.
Cache L1: 64 KB, 32 KB para instruções e 32 KB para dados.
Cache L2: 512 KB.
Clock externo: 800 MHz (200 MHz transferindo quatro dados por pulso de clock).
Encapsulamento: FC-LGA6.
Soquete: 775.
Instruções SSE, SSE2 e SSE3.
Tecnologia Execute Disable.
Tecnologia EM64T (tecnologia de 64 bits).
Na tabela abaixo listamos os modelos dos processadores Celeron Série 400 lançados até o
momento. TDP significa Thermal Design Power e indica a dissipação térmica do
processador, isto é, o cooler do processador deve ser capaz de dissipar pelo menos esta
quantidade de calor.
sSpec Modelo Clock interno Alimentação TDP
SLAFZ 450 2,2 GHz 1,0 V - 1,3375 V 35 W
SL9XL 440 2 GHz 1,050V - 1,300V 35 W
SL9XN 430 1,80 GHz 1,050V - 1,300V 35 W
SL9XP 420 1,60 GHz 1,050V - 1,300V 35 W
3.2.3 Celeron Série E1000
Finalmente a Intel traz para a família Celeron a tecnologia de dois núcleos. A princípio
isto poderia soar contraditório, já que a proposta do Celeron é de ser um processador de baixo
custo voltado para aqueles usuários que não querem ou não podem pagar por um processador
repleto de recursos tecnológicos. Entretanto, a tecnologia de dois núcleos já não pode mais ser
considerada a última inovação tecnológica disponível, historicamente o que a Intel faz é
colocar no mercado intermediário processadores com características que uma vez foram
consideradas top de linha e então, depois de um tempo, integrar essas características também
nos produtos mais baratos. Como os processadores top de linha hoje são de quatro núcleos e a
Intel só tem vendido processadores de dois núcleos para o mercado intermediário a um bom
tempo, nada mais natural do que começar a introduzir processadores de dois núcleos também
no mercado de entrada. Como podemos ver, em um futuro próximo só teremos processadores
com pelo menos dois núcleos de processamento disponíveis à comercialização.
Os processadores Celeron de dois núcleos são baseados na microarquitetura. Core, a
mesma usada pelos processadores Core 2 Duo. Esses modelos são também conhecidos pelo
seu codinome, Allendale.
Todos os processadores Celeron da série E1000 possuem as seguintes características:
Microarquitetura core;
Tecnologia de dois núcleos;
Tecnologia de fabricação de 65 nm;
Soquete 775;
Instruções SSE3;
Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo;
Cache L2 de 512 KB compartilhado;
Tecnologia EM64T;
Tecnologia Execute Disable;
Tecnologia Enhanced SpeedStep.
Na tabela abaixo listamos os modelos de Celeron com dois núcleos já lançados. TDP
significa Thermal Design Power e indica a máxima dissipação térmica do processador, isto é,
o cooler do processador deverá ser capaz de dissipar pelo menos esta quantidade de calor.
sSpec Modelo Clock
interno
Clock
externo TDP
Temp. Máx
(ºC)
Alimentação
(V)
SLAQW E1200 1,6 GHz 800 MHz 65
W 73,3 0,85 - 1,5
SLAR2 E1400 2,0 GHz 800 MHz 65
73,3 0,85 - 1,5
W
SLAQZ E1500 2,2 GHz 800 MHz 65
W 73,3 0,85 - 1,5
SLAQY E1600 2,4 GHz 800 MHz 65
W 73,3 0,85 - 1,5
3.2.4 Celeron Série E3000
Os processadores Celeron da série E3000 têm dois núcleos de processamento e são
baseados na microarquitetura Core de 45 nm (núcleo Penryn).
Todos os processadores Celeron da série E3000 possuem as seguintes características:
Microarquitetura core;
Tecnologia de dois núcleos;
Tecnologia de fabricação de 45 nm;
Soquete 775;
Instruções SSE4.1;
Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo;
Cache L2 de 1 MB compartilhado;
Tecnologia EM64T;
Tecnologia Execute Disable;
Tecnologia Enhanced SpeedStep;
Tecnologia de Virtualização;
Na tabela abaixo listamos os modelos de Celeron com dois núcleos já lançados. TDP
significa Thermal Design Power e indica a máxima dissipação térmica do processador, isto é,
o cooler do processador deverá ser capaz de dissipar pelo menos esta quantidade de calor.
sSpec Modelo Clock
interno
Clock
externo TDP
Temp.
Máx (ºC)
Alimentação
(V)
SLGTZ E3400 2,6 GHz 800 MHz 65
W 74,1 0,85 - 1,3625
SLGU4 E3300 2,5 GHz 800 MHz 65
W 74,1 0,85 - 1,3625
SLGU5 E3200 2,4 GHz 800 MHz 65
W 74,1 0,85 - 1,3625
3.3 Centrino
Centrino não é um processador para notebooks, mas sim uma plataforma composta por
um conjunto de componentes específicos ditados pela Intel: um determinado processador, um
determinado chipset e uma determinada rede sem fio. Um notebook só pode ser considerado
Centrino se ele possuir esses três componentes.
Até o momento, existem cinco gerações da plataforma Centrino:
A primeira geração da plataforma Centrino (codinome Carmel), lançada em março de 2003, é
formada pelo processador Pentium M (Núcleo Banias), chipset Intel 855 Express e rede sem
fio Intel PRO/Wireless 2100 (802.11b).
Em julho de 2004 a Intel lançou a 2ª geração da plataforma Centrino, conhecida também pelo
codinome Sonoma. Esta geração é formada pelo processador Pentium M (núcleo Dothan),
chipset Intel 915 Express e rede sem fio Intel PRO/Wireless 2200 ou 2915ABG
(802.11a/b/g).
A 3ª geração da plataforma Centrino trouxe para o notebook o poder computacional dos
processadores de dois núcleos. Esta geração, também conhecida pelo codinome Napa, é
formada pelo processador Core Duo (núcleo Yonah) ou Core 2 Duo (núcleo Merom), chipset
Intel 945 Express e rede sem fio Intel PRO/Wireless 3945ABG (802.11a/b/g). Existe ainda
uma versão da plataforma Centrino que usa o processador Core Solo, que tem apenas um
núcleo de processamento, tal como o Pentium M. Esta geração é chamada Centrino Duo para
indicar que o processador usados nesta plataforma é de dois núcleos.
A 4ª geração da plataforma Centrino, codinome Santa Rosa, é dividida em duas versões:
Centrino Duo e Centrino Pro. A diferença básica entre elas é que o Centrino Pro possui uma
tecnologia de gerenciamento remoto baseada em hardware chamada Intel Active Management
Technology (Intel AMT) que permite identificar e resolver problemas em computadores da
rede remotamente, mesmo que os computadores estejam desligados (mas é necessário que o
micro esteja ligado a uma fonte de energia e esteja com o cabo de rede conectado).
A 5a geração chama-se Centrino 2, codinome Montevina, e tem duas versões: Centrino 2 e
Centrino 2 com tecnologia vPro. Ela é baseada no processador Core 2 Duo ou Core 2 Quad de
45 nm (núcleo Penryn), chipset Intel série 4 para notebooks (GL40, GM45, PM45 e GS45), e
rede sem fio Intel Link série 5000, que aceita conexões 802.11n de até 450 Mbps. Esta
geração requer ainda a presença de rede com fio Gb Ethernet baseada no chip Intel 82567. A
outra versão simplesmente incorpora ainda a tecnologia de segurança e gerenciamento remoto
vPro (nova versão da tecnologia AMT).
Com o lançamento da plataforma Centrino “Santa Rosa”, um componente opcional foi
adicionado à plataforma Centrino: um cache de disco integrado usando memória flash com o
objetivo de aumentar o desempenho e economizar energia. Este componente é chamado Intel
Turbo Memory,conhecido como Tecnologia Robson.
Na tabela abaixo resumimos as especificações de cada geração da plataforma Centrino.
Plataforma Codinome Processador Chipset Rede Opcional
Centrino Carmel Pentium M
(Banias) Intel 855
Intel PRO / Wireless
2100
Centrino Sonoma Pentium M
(Dothan)
Intel 915
Express
Intel PRO / Wireless
2200BG ou Intel PRO
/ Wireless 2915ABG
Centrino Napa Core Solo Intel 945
Express
Intel PRO / Wireless
3945ABG
Centrino
Duo Napa
Core Duo (Yonah)
ou Core 2 Duo
(Meron)
Intel 945
Express
Intel PRO / Wireless
3945ABG
Centrino
Duo
Santa
Rosa Core 2 Duo
Intel 965
Express
Intel PRO / Wireless
4965AGN
Intel Turbo
Memory
Centrino
Pro
Santa
Rosa Core 2 Duo
Intel 965
Express
Intel PRO / Wireless
4965AGN
Intel Turbo
Memory
Centrino 2 Montevina
Core 2 Duo ou
Core 2 Quad
(Peryn)
Intel Série
4
Intel Gigabit 82567 /
Wireless Série 5000
Intel Turbo
Memory e
vPro.
3.4 Pentium D
No início de 2004 (Q1), surgiu o Pentium D, processador Dual Core para notebooks, que
começou a se utilizar de 90 nm. O Pentium D, trabalha com instruções MMX, SSE, SSE2,
SSE3 e EM64T, além de se utilizar de uma tecnologia similar à usada no Pentium III, onde
gerencia a energia de modo que o processador só a use quando necessário. E passou a se
destacar devido ao fato de trabalhar com 2 MB de cache L2, O Pentium D é baseado na
microarquitetura x86 de sétima geração da Intel, chamada Netburst, ou seja, tem o
processamento basicamente comparado a dois Pentium 4, trabalhando simultaneamente. Os
processadores Dual Core da Intel, melhoraram bastante ao executar várias tarefas
simultaneamente, já que os processos podem ser divididos entre os dois core, demonstrando
assim um desempenho superior ao do Pentium 4.
A diferença básica do Pentium D é a ausência da tecnologia Hyper-Threading. Nos
processadores Pentium D podem ser encontradas duas versões de núcleos: Smithfield e
Presler.
Todos usando o barramento externo de 800 MHz e as extenções de 64 da Intel (EM64T),
ou seja, o Pentium D é baseado no Pentium 4 séries 6xx.
Há processadores Pentium D que emulam a existência de um segundo processador,
aproveitando partes ociosas do processador para efetuar esta emulação.
Três modelos de Pentium D são anunciados:
Pentium D 820: 2,8 GHz, 1 MB de memória cache L2 para cada núcleo;
Pentium D 830: 3,0 GHz, 1 MB de memória cache L2 para cada núcleo;
Pentium D 840: 3,2 GHz, 1 MB de memória cache L2 para cada núcleo.
3.4.1 Smithfield
Os Processadores Pentium D da série 800 são baseados no núcleo Smithfield que consiste
em duas pastilhas de silício do núcleo Prescott montadas em um único processador. Ele
possui 230 milhões de transistores ocupando uma área de 206 mm2 e tecnologia de construção
de 90 nm.
As principais características dos processadores Pentium D da série 800 são as seguintes:
Tecnologia de núcleo duplo;
16 KB de cache L1 de dados;
2 MB de cache L2 (1 MB por núcleo);
Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock),
533 MHz no caso do Pentium D 805 (133 MHz transferindo quatro dados por pulso de clock);
Suporte às instruções SSE3;
Soquete 775;
Processo de fabricação de 90 nm;
Tecnologia de Memória Estendida de 64 bits (EM64t);
Tecnologia Execute Disable;
Tecnologia Enhanced SpeedStep (apenas nos modelos 840 e 830), que permite que o
processador reduza o seu clock interno em momentos de ociosidade de modo a economizar
bateria;
Tecnologia Hyper-Threading nos processadores Pentim Extreme Edition. Os processadores
Pentium D não têm esta tecnologia.
3.4.2 Presler
Os Processadores Pentium D da série 900 são baseados no núcleo Presler, que possui 376
milhões de transistores ocupando uma área de 162 mm2 e tecnologia de construção de 65 nm.
As principais características dos Processadores Pentium D e Pentium Extreme Edition da
série 900 são as seguintes:
Tecnologia de núcleo duplo;
16 KB de cache L1 de dados;
4 MB de cache L2 (2 MB por núcleo);
Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock) nos
Processadores Pentium D ou 1.066 MHz (266 tranferindo quatro dados por pulso de clock)
nos Processadores Pentium Extreme Edition;
Suporte às instruções SSE3;
Soquete 775;
Processo de fabricação de 65 nm;
Tecnologia de Virtualização;
Tecnologia de Memória Estendida de 64 bits (EM64t);
Tecnologia Execute Disable;
Tecnologia Enhanced SpeedStep, que permite que o processador reduza o seu clock interno
em momentos de ociosidade de modo a economizar bateria;
Tecnologia Hyper-Threading no Processadores Pentium Extreme Edition. Os Processadores
Pentium D não têm esta tecnologia.
3.5 Core Duo
Este processador adota a arquitetura de construção da família core. Em outras palavras,
esta é uma versão com menor custo do Core 2 Duo que opera com frequência mais baixa e
possui uma quantidade menor de cache L2. As três primeiras versões lançadas deste
processador possuíam FSB de 800 MHz visando manter compatibilidade com placas mãe
mais antigas.
A ideia central deste produto foi muito semelhante àquela adotada pelo Celeron – diminuir
um pouco da “potência” do processador para se obter custos mais baixos. Abaixo você
confere todos os modelos desta linha da Intel com suas respectivas especificações. Esta
geração de processadores da Intel foi lançada para substituir completamente a Netburst, que
até então vinha sendo utilizada. As principais características dos processadores desta família
são: 64 KB de cache L1 (em dois blocos, 32 KB para dados + 32 KB para instruções) por
núcleo; socket 775 (exceção: Core 2 Extreme no modelo QX9775 que utiliza o 771); cache de
memória L2 a partir de 2MB compartilhado e tecnologia de virtualização.
Os computadores que adotam processadores com tecnologia core 2 são mais rápidos,
eficientes e consomem menor quantidade de energia do que seus antecessores. Além disso,
toda a parte de multitarefa e processamento foi aperfeiçoada para garantir maior satisfação
mesmo para os usuários mais exigentes (veja Figura 1).
Figura 1: Representação de comparação de núcleos.
3.5.1 Core 2 Duo
Em meados de 2006 (Q3), surge talvez o melhor processador do mundo, o Core 2 Duo e
o Core 2 Duo Extreme, a partir desse momento o Pentium 4 se torna parte do passado. Dando
lugar aos processadores com 2 ou 4 núcleos unificados trabalhando em apenas 10 ciclos
contra os 14 do Pentium D.
O Core 2 Duo passa a trabalhar com as Instruções MMX, SSE, SSE2, SSE3, SSE4 e
EM64T. Através de diversas técnicas de miniaturização, o Core 2 Duo passa a trabalhar com
65 nm. Além de possuir barramentos superiores a 800 Mhz, alguns chegam até 1066 MHz o
que possibilita até 4 transferências de 266 Mhz por ciclo). O cache L1 do Core 2 Duo ou
Conroe nome genérico usado pela Intel trabalha com 8 linhas de associação contra apenas 2
do seu concorrente direto.
Isso possibilita um cache mais eficiente, aumentando a probabilidade da informação ser
encontrada. O cache L2, que pode chegar até 4 Mb, é acessado através de um barramento de
dados de 256 bits. E uma das novidades mais significativas do Core 2 Duo é o Macro-Fusion,
que permite diversos pares de instruções comuns combinados em uma única instrução, ao
invés de serem processados individualmente. Isso gera um efeito benéfico ao processador que
economiza espaço nos buffers de memória, economiza processamento no agendador de
instruções ou scheduler e assim por diante, causando até 11% de ganho bruto em nível de
desempenho se comparado a um de seus antecessores: o Pentium 4.
O grande forte do Core 2 Duo está na decodificação das instruções, pois processa as
instruções SSE de 128 bits em apenas um ciclo, o que causa grande agilidade.
As principais características técnicas dos processadores Core 2 Duo são as seguintes:
64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;
Tecnologia de um (Core 2 Solo), dois (Core 2 Duo, alguns modelos de Core 2 Extreme) ou
quatro núcleos (Core 2 Quad, alguns modelos de Core 2 Extreme);
Tecnologia de fabricação de 65 nm ou 45 nm;
Soquete 775 nos modelos para computadores de mesa (soquete 771 no Core 2 Extreme
QX9775);
Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock),
1.066 MHz (266 MHz transferindo quatro dados por pulso de clock), 1.333 MHz (333 MHz
transferindo quatro dados por pulso de clock) ou 1.600 MHz (400 MHz transferindo quatro
dados por pulso de clock);
2 MB, 3 MB, 4 MB ou 6 MB de cache de memória L2 compartilhado. Nos processadores de
quatro núcleos, cada par de núcleos tem seu próprio cache, compartilhado entre os dois
núcleos mais independente dos outros dois;
Tecnologia de Virtualização (exceto no Core 2 Duo modelos E4x00, E7x00 e E81xx);
Tecnologia Intel EM64T;
Instruções SSE3;
Instruções SSE4.1 nos modelos de 45 nm;
Execute Disable;
Intelligent Power Capability;
Tecnologia Enhanced SpeedStep.
3.5.2 Quad Core
Com o lançamento da mais nova plataforma de sistema operacional da Microsoft, o
Windows Vista no final de 2006 (Q4 para a Intel), a Intel lançou um processador que seria o
melhor para tal sistema. Assim surge no mercado o Intel Quad Core, que possui as mesmas
características que o Core 2 Duo, porém, possui ao invés de 2 núcleos, 4 e somente em
versões com 4 Mb de cache L2, o que o torna o mais rápido do mercado ao lado do Core 2
Duo Extreme.
3.5.3 Quad 2 Duo e tendências futuras
Já em janeiro de 2007 (Q1), a Intel fez o lançamento do Core 2 Quad com cerca de 45
nm, a nova geração de processadores dessa linha, com consumo de energia ainda menor, onde
a Intel buscava viabilizar o lançamento de versões ainda mais velozes e com maior poder de
processamento.
As principais características técnicas dos processadores Quad Core são as seguintes:
64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;
Tecnologia de um (Core 2 Solo), dois (Core 2 Duo, alguns modelos de Core 2 Extreme) ou
quatro núcleos (Core 2 Quad, alguns modelos de Core 2 Extreme);
Tecnologia de fabricação de 65 nm ou 45 nm;
Soquete 775 nos modelos para computadores de mesa (soquete 771 no Core 2 Extreme
QX9775);
Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock),
1.066 MHz (266 MHz transferindo quatro dados por pulso de clock), 1.333 MHz (333 MHz
transferindo quatro dados por pulso de clock) ou 1.600 MHz (400 MHz transferindo quatro
dados por pulso de clock);
2 MB, 3 MB, 4 MB ou 6 MB de cache de memória L2 compartilhado. Nos processadores de
quatro núcleos, cada par de núcleos tem seu próprio cache, compartilhado entre os dois
núcleos mais independente dos outros dois;
Tecnologia de Virtualização (exceto no Core 2 Duo modelos E4x00, E7x00 e E81xx);
Tecnologia Intel EM64T;
Instruções SSE3;
Instruções SSE4.1 nos modelos de 45 nm;
Execute Disable;
Intelligent Power Capability;
Tecnologia Enhanced SpeedStep;
3.5.4 Core i7
O Core i7 é o primeiro processador da Intel com controlador de memória integrado,
recurso já disponível nos processadores da AMD desde o Athlon 64. É baseado na arquitetura
Core, assim como o Core 2 Duo e Core 2 Quad, porém com diversos aprimoramentos para o
aumento do desempenho (microarquitetura Nehalem). Esse processador está disponível em
três diferentes soquetes, LGA1366 (arquitetura de memória de três canais e barramento QPI),
LGA1156 (arquitetura de memória de dois canais, controlador PCI Express 2.0 e barramento
DMI) e PGA988 para notebooks (com as mesmas especificações do LGA1156).
Tradicionalmente os processadores da Intel utilizam um controlador de memória externo,
localizado no chip ponte norte (também conhecido como MCH ou Hub Controlador de
Memória) do chipset. Isto significa que com processadores usando esta arquitetura o chipset
(e conseqüentemente a placa-mãe) é o componente que determina qual a tecnologia e a
quantidade de memória que você pode instalar no micro. Como no Core i7 o controlador de
memória está embutido no processador, é este – e não mais o chipset – que define qual
tecnologia e a quantidade de memória você pode ter instalada no micro. A placa-mãe, no
entanto, pode ter uma limitação na quantidade de memória instalada. O controlador de
memória integrado no Core i7 aceita apenas memórias DDR3 (até 1,6 V; memórias que
requerem mais do que isto não funcionarão e podem inclusive danificar o processador). Os
modelos soquete 1366 suportam a nova arquitetura de três canais com memórias DDR3-800 e
DDR3-1066, enquanto os modelos para soquetes 1156 e 988 suportam a (já padrão)
arquitetura de dois canais e memórias DDR3-800, DDR3-1066 e DDR3-1333.
A arquitetura de três canais dos modelos soquete 1366 permite ao processador acessar
três módulos de memória ao mesmo tempo para gravar e ler dados, aumentando a quantidade
de bits que são transferidos por pulso de clock de 128 (na arquitetura de dois canais) para 192.
Em teoria a arquitetura de três canais oferece um aumento de 50% na largura de banda em
relação à arquitetura de dois canais rodando com o mesmo clock. Por exemplo, memórias
DDR3-1066 trabalhando no modo de dois canais têm uma taxa de transferência máxima
teórica de 17 GB, enquanto que na arquitetura de três canais elas têm uma taxa de
transferência máxima de 25,5 GB/s.
Os processadores soquete 1366 comunicam-se com o restante do sistema por meio de um
novo barramento chamado QPI (Quick Path Interconnect), que trabalha a 2,4 GHz (4,8 GB/s)
no Core i7 e a 3,2 GHz (6,4 GB/s) no Core i7 Extreme. Nos modelos soquete 1156 e 988 o
processador também tem um controlador PCI Express 2.0 integrado, então nesses
processadores a placa de vídeo está conectada diretamente ao processador, o que em teoria
pode aumentar a taxa de transferência da placa de vídeo obtida na prática. Esses
processadores podem comunicar-se com uma placa de vídeo na velocidade x16 ou com duas
placas de vídeo a x8 cada. Como nesses modelos o controlador PCI Express 2.0 fica dentro do
processador, a Intel decidiu usar um barramento de menor velocidade chamado DMI (Digital
Media Interface), que opera a 2 GB, para conectar o processador ao chipset. Esse barramento
é usado para a comunicação entre a ponte norte e a ponte sul nos chipsets anteriores da Intel.
Essa largura de banda baixa não é problema, já que a razão para a alta largura de banda do
QPI é que ele é usado para conectar o processador ao controlador PCI Express 2.0 presentes
na ponte norte e já que nos processadores soquete 1156 e 988 esse componente fica dentro do
processador, um barramento de alta velocidade não é mais necessário. Os processadores core
i7 possuem uma tecnologia chamada Turbo Boost, que é um recurso de overclock automático.
Quando o processador percebe que precisa de mais poder de processamento, ele aumenta o
clock interno acima do clock padrão, automaticamente.
Outra característica interessante é a tecnologia Hyper-Threading, que simula dois
processadores lógicos para cada núcleo de processamento. Assim, como o Core i7 tem quatro
núcleos "reais", o sistema operacional detecta oito núcleos "virtuais", ou seja, oito
processadores.
O Core i7 Extreme é a versão mais poderosa (e cara) do Core i7. Suas principais
diferenças são o multiplicador destravado, além de velocidades do clock do processador e do
barramento QPI (apenas nos modelos soquete 1366) mais altas.
As principais características técnicas dos processadores da família corem i7 são as
seguintes:
Microarquitetura Nehalem;
64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;
256 KB de cache L2 por núcleo;
4 MB, 6 MB ou 8 MB de cache de memória L3 compartilhado;
Tecnologia de dois ou quatro núcleos;
Soquete 1366 ou 1156 nos processadores para desktops, soquete 988 nos modelos para
notebooks;
Barramento QPI rodando a 2,4 GHz (4,8 GB/s) ou a 3,2 GHz (6,4 GB/s) nos modelos soquete
1366;
Barramento DMI (2 GB/s) nos modelos soquete 1156 e 988;
Controlador de memória integrado suportando arquitetura de dois canais (soquetes 1156 e
988) ou três canais (soquete 1366);
Suporte a memórias DDR3 até 1066 MHz (soquete 1366) ou até 1333 MHz (soquetes 1156 e
988);
Controlador PCI Express 2.0 embutido nos modelos soquete 1156 e 988 (uma pista x16
ou duas x8);
Controlador gráfico embutido em alguns modelos para notebooks;
Tecnologia Turbo Boost;
Tecnologia de Virtualização;
Tecnologia Intel EM64T;
Tecnologia Hyper-Threading; (HT)
Instruções SSE4.2;
Instruções AES-NIS (nos modelos de 32 nm comente);
Tecnologia Execute Disable;
Tecnologia Enhanced SpeedStep;
Processo de fabricação de 32 nm ou 45 nm.
Como falamos anteriormente, modelos para soquete 1366 (modelos começando com
"9") têm um controlador de memória de três canais integrado suportando memórias DDR3
até 1066 MHz, enquanto nos modelos soquete 1156 (modelos começando com o número "8")
o controlador de memória embutido suporta arquitetura de dois canais e memórias DDR3 até
1333 MHz. Os modelos soquete 1156 têm um controlador PCI Express 2.0 integrado
suportando uma pista x16 ou duas x8. A comunicação dos modelos soquete 1366 com o
mundo externo é feita por meio de um barramento QPI rodando a 2,4 GHz (4,8 GB/s)
enquanto os modelos soquete 1156 usam um barramento DMI (2 GB). Turbo Boost é um
overclock automático efetuado pelo processador quando ele "sente" que é necessário mais
poder de processamento. Aqui listamos o clock máximo atingido pelo processador quando
esse modo está habilitado.
sSpec Modelo Clock
Interno
Turbo
Boost
TDP
(W)
Temp. Máxima
(oC)
Alimentação
(V) Soquete
SLBEU 960 3,2 GHz 3,46 GHz 130 67,9 0,8 - 1,375 1366
SLBEN 950 3,06 GHz 3,32 GHz 130 67,9 0,8 - 1,375 1366
SLBCK 940 2,93 GHz 3,2 GHz 130 67,9 0,8 - 1,375 1366
SLBEJ 920 2,66 GHz 2,93 GHz 130 67,9 0,8 - 1,375 1366
SLBCH 920 2,66 GHz 2,93 GHz 130 67,9 0,8 - 1,375 1366
SLBJG 870 2,93 GHz 3,6 GHz 95 72,7 0,64 - 1,4 1156
SLBLG 860s 2,53 GHz 3,46 GHz 82 76,7 0,65 - 1,4 1156
SLBJJ 860 2,8 GHz 3,46 GHz 95 72,7 0,65 - 1,4 1156
Na tabela abaixo listamos os modelos do processador Core i7 Extreme para desktops
lançados até o momento. Esses modelos têm um barramento QPI funcionando a uma
velocidade maior (3,2 GHz, 6,4 GB/s) e têm seu multiplicador de clock destravado, dando
mais essa possibilidade de overclock.
sSpec Modelo Clock
Interno
Turbo
Boost
TDP
(W)
Temp. Máxima
(oC)
Alimentação
(V) Soquete
SLBEQ 975 3,33 GHz 3,6 GHz 130 67,9 0,8 - 1,375 1366
SLBCJ 965 3,2 GHz 3,46 GHz 130 67,9 0,8 - 1,375 1366
Os modelos de Core i7 para notebooks usam um soquete chamado PGA988. Eles têm
as mesmas características dos modelos soquete 1156: controlador de memória DDR3 de dois
canais integrados (o clock de memória máximo suportado depende do processador, ver coluna
"Mem." na tabela abaixo; modelos que suportam memórias DDR3 até 1.333 MHz também
suportam memórias de 1.066 MHz mas não memórias de 800 MHz; modelos que suportam
memórias de 1.066 MHz também suportam memórias de 800 MHz), controlador PCI Express
2.0 integrado, suportando um dispositivo na velocidade x16 ou dois dispositivos x8 e
barramento DMI. A maior diferença entre os modelos para notebooks e os de computadores
de mesa são as frequências de clock para economizar bateria, os modelos para notebooks têm
um clock bem mais baixo. Porém, quando necessário, eles se "transformam" em
processadores de alto desempenho, como você pode ver nas tabelas abaixo. Os modelos
começados com o dígito "6" têm um controlador gráfico DirectX 10 integrado rodando a 733
MHz com 12 processadores gráficos ("unidades de sombreamento").
sSpec Modelo Clock
Interno
Turbo
Boost Tecn. Núcleos
Cache
L3 Mem.
TDP
(W)
Temp.
Máxima
(oC)
Alimentação (V)
SLBLX I7-
820QM
1,733
GHz
3,06
GHz
45
nm 4 8 MB
1333
MHz 45 100 0,65 - 1,4
SLBLY I7-
720QM 1,6 GHz
3,28
GHz
45
nm 4 6 MB
1333
MHz 45 100 0,65 - 1,4
SLBMM I7-
640UM 1,2 GHz
2,26
GHz
32
nm 2 4 MB
800
MHz 18 105 -
SLBMK I7-
640LM
2,13
GHz
2,93
GHz
32
nm 2 4 MB
1066
MHz 25 105 -
SLBMN I7-
620UM
1,06
GHz
2,13
GHz
32
nm 2 4 MB
800
MHz 18 105 -
SLBPE I7-
620M
2,66
GHz
3,33
GHz
32
nm 2 4 MB
1066
MHz 35 105 -
SLBPD I7-
620M
2,66
GHz
3,33
GHz
32
nm 2 4 MB
1066
MHz 35 105 -
SLBML I7-
620LM 2,0 GHz
2,8
GHz
32
nm 2 4 MB
1066
MHz 25 105 -
Na tabela abaixo listamos os modelos do processador Core i7 Extreme para notebooks
lançados até o momento. Eles têm o multiplicador de clock destravado, adicionando mais uma
opção de overclock.
sSpec Modelo Clock
Interno
Turbo
Boost
Cache
L3 Mem.
TDP
(W)
Temp.
Máxima (oC)
Alimentação
(V)
SLBLW 920XM 2,0 GHz 3,2 GHz 8 MB 1333
MHz 55 100 0,65 - 1,4
3.5.5 Core i5
O Core i5 é a segunda linha de processadores da Intel lançada com um controlador de
memória integrado, recurso já disponível nos processadores da AMD desde o Athlon 64. É
baseado na arquitetura Core, assim como o Core 2 Duo e Core 2 Quad, porém com diversos
aprimoramentos para o aumento do desempenho (microarquitetura Nehalem). Esse
processador está disponível em dois soquetes, LGA1156 (para computadores de mesa) e
PGA988 (para notebooks). Os processadores da Intel baseados nas arquiteturas anteriores (até
os modelos para soquete 775) utilizam um controlador de memória externo localizado no chip
ponte norte (também conhecido como MCH ou Hub Controlador de Memória) do chipset. Isto
significa que, com processadores usando esta arquitetura, o chipset (e conseqüentemente a
placa-mãe) é o componente que determina qual a tecnologia e a quantidade de memória que
você pode instalar no micro. No Core i5, assim como no Core i7, o controlador de memória
está embutido no processador, é este – e não mais o chipset – que define qual tecnologia e a
quantidade de memória que pode ser instalada no micro. A placa-mãe, no entanto, pode ter
limitação na quantidade de memória instalada. O controlador de memória integrado no Core
i5 aceita apenas memórias DDR3 (até 1,6 V; memórias que requerem mais do que isto não
funcionarão e podem inclusive danificar o processador). Os processadores core i5 suportam a
arquitetura de dois canais e memórias DDR3-1066 e DDR3-1333 nos modelos
para computadores de mesa e memórias DDR3-800 e DDR3-1066 nos modelos para
computadores portáteis.
Processador Core i5 tem também um controlador PCI Express 2.0 integrado, logo nesses
processadores a placa de vídeo externa está conectada diretamente ao processador, o que em
teoria pode aumentar a taxa de transferência que a placa de vídeo pode obter na prática. Esses
processadores podem comunicar-se com uma placa de vídeo na velocidade x16 ou com duas
placas de vídeo a x8 cada, nos modelos sem vídeo integrado (nos modelos com vídeo
integrado, esse barramento pode conectar apenas uma placa de vídeo a x16). Como nesses
modelos, o controlador PCI Express 2.0 fica dentro do processador, a Intel decidiu usar um
barramento de menor velocidade chamado DMI (Digital Media Interface), que opera a 2 Gb
para conectar o processador ao chipset. Esse barramento é usado na comunicação entre a
ponte norte e a ponte sul nos chipsets anteriores da Intel. Essa largura de banda aparentemente
baixa não é problema, já que um barramento externo de alta velocidade para a comunicação
com o chipset não é mais necessário visto que tanto a placa de vídeo quanto a memória estão
conectadas diretamente ao processador.
Os modelos fabricados com tecnologia de 32 nm (modelos 6xx para computadores de
mesa e em todos os modelos para notebooks) têm um controlador de vídeo integrado dentro
do processador, isto é, o vídeo "on-board" é controlado pelo processador e não pelo chipset da
placa-mãe.
Processadores Core i5 utilizam um clock base de 133 MHz a partir do qual seus outros
clocks são gerados, cada um de acordo com seu multiplicador específico, possuem
a tecnologia chamada Turbo Boost, que é um recurso de overclock automático. Quanto o
processador percebe que precisa de mais poder de processamento, ele aumenta o clock interno
acima do clock padrão, automaticamente.
As principais características técnicas dos processadores da família Core i5 são as
seguintes:
Microarquitetura Nehalem;
64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;
256 KB de cache L2 por núcleo;
3 MB, 4 MB ou 8 MB de cache de memória L3 compartilhado;
Tecnologia de dois ou quatro núcleos;
Soquete 1156 nos processadores para computadores de mesa, soquete 988 nos modelos para
notebooks;
Barramento DMI (2 GB/s);
Controlador de memória integrado suportando arquitetura de dois canais;
Suporte a memórias DDR3 até 1066 MHz (modelos para notebooks) ou até 1333 MHz
(modelos para computadores de mesa);
Controlador gráfico embutido em alguns modelos, rodando a 500 MHz, 733 MHz ou 900
MHz.
Tecnologia Turbo Boost;
Tecnologia de Virtualização;
Tecnologia Intel EM64T;
Tecnologia Hyper-Threading (HT) em alguns modelos;
Instruções SSE4.2;
Instruções AES-NIS (nos modelos de 32 nm somente);
Tecnologia Execute Disable;
Tecnologia Enhanced SpeedStep;
Processo de fabricação de 32 nm ou 45 nm;
O controlador de memória embutido suporta arquitetura de dois canais e memórias DDR3
até 1333 MHz, além de um controlador PCI Express 2.0 integrado, suportando uma pista x16
ou duas x8. A comunicação com o chipset da placa-mãe é feita por meio de um barramento
DMI (2 Gb). Os modelos começando com o número "6" têm ainda controlador de vídeo
integrado rodando a 900 MHz nos modelos terminados em "1" e a 733 MHz nos modelos
terminados em "0".
Turbo Boost é um overclock automático efetuado pelo processador quando ele "sente"
que é necessário mais poder de processamento. Aqui listamos o clock máximo atingido pelo
processador quando esse modo está habilitado. Alguns modelos posssuem a tecnologia
Hyper-Threading, que simula um núcleo de processamento extraem cada núcleo "real". Assim
o sistema operacional e programas reconhecem esses processadores como tendo quatro
núcleos, apesar de apenas dois estarem fisicamente presentes.
sSpec Modelo Clock
Interno
Turbo
Boost Núcleos HT Vídeo
Cache
L3 Tecn.
TDP
(W)
Temp.
Máxima
(oC)
Alimentação
(V)
SLBLH i5-750S 2,40
GHz
3,2
GHz 4 Não Não 8 MB
45
nm 82 76,7 0,65 - 1,4
SLBLC i5-750 2,66
GHz
3,2
GHz 4 Não Não 8 MB
45
nm 95 72,7 0,65 - 1,4
SLBTM i5-680 3,6
GHz
4,86
GHz 2 Sim Sim 4 MB
32
nm 73
0,65 - 1,4
SLBLT i5-670 3,56
GHz
3,73
GHz 2 Sim Sim 4 MB
32
nm 73 72,6 0,65 - 1,4
SLBNE i5-661 3,33
GHz
3,6
GHz 2 Sim Sim 4 MB
32
nm 87 69,8 0,65 - 1,4
SLBLV i5-660 3,33
GHz
3,6
GHz 2 Sim Sim 4 MB
32
nm 73 72,6 0,65 - 1,4
SLBLK i5-650 3,20
GHz
3,46
GHz 2 Sim Sim 4 MB
32
nm 73 72,6 0,65 - 1,4
Os modelos de Core i5 para notebooks usam um soquete chamado PGA988, possuindo
um controlador de memória DDR3 de dois canais integrado, sendo que até o momento os
modelos disponíveis suportam apenas memórias DDR3 de 800 MHz e de 1066 MHz. Eles
possuem ainda controlador PCI Express 2.0 integrado suportando um dispositivo na
velocidade x16 e um controlador de vídeo integrado rodando a 500 MHz.
A maior diferença entre os modelos para notebooks e os para computadores de mesa são
as frequências de clock: para economizar bateria, os modelos para notebooks têm um clock
bem mais baixo. Porém, quando necessário, eles se "transformam" em processadores de alto
desempenho através da tecnologia Turbo Boost, como você pode ver nas tabelas abaixo.
Todos os modelos para notebooks possuem dois núcleos de processamento com
tecnologia Hyper-Threading (que simula um núcleo de processamento em cada núcleo "real").
Assim o sistema operacional e programas reconhecem esses processadores como tendo quatro
núcleos, apesar de apenas dois estarem fisicamente presentes.
sSpec Modelo Clock
Interno
Turbo
Boost Núcleos HT Tecn.
Cache
L3
TDP
(W)
Temp.
Máxima (oC)
SLBPF i5-540M 2,53 GHz 3,06 GHz 2 Sim 32
nm 3 MB 35 105
SLBPG i5-540M 2,53 GHz 3,06 GHz 2 Sim 32
nm 3 MB 35 105
SLBQP i5-
520UM 1,066 GHz
1,866
GHz 2 Sim
32
nm 3 MB 18 105
SLBP6 i5-520E 2,4 GHz 2,93 GHz 2 Sim 32
nm 3 MB 35 105
SLBNA i5-520M 2,4 GHz 2,93 GHz 2 Sim 32
nm 3 MB 35 105
SLBNB i5-520M 2,4 GHz 2,93 GHz 2 Sim 32
nm 3 MB 35 105
SLBPM i5-430M 2,26 GHz 2,53 GHz 2 Sim 32
nm 3 MB 35 105
SLBPN i5-430M 2,26 GHz 2,53 GHz 2 Sim 32
nm 3 MB 35 105
3.5.6 Core i3
O Core i3 é o novo processador da Intel voltado para computadores de baixo custo. Ele é
a terceira linha de processadores da Intel lançada com um controlador de memória integrado
(o Core i7 e o Core i5 foram as primeiras), recurso já disponível nos processadores da AMD
desde o Athlon 64. Ele é baseado na arquitetura Core, assim como o Core 2 Duo e Core 2
Quad, porém com diversos aprimoramentos para o aumento do desempenho (microarquitetura
Nehalem). Esse processador está disponível em dois soquetes, LGA1156 (para computadores
de mesa) e PGA988 (para notebooks).
Os processadores da Intel baseados nas arquiteturas anteriores (até os modelos para
soquete 775) utilizam um controlador de memória externo localizado no chip ponte norte
(também conhecido como MCH ou Hub Controlador de Memória) do chipset. Com
processadores usando esta arquitetura o chipset (e conseqüentemente a placa-mãe) é o
componente que determina qual a tecnologia e a quantidade de memória que você pode
instalar no micro. Como no Core i3, assim como no Core i5 e no Core i7, o controlador de
memória está embutido no processador, é este – e não mais o chipset – que define qual
tecnologia e a quantidade de memória você pode ter instalada no micro. A placa-mãe, no
entanto, pode ter uma limitação na quantidade de memória instalada. O controlador de
memória integrado no Core i3 aceita apenas memórias DDR3 (até 1,6 V; memórias que
requerem mais do que isto não funcionarão e podem inclusive danificar o processador). Os
processadores Core i3 suportam a arquitetura de dois canais e memórias DDR3-1066 e
DDR3-1333 nos modelos para computadores de mesa e memórias DDR3-800 e DDR3-1066
nos modelos para computadores portáteis.
Processadores Core i3 têm também um controlador PCI Express 2.0 integrado, logo
nesses processadores a placa de vídeo externa está conectada diretamente ao processador, o
que em teoria pode aumentar a taxa de transferência que a placa de vídeo pode obter na
prática. Esses processadores podem comunicar-se com uma placa de vídeo na velocidade x16.
Como nesses modelos o controlador PCI Express 2.0 fica dentro do processador, a Intel
decidiu usar um barramento de menor velocidade chamado DMI (Digital Media Interface),
que opera a 2 GB/s, para conectar o processador ao chipset. Esse barramento é usado na
comunicação entre a ponte norte e a ponte sul nos chipsets anteriores da Intel. Essa largura de
banda aparentemente baixa não é problema, já que um barramento externo de alta velocidade
para a comunicação com o chipset não é mais necessário visto que tanto a placa de vídeo
quanto a memória estão conectadas diretamente ao processador.
Todos os modelos do Core i3 são fabricados com tecnologia de 32 nm e têm um
controlador de vídeo integrado dentro do processador, isto é, o vídeo "on-board" é controlado
pelo processador e não pelo chipset da placa-mãe.
Os processadores Core i3 utilizam um clock base de 133 MHz a partir do qual seus outros
clocks são gerados, cada um de acordo com seu multiplicador específico e não possuem a
tecnologia Turbo Boost, que é um recurso de overclock automático presente nos Core i5 e
Core i7.
As principais características técnicas dos processadores da família corem i3 são as
seguintes:
Microarquitetura Nehalem;
64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;
256 KB de cache L2 por núcleo;
4 MB de cache de memória L3 compartilhado nos modelos para computadores de mesa;
3 MB de cache de memória L3 compartilhado nos modelos para notebooks;
Tecnologia de dois núcleos;
Soquete 1156 nos processadores para computadores de mesa, soquete 988 nos modelos para
notebooks;
Barramento DMI (2 GB/s);
Controlador de memória integrado suportando arquitetura de dois canais;
Suporte a memórias DDR3 até 1066 MHz (modelos para notebooks) ou até 1333 MHz
(modelos para computadores de mesa);
Controlador PCI Express 2.0 embutido (uma pista x16);
Controlador gráfico embutido, rodando a 500 MHz nos modelos para notebooks e 733 MHz
nos modelos de mesa;
Tecnologia de Virtualização;
Tecnologia Intel EM64T;
Tecnologia Hyper-Threading (HT);
Instruções SSE4.2;
Instruções AES-NIS;
Tecnologia Execute Disable ;
Tecnologia Enhanced SpeedStep;
Processo de fabricação de 32 nm.
Na tabela abaixo listamos todos os modelos de processadores Core i3 para desktops
lançados até o momento. O controlador de memória embutido suporta arquitetura de dois
canais e memórias DDR3 até 1333 MHz, além de um controlador PCI Express 2.0 integrado
suportando uma pista x16. A comunicação com o chipset da placa-mãe é feita por meio de um
barramento DMI (2 GB/s). Todos os modelos de Core i3 possuem um controlador de vídeo
integrado rodando a 733 MHz.
Esses processadores possuem a tecnologia Hyper-Threading, que simula um núcleo de
processamento extraem cada núcleo "real". Assim o sistema operacional e programas
reconhecem esses processadores como tendo quatro núcleos, apesar de apenas dois estarem
fisicamente presentes.Alguns modelos na tabela abaixo.
sSpec Modelo Clock
Interno Núcleos HT Vídeo
Cache
L3 Tecn.
TDP
(W)
Temp.
Máxima
(oC)
Alimentação
(V)
SLBMQ i3-540 3,06 GHz 2 Sim Sim 4 MB 32
nm 73 72,6 0,64 - 1,4
SLBLR i3-530 2,93 GHz 2 Sim Sim 4 MB 32
73 72,6 0,65 - 1,4
nm
Os modelos de Core i3 para notebooks usam um soquete chamado PGA988, possuindo
um controlador de memória DDR3 de dois canais integrado, sendo que até o momento os
modelos disponíveis suportam apenas memórias DDR3 de 800 MHz e de 1066 MHz. Eles
possuem ainda controlador PCI Express 2.0 integrado suportando um dispositivo na
velocidade x16 e um controlador de vídeo integrado rodando a 500 MHz.
A maior diferença entre os modelos para notebooks e os para computadores de mesa são
as frequências de clock: para economizar bateria, os modelos para notebooks têm um clock
bem mais baixo.
Todos os modelos para notebooks possuem dois núcleos de processamento com
tecnologia Hyper-Threading (que simula um núcleo de processamento em cada núcleo "real").
Assim o sistema operacional e programas reconhecem esses processadores como tendo quatro
núcleos, apesar de apenas dois estarem fisicamente presentes. Alguns modelos na tabela
abaixo.
sSpec Modelo Clock
Interno Núcleos HT Tecn.
Cache
L3
TDP
(W)
Temp. Máxima
(oC)
SLBMD i3-
330M 2,26 GHz 2 Sim 32 nm 3 MB 35 90
SLBPK i3-
350M 2,13 GHz 2 Sim 32 nm 3 MB 35 90
3.6 Atom
O Atom é um processador de baixo consumo da Intel voltado para os mercados de
notebooks e de dispositivos móveis com acesso à internet.
Há duas versões do processador Atom. O Atom das séries 2xx, 3xx, Nxxx e Dxxx –
codinome “Diamondville” – é voltado para o mercado de notebooks e desktops compactos de
baixo consumo (já que eles usam chipsets Intel da série 945, que são maiores e usam dois
chips), enquanto que o Atom série Z5xx – codinome “Silverthorne” – é voltado para o
mercado de dispositivos móveis com acesso à internet, não apenas porque ele usa um novo
chipset chamado US15W, que é muito menor e usa apenas um chip, mas também porque os
processadores Atom Z5xx são fisicamente menores do que os processadores Atom anteriores
(14 x 13 mm contra 22 x 22 mm). As pinagens também são diferentes, sendo que a série Z5xx
usa um padrão de 441 pinos contra 437 pinos das outras séries.
O Atom é baseado em uma microarquitetura diferente das atualmente usadas nos demais
processadores Intel (arquitetura Core) mas contendo o mesmo conjunto de instruções x86
presentes nos processadores da arquitetura Core (Core 2 Duo, por exemplo). Uma das
principais diferenças entre a microarquitetura do Atom em relação aos processadores
atualmente usados em PCs é que ela executa microinstruções em ordem, tal como era até o
primeiro Pentium, e não fora de ordem, como ocorre do Pentium Pro, Pentium II e superiores.
Isto foi feito com o intuito de reduzir o consumo do processador, já que os
componentes necessários para enviar e controlar as microinstruções a serem executadas
puderam ser removidos. O Atom é capaz de decodificar duas instruções por pulso de clock.
Os processadores Atom têm 32 KB de cache L1 de instruções, 24 KB de cache L1 de
dados e um cache L2 de 512 KB (1 MB no modelo com dois núcleos). Eles não têm um
controlador de memória integrado, e por essa razão os tipos e capacidades de memória são
definidos pelo chipset e não pelo processador.
A maioria dos modelos do Atom suporta a tecnologia Hyper-Threading, que é a
capacidade de usar unidades ociosas do processador para formar um segundo processador
virtual, fazendo com que o sistema operacional veja cada núcleo do processador como sendo
dois processadores, apesar de apenas um núcleo estar fisicamente presente. Claro que esta
técnica é menos eficiente do que ter dois núcleos de processamento verdadeiros, mas este
“núcleo” extra – e conseqüentemente o desempenho extra – você ganha de graça.
Outro detalhe importante é o fato de que a maioria dos processadores Atom não possui a
tecnologia Enhanced Speedstep ou nenhuma outra que permita que seu clock baixe caso o
processador esteja ocioso. Assim, eles sempre funcionam com o mesmo clock fixo. Apenas os
modelos Nxxx possuem essa tecnologia.
As principais características do processador Atom são as seguintes:
Compatibilidade total com o conjunto de instruções x86, o que significa que ele pode rodar
diretamente programas e sistemas operacionais para PCs. Vários outros processadores
voltados para o mercado de dispositivos móveis têm conjunto de instruções proprietário.
Um ou dois núcleos de processamento;
Baixíssima dissipação térmica (TDP), entre 0,65 W e 5,5 W nos modelos de um núcleo;
Tecnologia Hyper-Threading (exceto modelo Z510);
Tecnologia de Virtualização nos modelos Z520, Z520PT, Z530, Z530P, Z540 e Z550;
Tecnologia Enhanced SpeedStep nos modelos Nxxx;
Tecnologia Intel EM64T nos modelos 230, 330, N450, D510, Z510P, Z510PT, Z520PT e
Z530P;
Execute Disable;
Conjunto de instruções SSE3;
Clock externo de 400 MHz, 533 MHz ou 667 MHz (100 MHz, 133 MHz ou 166 MHz
transferindo quatro dados por pulso de clock);
Caminho de dados interno de 128 bits (“Digital Media Boost”);
32 KB de cache L1 de instruções e 24 KB de cache L1 de dados por núcleo;
512 KB de cache L2 (1 MB nos modelos de dois núcleos);
Tamanho de cache dinâmico: capacidade de desligar porções do cache de memória quando o
processador entra nos modos de economia de energia C4 ou C4E (não disponível nos modelos
Atom 2xx e 3xx);
Fabricado com tecnologia de 45 nm;
Pode trabalhar em conjunto com um chipset móvel da classe Intel 945 (Atom modelos 2xx,
3xx e N2xx) ou com um chipset Intel US15W “Poulsbo” (Atom modelos Z5xx). Os modelos
2xx, 3xx e N2xx são voltados para o mercado de notebooks, enquanto que os modelos Z5xx
são voltados para o mercado de dispositivos móveis com acesso à Internet;
437 pinos (modelos “Diamondville”, ou seja, xxx e Nxxx) ou 441 pinos (modelos
“Silverthorne”, ou seja, Z5xx).
3.7 Xeon
3.7.1 Modelos 50xx, 70xx e 71xx (Dois Núcleos)
A tecnologia de dois núcleos traz dois processadores inteiros dentro de um mesmo
invólucro. Como os processadores Xeon de núcleo duplo modelos 50xx, 70xx e 71xx têm a
tecnologia Hyper-Threading – que simula a existência de dois processadores em cada núcleo
– o sistema operacional reconhece cada processador Xeon de núcleo duplo como sendo quatro
processadores. Assim, em um servidor com dois processadores Xeon de núcleo duplo, o
sistema operacional reconhecerá oito processadores (quatro núcleos, dois por pocessador, e
dois processadores lógicos por núcleo).
Os processadores Xeon das séries 30xx, 51xx e 72xx possuem as seguintes características:
Microarquitetura core;
Tecnologia de dois núcleos;
Tecnologia de fabricação de 65 nm;
Soquete 604 (modelos 72xx), 771 (modelos 51xx) ou 775 (modelos 30xx);
Instruções SSE3;
Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo;
Cache L2 de 4 MB compartilhado entre os núcleos;
Tecnologia EM64T;
Tecnologia de Virtualização;
Tecnologia Execute Disable;
Tecnologia Demand-Based Switching (DBS), nos modelos 5140, 5148, 5150 e 5160;
Tecnologia Enhanced SpeedStep;
Tecnologia Dual Independent Bus (DIB), onde cada núcleo tem seu próprio barramento
externo em vez de ter apenas um barramento compartilhado entre os núcleos para a
comunicação com os outros dispositivos do micro.
3.7.2 Modelos 31xx e 52xx (Dois Núcleos)
Os processadores Xeon 31xx e 52xx, assim como os modelos 30xx, 51xx e 72xx, são
baseados na microarquitetura Core, a mesma usada pelos processadores Core 2 Duo (para
saber mais detalhes sobre a microarquitetura. A principal diferença entre esses modelos é a
tecnologia de fabricação. Enquanto os modelos 30xx, 51xx e 72xx usam o processo de
fabricação de 65 nm, as séries 31xx e 52xx usam o novo processo de 45 nm. Este processo de
fabricação é conhecido pelo nome-código Penryn.
Todos os processadores Xeon 31xx e 52xx possuem as seguintes características:
Microarquitetura core
Tecnologia de dois núcleos
Tecnologia de fabricação de 45 nm
Soquete 771
Instruções SSE4
Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo
Cache L2 de 6 MB compartilhado
Tecnologia EM64T
Tecnologia de Virtualização
Tecnologia Execute Disable
Tecnologia Demand-Based Switching (DBS)
Tecnologia Enhanced SpeedStep
3.7.3 Modelos 32xx, 53xx e 73xx (Quatro Núcleos, 65 nm)
Os processadores Xeon 32xx, 53xx e 73xx são baseados na microarquitetura Core e
possuem quatro núcleos de processamento, sendo que estes quatro núcleos são obtidos a partir
de duas pastilhas de dois núcleos cada. Com isso, o cache L2 desses processadores não é
compartilhado entre todos os seus núcleos: os núcleos 1 e 2 compartilham um mesmo cache
L2, enquanto que os núcleos 3 e 4 compartilham um outro cache L2. O valor divulgado é o
valor total (soma dos dois caches).
Todos os processadores Xeon das séries 32xx, 53xx e 73xx possuem as seguintes
características:
Microarquitetura core
Tecnologia de quatro núcleos
Tecnologia de fabricação de 65 nm
Soquete 604 (modelos 53xx e 73xx) ou 775 (modelos 32xx)
Instruções SSE3
Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo
Cache L2 de 4 MB, 6 MB ou 8 MB, dependendo do modelo, dividido em dois
Tecnologia EM64T
Tecnologia de Virtualização
Tecnologia Execute Disable
Tecnologia Demand-Based Switching (DBS)
Tecnologia Enhanced SpeedStep
3.7.4 Modelos 33xx e 54xx (Quatro Núcleos, 45 nm)
Os processadores Xeon 33xx e 54xx, assim como os modelos 32xx, 53xx e 73xx, são
baseados na microarquitetura Core, a mesma usada pelos processadores Core 2 Duo (para
saber mais detalhes sobre a microarquitetura. A principal diferença entre esses modelos é a
tecnologia de fabricação. Enquanto os modelos 32xx, 53xx e 73xx usam o processo de
fabricação de 65 nm, as séries 33xx e 54xx usam o novo processo de 45 nm. Este processo de
fabricação é conhecido pelo nome-código Penryn. Note que Penryn é o codinome da
tecnologia de fabricação e não do processador. O nome-código dos processadores Xeon 33xx
é Yorkfield e o dos processadores Xeon 54xx é Harpertown.
Há outras diferenças entre os processadores Xeon 33xx e 54xx e os demais modelos de
Xeon baseados na microarquitetura core descritos anteriormente, além do processo de
fabricação: o novo conjunto de instruções SSE4 e um cache de memória L2 maior.
Os quatro núcleos dos processadores Xeon 33xx e 54xx são obtidos a partir de duas
pastilhas de dois núcleos cada, assim como ocorre com os modelos descritos anteriormente.
Com isso, o cache L2 desses processadores não é compartilhado entre todos os seus núcleos:
os núcleos 1 e 2 compartilham um mesmo cache L2, enquanto que os núcleos 3 e 4
compartilham um outro cache L2. O valor divulgado é o valor total (soma dos dois caches).
Todos os processadores Xeon 33xx e 54xx possuem as seguintes características:
Microarquitetura core
Tecnologia de quatro núcleos
Tecnologia de fabricação de 45 nm
Soquete 771 (modelos 54xx) ou 775 (modelos 33xx)
Instruções SSE4
Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo.
Cache L2 de 6 MB ou 12 MB dividido em dois
Tecnologia EM64T
Tecnologia de Virtualização
Tecnologia Execute Disable
Tecnologia Demand-Based Switching (DBS)
Tecnologia Enhanced SpeedStep
4 Processadores da AMD
4.1 Athlon
A AMD foi a primeira empresa a lançar processadores de núcleo duplo com
arquitetura de 64 bits, baseado na arquitetura IBM PC x86. Ela utiliza tecnologia própria para
a comunicação entre o processador e os outros dispositivos de entrada e saída de memória o
“Direct Connect Arquitecture” que permite conexão independente para cada núcleo.
Com dois núcleos o computador trabalha como se houvesse dois processadores
independentes. Apenas sistemas operacionais com suporte a SMP (Suporte ao
Multiprocessamento Simétrico) são capazes de utilizar e perceber o aumento do poder de
processamento proporcionado por esta arquitetura.
Uma das principais características dos processadores de núcleo duplo da AMD é a
comunicação entre os núcleos que se dá através de um barramento embutido no processador,
chamado de HyperTransport, permitindo-o atingir velocidades maiores nesta comunicação.
Outros fabricantes utilizam a ponte norte que está fora do processador para esta comunicação,
o que em teoria diminuiria a velocidade de comunicação entre os núcleos.
A tecnologia de núcleo duplo do processador Athlon 64 X2 tem por base a utilização
de um processador com dois núcleos, cada núcleo idêntico ao Athlon 64, ou seja, cada núcleo
tem sua arquitetura baseada em um Athlon 64.
Processadores da AMD baseados na arquitetura do Athlon 64 podem ser encontrados com os
seguintes padrões de pinagem:
Soquete 754: Usado pelas primeiras versões de Athlon 64 e alguns modelos de Sempron e
Turion 64. Seu controlador de memória usa somente um canal (single channel), o que
significa que o processador acessa a memória a 64 bits. Aceita somente memórias do tipo
DDR.
Soquete 939: Usado por alguns modelos de processadores Athlon 64, Athon 64 FX, Athlon 64
X2 e Opteron. Seu controlador de memória usa dois canais (dual channel), o que significa que
o processador acessa à memória a 128 bits, se um número par de módulos de memória for
usado. Aceita somente memórias do tipo DDR.
Soquete 940: Usado pelos primeiros processadores Athon 64 FX e alguns modelos
do Opteron. Seu controlador de memória usa dois canais (dual channel), o que significa que o
processador acessa a memória a 128 bits, se dois módulos forem usados (ou um número par
de módulos de memória forem usados). É necessária a utilização de memórias do tipo ECC e
aceita somente memórias do tipo DDR.
Soquete AM2: Usado por modelos de Athlon 64, Athlon 64 FX e Athlon 64 X2 suportando
memórias DDR2 até 800 MHz, suportando a configuração de dois canais (dual channel), o
que significa que o processador acessa a memória a 128 bits, se um número par de módulos
for usado. Lembre-se que o controlador de memória dos processadores soquete 754, 939 e
940 suporta apenas memórias DDR.
Soquete AM2+: Usado por alguns modelos do Athlon X2 baseados no processador
Phenom. O soquete AM2+ permite dois recursos, o uso do barramento HyperTransport 3.0
(maior taxa de transferência entre o processador e o chipset) e separação dos pinos de
alimentação dos núcleos de processamento e do controlador de memória, o que permite ao
controlador de memória a trabalhar a um clock mais elevado e também resolvendo o
problema do multiplicador de clock da memória que descrevemos mais abaixo. Processadores
soquete AM2+ podem ser instalados em placas-mãe soquete AM2, porém a taxa de
transferência do barramento HyperTransport será limitada a 4 GB/s, o controlador de
memória trabalhará a um clock inferior e o problema da memória ser acessada a um clock
inferior (ver abaixo) poderá existir. Placas-mãe soquete AM2+ aceitam processadores soquete
AM2 sem problemas. Processadores soquete AM2+ suportam memórias DDR2 até 1.066
MHz.
Soquete AM3: Usado pelo Athlon II X2, Athlon II X3 e Athlon II X4. Esse soquete também
usa o HyperTransport 3.0 e sua principal diferença em relação ao soquete AM2+ é o uso de
memórias DDR3. Um processador AM3 pode ser instalado em placas-mãe AM3 (onde vai
trabalhar apenas com memórias DDR3) ou em placas-mãe AM2+ (suportando, assim,
memórias DDR2). Placas-mãe AM3, no entanto, suportam apenas processadores AM3.
Soquete F: Este soquete de 1.207 pinos criado para modelos do processador Opteron é
também usado pelos processadores Athlon 64 FX utilizados na plataforma Quad FX da AMD
(Athlon 64 FX modelos 7x). Os processadores que utilizam este soquete trabalham no modo
SMP (multiprocessamento simétrico), podendo trabalhar com mais de um processador em
paralelo. Assim como os processadores soquete AM2 e AM2+, nesses processadores o
controlador de memória integrado suporta memórias DDR2-533, DDR2-667 e DDR2-800 na
configuração de dois canais, o que significa que o processador acessa a memória a 128 bits, se
um número par de módulos de memória for usado.
O controlador de memória integrado nos processadores Athlon 64 soquetes AM2 e Athlon 64
FX soquete F suporta memórias DDR2-533, DDR2-667 e DDR2-800. O problema, no
entanto, é como o clock do barramento da memória é obtido. Em vez de ser gerado através do
clock base do processador (clock HTT, que é de 200 MHz), é usada uma divisão do clock
interno do processador. O valor desta divisão é metade do valor do multiplicador do
processador.
Um processador AMD64 com um multiplicador de clock 12x terá um divisor do barramento
de memória de 6. Este processador trabalhará a 2,4 GHz (200 MHz x 12) e sua memória
funcionará a 400 MHz (DDR2-800, 2.400 MHz / 6). Tenha em mente que as memórias DDR
e DDR2 são rotuladas com o dobro dos seus clocks reais.
O problema é quando o multiplicador de clock do processador é um número ímpar. Para um
processador AM2 com um multiplicador de clock 13x teoricamente o divisor do seu
barramento de memória seria de 6,5. Como o barramento de memória do AMD64 não
trabalha com divisores “quebrados” este valor é arredondado para o próximo número inteiro...
Enquanto este processador funcionará a 2,6 GHz (200 MHz x 13) seu barramento de memória
funcionará a 371 MHz (742 MHz DDR) e não a 400 MHz (800 MHz DDR), fazendo com que
o processador não alcance a largura de banda máxima que as memórias DDR2 podem
fornecer.
Alguns exemplos:
Clock
Interno
Multiplicador do
Processador
Divisor da
Memória
Barramento da
Memória
2,8 GHz 14x 7 800 MHz
2,6 GHz 13x 7 742 MHz
2,4 GHz 12x 6 800 MHz
2,2 GHz 11x 6 733 MHz
2 GHz 10x 5 800 MHz
1,8 GHz 9x 5 720 MHz
1,6 GHz 8x 4 800 MHz
Este mesmo problema não ocorre com processadores soquetes AM2+ e AM3.
Outras características encontradas nos processadores baseados na arquitetura do Athlon 64
são as seguintes:
O processador não é vendido com base em seu clock de operação, mas sim através de um
indicativo de desempenho chamado “performance rating” ou PR;
Podem acessar até 1 TB (terabyte) de memória RAM (barramento de endereços de 40 bits,
2^40 = 1 TB);
Suporte às instruções MMX, 3Dnow!, SSE e SSE2 (SSE3 apenas nos modelos mais novos,
SSE4a nos modelos para soquete AM2+ e AM3);
Tencnologia EVP (Enhanced Vírus Protection), também conhecida como “NX Bit Disable”;
Tecnologia Cool’n’Quiet.
4.1.1Plataforma Quad FX
A AMD lançou a plataforma Quad FX que utiliza dois soquetes na mesma placa mãe trazendo
para o pc o que já era comum nos servidores. Através da arquitetura de Conexão Direta de
Soquete Duplo (DSDC) que se dá a comunicação dos dois processadores de duplo núcleo,
facilitando o trabalho em paralelo. O barramento HyperTransport coerente conecta os dois
processadores desta plataforma. Esta plataforma exige que o processador possua dois
barramentos HyperTransport, um conecta os dois processadores enquanto o outro barramento
cuida da conexão com o chipset, vale ressaltar que há dois chips sets, um para cada soquete.
Esta plataforma utiliza dois processadores Athlon 64 FX de soquete F (1.027pinos) este
suporta as instruções MMX, 3Dnow!, SSE e SSE2. Alem disto nota-se também que o controle
da memória é embutido no processador e a memória é acessada por um barramento exclusivo
facilitando a transferência de dados entre os dois
4.1.2 Modelos do Athlon 64
O Athlon 64 pode ser encontrado em versões para o soquete 754, soquete 939 e o soquete
AM2. As versões para soquete 939 e soquete AM2 podem utilizar a configuração de memória
em dois canais, dobrando a taxa de transferência no acesso à memória desde que você use
dois ou quatro módulos de memória em seu micro.Os processadores soquete 754 e 939
aceitam somente memórias DDR, enquanto que os processadores soquete AM2 aceitam
somente memórias DDR2.
O Athlon 64 pode se encontrado com diferentes versões de núcleo. As principais
características técnicas do Athlon 64 são as seguintes:
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados;
512 KB ou 1 MB de cache de memória L2;
Barramento HyperTransport (HT) trabalhando a 800 MHz (3,2 GB/s) ou a 1 GHz (4 GB/s);
esses clocks podem também ser referenciados como “1.600 MHz” ou “2.000 MHz”,
respectivamente;
Configuração de memória em dois canais nos modelos soquete 939 e AM2 (você precisa
instalar dois ou quatro módulos de módulos de memória para usar este recurso);
Conjunto de instruções SSE3 em alguns modelos;
4.1.3 Modelos do Athlon 64 FX
O Athlon 64 FX é um processador destinado para a galera que se amarra em jogos.
Originalmente a diferença entre o Athlon 64 e o Athlon 64 FX era a quantidade de memória
cache L2 (512 KB no Athlon 64 vs. 1 MB no Athlon 64 FX) e maior flexibilidade para
overclock, já que ele vinha com o multiplicador de clock destravado. Todos os processadores
tanto da Intel quando da AMD possuem o multiplicador de clock fixo, que não pode ter seu
valor aumentado – em todos os outros processadores a única maneira de fazer um overclock é
aumentando o clock externo do processador. Com o Athlon 64 FX, no entanto, você tem duas
opções para fazer o overclock do processador, aumentando o seu clock base (também
conhecido clock HTT), que é de 200 MHz, e/ou aumentando seu multiplicador de clock.
Quando o processador Athlon 64 começou a ser vendido também com 1 MB de cache
L2, a diferença entre eles passou a ser apenas o multiplicador de clock destravado. O Athlon
64 4000+ e Athlon 64 FX-53 são o mesmo processador. Tradicionalmente os processadores
Athlon 64 de maior clock são os encontrados na linha Athlon 64 FX.
As principais características técnicas do Athlon 64 FX são as seguintes:
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;
1 MB de cache de memória L2;
Barramento HyperTransport (HT) trabalhando a 800 MHz (3,2 GB/s) ou 1 GHz (4 GB/s).
Esses clocks podem também ser referenciados como “1.600 MHz” ou “2.000 MHz”,
respectivamente;
Configuração de memória em dois canais em todos os modelos (você precisa instalar um
número par de módulos de memória para usar este recurso);
Conjunto de instruções SSE3 em alguns modelos;
Núcleo duplo nos modelos terminados em um número par. Esta tecnologia faz com que o
processador possua dois processadores completos em seu interior. Leia nosso tutorial
Processadores de Núcleo Duplo da AMD para aprender mais sobre esta tecnologia;
Modelos soquete AM2 e soquete F trabalham com memórias DDR2, enquanto os modelos
soquete 939 e 940 trabalham com memórias DDR.
4.1.4 Athlon 64 X2
O Athlon 64 X2 é um Athlon 64 com tecnologia de núcleo duplo, ou seja, ele possui
dois processadores dentro de um só.. A AMD trocou o nome dos processadores desta linha
para Athlon X2 e, pouco tempo depois, para Athlon X2 Dual Core.
Há versões do Athlon 64 X2 para os soquetes 939, AM2 e AM2+, porém em placas-
mãe soquete 939 talvez você precise fazer um upgrade de BIOS caso a sua placa-mãe tenha
sido lançada antes da introdução deste processador no mercado para que ela possa suportá-lo.
Assim como os processadores Athlon 64, os processadores Athlon X2 são
identificados por um número de modelo com quatro dígitos (Athlon 64 4000+, Athlon X2
6000+, etc). Esse sistema de numeração serve para indicar o desempenho de um processador
dentro de uma mesma família. Quanto maior o número do modelo dentro de uma família,
mais rápido é o processador. O Athlon 64 4000+ é mais rápido do que o Athlon 64 3800+,
que por sua vez é mais rápido do que o Athlon 64 3400+.
Podemos usar esse sistema de numeração para comparar processadores dentro de uma
mesma família. Não podemos dizer que um Athlon 64 4000+ é mais rápido do que o Athlon
X2 3800+ só porque o seu número de modelo é maior. Esses processadores fazem parte de
famílias diferentes e, portanto, não podemos comparar.
Acontece que a AMD a partir de agora está usando um novo sistema de numeração
para seus processadores. Esse novo sistema é mais complicado do que o anterior e só será
adotado pelos os novos processadores, ou seja, os processadores já existentes continuarão a
usar o sistema de numeração antigo.
Esse novo sistema de numeração usa um formato alfanumérico de cinco caracteres:
XX-####, onde XX são letras e #### são números. As duas letras indicam a classe do
processador, sendo que o segundo caractere indica a dissipação térmica do processador. O
primeiro número após o traço indica a série do processador e informa quais recursos o
processador tem. Os três últimos números indicam a posição do processador dentro da sua
série/classe. Quanto maior este número mais recursos o processador tem – normalmente
indicando um maior desempenho dentro de sua classe/série.
Os novos processadores Athlon X2 Dual Core são os primeiros a adotar o novo
sistema de numeração. Dessa forma, só para exemplificar como funciona o novo sistema de
numeração, o processador Athlon X2 Dual-Core BE-2350 pertence à classe “BE” (a letra “E”
indica que o processador dissipa 45 W), da série “2xxx”, e o seu número dentro dessa
série/classe é “350”.
As principais características técnicas do Athlon 64 X2 são as seguintes:
Dois núcleos de processamento;
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;
512 KB ou 1 MB de cache de memória L2;
2 MB de cache L3 nos modelos AM2+;
Barramento HyperTransport (HT) trabalhando a 1 GHz (4 GB/s) nos modelos soquete 939 e
AM2. Esse clock pode também ser referenciado como “2.000 MHz”. Nos modelos soquete
AM2+ esse barramento é de 1,8 GHz (7,2 GB/s). Esse clock pode também ser referenciado
como "3,6 GHz";
Soquete 939, AM2 ou AM2+. Modelos soquete 939 aceitam somente memórias DDR
enquanto modelos soquete AM2 e AM2+ aceitam somente memórias DDR2;
Configuração de memória em dois canais em todos os modelos (você precisa instalar um
número par de módulos de memória para usar este recurso);
Conjunto de instruções SSE3 em todos os modelos, SSE4a nos modelos soquete AM2+.
4.1.5 Modelos do Athlon II X2
O Athlon II X2 é semelhante ao processador Phenom II, mas com apenas dois núcleos
de processamento e sem cache L3.
O Athlon II X2 usa o soquete AM3, sendo compatível também placas-mãe AM2+
certificadas. Quando instalado em uma placa-mãe AM3 ele suporta memórias DDR3 mas se
instalado em uma placa-mãe AM2+ ele passa a trabalhar com memórias DDR2.
As principais características técnicas do Athlon II X2 são as seguintes:
Dois núcleos de processamento;
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;
1 MB ou 512 KB de cache de memória L2 por núcleo;
Barramento HyperTransport (HT) trabalhando a 2 GHz (8 GB/s). Esse clock pode também ser
referenciado como “4.000 MHz”;
Soquete AM3;
Configuração de memória em dois canais em todos os modelos (você precisa instalar um
número par de módulos de memória para usar este recurso);
Conjunto de instruções SSE4a (que é diferente das instruções SSE4 da Intel);
Tecnologia de fabricação de 45 nm.
4.1.6 Modelos do Athlon II X3
O Athlon II X3 é similar ao Athlon II X2 e ao Athlon II X4, mas com três núcleos de
processamento em vez de dois ou quatro. Como os demais membros da família Athlon, ele
não tem cache de memória L3.
O Athlon II X3 usa o soquete AM3, sendo compatível também placas-mãe AM2+
certificadas. Quando instalado em uma placa-mãe AM3 ele suporta memórias DDR3 mas se
instalado em uma placa-mãe AM2+ ele passa a trabalhar com memórias DDR2.
As principais características técnicas do Athlon II X3 são as seguintes:
Três núcleos de processamento;
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo
512 KB de cache de memória L2 por núcleo;
Barramento HyperTransport (HT) trabalhando a 2 GHz (8 GB/s). Esse clock pode também ser
referenciado como “4.000 MHz”;
Soquete AM3;
Configuração de memória em dois canais em todos os modelos (você precisa instalar um
número par de módulos de memória para usar este recurso);
Conjunto de instruções SSE4a (que é diferente das instruções SSE4 da Intel);
Tecnologia de fabricação de 45 nm.
4.1.7 Modelos do Athlon II X4
Athlon II X4 é semelhante ao processador Phenom II X4, porém sem cache de
memória L3. O Athlon II X4 usa o soquete AM3, sendo compatível também placas-mãe
AM2+ certificadas. Quando instalado em uma placa-mãe AM3 ele suporta memórias DDR3
mas se instalado em uma placa-mãe AM2+ ele passa a trabalhar com memórias DDR2.
As principais características técnicas do Athlon II X4 são as seguintes:
Quatro núcleos de processamento;
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;
512 KB de cache de memória L2 por núcleo;
Barramento HyperTransport (HT) trabalhando a 2 GHz (8 GB/s). Esse clock pode também ser
referenciado como “4.000 MHz”;
Soquete AM3;
Configuração de memória em dois canais em todos os modelos (você precisa instalar um
número par de módulos de memória para usar este recurso);
Conjunto de instruções SSE4a (que é diferente das instruções SSE4 da Intel);
Tecnologia de fabricação de 45 nm.
4.2 Turion
Lançado para ser o principal concorrente do Pentium M da Intel, o Turion da AMD é
um processador de baixo consumo voltado para o mercado de notebooks e está disponível em
duas versões: núcleo único ("single core") e dois núcleos ("dual core") de processamento.
O Turion 64 é baseado na arquitetura do Athlon 64 e a principal diferença entre o
Turion 64 e o Athlon 64 é o consumo: o Athlon 64 dissipa 65 W enquanto que o Turion 64
dissipa apenas 35 W (modelos ML), 31 W (modelos MK) ou 25 W (modelos MT). Uma outra
diferença entre eles é a quantidade de memória cache L2, que é de 1 MB nos processadores
Athlon 64, enquanto que os processadores Turion 64 podem ter memória cache L2 de 512 KB
ou 1 MB, dependendo do modelo.
Tanto o Turion 64 quanto o Athlon 64 possuem a tecnologia PowerNow! da AMD,
que é similar a tecnologia Cool’n’Quiet usado pelos processadores desktop. Esta tecnologia
altera o clock e a tensão de alimentação do processador de acordo com a carga de trabalho que
esteja sendo realizada, de modo a economizar bateria. Como você pode ver, esta tecnologia
compete com a tecnologia Enhanced SpeedStep da Intel.
As principais características do Turion 64 são as seguintes:
O processador não é vendido com base em seu clock de operação, mas através de um
“número de modelo”;
Apenas um núcleo de processamento ("single core");
64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados;
512 KB ou 1 MB de cache de memória L2, dependendo do modelo;
Barramento HyperTransport trabalhando a 800 MHz (3,2 GB/s). Este clock pode
também ser referenciado como “1.600 MHz”;
Suporte a memórias DDR em canal único (single channel) nos modelos soquete 754 e
suporte a memórias DDR2 em dois canais (dual-channel) nos modelos soquete S1;
Soquete 754 ou S1 (modelos MK-36 e MK-38);
Podem acessar até 1 TB (terabyte) de memória RAM (barramento de endereços de 40
bits, 2^40 = 1 TB);
Suporte às instruções MMX, 3Dnow!, SSE e SSE2 e SSE3;
Tecnologia PowerNow!;
Tencnologia EVP (Enhanced Vírus Protection), também conhecida como “NX Bit
Disable”, leia nosso tutorial sobre o assunto;
Tecnologia de 90 nanômetros;
Os processadores Turion 64 estão disponíveis em duas séries: ML, que tem dissipação
térmica máxima de 35 W, e MT, que tem dissipação máxima de 25 W. Quanto menor a
dissipação térmica, maior será a autonomia da bateria do seu notebook e menor será o calor
gerado.
4.2.1Modelos de Turion X2
A AMD usa quatro nomes diferentes para os modelos de Turion com tecnologia de
dois núcleos: Turion 64 X2 (modelos "TL"), Turion X2 (modelos "RM"), Turion X2 Ultra
(modelos "ZM") e Turion Neo X2 (modelo "L"). Apesar do nome diferentes, esses
processadores são idênticos. As principais diferenças entre esses modelos e o Turion original
é a presença de dois núcleos de processamento e o suporte a memórias DDR2 operando em
modo de dois canais, o que permite o acesso à memória a 128 bits por vez, dobrando a taxa de
transferência máxima teórica (os modelos soquete S1 do Turion de núcleo único também
aceita memórias DDR2 em dois canais).
Enquanto que o Turion 64 compete com o Pentium M e Core Solo, o Turion X2
compete com o Core Duo e Core 2 Duo.
O Turion 64 X2 possui as mesmas características básicas do Turion 64 com a adição
de:
Tecnologia de dois núcleos;
256KB, 512 KB ou 1 MB de cache de memória L2 por núcleo;
Barramento HyperTransport trabalhando a 800 MHz (3,2 GB/s), 1800 MHz (7,2 GB/s), 2000
MHz (8,0 GB/s) ou 2200 MHz (8,8 GB/s). Este clock pode também ser referenciado como
“1.600 MHz”, "3.600 MHz", "4.000 MHz" ou "4.400 MHz", respectivamente;
Suporte a memórias DDR2 em configuração de dois canais;
Soquete S1;
Tecnologia de fabricação de 65 nm ou 90 nm.
4.2.2 Modelos de Turion II
O Turion II é o Turion X2 fabricado com tecnologia de 45 nm. Existem duas linhas, o
Turion II (modelos M5xx) e Turion II Ultra (modelos M6xx).
Suas principais características são:
Tecnologia de dois núcleos;
256KB, 512 KB ou 1 MB de cache de memória L2 por núcleo;
Barramento HyperTransport trabalhando a 1800 MHz (7,2 GB/s). Este clock pode também ser
referenciado como "3.600 MHz";
Suporte a memórias DDR2 em configuração de dois canais;
Soquete S1;
Tecnologia de fabricação de 45 nm.
4.3 Phenom
Phenom é a série de processadores da AMD mais recente, baseada na nova
microarquitetura K10.
As principais diferenças entre o Phenom e o Athlon 64 são as seguintes:
Uso de um cache de memória L3;
Uso de um barramento HyperTransport 3.0 entre o processador e o chipset,
aumentando a largura de banda disponível entre o processador e o mundo externo;
É importante notar que até o momento os processadores Phenom não trabalham com o
desempenho máximo oferecido pelo barramento HyperTransport 3.0;
Uso de linhas separadas de alimentação para o processador e para o controlador de
memória, que está embutido dentro do próprio processador (esta tecnologia também é
conhecida como “split-plane” – “alimentação dividida” – ou DDPM, Dual Dynamic
Power Management, ou Gerenciamento Elétrico Dinâmico Duplo);
Uso de um gerador de clock para o controlador de memória com um valor fixo. Isto
resolve o problema que acontece com o Athlon 64 onde dependo do modelo do
processador as memórias não funcionam em seu desempenho máximo;
Suporte para memórias DDR2 até DDR2-1066/PC2-8500 (processadores Athlon 64
suportam até DDR2-800/PC2-6400) nos modelos para soquete AM2+; suporte para
memórias DDR3 nos modelos para soquete AM3, que também suportam memórias
DDR2 quando instalados em placas-mãe AM2+ certificadas.
Os processadores Phenom podem ser instalados em placas-mãe soquete AM2 antigas, mas
eles estarão limitados à taxa de transferência de 4.000 MB/s do HyperTransport 2.0, não
usufruirão da tecnologia DDPM e o controlador de memória trabalhará com a clock menor
(1,6 GHz).
Alguns modelos do Phenom II são projetados para uso em placas-mãe soquete AM3 e
funcionam com memórias DDR3 quando instalados nessas placas-mãe. Eles são, porém,
compatíveis com placas-mãe AM2+ certificadas, só que trabalham com memórias DDR2.
Até agora a AMD lançou modelos do Phenom de três e quatro núcleos e modelos de
Phenom II de dois, três, quatro e seis núcleos, com as seguintes especificações técnicas para
todos os modelos:
Cache de memória L1 de 128 KB por núcleo;
Cache de memória L2 de 512 KB por núcleo;
Cache de memória L3 de 2 MB compartilhado por todos os núcleos (4 MB ou 6 MB
nos modelos Phenom II);
Barramento HyperTransport 3.0 trabalhando a 1,6 GHz (6.400 mb/s), 1,8 GHz (7.200
MB/s), 2 GHz (8.000 MB/s), dependendo do modelo. Note que o HyperTransport 3.0
oferece taxas maiores (2,4 GHz/9.600 MB/s e 2,6 GHz/10.400 MB/s) que ainda não
estão sendo utilizadas;
Soquete AM2+ ou AM3 (alguns modelos do Phenom II);
Processo de fabricação de 65 nm (45 nm nos modelos Phenom II).
Conjunto de instruções "SSE4a", que é simplesmente a adição de duas novas instruções
SSE e não tem nada a ver com o SSE4.1 existente nos mais recentes processadores da Intel e
que traz 47 novas instruções.
Modelos "Black Edition" possuem o multiplicador de clock destravado, significando uma
maior capacidade para overclock, já que eles podem ser configurados como se fossem um
processador de clock mais elevado. Recurso de overclock automático nos modelos de Phenom
II X6
4.3.1 Modelos do Phenom X3
Os processadores Phenom com três núcleos de processamento são chamados "Phenom
X3". Modelos baseados na revisão "B2" (ou seja, aqueles cujo número do modelo termina em
"00") têm um bug na tabela de tradução de endereços (TLB). Modelos baseados na revisão B3
(aqueles com número do modelo terminado em "50") não sofrem esse problema.
4.3.2 Modelos do Phenom X4
Os processadores Phenom com quatro núcleos de processamento são chamados
"Phenom X4". Modelos baseados na revisão "B2" (ou seja, aqueles cujo número do modelo
termina em "00") têm um bug na tabela de tradução de endereços (TLB). Modelos baseados
na revisão B3 (aqueles com número do modelo terminado em "50") não sofrem esse
problema.
4.3.3 Modelos do Phenom II X2
Os processadores Phenom II X2 são os modelos do Phenom com dois núcleos
fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR2
(placas-mãe soquete AM2+ certificadas) ou DDR3 (placas-mãe soquete AM3).
4.3.4 Modelos do Phenom II X3
Os processadores Phenom II X3 são os modelos do Phenom com três núcleos
fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR3
(quando instalados em placas-mãe soquete AM3) e DDR2 (quando instalados em placas-
mãe soquete AM2+ certificadas).
4.3.5 Modelos do Phenom X4
Os processadores Phenom com quatro núcleos de processamento são chamados
"Phenom X4". Modelos baseados na revisão "B2" (ou seja, aqueles cujo número do modelo
termina em "00") têm um bug na tabela de tradução de endereços (TLB). Modelos baseados
na revisão B3 (aqueles com número do modelo terminado em "50") não sofrem esse
problema.
4.3.6 Modelos do Phenom II X2
Os processadores Phenom II X2 são os modelos do Phenom com dois núcleos
fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR2
(placas-mãe soquete AM2+ certificadas) ou DDR3 (placas-mãe soquete AM3).
4.3.7 Modelos do Phenom II X3
Os processadores Phenom II X3 são os modelos do Phenom com três núcleos
fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR3
(quando instalados em placas-mãe soquete AM3) e DDR2 (quando instalados em placas-
mãe soquete AM2+ certificadas).
4.3.8 Modelos do Phenom II X4
Os processadores Phenom II X4 são os modelos do Phenom com quatro núcleos
fabricados com tecnologia de 45 nm. Seu cache L3 é maior (4 MB ou 6 MB, dependendo do
modelo). Os modelos para soquete AM3 suportam memórias DDR3, mas quando instalados
em placas-mãe soquete AM2+ certificadas podem funcionar usando memórias DDR2.
4.3.9 Modelos do Phenom II X6
Os processadores Phenom II X6 são os modelos do Phenom com seis núcleos
fabricados com tecnologia de 45 nm. Seu cache L3 tem 6 MB. Eles usam soquete AM3 e
suportam memórias DDR3, mas quando instalados em placas-mãe soquete AM2+ podem
funcionar usando memórias DDR2. Uma novidade desses novos processadores é a adoção de
uma tecnologia de overclock automático similar à tecnologia Turbo Boost da Intel. Quando o
processador “sente” que três ou mais núcleos estão ociosos, ele aumenta o clock dos núcleos
ativos.
5 Tecnologia
5.1 Penryn
Penryn é o codinome do núcleo que é usado pelos processadores Core 2 e Xeon
baseados na microarquitetura Core fabricada com processo de 45 nm. Além do novo processo
de fabricação, este núcleo trará novos recursos.
A microarquitetura da Intel é chamada Core e é usada pelos processadores Core 2 e
pelos processadores Xeon.. Atualmente os processadores que usam esta microarquitetura são
fabricados com processo de 65 nm.
O núcleo Penryn é um aprimoramento da microarquitetura core, trazendo algumas
novas características:
Cache de memória L2 maior (até 6 MB para os processadores de dois núcleos e até 12 MB
para os processadores de quatro núcleos);
Caches com divisão de carga;
Barramentos externos mais rápidos (até 1.600 MHz);
Novo conjunto de instruções SSE4 (que traz 47 novas instruções SSE para o processador);
Tecnologia de Desligamento Profundo (Deep Power Down, apenas nos processadores para
notebooks);
Tecnologia de Aceleração Dinâmica Avançada (Enhanced Intel Dynamic Acceleration,
apenas nos processadores para notebooks);
Circuito divisor usando o algoritmo Raiz-16 (aprimoramento da unidade de ponto flutuante);
Unidade “Shuffle” aprimorada (aprimoramento da unidade de ponto flutuante);
Tecnologia de Virtualização Aprimorada (entre 25% e 75% de aumento de desempenho no
tempo de transição entre máquinas virtuais);
5.1.1Halt ,Deep Sleep ,Stop Clock, Deeper Sleep ,Enhanced Deeper Sleep e
Deep Power Down
Para economizar energia, os processadores para notebook da Intel podem reduzir suas
tensões de alimentação, desabilitar seus clock e até mesmo desabilitar seus caches de
memória quando estiverem ociosos. Isto é particularmente interessante para notebooks, onde
qualquer economia de energia reflete diretamente em maior autonomia da bateria.
Existem três modos básicos de economia de energia, chamados Parar (Halt ou C1),
Parar Clock (Stop Clock ou C2) e Sono Profundo (Deep Sleep ou C3). Quando nenhum modo
de economia de energia estiver sendo usado o processador estará trabalhando em sua carga
máxima e dizemos que ele está no modo C0. Esses modos de economia de energia são
genericamente chamados Estados C.
Com o primeiro processador de dois núcleos baseado no núcleo do Pentium M,
chamado Core Duo, a Intel permitiu que esses modos fossem configurados por núcleo, o que
significa que se um dos núcleos do processador estiver ocioso, o processador pode reduzir a
tensão de alimentação e desligar o clock para este núcleo, mantendo o outro núcleo
funcionando normalmente. Portanto os dois núcleos podem estar em diferentes Estados C.
Além disso, com este processador a Intel introduziu dois novos Estados C, Sono Mais
Profundo (Deeper Sleep ou C4) e Sono Mais Profundo Aprimorado (Enhanced Deeper Sleep
ou DC4), que podem apenas ser ativados para os dois núcleos ao mesmo tempo.
O núcleo Penryn traz um novo Estado C, chamado Desligamento Profundo (Deep
Power Down ou C6). Quando o processador entra neste modo, sua tensão de alimentação é
reduzida bastante, os sinais de clocks são desabilitados e ambos os caches de memória são
desligados. Este modo economiza mais energia do que todos os outros modos C disponíveis
até hoje, mas o processador demora mais tempo para voltar para o seu estado ativado.
5.1.2 Tecnologia de Aceleração Dinâmica Avançada
‘Quando um dos núcleos entra em um dos estados “Profundos” de economia de
energia (ou seja, do estado C3 em diante) o novo núcleo Penryn permite que outro núcleo
aumente seu clock (ou seja, ele faz um overclock nele mesmo) mantendo o consumo interno
do processador no mesmo nível. Como o núcleo inativo estará consumindo menos energia, o
núcleo ativo pode dissipar mais calor e consumir mais energia e ainda assim manter o
consumo e os requisitos de potência do processador dentro do valor padrão: o processador
estará consumindo a mesma quantidade de energia e estará dissipando a mesma quantidade de
calor (ou menos).
5.1.3 Aprimoramentos da Unidade de Ponto Flutuante
O núcleo Penryn traz dois aprimoramentos para a unidade de ponto flutuante do
processador, uma para sua unidade de divisão e outro para a sua unidade “shuffle”, que é
usada por instruções SSE.
5.1.4 Divisor Usando Algoritmo Raiz-16
Este é um aprimoramento no modo como a unidade de ponto flutuante do processador
manipula operações de divisão. Nos processadores Core 2, as operações de divisão
processam dois bits por pulso de clock. O novo circuito divisor implementado no Penryn é
capaz de processar quatro bits por pulso de clock, É duas vezes mais rápido em operações de
divisão do que os processadores Core 2.
5.1.5 Aprimoramento da Unidade “Shuffle”
Este é um aprimoramento no modo como a unidade de ponto flutuante do processador
manipula operações usadas pelas instruções SSE de formatação de dados, permitindo aos
processadores com núcleo Penryn executar algumas instruções em menos pulsos de clock se
comparado com o núcleo usado atualmente pelos processadores Core 2 Duo.
Várias instruções SSE de 128 bits que levam mais do que um pulso de clock para
serem processadas são agora processadas em apenas um pulso de clock, aumentando o
desempenho SSE. As extensões SSE (Streaming SIMD Extensions) são usadas em aplicativo
multimídia que implementam este tipo de instrução.
5.2 Nehalem
Esta arquitetura também será usada nos processadores para servidores (Xeon). Os
processadores baseados nesta arquitetura tem um controlador de memória DDR3 integrado de
três canais, três níveis de cache, a volta da tecnologia Hyper-Threading, um novo barramento
externo chamado QuickPath
Abaixo os principais recursos da arquitetura Nehalem:
Baseado na microarquitetura Intel Core;
De dois a oito núcleos;
Controlador de memória DDR3 integrado com três canais de memória;
Caches de memória L2 individuais de 256 KB para cada núcleo;
Cache de memória L3 de 8 MB;
Novo conjunto de instruções SSE 4.2 (sete novas intruções);
Tecnologia Hyper-Threading;
Modo Turbo (overclock automático);
Aprimoramentos na microarquitetura (suporte a fusão de instruções no modo de 64 bits,
detector de laços aprimorado, seis portas de despacho, etc);
Aprimoramentos na unidade de previsão de desvios, com a adição de um segundo Buffer de
Desvios (BTB, Branch Target Buffer);
Um segundo Buffer de Tradução de Endereços (TLB, Translation Look-aside Buffer) com
512 entradas;
Otimizado para as instruções SSE desalinhadas;
Aumento do desempenho da tecnologia de virtualização (melhora de 60% na latência de
virtualização em relação aos processadores Core 2 de 65 nm e melhora de 20% em relação
aos processadores Core 2 de 45 nm, segundo a Intel);
Novo barramento externo QuickPath;
Nova unidade de controle de energia;
Tecnologia de fabricação de 45 nm no lançamento, com futuros modelos de 32 nm
(processadores com codinome “Westmere”).
Novo soquete com 1.366 pinos.
É importante lembrar que os processadores Core 2 fabricados com tecnologia de 45 nm
têm recursos extras em relação aos processadores Core 2 com tecnologia de 65 nm. Todos
esses recursos estão presentes nos processadores baseados na arquitetura Nehalem e os mais
significativos deles são:
Novo conjunto de instruções SSE4 (que traz 47 novas instruções SSE para o
processador);
Tecnologia de Desligamento Profundo (Deep Power Down, apenas nos processadores
para notebooks, também conhecido como estado C6);
Tecnologia de Aceleração Dinâmica Avançada (Enhanced Intel Dynamic
Acceleration, apenas nos processadores para notebooks);
Circuito divisor usando o algoritmo Raiz-16 (aprimoramento da unidade de ponto
flutuante);
Unidade “Shuffle” aprimorada (aprimoramento da unidade de ponto flutuante);
Tecnologia de Virtualização Aprimorada (entre 25% e 75% de aumento de
desempenho no tempo de transição entre máquinas virtuais).
5.2.1 Controlador de Memória Integrado
Desde os primeiros processadores da Intel usa um barramento externo chamado
barramento frontal (Front Side Bus, FSB) que é compartilhado entre a memória e os demais
componentes do micro. Os processadores baseados na arquitetura Nehalem têm um
controlador de memória integrado e, portanto, têm dois barramentos: um barramento de
memória para conectar o processador à memória e um barramento de entrada/saída para
conectar o processador ao mundo externo.
Esta mudança proporciona um aumento de desempenho no micro por dois motivos:
primeiro porque agora nós temos dois caminhos de dados separados para o acesso à memória
e aos dispositivos de entrada/saída. Segundo porque o acesso à memória é mais rápido já que
o processador não precisa mais se comunicar primeiro com um controlador externo.
Nas Figuras 2 e 3 nós comparamos a arquitetura tradicional usada pelos processadores
da Intel e a nova arquitetura que será usada pelos novos processadores da Intel com
controlador de memória integrado
Figura 2: Arquitetura usada pelos atuais processadores da Intel.
Figura 3: Arquitetura usada pelos futuros processadores da Intel com controlador de memória
integrado.
Este novo barramento externo é chamado QuickPath Interconnect (QPI) e oferece dois
caminhos de dados separados (uma para transmissão e outro para recepção dos dados) para o
processador se comunicar com o chipset ou com outros processadores, no caso de servidores
com mais de um processador instalado. Como você pode ver, este barramento é o equivalente
ao HyperTransport usado nos processadores da AMD. A primeira versão do barramento
QuickPath trabalha com um clock de 3,2 GHz transferindo dois dados de 16 bits por pulso de
clock, resultando em uma taxa de transferência máxima teórica de 12,8 GB/s em cada direção.
Os processadores para desktop têm apenas um barramento QuickPath, enquanto que os
processadores para servidores têm dois barramentos independentes para permitir a
comunicação entre eles em ambientes de multiprocessamento simétrico (SMP).
O controlador de memória integrado nos processadores baseados na arquitetura
Nehalem oferece três canais de memória, o que significa que ele é capaz de acessar três
módulos de memória ao mesmo tempo, em paralelo, aumentando assim o desempenho – em
teoria a arquitetura de três canais oferece um aumento de 50% na largura de banda em relação
a arquitetura de dois canais rodando com o mesmo clock.
Portanto para obter o maior desempenho possível com os processadores baseados na
arquitetura Nehalem, como é o caso do Core i7, você precisará instalar três ou seis (caso sua
placa-mãe tenha seis soquetes de memória) módulos de memória. A maioria dos
Computadores tem 2 GB ou 4 GB (dois ou quatro módulos de memória instalados na
configuração de dois canais) enquanto que com o processador Core i7 você precisa ter um
microcomputador com 1,5 GB, 3 GB ou 6 GB para atingir o maior desempenho possível (três
ou seis módulos de memória instalados na configuração de três canais).
Algumas placas-mãe voltadas para os processadores Core i7 tem quatro soquetes de
memória, como é o caso da placa-mãe "Smackover" da Intel, baseada no chipset Intel X58. Se
instalar quatro módulos de memória, terá mais memória disponível, mas diminuirá o
desempenho do micro. Se instalar 4 GB (quatro módulos de 1 GB), o micro acessará os
primeiros 3 GB no modo de três canais, mas a área de memória entre 3 GB e 4 GB será
acessada com o desempenho de um único canal. Portanto, a menos que você realmente
precise de mais memória RAM, equipe o seu micro com 1,5 GB, 3 GB ou 6 GB de memória.
Outros fabricantes já anunciaram que fabricarão placas-mãe com seis soquetes, portanto
nestas placas você terá de instalar memórias de três em três para atingir o
máximo desempenho possível.
Com o modo de três canais o processador acessará a memória a 192 bits por vez (3 x
64 bits), se você tiver três ou seis módulos de memória instalados. Isto resulta em uma taxa de
transferência máxima teórica de 25,58 GB/s, caso memórias DDR3-1066 sejam usadas.
O controlador de memória integrado nos processadores Nehalem aceita apenas
memórias DDR3 – sem suporte para memórias DDR2.
Por causa do controlador de memória integrado a Intel mudou o padrão de pinagem do
processador para um novo soquete de 1.366 pinos. Portanto não poderá fazer um upgrade do
atual processador Intel para um processador Core i7 trocando apenas o processador; terá que
trocar também a placa-mãe e provavelmente as memórias, caso você não tenha memórias
DDR3.
5.2.2 Cache de Memória
O cache de memória, a Intel usará a mesma abordagem de cache que a AMD está usando em
seus processadores Phenom, caches L2 individuais para cada núcleo e um cache de memória
L3 compartilhado. Cada cache de memória L2 será de 256 KB e o cache L3 será de 8 MB. O
cache L1 permanece igual ao Core 2 Duo (64 KB, 32 KB para instruções e 32 KB para
dados).
Os processadores Core 2 Duo têm apenas um cache de memória L2, que é
compartilhado entre os dois núcleos do processador, mas os processadores de quatro núcleos
da Intel, como o Core 2 Quad e o Core 2 Extreme têm dois caches L2, cada um compartilhado
por cada grupo de dois núcleos.As arquiteturas de cache disponíveis nas Figuras 4 e 5.
Figura 4: Uma comparação entre as arquiteturas de cache.
Figura 5: Uma comparação entre as arquiteturas de cache.
5.2.3 Aprimoramentos no Pipeline do Processador
Como mencionado, a arquitetura Nehalem (Core i7) é baseada na arquitetura usada pelo
processador Core 2 Duo, adicionando alguns aprimoramentos na maneira como as instruções
fluem dentro do processador. Nesta página descreveremos esses aprimoramentos.
O processador Core 2 Duo, a propósito, é baseado na arquitetura do Pentium M, que por
sua vez é baseada na arquitetura usada pelos processadores Pentium III. Todos esses
processadores são de 6ª geração (se você rodar a instrução CPUID todos eles retornarão “6”
no campo “Família”). O Pentium 4 era um processador Intel de 7ª geração usando uma
microarquitetura completamente diferente – os processadores Core 2 e Core i7 é diferente do
Pentium 4. Na Figura 6 é a genealogia da microarquitetura Nehalem. Também os principais
aprimoramentos trazidos por cada novo processador;
Figura 6: Árvore genealógica da microarquitetura Nehalem.
Os programas são escritos usando instruções x86 (também chamadas “macro-ops” ou
simplesmente “instruções”), que não são entendidas pelas unidades de execução do
processador. Elas precisam primeiro ser decodificadas em microinstruções (também
chamadas “micro-op” ou “µop”). Esta arquitetura híbrida CISC/RISC foi introduzida pelo
Pentium: o processador recebe instruções x86 (CISC), mas executa microinstruções
proprietárias (RISC).
A microarquitetura Core, usada nos processadores Core 2, introduziu o conceito de
fusão de instruções (“macro-fusion”), que é a capacidade de combinar duas instruções x86
dentro de apenas uma microinstrução. Isto aumenta o desempenho e diminui o consumo do
processador, já que ele executará apenas uma microinstrução em vez de duas, é limitado a
instruções de desvio condicional e de comparação (Instruções CMP, TEST e Jcc).
A microarquitetura Nehalem aumenta a capacidade da fusão de instruções de duas
formas. Primeiro adicionando suporte a várias instruções condicionais que não poderiam ser
fundidas nos processadores Core 2. Segundo, nos processadores baseados na microarquitetura
Nehalem a fusão de instruções é usada nos modos de 32 bits e de 64 bits, enquanto que nos
processadores Core 2 a fusão de instruções funciona apenas quando o processador está
trabalhando no modo de 32 bits.
A microarquitetura Core adicionou um detector de laços (“Loop Stream Detector”),
basicamente um pequeno cache de 18 instruções entre as unidades de busca e de
decodificação do processador. Quando o processador está executando um laço de repetição
(mais conhecido como “loop”, parte de um programa que se repete várias vezes) o
processador não precisa buscar as instruções requeridas novamente do cache L1 de instruções:
elas já estão próximas da unidade de decodificação. O processador desliga as unidades de
busca e de previsão de desvio quando detecta a execução de um laço, fazendo com que o
processador consuma menos energia.
Nos processadores baseados na microarquitetura Nehalem este pequeno cache foi
movido para após da unidade de decodificação de instruções. Portanto, em vez de armazenar
instruções x86 como nos processadores Core 2, este cache guarda até 28 microinstruções
(micro-ops). Isto faz com que exista um aumento de desempenho quando o processador está
executando um laço de repetição, já que ele não precisa decodificar as instruções presentes no
laço: elas já estarão decodificadas dentro deste pequeno cachê(figura 7). O processador pode
desligar a unidade de decodificação de instruções além das unidades de busca e previsão de
desvio quando detecta a execução de um laço, fazendo com que o processador economize
ainda mais energia.
Figura 7: Localização do detector de laços nos processadores Core e Nehalem.
Figura 8: Portas de despacho e unidades de execução.
A arquitetura Nehalem adicionou uma porta de despacho extra e agora tem 12
unidades de execução, como você pode ver acima. Com isso os processadores baseados nesta
arquitetura podem ter mais microinstruções sendo executadas ao mesmo tempo do que os
processadores anteriores (Figura 8).
A microarquitetura Nehalem adicionou também dois buffers extras: um segundo
Buffer de Tradução de Endereços (TLB, Translation Look-aside Buffer) com 512 entradas e
um segundo Buffer de Desvios (BTB, Branch Target Buffer). A adição desses dois buffers
aumenta o desempenho do processador.
O TLB é uma tabela usada pelo circuito de memória virtual para conversões entre
endereços físicos e endereços virtuais. A memória virtual é uma técnica onde o processador
simula mais memória RAM em um arquivo no disco rígido (arquivo de troca) para permitir
que o microcomputador continue operando mesmo quando não há memória RAM suficiente
disponível (o processador pega o que está na memória RAM, armazena neste arquivo de troca
e então libera espaço na memória para uso).
A previsão de desvios é um circuito que tenta “adivinhar” os próximos passos de um
programa, carregando para dentro do processador as instruções que ele acha que o
processador tentará carregar. Se ele estiver certo, o processador não perderá tempo carregando
essas instruções da memória, já que elas já estarão dentro do processador. Aumentando o
tamanho desse buffer (ou adicionando um segundo buffer, no caso dos processadores
baseados na microarquitetura Nehalem) permite que este circuito carregue antecipadamente
ainda mais instruções, aumentando o desempenho do processador.
5.2.4 Aprimoramentos no Gerenciamento de Energia
Os transistores dentro do processador funcionam como chaves, com dois estados
possíveis: condutivo (também chamado “modo de saturação”), funcionando como uma chave
fechada, e não-condutivo (também chamado “modo de corte”), funcionando como uma chave
aberta. O problema é que quando os transistores estão no estado não-condutivo eles
teoricamente não deveriam permitir nenhum tipo de passagem de corrente, porém uma
pequena quantidade acaba passando. Esta corrente é chamada corrente de fuga e se você
somar todas as correntes de fuga você terá uma quantidade significativa de corrente (e
consequentemente potência) sendo desperdiçada, gerando calor desnecessariamente.
Atualmente um dos desafios nos projetos de processadores tem sido a tentativa de eliminar a
corrente de fuga.A arquitetura Nehalem traz uma unidade de controle de energia dentro do
processador que é responsável por melhorar o gerenciamento de energia (veja na Figura 9).
Esta unidade reduz a corrente de fuga além de permitir o novo “Modo Turbo”, que falaremos
na próxima página. Basicamente, o processador pode agora alimentar com diferentes tensões
e clocks cada núcleo, as unidades fora dos núcleos, o controlador de memória, o cache e as
unidades de entrada/saída. Nos processadores anteriores todos os núcleos tinham de trabalhar
com o mesmo clock, mas nos processadores Nehalem cada núcleo pode ser programado para
rodar com um clock diferente com o objetivo de economizar energia.
Figura 9: Unidade de controle de energia.
A unidade de controle de energia embutida pode agora desligar qualquer um dos
núcleos do processador, recurso este não disponível em processadores Core 2 para notebooks.
O processador pode colocar qualquer núcleo no modo C6 (“desligamento profundo”)
independente do estado de funcionamento dos outros núcleos. Isto permite economizar
energia quando o micro está rodando normalmente, porém com um ou mais núcleos ociosos e
que podem ser desligados.
5.2.5 Modo Turbo
A unidade de controle de energia embutida também incluiu sensores da potência
dissipada por cada núcleo. Dessa forma o processador sabe a potência que cada núcleo está
consumindo e a quantidade de calor que está sendo dissipada. Isto permitiu a adição de um
“Modo Turbo” no processador.
O Modo Turbo permite ao processador aumentar o clock do(s) núcleo(s) ativo(s). Esta
não é nova e o Core i7 não é o primeiro processador a usá-la (alguns processadores Xeon
baseados na arquitetura Netburst –a arquitetura do Pentium 4 – têm este recurso, conhecido
como tecnologia “Foxton”). Mas nas encarnações antigas desta tecnologia este recurso só
podia ser usado quando os outros núcleos de processamento estavam ociosos.
Este novo modo é um sistema de laço fechado. O processador está constantemente
monitorando sua temperatura e consumo. O processador fará um overclock dos núcleos ativos
até que o processador atinja seu TDP máximo permitido, baseado no cooler que você estiver
usando. Isto é configurado no setup da placa-mãe. Por exemplo, se você disser que o cooler do
processador é capaz de dissipar 130 W, o processador aumentará (ou reduzirá) o seu clock de
modo que a sua potência seja compatível com a quantidade de potência que o cooler do
processador consegue dissipar. Se substituir o cooler do processador por um melhor, terá que
configurar no setup da sua placa-mãe o TDP do novo cooler (a quantidade máxima de potência
térmica que ele pode dissipar) para que o Modo Turbo aumente o clock do processador.
O processador não tem que necessariamente desligar os núcleos que não estejam sendo
usados para habilitar o Modo Turbo. Mas como esta técnica de overclock dinâmica é baseada
na quantidade de potência que você pode dissipar usando o cooler do seu processador,
desligar os núcleos que não estejam sendo usados reduzirá o consumo do processador e a
dissipação de potência e conseqüentemente permitirá um overclock maior. O novo Modo
Turbo é uma extensão da tecnologia SpeedStep e é por isso que ele é visto pelo micro como
um recurso SpeedStep. Ele funcionará apenas para os núcleos do processador, e por isso o
controlador de memória e o cache de memória não serão afetados por esta tecnologia.
6 Outros Recursos
A tecnologia Hyper-Threading permite que cada núcleo do processador seja reconhecido
como dois processadores. Dessa forma, se você tem um processador Core i7 com quatro
núcleos o sistema operacional o reconhecerá como sendo um processador de oito núcleos.
Esta tecnologia é baseada no fato de que quando o processador está trabalhando existem
certos circuitos internos que ficam ociosos e que poderiam ser usados. Originalmente lançada
para os processadores Pentium 4 esta é a primeira vez que a tecnologia Hyper-Threading está
disponível nos processadores Intel de 6ª geração. Esta tecnologia também é chamada SMT ou
Simultaneous Multi-Threading (SMT). Esta tecnologia não oferece o mesmo ganho de
desempenho de como se núcleos “de verdade” fossem usados (um processador com 8 núcleos
é mais rápido do que um processador com 4 núcleos com tecnologia HT, desde que ambos
estejam trabalhando com o mesmo clock e sejam baseados na mesma arquitetura); porém
você está ganhando esses “núcleos extras”. Existem dois tipos de instruções SSE que acessam
a memória: alinhadas e desalinhadas. As instruções alinhadas precisam que os dados
requisitados estejam dentro do limite de endereçamento de 16 bytes (128 bits), enquanto que
as instruções desalinhadas não. (Figura 10)
Figura 10: Instruções alinhadas vs. Desalinhadas