Upload
fabricio-pinheiro
View
3.561
Download
2
Embed Size (px)
DESCRIPTION
Web seminário realizado dia 11 de abril de 2008, às 15h (horário de Brasília) tendo como palestrante Roberto Brandão, Gerente de Tecnologia da AMD South America Ltda. Para que não pode participar, pode conferir aqui a apresentação com o audio. Link do áudio: http://bizrevolution.typepad.com/AMDPhenom32.mp3
Citation preview
AMD Web SeminárioCapítulo 1 – AMD Phenom
Roberto BrandãoGerente de Tecnologia
AMD South America
Nessa apresentação
• Introdução
• Linha de produtos AMD
• Atualização sobre a tecnologia AMD 64
• O AMD Phenom
• A plataforma para o AMD Phenom
• Análise competitiva
04/13/23
Computing
Digital TVs
GameConsoles
Handhelds
A nova AMD – Parceiros e Produtos
História dos Processadores AMD
1991 1992 1993 1994 1995 1996 1997 1998 1999
1999 2000 2001 2002 2003 2004 2005 2006 2007
am386 am486
Dual CoreDual Core Quad CoreQuad Core
Notebooks1 e 2 núcleos
Plataforma certificada
Notebooks1 e 2 núcleos
Plataforma certificada
Servidores2 e 4 núcleos
1 a 8 processadores
Aceleradores numéricos
Servidores2 e 4 núcleos
1 a 8 processadores
Aceleradores numéricos
Desktops1 a 4 núcleosDesktops
1 a 4 núcleos
AMD para computadores
Infra-estrutura Infra-estrutura
Chipsets Placas gráficas
Arquitetura AMD de 10ª geração – K10
A arquitetura AMD64
ChipsetChipsetPCI-EPCI-E
PCI-EPCI-E
USBUSB
PCIPCI
USBUSB
PCIPCI
PCI-EPCI-E
PCI-EPCI-EChipsetChipset
Outro
Pontos a considerar
• Latência no acesso à memória
• Largura de banda total
• Independência dos barramentos
• Tamanho do cache necessário
• Complexidade do chipset
FSBHyper Transport
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Núcleo1
Núcleo2
Núcleo1
Núcleo2
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Cache
Cache Cache
CROSSBAR
Otimizações internas à CPUmulticore mais eficiente
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo4
Cache L2 Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1 Aplicação 2
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1 Aplicação 2
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1 Aplicação 2
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1 Aplicação 2 Aplicação 3
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1 Aplicação 2 Aplicação 3 Aplicação 4
GARGALO
Cache L3
Otimizações internas à CPUquad-core nativo
PCI /
PC
I-e PCI / PC
I-e
Chipset
FSB
Chipset
HyperTransport
Arquitetura convencional Arquitetura AMD64
Controlede
memória
Controlede
memória
InterfaceHyper
Transport
Núcleo1
Núcleo1
Núcleo2
Núcleo2
Núcleo1
CacheL2
CROSSBAR
Núcleo3
Núcleo3
Núcleo4
Núcleo4
Cache L2Cache L2 Cache L2Cache L2
Núcleo2
CacheL2
Núcleo3
CacheL2
Núcleo4
CacheL2
Aplicação 1 Aplicação 2 Aplicação 3 Aplicação 4
GARGALO
Otimizações internas à CPUquad-core nativo – impacto em múltiplas aplicações
Aplicação 1
1 1
Aplicação 2
2 2
Aplicação 3
3
3
Aplicação 4
4
4
Concorrente AMD – Multi-core nativo
Um processador com menor consumo
Melhor Performance por watt quando exigido
Maior Economia quando ocioso
• Economia de energia
• Menor necessidade de infra-estrutura elétrica
• Menor consumo de ar condicionado
• Diminuição do ruído ambiente
• Redução estatística do número de falhas
• Menos manutenção requerida
• Maior capacidade de upgrade
• Utilização consciente da energia
Tecnologia AMD CoolCore™ Desliga blocos funcionais ociosos automaticamente
Controle de blocos Ex: FPU (parte mais quente)
Controlador de Memória Leitura escrita desligada
Escrita leitura desligada
Controle Fino Seções pequenas são
desligadas
FPU
Memory ControllerL3
L1
FPU
Memory ControllerL3
L1
L2L1
Core 1 Core 2
Core 3 Core 4
Tempo de resposta dos componenetes desligados: zero!
Controladores de memória independentesAMD Memory Optimizer Technology
Modo “Ganged” Controladores Independentes
Exemplo
Ganged
64-bit + 64-bit = Um Canal de 128-bits Dois Canais 64-bits
Data A Data B
Data E Data F
Requer dois acessos à memória
Desperdício de largura de banda
+
Independente
Data A Data F
Duas linhas no mesmo fetch
Um único acesso à memória
Banda melhor aproveitada
Data A Data B
Data E Data F
Data C Data DData E Data F
Data A Data B
Row123
Data C Data D
+
Alocação dinâmica de modo de acesso à memória
O AMD Phenom
AMD Athlon™
Alta eficiência single e dual-core
AMD Sempron™
Computação do dia-a-diaSingle-core
AMD Phenom™ FXUltimate Performance
True Quad-core
AMD 2008 Desktop Posicionamento de produtos
AMD Phenom™
True Quad- and Triple-core
Renderização de filmes 40% mais rápida
Servidor multimídia para disponibilizar seus vídeos para dispositivos móveis
Visualização de vídeos em alta definição
Até 50% melhor performance para jogos em múltiplos monitores com alta
resolução
Vantagens do AMD PhenomMedidas onde importa – nas aplicações reais
Lançamentos recentesAMD Phenom™ X4AMD Phenom™ X4 9850 Black Edition Processor
Multiplicador de frequência destravado
Clock inicial de 2.5GHz
Caixa “Black Edition” – inclui cooler
AMD Phenom™ X4 9750 Clock de 2.4 GHz Processor-in-a-box
AMD Phenom™ X4 9550 Clock de 2.2 GHz Processor-in-a-box
AMD Phenom™ X4 9100e Clock de 1.8 GHz Processor-in-a-box Apenas 65W TDP
Características do AMD Phenom™
• Processador de núcleos múltiplos, com 3 ou 4 núcleos integrados em uma única pastilha de silício
• Excelente escalabilidade multi-tarefa: um processador feito para rodar várias aplicações pesadas ao mesmo tempo
• Utiliza sistema dinâmico de caches, com caches L2 para alta disponibilidade e cache L3 de distribuído
• Tecnologia HyperTransport 3.0, com velocidade de barramento de até 5.2GHz
• Controlador de memória DDR2 dinâmico integrado ao processador: performance muito maior para sistemas com grandes quantidades de memória RAM
• Compatível com socket AM2 e AM2+
• Mesmo consumo de energia do Athlon 64 X2
• Gerenciamento de energia independente por core
A plataforma do AMD Phenom
Plataformas AMDVisão sobre as tendências em desktops
Vídeo de alta definição
• Multi-core nativo• Barramento HyperTransport de até 5.2GHz
• Suporte a Multi-GPU• Suporte a PCI Express® 2.0 e DirectX 10.1
Performance escalável
Melhor experiência ao usar o PC
• Saídas HDMI e Display Port• Áudio Digital Surround
• Tecnologia Cool’n’QuietTM 2.0• Alta performance com muita memória
• Suporte a Blu-Ray, H.264, MPEG-4, etc• Sistemas com múltiplos monitores• Aceleração gráfica em gráficos integrado e externo• Vídeo em Full HD - 1080P com UVD
• Suporte a Blu-Ray, H.264, MPEG-4, etc• Sistemas com múltiplos monitores• Aceleração gráfica em gráficos integrado e externo• Vídeo em Full HD - 1080P com UVD
Características da Plataforma
AM2 AM2+ AM3
HyperTransport™ HT 1.0 and HT 2.0 HT 3.0 HT 3.0
Memory DDR2 400-800 DDR2 400-1066* DDR3 1333
Processor Power Planes Single Dual Dual
VIDs Parallel Parallel / Serial Serial
Thermal Monitor Diode Diode Thermal Sense Interface (TSI)
Flash BIOS 4 M-bit 8 M-bit 8 M-bit
Max Power Delivery 95A Core & Northbridge 110A Core / 20A Northbridge 110A Core / 20A Northbridge
28
?Processador
Plataforma
Estabilidade de plataformaFlexibilidade para upgrade para otimizar investimento
Chipsets AMD
CPU
Chipset
GPU CM
Vídeo MemóriaVídeo
FSB
CPU
Chipset
GPU
CM
Vídeo
Memória
Vídeo
Hyper Transport
Concorrente AMD
Melhores gráficos... alterando o processador?
Evolução em detalhes
31
Windows Vista
Windows Vista Capable PC• “A modern processor” (at least 800MHz) • 512 MB of system memory • 4 GB of hard drive capacity with 15 GB free space• A graphics processor that is DirectX 9 capable
Windows Vista Premium Ready PC• 1 GHz processor 32-bit (x86) or 64-bit (x64) • 1 GB of system memory• 15 GB of hard drive capacity with 15 GB free space • Support for DirectX 9 graphics with a WDDM driver, 128 MB of graphics memory (minimum), Pixel Shader 2.0 and 32 bits per pixel • DVD-ROM Drive • Audio output capability• Internet access capability
Chipset AMD 690
Tratamento digital de
imagem em IGPVista Aero
Suporte a Full HD
Plataformaestável
Melhor qualidade de
imagem
Vídeos com melhor
definição
Vista Premium Ready
Aceleradores 2D/3D inéditos
em IGP
Suporte nativo a DVI e HDMI
Controladores SATA de alta performance
Suporte a multi-monitor
Plataforma estável e
confiável para clientes
corporativos
Eficiente no uso de energia
Plataforma certificada pela
AMD
34
Chipsets AMD – Gráficos externos
HT 3.0 PCIe Gen 2.0 PCIe Slots
Aplicações GPUs Direct X
- Gaming
- CAD
- Foto
- Vídeo
- Gaming
- CAD
- Foto
- Vídeo
Multi-Monitor Gaming
Ultimate DirectX10 Performance
Chipset AMD 780Novo chipset AMD para socket AM2+
Suporte a DirectX 10
Suporte a UVD
Hyper Transport 3.0
Plataforma eficiente em energia
Vídeo de alta definição
Suporte a Crossfire Híbrido
Análise Competitiva
Posicionamento de mercado
Processador
Preço
Escritório
Multi-tasking
Mega-tasking
Entretenimento
Criação de conteúdomultimídia
Games
MuitoImportante
Importante
Neutro
PoucoImportante
Felltop Benchmark
Office Productivity Version Description
PC WorldBench 6 BETA v6 BETA 2 Industry standard benchmark
SYSmark® 2007 Preview 2007-release Preview release of the next generation of this family of industry standard benchmarks.
Office FX v2.0.0.0 Benchmark included in Office FX software by manufacturer.
Windows send-to zip Windows Vista native
zip tool Compression of 500MB of common files (mp3, doc, etc.) with Windows Vista native zip compression feature.
Digital Media
Nero v7.10.1.0HD Video file transcode from Apple Quicktime (mov) to MPEG4 file for viewing on mobile devices.
iTunes ACC v7.11iTunes native lossless codec (AAC) from pre-ripped WAV files, such as those from a CD.
POV-Ray Raytracer BETA v22 Real-time ray tracing, essentially the computation of light as it goes from source to surface, of a digital image to produce texture and lighting effects.
Movie Maker “European Vacation”
Movie Maker in Windows Vista 32
Set of high resolution vacation digital pictures rendered into WMV-based digital slide show, with transitions.
Graphics
3D Mark® 06 (hardware) v1.3.0 Running the 3DMark test using the GPU as the render engine for the vertex shaders, creating texture and lighting on surfaces inside the game.
3D Mark® 06 (CPU) v1.1.0 3D Mark® 06 hardware test sub-score
3D Mark® 06 (software) v1.1.0 Running the 3DMark test using the CPU as the render engine for the vertex shaders, creating texture and lighting on surfaces inside the game.
70%10% 30% 50%20% 40% 60% 80% 90% 100% 110%
Análise competitivaOffice Productivity + Digital Media + Games
AMD Phenom™ X4 e AMD Phenom X3Sistemas utilizando chipsets do fabricante do processador e vídeo externo
Usando Windows Vista Ultimate
95.1%AMD Phenom™ X3 8650Projection (2.3GHz)
102.3%AMD Phenom™ X4 9650(2.3GHz)
98.5%AMD Phenom™ X3 8750Projection (2.4GHz)
105%AMD Phenom™ X4 9750(2.4GHz)
108.6%AMD Phenom™ X4 9850(2.5GHz)
100%AMD Phenom™ X4 9550 (2.2GHz)
AMD PhenomEspecificações dos modelos em produção
Modelo Clock TDPCache
L2Cache
L3Barramento
HyperTransport
AMD Phenom X4 9850 2.5GHz 125W 2.0MB 2.0MB 4000Mhz
AMD Phenom X4 9750 2.4GHz 95W 2.0MB 2.0MB 3600Mhz
AMD Phenom X4 9650 2.3GHz 95W 2.0MB 2.0MB 3600Mhz
AMD Phenom X4 9550 2.2GHz 95W 2.0MB 2.0MB 3600Mhz
AMD Phenom X4 9600 2.3GHz 95W 2.0MB 2.0MB 3600Mhz
AMD Phenom X4 9100e 1.8GHz 65W 2.0MB 2.0MB 3200Mhz
AMD Phenom X3 8750 2.4GHz 95W 1.5MB 2.0MB 3600Mhz
AMD Phenom X3 8650 2.3GHz 95W 1.5MB 2.0MB 3600Mhz
AMD Phenom X3 8450 2.1GHz 95W 1.5MB 2.0MB 3600Mhz
AMD Phenom X3 8600 2.3GHz 95W 1.5MB 2.0MB 3600Mhz
Posicionamento de preço
6000+
$153
Triple-Core
Quad-Core
Intel E8400 $260
9850
$2359750
$2159550
$195
Intel QuadCore
$250
AMD Q2 SSBP prices and Intel prices on newegg.com as of 03/26/08
Dual-Core
8750
$1958650
$1758450
$155
O AMD Phenom X3 oferece até 30% melhor performance que
concorrente dual-core de mesmo preço
O processador AMD Phenom X4 oferece até
20% melhor performance por preço que
processadores quad-core concorrentes
Características do AMD Phenom™
• Processador de núcleos múltiplos, com 3 ou 4 núcleos integrados em uma única pastilha de silício
• Excelente escalabilidade multi-tarefa: um processador feito para rodar várias aplicações pesadas ao mesmo tempo
• Utiliza sistema dinâmico de caches, com caches L2 para alta disponibilidade e cache L3 de distribuído
• Tecnologia HyperTransport 3.0, com velocidade de barramento de até 5.2GHz
• Controlador de memória DDR2 dinâmico integrado ao processador: performance muito maior para sistemas com grandes quantidades de memória RAM
• Compatível com socket AM2 e AM2+
• Mesmo consumo de energia do Athlon 64
• A melhor performance por preço para aplicações reais