AMD가 헤테로지니어스 차세대 카베리 APU 공식 발표.
AMD 카베리는 글로벌 파운드리의 28나노 SHP 공정으로 제조, 아키텍쳐의 주요 특징은 CPU와 GPU를 동급 선상으로 취급하여 연산 성능을 극대화 할 수 있는 HSA, CPU와 GPU의 메모리를 공유하는 HUMA, 실행 큐를 CPU와 GPU에서 공유하는 HQ가 기술의 핵심 포인트
CPU 코어는 개선된 스팀롤러 코어 / GPU는 GCN 아키텍쳐로 새로운 트루오디오, VCE2, UVD4 기술등을 지원
AMD 45W Bulldozer Based APUs | ||||
Trinity | Richland | Kaveri | ||
Model | - | A8-6500T | A8-6700T | A8-7600 |
Core Name | - | Richland | Richland | Kaveri |
Microarch | - | Piledriver | Piledriver | Steamroller |
Socket | - | FM2 | FM2 | FM2+ |
Modules/Cores | - | 2/4 | 2/4 | 2/4 |
CPU Base Freq | - | 2100 | 2500 | 3100 |
Max Turbo | - | 3100 | 3500 | 3300 |
TDP | - | 45W | 45W | 45W |
L1 Cache | - | 128KB I$ 64 KB D$ |
128 KB I$ 64 KB D$ |
192 KB I$ 64 KB D$ |
L2 Cache | - | 2x2 MB | 2x2 MB | 2x2 MB |
Graphics | - | HD 8550D | HD 8650D | R7 |
GPU Cores | - | 256 | 284 | 384 |
GPU Clock | - | 720 | 720 | 720 |
Max DDR3 | - | 1866 | 1866 | 2133 |
Current Price | - | N/A | N/A | $119 |
기존 45와트 계열 리치랜드와 카베리 7600의 스펙 비교. CPU가 스팀롤러로, 소켓은 FM2+(기존 메인보드 호환), 2모듈 4코어, 동작클럭 3.1GHz, 부스트 클럭 3.3GHz, TDP 45와트, L1 캐쉬 192KB로 증가, GPU 코어 384 유닛, GPU 클럭 720MHz, GPU 메모리 2133MHz, 가격은 119달러.
AMD 95-100W Bulldozer Based APUs | ||||||
Trinity | Richland | Kaveri | ||||
Model | A8-5600K | A10-5800K | A8-6600K | A10-6800K | A10-7700K | A10-7850K |
Core Name | Trinity | Trinity | Richland | Richland | Kaveri | Kaveri |
Microarchi | Piledriver | Piledriver | Piledriver | Piledriver | Steamroller | Steamroller |
Socket | FM2 | FM2 | FM2 | FM2 | FM2+ | FM2+ |
Modules/Cores | 2/4 | 2/4 | 2/4 | 2/4 | 2/4 | 2/4 |
CPU Base Freq | 3600 | 3800 | 3900 | 4100 | 3500 | 3700 |
Max Turbo | 3900 | 4200 | 4200 | 4400 | 3800 | 4000 |
TDP | 100W | 100W | 100W | 100W | 95W | 95W |
L1 Cache | 128KB I$ 64KB D$ |
128KB I$ 64KB D$ |
128KB I$ 64KB D$ |
128KB I$ 64KB D$ |
192KB I$ 64KB D$ |
192KB I$ 64KB D$ |
L2 Cache | 2 x 2 MB | 2 x 2 MB | 2 x 2 MB | 2 x 2 MB | 2 x 2 MB | 2 x 2 MB |
Graphics | HD 7560D | HD 7660D | HD 8570D | HD 8670D | R7 | R7 |
GPU Cores | 256 | 384 | 256 | 384 | 384 | 512 |
GPU Clock | 760 | 800 | 844 | 844 | 720 | 720 |
Max DDR3 | 1866 | 1866 | 1866 | 2133 | 2133 | 2133 |
Current Price | $100 | $130 | $120 | $140 | $152 | $173 |
기존 95와트 계열 리치랜드와 카베리 7850k 비교. 기존 7600과 기본 스펙은 동일하며 동작 클럭 3.7GHz로 상승, TDP 95와트, GPU 코어 유닛이 512로 증가, 가격은 173달러
AMD APU Details | ||||
Core Name | Llano | Trinity | Richland | Kaveri |
Microarch | K10 | Piledriver | Piledriver | Steamroller |
CPU Example | A8-3850 | A10-5800K | A10-6800K | A10-7850K |
Threads | 4 | 4 | 4 | 4 |
Cores | 4 | 2 | 2 | 2 |
GPU | HD 6550 | HD 7660D | HD 8670D | R7 |
GPU Arch | VLIW5 | VLIW4 | VLIW4 | GCN 1.1 |
GPU Cores | 400 | 384 | 384 | 512 |
Die size / mm2 | 228 | 246 | 246 | 245 |
Transistors | 1.178 B | 1.303 B | 1.303 B | 2.41 B |
Power | 100W | 100W | 100W | 95W |
CPU MHz | 2900 | 3800 | 4100 | 3700 |
CPU Turbo | N/A | 4200 | 4400 | 4000 |
L1 Cache | 256KB C$ 256KB D$ |
128KB C$ 64KB D$ |
128KB C$ 64KB D$ |
192KB C$ 64KB D$ |
L2 Cache | 4 x 1MB | 2 x 2 MB | 2 x 2 MB | 2 x 2 MB |
Node | 32nm SOI | 32nm SOI | 32nm SOI | 28nm SHP |
Memory | DDR-1866 | DDR-1866 | DDR-2133 | DDR-2133 |
세부 스펙비교, 기존 트리니티는 VLIW4아키텍처 카베리는 GCN 1.1 아키텍처로 변경 및 코어 유닛 증가, TDP 95와트로 감소, L1 캐쉬 증가, 트랜지스터 2.41B로 증가, 28나노 SHP 공정으로 변경
Transistor Density Comparison | ||||||||
Manufacturing Process | Transistor Count | Die Size | Transistors per mm2 | |||||
AMD Kaveri | GF 28nm SHP | 2.41B | 245 mm2 | 9.837M | ||||
AMD Richland | GF 32nm SOI | 1.30B | 246 mm2 | 5.285M | ||||
AMD Llano | GF 32nm SOI | 1.178B | 228 mm2 | 5.166M | ||||
AMD Bonaire (R7 260X) | TSMC 28nm | 2.08B | 160 mm2 | 13.000M | ||||
AMD Pitcairn (R7 270/270X) | TSMC 28nm | 2.80B | 212 mm2 | 13.209M | ||||
AMD Vishera (FX-8350) | GF 32nm SOI | 1.2B | 315 mm2 | 3.810M | ||||
Intel Haswell 4C (GT2) | Intel 22nm | 1.40B | 177 mm2 | 7.910M | ||||
NVIDIA GK106 (GTX 660) | TSMC 28nm | 2.54B | 214 mm2 | 11.869M |
APU 세대별 공정과 트랜지스터, 다이사이즈 비교
[ 테스트 시스템 ]
AMD APU TestBed | ||||||||
SKU | Cores | CPU / Turbo |
DRAM MHz |
Power | IGP | SPs | GPU MHz | |
Kaveri APUs | A10-7850K | 2M/4T | 3.7 GHz 4.0 GHz |
2133 | 95W | R7 | 512 | 720 MHz |
A8-7600 | 2M/4T | 3.3 GHz 3.8 GHz |
2133 | 65W | R7 | 384 | 720 MHz | |
A8-7600 | 2M/4T | 3.1 GHz 3.3 GHz |
2133 | 45W | R7 | 384 | 720 MHz | |
Richland APUs | A10-6800K | 2M/4T | 4.1 GHz 4.4 GHz |
2133 | 100W | 8670D | 384 | 844 MHz |
A10-6700T | 2M/4T | 2.5 GHz 3.5 GHz |
1866 | 45W | 8650D | 384 | 720 MHz | |
A8-6500T | 2M/4T | 2.1 GHz 3.1 GHz |
1866 | 45W | 8550D | 256 | 720 MHz | |
Trinity APUs | A10-5800K | 2M/4T | 3.8 GHz 4.2 GHz |
2133 | 100W | 7660D | 384 | 800 MHz |
A8-5500 | 2M/4T | 3.2 GHz 3.7 GHz |
1866 | 65W | 7560D | 256 | 760 MHz | |
Memory | AMD Radeon 2 x 8 GB DDR3-2133 10-11-11 1.65V G.Skill RipjawsX 4 x 4 GB DDR3-2133 9-11-11 1.65V G.Skill RipjawsZ 4 x 4 GB DDR3-1866 8-9-9 1.65V | |||||||
Motherboards | ASRock FM2A88X Extreme6+ ASRock FM2A88X-ITX+ | |||||||
Power Supply | OCZ 1250W ZX Series | |||||||
Storage | OCZ 256GB Vertex 3 SSDs | |||||||
Operating System | Windows 7 64-bit SP1 with Core Parking updates | |||||||
Video Drivers | Graphics Driver Build 13.300 RC2 for Radeon R7 Catalyst 13.12 for all others |
Intel TestBed | ||||||||
SKU | Cores | CPU / Turbo |
DRAM MHz |
Power | IGP | SPs | GPU MHz | |
Sandy Bridge | i5-2500K | 4C/4T | 3.3 GHz 3.7 GHz |
1600 | 95W | HD 3000 | 12 | 850 |
Ivy Bridge | i3-3225 | 2C/4T | 3.3 GHz | 1600 | 55W | HD 4000 | 16 | 550 |
i7-3770K | 4C/8T | 3.5 GHz 3.9 GHz |
1600 | 77W | HD 4000 | 16 | 550 | |
Haswell | i3-4330 | 2C/4T | 3.5 GHz | 1600 | 54W | HD 4600 | 20 | |
i7-4770K | 4C/8T | 3.5 GHz 3.9 GHz |
1600 | 84W | HD 4600 | 20 | ||
i7-4770R + Iris Pro |
4C/8T | 3.2 GHz 3.9 GHz |
1600 | 65W | HD 5200 | 40 | ||
Memory | ADATA XPG 2 x 8 GB DDR3L-1600 9-11-9 1.35V | |||||||
Motherboards | ASUS Z87 Gryphon | |||||||
Power Supply | OCZ 1250W ZX Series | |||||||
Storage | OCZ 256GB Vertex 3 SSDs | |||||||
Operating System | Windows 7 64-bit SP1 with Core Parking updates | |||||||
Video Drivers | 15.28.20.64.3347 for HD 3000 15.33.8.64.3345 for HD 4000+4600 |
IGP Gaming, 1280x1024
For the 100W APUs at 1280x1024, there is almost no movement between the Richland and the Trinity APUs, except for Company of Heroes which would seem to leverage the extra SPs more than the MHz available.
45W APUs are clearly in vogue at 1280x1024, each of them providing a good bump over Richland.
IGP Gaming, 1680x1050
1680x1050 sees more benefit for the 100W APUs, but the 45W APUs still show big leaps.
IGP Gaming, 1920x1080
At 1080p the effects are more pronounced all around.
CPU Timed Benchmarks
Unfortunately the CPU timed benchmarks at 100W are bit over the place. Here we are dealing with an IPC gain but MHz deficit, and each benchmark has a different way of dealing with it. For Agisoft, MHz wins, but for Xilisoft, the Kaveri improvements work out well for the system.
At 45W the situation is a lot more clearer, and the newer APUs have the advantage, especially in Adobe After Effects.
CPU Score Benchmarks
45W still makes the biggest jump when it comes to score based CPU benchmarks.
IGP Synthetics
I never like putting much thought into the synthetic results – here both the 100W and the 45W range are showing good improvements all around. 3DMark 06 has the most trouble getting improvements as it relies more on the grunt, rather than the features that Kaveri affords.
IGP Compute
Off the bat we can see just how much of a difference the Kaveri GPU Compute can make over previous APUs. This is still without hUMA fully being in effect while we wait for a proper driver and software stack to become available.
Up to a +222% boost from Kaveri is amazing for a 45W part.
AMD vs Intel
For a little tete-a-tete, putting the 65W Iris Pro up against the 65W Kaveri seems like a good idea. To add to the mix, due to the extreme price difference of Iris Pro in this equation, we also add the 95 W Kaveri for comparison.
[ 카베리 APU 요약 ]
스팀롤러 CPU 단일 성능은 높지 않은 약간의 IPC 상승 (불도저 기반의 한계) 인텔 i3와 비교시 큰 메리트가 없으며 CPU 단일 성능은 차기 아키텍쳐 엑스카베이터를 기대, 단일 GPU 성능은 AMD의 강점을 여전히 보여주는 좋은 성능을 보여주지만 리치랜드 대비 크게 상승하지는 않았고, CPU+GPU 모두를 사용한 연산 성능은 훌륭하며 HSA (헤테로지니어스)의 미래(가능성)을 보여주고 있다.
결론적으로 CPU와 GPU 각각을 볼때는 마이너 업그레이드 버전이지만 CPU와 GPU를 모두 사용한 HSA 성능은 훌륭하기 때문에 향후의 관건은 SW 업체들의 지원 여부에 달렸다.
HSA / HQ / HUMA 모두 기술은 확실히 좋아보이기 때문에 앞으로가 관건입니다.