MS는 핫칩25(Hot Chips)에서 엑스박스원의 CPU 세부 개요 공개 (AMD 재규어)

by 연대생 posted Aug 28, 2013
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

soc.jpg

 

마이크로소프트가 핫칩25(8월 25~27일)에서 엑스박스원의 메인 프로세서에 대한 개요를 발표했다. 엑스박스원의 특징은 PS4칩 이상으로 커스터마이즈 된 칩으로 메인 SoC는 CPU 코어와 GPU 코어, 오디오 프로세서, 비디오 코덱, 32MB 메모리등을 통합. 8GB의 메인 메모리 DDR3는 메인 SoC의 256-bit의 DRAM인터페이스에 접속, HDMI의 비디오/음성 출력은 메인 SoC에서 연결되며 기가비트 이더넷도 메인 SoC의 PCI Express에 직결되어 있다.

사우스 브리지 칩은 각종 I/O과 클럭, 시스템 컨트롤러를 통합하며 키넥트 모듈은 사우스 브리지에 USB로 접속되고, 마찬가지로 USB에 접속된 Wi-Fi가 2계통으로 설계되어 있다. 한쪽 와이파이는 게임 컨트롤러 등을 접속하며 컨트롤러는 블루투스가 아닌 와이파이 연결이다. 또 SATA2에 BD 드라이브와 HDD가 연결되고 8GB의 NAND 플래시가 eMMC 4.5 인터페이스에 접속되고 있다.

메인 SoC는 TSMC의 28nm HPM 프로세스로 제조되고 있다. 즉, 스마트 폰이나 태블릿에 사용되는 모바일 SoC의 최첨단 칩과 같은 프로세스를 사용하고 있다. 다이 사이즈는 363kmm로 소비자 기기의 표준적인 사이즈를 크게 넘어선 서버 CPU 수준이다.

메인 SoC의 트랜지스터 집적도는 발표때 공표된 대로 5Billion(50억). 트랜지스터 수가 비 정상적으로 많은 것은 내장한 SRAM 메모리의 양이 많기 때문이다. 32MB의 그래픽용 메모리는 ESRAM(Embedded SRAM)으로도 불리며 메모리 셀이 표준적인 6T SRAM이라고 하면 32MB의 ESRAM 부분만으로 트랜지스터 수는 계산상으로 약 1.6B(16억)이다. 더 복잡한 셀의 트랜지스터 수도 더하면 약 1.6B(16억)의 트랜지스터가 추가, 합계 5B(50억)정도가 된다. 

 

soc2.jpg

 

메인 SoC의 내부는 AMD의 표준적인 APU와는 상당히 다르다. 다만 AMD APU 설계의 흐름을 따르고 있는 부분도 있는데 CPU 코어와 GPU 코어의 양쪽에서 DRAM 컨트롤러에 인터커넥트가 있다는 점이다. 

Xbox One의 메모리 시스템의 최대 특징인 32MB의 임베디드 SRAM은 GPU측의 호스트 - 게스트 GPU MMU에 직결되고 있다. 8MB 씩의 블록으로 각각 256-bit의 읽기&쓰기 버스로 연결되어 있다. 버스는 합계 1024-bit, 메모리 대역은 피크 204GB/sec으로 하한선이 109GB/sec. 204GB/sec의 전송 속도는 계산상 1.6Gbps이다.

GPU MMU는 DRAM컨트롤러로 68GB/sec의 풀 대역을 살리는 대역으로 접속하고 있다. AMD의 APU는 Radeon Memory Bus(GARLIC)라 불리는 버스며 GPU MMU에서 CPU측의 메모리 컨트롤러에도 접속하고 있다. 이는 AMD APU는 Fusion Compute Link(ONION)이라 불리는 버스에 노출되는 부분이지만 Xbox One에서는 다르다. 메모리 공유 구조가 AMD APU와 다르기 때문에 간섭성 프로토콜 등이 확장되어 있다고 본다.

CPU코어는 Jaguar 아키텍처 4코어로 Xbox One은 TSMC 제조로 AMD의 28nm 세대 코어는 Jaguar밖에 선택 사항이 없는 점은 PS4와 같다. 다만 메모리 공유 구조가 다르기 때문에 버스 프로토콜 등은 확장될 가능성이 있다.

GPU 코어는 연산 성능이 1.31TFLOPS에 텍스처 필터링 성능이 41GTexel/sec. GPU 코어의 연산 유닛은 12 CU(Compute Unit)에서 768 FMAD라고 하고 있어 역산하면 GPU 코어의 동작 주파수는 850MHz 정도가 된다.

ROP(Rendering Output Pipeline) 퍼포먼스는 13.6Gpixel/sec. 850MHz에서 역산하면 ROP 유닛이 16개다.

그 외 강화된 부분은 오디오 프로세서다. 2개의 128-bit SIMD(Single Instruction, Multiple Data)FP 엔진을 갖추고 15.4GFLOPS의 연산 성능을 갖는다. 또, 2개의 스칼라 DSP 코어도 포함하며 전용 하드웨어 부분의 처리 성능은 18G 오퍼레이션으로 상당하다. 강력한 오디오 프로세서들은 키넥트의 오디오 처리도 하기 위해서다.






Articles

5 6 7 8 9 10 11 12 13 14