NVIDIA가 테그라 K1의 후계가 되는 SoC 테그라X1(개발 코드 네임:Erista)을 발표했다. 테그라 X1의 최대 특징은 GPU가 NVIDIA의 최신 세대 GPU인 Maxwell(맥스웰) 아키텍처를 채용해 256개의 CUDA Core를 가진 강력한 GPU을 내장하고 있는 것이다. 게다가 CPU는 8코어의 64bit ARM 프로세서(Cortex-A57 쿼드 코어+Cortex-A53 쿼드 코어, 빅리틀 대응)을 갖추고 TSMC의 20nm 프로세스로 제조된다.
NVIDIA는 동시에 보도 관계자 전용 세션을 개최하고 테그라 X1의 벤치마크 데이터를 공개했다. 3D 벤치마크로 된 3DMark의 Ice Storm Unlimited에서 43,000을 넘는 스코어로 태블릿 전용 SoC로서는 큰 차이의 스코어를 나타내고 있으며 PC용 CPU인 제 4세대 Core 프로세서(하스웰)에 내장된 GPU(메인 스트림을 위한 GT2)에 필적하는 높은 스코어가 되고 있다.
맥스웰 GPU와 Cortex-A57/53의 옥타 코어 64bit ARM 프로세서로 구성
테그라 X1은 개발 코드 네임 Erista(에리스타)로 알려진 SoC로 2014년 International CES에서 발표된 Tegra K1(개발 코드 네임:Logan, 로건)의 후계가 되는 제품이다.
Tegra X1 | Tegra K1(64bit) | Tegra K1(32bit) | |
---|---|---|---|
CPU | Cortex-A57(4코어)+ Cortex-A53(4코어) | Denver(듀얼 코어) | Cortex-A15(4코어) |
GPU 아키텍처 | Maxwell | Kepler | Kepler |
SM | 2 | 1 | 1 |
CUDA 코어 | 256 | 192 | 192 |
최대 특징은 Tegra K1은 탑재된 GPU가 Kepler(케플러)아키텍처였으나 테그라 X1은 Maxwell로 불리는 GeForce GTX 980/970 등에 채용되고 있는 NVIDIA의 최신 아키텍처에 대응하고 있다.
Kepler가 GPGPU 등에서 최대 성능을 발휘할 수 있도록 내부 구조가 설계되고 있는 반면 맥스웰은 전력 효율을 의식한 설계로 되어 있어 하나의 연산 유닛이 Kepler에 비해 작지만 실행 효율을 높였다. 또한 NVIDIA Tegra 마케팅 부장 맷 웹 링에 따르면 Tegra X1의 "X"는 Ma"x"well 에서 따와 "M"이 아닌 것은 "X"가 매력적이기 때문이라고 설명했다.
기존 Tegra K1에서는 192개의 CUDA 코어를 내포하고 있는 SM으로 불리는 GPU 블록 단위가 하나의 구성으로 되어 있었다. 이에 비해 Tegra X1의 Maxwell 아키텍처는 1개의 SM에는 128개의 CUDA 코어가 내장되는 형태로 바뀌었고, Tegra X1에서는 그 SM이 2개 내장된다. 즉 CUDA 코어는 합계 256개 내장되어 있는 것이다.
CPU는 Tegra K1에서 큰 변경 사항이다. Tegra K1의 32bit 버전은ARM Cortex-A15 쿼드 코어(+1개의 히든 코어), 64bit 버전이 듀얼 코어 Denver(NVIDIA 자체 설계 64bit ARM 프로세서)라는 구성으로 되어 있었다. 그리고 전자를 채용하고 있는 것이 NVIDIA 자신이 판매하는 "SHIELD Tablet", 후자를 채용하고 있는 것이 Google이 판매하는 "Nexus 9"이 된다.
이에 대해 Tegra X1에서는 ARM이 라이선스 하는 64bit ARM 프로세서로 디자인 됐으며 Cortex-A57을 4코어, 마찬가지로 ARM의 Cortex-A53을 4코어를 조합한 옥타 코어 구성이다. 다만 A57과 A53은 big.LITTLE(빅리틀)로 불리는 ARM이 제공하는 전력 절약 기술을 이용해 부하에 따라 전환되는 사양이 되고 있다(물론 8코어를 동시에 이용하는 것도 설정에 따라 가능하다).
이미 자사가 디자인 한 Denver가 있음에도 불구하고 ARM의 IP 디자인을 이용한 것에 대해 웹 링은 "자사 설계의 코어는 막대한 자원을 필요로 한다. 따라서 ARM의 IP 라이선스를 포함해 최적인 것을 채용한다"고 밝혀 라인 업을 늘리기 위해서도 자사 설계 코어에만 구애되지 않고, 그때 그때 최적의 CPU 코어를 채용할 방침이라고 설명했다.
또한 상세한 내용은 밝히지 않았지만 Denver 프로세서+Maxwell 이라고 하는 편성의 제품도 출시될 가능성을 시사했다. NVIDIA는 Erista의 후계 제품으로 Parker(파커)로 불리는 제품을 계획하고 있으며 이 제품이 그 조합이 될 가능성이 높은 것은 아닐까.
이 밖에 Tegra X1에는 60fps의 4K 동영상 디코딩이 가능한 H.264/VP9의 디코더, 엔코더를 내장했다(인코딩은 30fps). 이 디코더, 엔코더는 고정 기능으로 실현되어 SoC의 전력을 거의 소비하지 않고 4K 동영상 인코딩/디코딩이 가능하게 하는 것이 특징이다. 또 HDCP 2.2/HDMI 2.0에도 대응하고 있어 4K 디스플레이로 출력해 4K 동영상을 재생할 수 있다.
Core i5-4200U의 내장 GPU에 맞먹는 3DMark의 스코어를 보이다
NVIDIA는 테그라 X1의 성능 데이터에 관해서도 공개했다. NVIDIA의 웹 링은 "테그라 X1은 Maxwell 세대의 GPU가 탑재되어 1.5 ~ 2배 정도의 성능 향상이 나타난다. 전력 효율은 크게 개선되고 있으며 Apple의 "A8X"에 비하면 1.7배의 전력 효율을 구현했다"고 밝혀 그 높은 GPU 성능과 전력 효율을 어필했다.
실제로 공개된 Tegra X1 기반의 개발 보드를 이용한 벤치마크에서 GLBench 3.0 Manhattan 1080p OffScreen이 4,077(65.8fps), 3DMark Ice Storm Unlimited가 43,388 이라는 스코어를 나타내고 있었다. GLBench 3.0은 수중에 비교할 수 있는 데이터가 없었지만 3DMark Ice Storm Unlimited는 Tegra K1(32bit)을 탑재한 SHIELD Tablet이 30,072, Core i5-4200U(Haswell, GT2 내장)를 탑재한 VAIO Duo 13이 42,367이었으며 Tegra K1과 비교해 1.3배, Intel의 GT2가 내장된 Core i5와 비교해 웃도는 결과를 내고 있는 것이다. 또한 열 설계는 태블릿에 들어가도록 팬리스 히트싱크를 붙이는 설정이며 실제로 테그라 X1이 태블릿에 들어갔을 때는 이 정도의 성능이 기대된다.
이 외에도 Apple의 "iPad Air 2"에 탑재되고 있는 A8X와 GPU의 소비 전력 비교 데이터도 공개되어 양사를 동일한 성능으로 설정한 경우 테그라 X1이 A8X에 비해 낮은 소비 전력으로 동작하는 모습도 공개됐다. 툴로 확인된 평균 소비 전력의 숫자는 A8X의 GPU가 2.651W인 반면 테그라 X1의 GPU가 1.498W으로 표시되고 있었다.
엔비디아 멋집니다! 역시 맥스~웰