AMD의 새로운 아키텍처 세대 GPU Hawaii(하와이) 시리즈 브랜드는 "라데온 R9""라데온 R7"시리즈로 크게 변경됐다. 플래그십 모델의 연산 성능은 5TFLOPS 이상, 메모리 대역은 300GB/sec 이상 트라이앵글은 초당 40억, 그리고 트랜지스터수는 60억 이상이다. 참고로 NVIDIA의 거대칩 GK110(GeForce GTX Titan)의 트랜지스터 수가 71억으로 하와이는 그것에 육박하고 있다.
이 스펙을 보고"어라?"라고 의문을 느끼는 사람도 많을 것이다. 세대가 바뀔 때마다 퍼포먼스는 2배가 되는 것이 당연한 GPU인데 이번에는 2배가 되고 있지 않기 때문이다. 앞선 세대의 최고봉 다이인 Tahiti(타히티:Radeon HD 79xx계열)은 4TFLOPS로 메모리 대역은 288GB/sec, 트랜지스터 수는 4.3B(43억)으로 Tahiti에서 Hawaii는 2배가 아니다.
2배가 안 되는 이유는 여러가지가 생각되는데, 그 결과로서 명확히 예측할 수 있는 것은 AMD GPU는 앞으로 1년마다 성능 또는 퍼포먼스/전력이 올라 갈 것이다. 파운드리 프로세스로의 이행이 55nm→ 40nm→ 28nm로 2년씩 되었기 때문에 과거 몇 년간의 GPU는 사실상 퍼포먼스 거치 기간이 길어지고 있었다. 하지만 앞으론 반도체 기술의 상황이 변화하므로 단계적으로 성능이 향상되어 갈 것이다. Hawaii는 그것의 제 1편인 GPU다. GPU의 다이 사이즈와 트랜지스터 밀도에서 생각하면 조만간 GPU는 100억 트랜지스터의 선을 넘을것이다.
Hawaii에서 두드러지는 것은 성능을 올릴 뿐 아니라 아키텍처도 진화시킨 것이다. 이번 칩 아키텍처 면에서의 특징은 오디오 엔진을 추가한 것. "TrueAudio"로 명명된 프로그래머블 오디오 엔진을 Radeon R9 290/290X/260X에 탑재했다. TrueAudio의 탑재 형태는 발표되지 않았지만 오디오 하드웨어를 PC용 GPU에 내장은 지금까지도 몇 번 있었다. 원래 NVIDIA가 처음 발표한 "NV-1"이 3D그래픽 GPU에 오디오 프로세싱도 내장한 멀티 미디어 프로세서였다.
이번에 AMD가 구현한 것은 프로그래머블 엔진에서 3D 오디오를 비롯한 사운드 기능을 구현하고 CPU에서 오프 로드 처리함으로써 CPU의 부담을 줄일 수 있다. 반도체적으로 보면 이론적으로는 오디오 같은 특정 기능의 하드웨어를 GPU에 대한 통합은 의미가 있다. 그것은 반도체 칩의 전력 밀도를 낮추지 않기 때문에 그래픽 연산 유닛만 늘려 가면 열 처리에서 막혀 버리기 때문이다. 특정 기능의 하드웨어는 전력 효율이 높기 때문에 그러한 유닛을 늘리는 것은 칩 전체의 전력 효율 면에서 이점이 있다. 또, GPU코어와 부하 피크의 타이밍이 다른 경우가 많기 때문에 열의 분산화 면에서도 이점이 있다.
GPU 코어 아키텍처도 진화했다. AMD는 "Southern Islands(서던 아일랜드:Radeon HD 7xxx)"의 세대에서 GPU아키텍처를 크게 전환했다. 그때까지 VLIW(Very Long Instruction Word)아키텍처에서 GCN(Graphics Core Next)아키텍처로 진화시켰다. 다음 "Sea Islands(시 아일랜드:Radeon HD HD 8xxx)"시리즈는 대부분 Southern Islands와 동일 계열 다이로 GCN 도입의 큰 설계 변경은 이번"Volcanic Islands"시리즈가 처음이다.
이번 GCN의 확장 최대의 포인트는 DirectX 11.2에 대한 대응이다. DirectX 11.2의 하드웨어 쪽에서 가장 눈에 띄는 변화는 타일 자원의 지원으로 실제 하드웨어상의 구현은 드러나지 않았다.
다만 AMD가 아키텍처를 뿌리부터 바꾸기는 어려울 것이다. 그것은 GPU 제조 업체에 있어서도 GPU개발은 시간이 걸릴 것이고, 예전처럼 완전히 새로운 아키텍처를 매 세대 개발하는 것은 매우 어렵기 때문. NVIDIA와 AMD도 현재는 베이스 아키텍처를 완성시키면 몇 세대에 걸쳐 그 확장판을 계속하는 패턴이다.
Hawaii의 메모리 대역은 300GB/sec이상으로 GDDR5의 한계도 서서히 다가오고 있어 메모리 대역의 확장도 둔화하기 시작했다. AMD의 이번 발표에서 가장 임팩트가 강했던 것은 아직 세부가 뚜렷하지 않은 GPU 하드웨어보다 소프트웨어층의 Mantle(맨틀) 일지도 모른다. Mantle은 한마디로 게임기의 프로그래밍 모델을 PC에 반입한 것이다. Mantle은 미들 웨어 같은 상위 소프트웨어층이 아니라 DirectX 같은 하위 그래픽 API와 드라이버 소프트웨어층이다.
그 의도는 런타임 소프트웨어를 낮춤으로써 게임기처럼 PC의 그래픽 기능을 최대한 사용할 수 있도록 한다. 지구에 비유하자면 코어(그래픽 스코어)을 감싸듯, 맨틀 층(Mantle 드라이버와 Mantle API)이 있고 그 외측의 지각(그래픽스 애플리케이션)를 지지하는 이미지다.
Mantle은 새로운 로우 레벨 인터페이스다. Microsoft의 HLSL과 같은 기존 언어와도 호환되기 때문에(소프트웨어)이식은 매우 간단하다. Mantle의 장점은 다른 PC용 API에 비해 9배의 고유 콜을 가능하게 하는 점이다. 그것은 2018년 하드웨어(성능)을 당장 손에 쥘 수 있다는 것을 의미한다.
지금까지 게임 콘솔의 개발자는 모어&리스(more and less)였다. 즉, 낮은 하드웨어 스펙부터 보다 많은 퍼포먼스를 끌어낼 수 있었다. 그것에 대해 오늘날 PC용(게임)개발자는 레스&모어(less and more)에 지나지 않는다. 하드웨어 스펙은 콘솔보다 뛰어난데 낮은 성능밖에 얻을 수 없다. 그러나 Mantle은 PC전용 개발자에게 모어 앤 모어(more and more)을 줄 수 있다.
게임 콘솔에서는 5~10년정도 하드웨어 스펙이 고정되므로 라이프 사이클의 후반에서는 하드웨어의 스펙은 PC보다 훨씬 낮아진다. 그러나 소프트웨어층의 오버 헤드가 적어 퍼포먼스를 도출할 수 있다. 그것에 대해 PC에서는 하드웨어는 매년 진화하기 때문에 콘솔을 훨씬 앞지르지만 소프트웨어 오버 헤드 때문에 최대한으로 퍼포먼스를 살릴 수 없다.
이것이 지금까지 게임 개발의 상식이었다. 그러나 AMD는 Mantle에서 그 이론을 깨려 한다. PC에도 게임기 수준 오버 헤드의 작은 소프트웨어층을 도입함으로써 개발자가 하드웨어의 성능을 이끌어 낼 수 있도록 한다. 그래서 PC게임을 더 풍부하게 하려는 것이 Mantle의 아이디어다.
Mantle은 컨셉을 보면 게임기 소프트웨어 모델과 판박이다. 그래픽 소프트웨어를 가볍고 연하게 함으로써 GPU의 퍼포먼스를 최대한 얻도록 한다. 그래픽 프로그래밍에서 난관의 한가지는 드로 콜(Draw Call), 즉 묘화 호출로 불리는 그래픽 API의 콜이다. 묘화 엔진이 발행하는 드로 콜이 늘면 API 측의 처리가 무거워져 CPU의 성능을 먹게 된다. Mantle은 소프트웨어층을 가볍고 연하게 함으로써 발행할 수 있는 드로 콜을 대폭 늘리는 것.
Mantle의 이점 1가지는 비슷한 프로그래밍 모델을 취한 게임기의 게임 이식을 쉽고 높은 퍼포먼스로 할 수 있는 것이라고 추측된다. 물론 PC 그래픽상의 Mantle과 PlayStation 4(PS4)나 Xbox One에서는 같은 로우 레벨 API 에서도 차이는 있겠지만 친화성은 강할 것이다. 무엇보다 Mantle이 지원하는 것은 현재 GCN뿐이므로 같은 AMD 그래픽이나 Wii U는 빗나가게 된다.
더 넓은 시각으로 보면 Mantle은 GPU 제조 업체가 독자적인 그래픽 API로 패권을 겨루던 시절로 돌아갈 것 같은 움직임이라고 볼 수도 있다. 과거 3Dfx Interactive의 Glide API가 게임의 플랫폼이던 시절의 재현이라는 분석이다.
다른 견해를 본다면 과거의 속박에서 무거운 GPU를 위한 런타임 재편의 일환으로도 볼 수도 있다. AMD는 무거운 그래픽 런타임을 빼고 GPU 컴퓨팅을 실현하기 위해 HSA(Heterogeneous System Architecture)를 도입하고 있다. Mantle은 소프트웨어층을 가볍게 하는 의미에서 HSA와 공통되는 부분이 있다.
Mantle의 상세 정보는 11월 AMD가 개최하는 기술 컨퍼런스 AMD Developer Summit에서 공개될 예정이다.
보도 - http://pc.watch.impress.co.jp/docs/column/kaigai/20130927_617112.html