GeForce GTX 780 Ti |
2012~2014년 NVIDIA 로드맵 |
저전력과 저가격에 힘쓴 Kepler 1.0 ~ 2.0 세대
우선 Kepler 1.0 세대의 업데이트를 보면 2013년 4월에는 OEM 전용으로 GeForce GTX 645를 발표하고 있다. 다소 이해하기 어렵지만 NVIDIA는 GF114 기반의 GeForce GT 645를 2012년에 발매하고 있어 이것의 상위 제품으로 취급 되는 셈이다.
GeForce GTX 645 |
구성적으로는 GeForce GTX 650 Ti 보다 하위겠다는 느낌이지만 미묘한 것은 리테일용 GeForce GTX 650 보다 잠재적으로는 성능이 위(GK106코어 기반)라는 것으로, 성능 차별화 때문에 동작 주파수를 떨어뜨리거나 메모리의 속도를 4Gbps로 조정하는 것으로 밸런스를 맞추고 있는 인상이다.
테스트를 한 것은 아니지만 이 2가지 제품은 벤치 마크를 하면 꽤 막상막하가 될 듯한 인상이다. 아마도 해상도를 올리면 GTX 650이, 해상도가 내리면 GTX 645가 유리할 것이라는 결과가 나올 것이라고 예상된다.
Kepler 2.0 세대라고 하면 취급적으로는 아직 Kepler 1.0 세대에 속해 있는 것이 GK208 코어의 OEM용 제품이다. GK208은 GK107의 후계에 해당하는 것이지만 그래도 분류는 Kepler 1.0 인것 같다. 실제 제품 번호도 700 넘버가 아닌 600 넘버이며 일단 2013년에 들어가고부터 투입된 새로운 핵심으로 하여 그림에서는 Kepler 2.0에 포함하고 있다.
최대 384 CUDA(2SMX)의 구성으로 동작 주파수도 비슷하여 메모리 구성이 같다면 성능은 거의 같을 것이다. 실제로는 미묘하게 구성이 다르므로 동일 기준으로 평가 하기에는 어렵겠지만,,
GK208은 신기능이 탑재된 것은 아니며 뭐가 다른가 하면 소비 전력이다. 예를 들면 GK107 기반 GeForce GT 630의 TDP가 50W인 반면 GK208 기반의 GeForce GT 630은 25W로 반감되고 있다. 다만 이것은 순수하게 핵심적인 차이가 아니라 메모리 구성도 함께 변화하고 있으므로 그렇게 단순하지 않다.
이 GK208 세대는 성능 제거 방식이 지금까지와 다른 것도 특징이다. GK107 기반 GeForce GT 640과 GeForce GT 630을 비교했을 경우, 1SM만 활성화 하고 동작 주파수는 오히려 높여 균형을 맞추는 방법이었다.
GK208 기반의 GeForce GT 630/635/640의 경우 쿠다 구성은 모두 같은 2SM으로 대신 메모리 대역을 64bit화하고, 또 속도를 떨어뜨리는 형태로 성능 조정을 하고 있다.
ZOTAC의 GT 640 2GB 64bit DDR5. GK208 기반의 GeForce GT 640 채용으로 소비 전력이 감소 |
이 결과로서 최종적인 필 레이트 자체는 메모리가 병목이 되어 이전과 다름 없는 성능이지만, 쿠다를 최대한 사용하는 정교한 3D 화면에서도 성능이 떨어지는 추세로 되는 것 같다.
반대로 말하면 3D 게임에서 옵션을 낮은 품질로 조정해도 성능이 올라갈 수 없다는 의미이기도 하지만, 최근에는 이러한 로우 엔드 GPU 카드가 이용되는 게임이라도 품질 요구가 높아지면서 성능 조정 방향성을 변화시킨 것으로 생각된다.
OEM 제품이 올해 10월 2가지 제품이 추가됐다. 우선 GeForce GTX 760 192bit 로 이것은 GeForce GTX 760의 서브 모델이라는 의미지만 사용되고 있는 다이는 Kepler 2.0의 GK104-A2가 아닌 Kepler 1.0의 GK104와 같다.
GeForce GTX 760 192bit |
동작 주파수를 약간 내리는 것과 동시에 메모리 버스를 이름대로 192bit로 제한한 것으로 이는 높은 해상도에서 성능이 내려갈 것이다. 이는 OEM 전용 2K 정도의 화면 크기에 대응하는 용도라면 그 만큼 큰 성능 감소는 아니면서 가격을 싸게 묶을 수 있다는 것으로 생각된다.
GeForce GTX 760 192bit와 거의 같은 타이밍에 투입된 것이 GeForce GTX 760 Ti지만 이쪽도 코어 자체는 Kepler 1.0의 GK104다. 구성적으로는 거의 GeForce GTX 680과 비슷하고 약간의 동작 주파수가 떨어진 정도로 사실상 GeForce GTX 680의 리네이밍이 된다.
GeForce GTX 760 Ti |
리테일은 GDDR5 7Gbps를 탑재한 GeForce GTX 770이 투입돼 있기 때문에 GDDR5 6Gbps 그대로의 GeForce GTX 760 Ti는 성능 면에서 차별화가 제대로 되어 있다.
2012~2014년 NVIDIA로드맵 |
출하가 공식적으로 알려진 GeForce GTX 780 Ti
여기까지가 이미 출하된 제품 업데이트고 지금부터가 향후의 제품 로드맵이지만 사실 이부분은 많은 정보가 없다.
우선 한가지 명확한 것이 GeForce GTX 780 Ti다. 이것은 공식적으로 존재가 밝혀지고 있으며 아마 11월 중 출하가 될 전망이다. 이것은 AMD의 Radeon R9 290X에 맞서는 제품이라고 규정되고 있다.
GeForce GTX 780 Ti |
사실 Radeon R9 290X의 성능은 대체로 GeForce GTX 780 보다 약간 위 정도에서 시장에 많이 나돌고 있는 오버 클럭판 GeForce GTX 780 정도의 성능 레인지라고 생각해도 된다.
문제는 Radeon R9 290X가 549 달러라는 매우 싼 가격에 투입될 예정인 것으로 이것은 GeForce GTX 780의 650달러와 비교해 100달러나 싸게 된다.
이를 메우기에는 GeForce GTX 780을 역시 550달러 정도로 내리면 경쟁하게 되는데 그렇게 되면 당연히 GeForce GTX 770은 400달러 정도로 하지 않으면 앞뒤가 맞지 않게 되고 그 이하의 제품에도 영향을 미치다 보니 가격을 내리지 못하는 상황으로 보인다.
대략 500mm2을 넘는 거대한 다이 사이즈의 GK110을 탑재하고 있고 이를 500달러대에 파는 것 자체가 진지하게 이익 감소를 초래하므로 NVIDIA에 있어서도 받아들일 수 없다. GeForce GTX 780의 650달러라는 가격은 GK110 코어를 탑재하는 카드의 거의 하한선에 가깝다고 생각된다.
GK110(GeForce GTX TITAN)의 다이 사이즈는 551kmm로 거대 |
여기서 손을 놓고 있을 수도 없기 때문에 가격을 동결한 상태에서 성능을 끌어올리는 대항책을 취한 것이 GeForce GTX 780 Ti 라는 것이다.
원래 GK110 코어는 15 SMX 구성, GeForce GTX Titan은 14 SMX, GeForce GTX 780은 12 SMX를 유효하게 하는 형태로 발매되고 있는데 GeForce GTX 780 Ti 는 13 SMX를 유효하게 하는 형상으로 하는것 같다.
GeForce GTX 780 이 12 SMX 로 구성했던 것은 제품 수율 대책이라기보다는 성능 차이를 갖추기 위한 측면이 강해 이를 13 SMX 구성으로 해도 제품 원가에 거의 영향은 없다고 생각된다.
이를 보완하기 위해 약간의 동작 속도 향상과 또는 메모리 속도의 향상도 있을 가능성이 있다. 그런데 메모리 제조 업체의 GDDR5 칩은 기존의 6Gbps 위로 7Gbps가 현재 가격도 꽤 비싸기 때문에 현실적인 부분으로는 6Gbps의 제품으로 할 것이라고 필자는 보고 있다.
다음은 13 SMX 구성 + 동작 속도 향상으로 Radeon R9 290X와 100달러의 가격 차이를 정당화할 만한 성능 개선이 있는지가 GeForce GTX 780 Ti의 포지션을 결정할 것이다.
경우에 따라서는 GeForce GTX 780으로 무효화된 DP(Double Precision:배정밀도 부동 소수점 연산)을 유효한 형태의 대응도 있을지도 모르지만 그렇게 되면 이번에는 GeForce GTX Titan의 포지션이 미묘하게 되는 만큼 실제로 그렇게 될지는 장담하기 어렵다.
GeForce GTX 780은 CUDA-Double Precision의 항목이 존재하지 않는다 |
현재 필자가 듣기로는 Kepler 2.0 세대의 제품은 거의 이것으로 끝내는 것이 될 것 같고, 다음은 TSMC의 20나노 프로세스를 사용한 맥스웰 세대가 될 것으로 보인다.