4월 30일 (화) 오후 4:50
랩터 인터내셔널에 오신걸 환영 합니다
>

logo

  • head
  • news
  • product
  • mobile
  • benchmark
  • analysis
  • computing
  • multimedia

우리 삶을 혁신적으로 바꾸고 있...
"SAN"은 "Storage Area Network"...
웹 애플리케이션에서의 버퍼 오버...

ff168785-6b9c-4860-80aa-d99482cb605_mid.jpg


세계 최정상 GPU 기업 엔비디아(NVIDIA)가 SIGGRAPH 기조 강연에서 새로운 GPU 아키텍처 Turing을 공식 발표했다. CEO 젠슨황은 Turing은 NVIDIA의 GeForce와 Quadro를 위한 새로운 GPU이며 과거 GTX 8800과 같이 혁신적인 제품이라고 설명했다.


엔비디아는 발표와 함께 Turing 아키텍처의 프로페셔널 제품으로 Quadro RTX를 공개했다. Quadro RTX의 최대 포인트는 세이더 프로세싱만 아니라 다른 처리 기능을 부가한 것으로서 CUDA 코어의 개수는 4608개로 연산 성능은 FP32에서 16TFLOPS, 딥러닝 텐서 코어(Tensor Core)의 성능은 INT4 500TOPS, 새로운 레이 트레이싱 액셀러레이터 RT 코어(RT Core)는 10Giga Rays/s, 또한 멀티 GPU를 위한 NVLink 2링크를 지원한다.


Turing 세대에서 레이 트레이싱 지원 하드웨어의 성능은 예상을 뛰어넘는다. 10Giga Rays/s라는 엄청난 성능으로 실시간 레이 트레이싱을 전통적 3D 렌더링과 같은 수준으로 실현해 버린다. 또한 RT 코어의 개요는 아직 정확하게 밝혀지지 않았으며 슬라이드에는 Ray Triangles Intersection, Bounding Volume Hierarchy Traversal로 설명하고 있다.


Project Sol: A Real-Time Cinematic Scene Powered by NVIDIA RTX


이러한 요소는 레이 트레이싱에서 처리량이 많은 부분을 액셀러레이터에서 처리하는 것을 의미하며 엔비디아가 본격적인 레이 트레이싱 액셀러레이터를 구현한 것이다. 엔비디아 자체적으로 실시간 레이 트레이싱에서 Turing은 기존 Pascal 아키텍처 대비 6배 고속이라고 밝혔다. 6배라는 차이는 전체 처리 시간을 비교한 것으로 딥러닝 기반의 DLAA를 포함한 시간이며 이 비교는 Microsoft의 DirectX Ray Tracing에서 비교됐다.


새로운 튜링 아키텍처는 12나노 프로세스가 적용되고, 186억 트랜지스터, 강력한 RT 코어를 갖추며 다이 사이즈는 754mm2로 기존 GP102의 471mm2 다이 사이즈보다 더 커지고 있다. CUDA 코어는 4608개로 연산 성능은 FP32에서 16TFLOPS, SM(Streaming Multiprocessor)은 64개의 CUDA 코어로 갖춰져 있다. SM 또한 새로운 설계가 적용되고 있는데 부동 소수점 연산 유닛과 정수 연산 유닛을 병렬로 동작시킬 수 있도록 변경되고 있기 때문에 기존의 SM 구성과 단순 성능 비교가 힘들다. 또, Turing은 처음으로 텐서 코어를 탑재하고 있다. 텐서 코어는 FP16, INT8, INT4, 추론 성향으로 8-bit 정수와 4-bit 정수가 지원됐다. INT8과 INT4는 SIMD(Single Instruction, Multiple Data)로 연산 성능은 각각 FP16의 2배와 4배나 많다.


RTX.jpg


메모리는 GDDR6가 탑재되어 전송 속도는 14Gbps, 메모리 인터페이스는 384-bit, 메모리 대역은 672GB/s로 확인됐다. 메모리 용량은 최대 48GB로 이는 GDDR6에서는 16Gb 용량의 칩이 양산되고 있기 때문이며 온 다이 L2 캐시를 6MB 탑재한다. 메모리 스펙도 레이 트레이싱에 유리한데 이는 레이 트레이싱에서 렌더링 하는 3D 스페이스가 커지기 때문에 더 큰 메모리가 필요하며 메모리 접근 패턴이 보다 디테일하게 되는 경우가 많아 메모리 입도가 작은 쪽이 좋기 때문이다.


엔비디아는 칩 간 접속 기술로 NVLink를 개발했다. Turing에도 NVLink가 2링크 탑재되고 있으며 1링크에 50GB/s 쌍방향 대역으로 합계 100GB/s의 대역을 지원한다. Quadro RTX는 NVLink 인터페이스가 탑재되고 있어 NVLink 브리지를 연결해 2개의 카드를 100GB/s 대역으로 접속할 수 있다. 호스트와의 접속은 기존과 같이 PCI Express이며 2장의 카드에 의한 시스템의 메모리 용량은 최대 96GB 라는 계산이 된다. 디스플레이는 8K DisplayPort 지원 외 Virtuallink 지원이 추가됐다. 주로 VR(가상현실)용으로 USB type-C 경유로 비디오 출력과 제어의 단일화가 가능한 규격이다. 때문에 USB type-C의 PHY를 다이에 싣고 있다.


Turing은 GPU 진화가 새로운 단계로 접어든 것을 나타내고 있다. Turing 아키텍처를 보면 전통적인 CUDA 코어 보다 레이 트레이싱을 위한 RT 코어 하드웨어와 인공지능 딥러닝을 위한 텐서 코어, 그리고 칩 간 접속을 위한 NVLink PHY 등을 보다 더 강화하고 있다. 이러한 방향은 그래픽 GPU의 진화 방향은 이제 단순히 세이더 프로세싱 성능 강화가 큰 의미가 없다는 것을 의미한다. 엔비디아는 전통적인 래스터 라이즈 파이프 라인의 증량이 아닌 레이 트레이싱과 딥러닝을 통합한 하이브리드 그래픽 파이프 라인 아키텍처 확립으로 새로운 GPU 방향을 제시하기 시작했다. 






List of Articles
제목 날짜 조회 수
ARM 킬러, 인텔 실버몬트 베이스의 베이트레일이 다가온다 (렉싱턴,베이트레일-T,아톰 SOC) 2013.01.08 27630
아이폰5의 A6는 애플이 커스텀한 아키텍쳐가 적용 --- '혁신'은 A6 였다 2012.09.26 20432
네이버vs다음 국내 포털 점유율, 대한민국은 네이버가 지배한다 (네이버 각 데이터센터) 2013.07.02 15303
경제) 한국의 주식 시장은 완전한 사기극으로 판명? 13 2018.04.07 15255
새로운 시대의 서막, 인텔의 강력한 모바일 아키텍처 실버몬트 (베이트레일,메리필드,아보톤,랭글리) 2013.05.11 13055
인텔, 낸드플래시보다 1000배 빠른 3D XPoint 개발 3 2015.07.31 12958
글로벌 OS 점유율, 마이크로소프트 윈도우즈 시리즈의 패권은 절대적 外 웹 브라우저 점유율(윈도우 점유율,데스크탑vs모바일) 2013.06.07 11631
세계 모바일AP 시장 점유율, 퀄컴의 독주와 애플/미디어텍 약진, 엑시노스 추락 (ARM) 2013.10.12 11594
마이크로소프트의 x86 서피스 프로는 다음달부터 판매 시작 (스펙/사양) 2012.12.07 11006
마침내 1GB당 1달러에 도달한 SSD의 가격, 더 가까워진 대중화 2012.12.19 10272
윈도우10 시대로 진입, 에디션 종류 및 출시 관련 정보 2015.07.14 8936
글로벌 네트워크 시대, 그 핵심은 라우터와 스위치 (L3,X.25,프레임 릴레이) 2013.10.22 8878
서버 시장을 위한 실버몬트 아키텍처의 인텔 아톰 프로세서 아보톤(Avoton) 릴리즈 (베이트레일/메리필드) 2013.04.09 8716
2015 아키텍처> x86, HSA, HBM, TSV, 3D VNAND, 카리조 등 2015.01.16 8587
윈도우XP의 서비스 지원 종료가 다가온다. 이제는 역사의 뒤안길로 2012.11.28 8537
인텔 베이트레일 태블릿 종합 - 델 베뉴 8/11 프로,아수스 T100,레노버 믹스2,아이코니아W4등 2013.11.26 8475
전세계 스마트폰 분포도를 통한 아이폰과 안드로이드폰의 점유율 현황 (아이폰vs안드로이드) 2013.06.25 8194
전세계 데이터가 폭발한다. 2020년까지 40ZB까지 확대될 전망 (디지털 유니버스) 2012.12.12 8115
프로세서와 메모리, 스토리지를 분리한 인텔의 모듈러 서버 설계 발표 (랙 스케일 아키텍쳐 / 프로젝트 스콜피오) 2013.04.21 8105
네이버vs다음 국내 포털 점유율 - 확대되는 격차 (네이버,다음 실적) 2014.02.17 8018
HGST, HDD 기록 밀도를 2배로 증가시키는 새로운 나노 테크놀로지 Break through 기술 발표 2013.03.05 7971
퀄컴, 스마트폰에 옥타코어는 바보짓이다 - 스스로의 한계성을 인정 (ARM 빅리틀) 2013.08.03 7942
(IDF2015) 차세대 스카이레이크 아키텍처 분석 2 2015.08.20 7552
현재는 PC 플러스 시대 ― IDC 애널리스트 Bob O'Donnell 2013.10.01 7509
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 16 Next
/ 16