2016.12.14 17:37

25TFLOPS 슈퍼 GPU, AMD 베가를 GPU 컴퓨트 시장에 투입

아키텍트

조회 수 655

Radeon Instinct 이니셔티브로 GPU 컴퓨트 시장을 겨냥

AMD는 1장의 카드로 25TFLOPS(FP16)의 성능을 실현하는 새로운 GPU "Radeon Instinct MI25"를 GPU 컴퓨트에 투입한다. 차세대 GPU 아키텍처 "베가(Vega)" 베이스의 GPU다. 등장하면 NVIDIA의 파스칼 베이스의 "Tesla P100(GP100)"의 21TFLOPS(FP16)을 넘어선다.

AMD가 GPU 컴퓨트를 위한 포괄적 전략과 하드웨어 제품 계열 소프트웨어 플랫폼을 발표했다. 뜨거워진 머신 러닝(AMD는 Machine Intelligence(MI)라고 부른다)에 초점을 맞추고 GPU 컴퓨트에 대한 새로운 제품 브랜드 "Radeon Instinct"을 투입한다. Radeon Instinct는 머신 러닝 액셀러레이터를 메인 타깃으로 한 GPU 제품으로 내년(2017년)전반에 시장에 투입된다. 앞으로는 이런 GPU 컴퓨트 제품도 Radeon 브랜드의 서브 브랜드가 된다.

Radeon Instinct에는 현재의 "Polaris","Fiji" 아키텍처 GPU 뿐 아니라 차세대 "Vega" 아키텍처 GPU도 라인 업되고 있다. 새로운 아키텍처 Vega 기반의 "Radeon Instinct MI25"에서는 SIMD 포맷의 FP16(16-bit 부동 소수점 연산)이 지원되는 것도 공식적으로 밝혀졌다.

AMD는 Radeon Instinct에 맞추어 오픈 소스 머신 러닝용 라이브러리 "MIOpen"을 내년(2017년) 1분기에 제공한다. 또한 AMD는 올해(2016년) 4월에 Radeon 상에 GPU 컴퓨트 소프트웨어 플랫폼 "Radeon Open Compute Platform(ROCm)"을 발표하고 있다. ROCm은 멀티 프로그래밍 언어 대응의 오픈 소스 GPU 컴퓨팅 플랫폼이다. HSA(Heterogeneous System Architecture)의 AMD GPU 용 확장 구현의 플러스 알파로 Radeon Instinct에 맞추어 AMD는 ROCm을 확장하는 딥 러닝 프레임워크로 최적화했다.

또 AMD의 Lisa Su(리사수, President and CEO, AMD)는 Radeon Instinct 배경으로 "컴퓨팅이 몰입적(Immersive)에서 본능적(Instinctive)화 되고 있다"고 설명하며 그런 시대에는 데이터 센터가 변화할 필요가 있으며 고성능 CPU 뿐 아니라 고성능 GPU와 CPU를 연계시키는 구조가 필요하다는 것이었다. 그 양쪽을 갖춘 것은 AMD 뿐이라는 주장이다.

만반의 준비를 하고 GPU 컴퓨트 시장에 참여하는 AMD

Radeon Instinct 이니셔티브는 한마디로 AMD의 GPU 컴퓨트 시장 "재" 참가 선언이다. GPU를 범용에 사용 GPU 컴퓨트는 현재 NVIDIA의 거의 독무대다. NVIDIA의 대항마는 지금까지는 AMD GPU가 아니라 인텔의 "Knights Landing(나이츠 랜딩:KNL)"과 FPGA(Field-Programmable Gate Array) 전용 엑셀러레이터다. AMD는 이 시장에 몇번 시도했으나 별다른 성공은 거두지 못하고 있다. 원인은 몇가지 있다.

하나는 2년전까지 AMD가 CPU와 GPU를 다이상에서 통합된 "APU(Accelerated Processing Unit)"에 초점을 맞추고 디스크리트 GPU를 적극적으로 GPU 컴퓨트에 추진하지 않은 것. GPU컴퓨트를 위한 소프트웨어 플랫폼을 "HSA"로 타사가 펼치겠다고 해서 책정에 시간이 걸린 것. 그리고 아마도 GPU 컴퓨트 시장의 급속한 확대를 예측하지 못한 것이다.

그러나 상황은 달라졌다. 현재 AMD는 APU를 모든 시장에 적용하는 전략을 세우고 하이엔드 CPU와 GPU는 각각 독립적인 전략으로 전환한 것으로 보인다. 두 프로세서 사이는 간섭성 인터 커넥트로 접속할 방침을 전하고 있다. 소프트웨어는 AMD는 GPU을 오픈화하는 "GPUOpen" 이니셔티브를 1년 전에 만들어 오픈 소스화를 추진하고 그 성과가 이제 나타나기 시작했다. 한편 GPU 컴퓨트는 머신 러닝의 발전으로 HPC(High Performance Computing)시장뿐 아니라 폭넓은 시장으로 급속히 보급되고 있다. 데이터 센터 뉴럴 네트워크의 "학습(Training)"과 에지 측에서 "추론(inference)"에 GPU가 사용된다.

현재 AMD는 머신 러닝의 물결에 대응한 GPU 컴퓨트 제품 투입을 요구 받고 있다. 여기서 뒤지면 HPC라는 상대적으로 좁은(금액은 크지만 노드가 적은)시장 뿐 아니라 "모든 데이터 센터에 GPU가 들어가는" 이란 절호의 기회를 치명적으로 놓치게 된다. AMD 역시 디스크리트 GPU의 센트릭 한 방향으로 전환하고 소프트웨어 토대도 오픈 소스 커뮤니티의 힘을 빌리게 되었다. 더욱이 FinFET 프로세스와 적층 DRAM에 의해서 GPU 자체의 성능도 급격히 오르면서 머신 러닝용으로 확장한 새로운 GPU "베가(Vega)"의 투입이라는 타이밍도 맞는다. Radeon Instinct는 이러한 상황에서 투입된다.

학습 페이즈에 Vega, 추론 페이즈에 Polaris

Radeon Instinct의 라인 업은 3세대의 AMD GPU에 걸치고 있다. 성능과 전력 차례대로 "MI6","MI8","MI25"다. MI는 기계 지능에서 유래 된 것으로 보인다. 숫자는 FP16 연산시 TFLOPS 수를 나타내는 것으로 추측된다. 참고로 MI6은 007이 소속됐던 영국 첩보 기관 MI6(Military Intelligence section 6)와 같은 명칭이다.

MI6는 패시브 냉각으로 5.7TFLOPS, 224GB/sec의 메모리 대역에서 150W 이하의 전력이다.스펙부터 14nm FinFET 프로세스의 "Polaris 10(그래픽 제품에는 Radeon RX 480)" 인 것으로 추측할 수 있다.

MI8은 스몰 폼 팩터에 8.2TFLOPS, 512GB/sec의 메모리 대역에서 175W 이하의 전력 스펙부터 28nm 공정의 "Fiji XT(그래픽 제품에는 Radeon R9 Nano)"인 것으로 추측할 수 있다. Fiji 아키텍처의 저전력판이다.

MI25가 Radeon Instinct의 차세대 Vega 구조 베이스로 패시브 냉각이다. 그림에서는 2배의 연산이며 AMD는 Q&A로 SIMD 포맷의 FP16(16-bit 부동 소수점)이라고 설명하고 있다. AMD GPU는 FP32(32-bit 부동 소수점) 연산에 최적화 된 파이프 라인을 갖추고 있다. 그러나 Vega는 32-bit 파이프에서 16-bit 부동 소수점 연산을 2병렬 SIMD(Single Instruction, Multiple Data)형식으로 행하여 FP16시 FP32의 2배 성능을 낼 수 있다.

이는 머신 러닝 학습 페이즈에서 데이터 밀도를 낮춘 FP16 이용이 진행되고 있는 상황에 대응한 것이다. 현재의 GPU 컴퓨트는 기계 학습 때문에 저 정도의 서포트 경쟁이 되고 있으며 NVIDIA도 Pascal(파스칼)에서는 FP16에 대응하고 있다.

AMD는 머신 러닝 시장에서 이 3개 제품이 나뉜다고 설명한다. 인식을 하는 추론 페이즈 전용은 Polaris의 MI6에서 MI8도 추론 페이즈를 위해 자리 매김된다. 반면 MI25는 학습 페이즈와 대형 추론용이라고 AMD는 설명한다. 데이터 센터에서 학습과 대형 스케일의 추론에 쓰이는 것은 MI25다.

오픈 전략을 추진하는 AMD

AMD의 Radeon Instinct GPU 컴퓨트 전략의 열쇠는 오픈화다.

"Radeon Instinct는 단순한 제품이 아니라 완전히 새로운 이니셔티브다. 기존 컴퓨트 인프라 스트럭처는 호모지니어스(Homogeneous) 프로세서에 전용화 된 엑셀러레이터, 인터커넥트, 엑셀러레이터 소프트웨어가 남는 세계였다. 그러나 차세대 컴퓨팅 인프라에서는 헤테로지니어스(Heterogeneous:이종 혼합) 프로세서로 오픈 소스 소프트웨어 계층, 개방적인 인터커넥트와 액셀러레이터가 된다".

AMD의 Raja Koduri(라자 코두리, Senior Vice President and Chief Architect, Radeon Technologies Group, AMD)는 Radeon Instinct에서 이렇게 말한다. 오픈화와 확장성이 열쇠가 될 것이라 보는 것이 AMD의 사상이다.

AMD는 우선 딥 러닝과 하드웨어 가상화에 의한 멀티 유저 GPU(Multiuser GPU:MxGPU)는 궁합이 좋다고 설명한다. GPU를 여러 클라이언트에서 원활히 공유할 수 있으며 하드웨어 콘텍스트 스위칭 베이스의 멀티 유저 GPU를 AMD GPU는 서포트하고 있다. 이 기능을 통하여 복수의 추론 인스턴스를 가상 GPU 상에서 PCI 디바이스의 가상화 "Single Root I/O Virtualization(SR-IOV)"에 의해 효율적으로 실현된다.

멀티 GPU에서는 ROCm 소프트웨어 인프라에서 "Remote Direct Memory Access(RDMA)"에 의한 멀티 GPU간 의사 소통이 가능하고 "Coarse-Grain Shared Virtual Memory"도 지원한다.

또한, AMD는 프로세서간 간섭성 인터커넥트의 표준 규격화에도 참여하고 있다. 현재 "OpenCAPI" "CCIX(Cache Coherent Interconnect for Accelerators)" "Gen-Z"의 3개 컨소시엄이 있는데 AMD는 모두 참여하고 있다.

서버 벤더도 Radeon Instinct 서버 제품을 준비한다. 모두 Radeon Instinct MI25 베이스의 시스템이다. MI25가 16유닛 시스템에서 400TFLOPS, 4유닛 시스템에서 100TFLOPS이다. 서두에 말했듯이 MI25가 25TFLOPS 정도로 예정된 것으로 나타났다. 최대 규모의 MI25 120 유닛의 시스템은 무려 총 3PFLOPS다. 단 모두 FP16의 값이다.

AMD는 내년(2017년), 새로운 CPU Zen과 새로운 GPU 베가, 2개의 대형 아키텍처 투입을 앞두고 있다. Zen 투입후 Zen+Vega의 조합의 Radeon Instinct 플랫폼을 앞세울 것이라 보인다.

출처 - http://pc.watch.impress.co.jp/docs/column/kaigai/1034800.html

Facebook Twitter Google Pinterest

Atachment
첨부 '1'	6.jpg,

위로 아래로 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

AMD, HDR 대응을 추가한 프리싱크2 기술 발표

미국 AMD는 3일(현지 시간) HDR 대응 등의 추가 사양을 담은 동적 리프레시 레이트 동기화 기술 "Radeon FreeSync 2" 기술을 발표했다. FreeSync는 비디오 카드 출력과 디스플레이 리프레시 레이트를...

Date2017.01.05 CategoryGPU Views259

Read More
지포스도 서브 스크립션 시대로 (클라우드 게이밍)

미국 NVIDIA는 4일(현지 시간) CES 2017에서 프레스 컨퍼런스를 개최하고 클라우드 경유로 지포스의 성능을 이용하여 최신 게임을 플레이할 수 있는 "GeForce Now" 서비스 전개를 발표했다. 그 동...

Date2017.01.05 CategoryGPU Views336

Read More
25TFLOPS 슈퍼 GPU, AMD 베가를 GPU 컴퓨트 시장에 투입

Radeon Instinct 이니셔티브로 GPU 컴퓨트 시장을 겨냥AMD는 1장의 카드로 25TFLOPS(FP16)의 성능을 실현하는 새로운 GPU "Radeon Instinct MI25"를 GPU 컴퓨트에 투입한다. 차세대 GPU 아키텍처 "베가(Veg...

Date2016.12.14 CategoryGPU Views655

Read More
지포스vs라데온 GPU 점유율 분석 (from 2002 to Q3/2016)

엔비디아의 지포스와 AMD 라데온의 2002년부터 2016년 3분기 현재까지 GPU 점유율 - 주요 시기별 점유율 추이 분석 2002년 4분기 지포스 VS 라데온 = 65 : 26 (라데온 9000 시리즈) 지포스 ...

Date2016.11.24 CategoryGPU Views658

Read More
NVIDIA, 맥스웰을 종결시키는 지포스GTX 1050 발표

미국 NVIDIA는 18일(현지 시간) 파스칼 아키텍처를 채택한 엔트리용 GPU "GeForce GTX 1050", "GeForce GTX 1050 Ti"를 발표했다. 미국에서 발매는 10월 25일로 권장 소매 가격은 전자가 109달러,...

Date2016.10.20 CategoryGPU Views543

Read More
엔비디아는 지포스GTX 1050TI, 1050 두가지 모델을 준비중

해외 정보에 따르면, 엔비디아가 새로운 지포스GTX 1050TI와 1050 두가지 모델을 준비중인 것으로 알려졌습니다. 지포스GTX 1050TI는 768 CUDA 코어, 48 TMUs, 32 ROPs, 1290MHz 베이...

Date2016.10.02 CategoryGPU Views819

Read More
차기 메인스트림 강자! 지포스GTX 1050 정보

benchlife.info 사이트에 따르면 엔비디아가 차세대 메인스트림 GPU 지포스GTX 1050을 준비중인 것으로 확인되고 있습니다. 현재의 메인스트림 GPU 지포스GTX 950을 대체하게 될 1050은 신형 파...

Date2016.09.06 CategoryGPU Views354

Read More
엔비디아 지포스GTX 1060 3GB 발매, 메인스트림 장악

엔비디아가 먼저 발표한 퍼포먼스급 지포스GTX 1060 6GB에 이어 GTX 1060 3GB 모델을 발표했다. 지포스GTX 1060 3GB 모델은 TSMC 16나노 공정의 GP106 코어가 탑재되며 쿠다코어가 기존 6GB 모델의...

Date2016.08.23 CategoryGPU Views619

Read More
제온파이가 GPU보다 빠르다는 주장에 엔비디아가 반박

미국 NVIDIA는 16일(현지시간) 인텔이 공개한 심층 학습(딥러닝)에 관한 제온파이와 NVIDIA GPU을 비교한 벤치마크 결과에 오류가 있다는 주장을 블로그에 공개했다. 인텔에 따르면 제온파이는 딥...

Date2016.08.19 CategoryGPU Views494

Read More
엔비디아, 노트북에도 M이 아닌 풀버전 GTX 1080 투입

미국 NVIDIA는 16일(현지 시간) 노트 PC용 GPU, GeForce GTX 1080, 1070, 1060을 발표했다. 탑재기는 노트 PC업체부터 차례로 출하된다. 파스칼 아키텍처를 채용한 모바일 GPU지만 ...

Date2016.08.16 CategoryGPU Views360

Read More
AMD 폴라리스 라데온 RX470, RX460 공식 발표

NITRO+ RADEON RX 470 8G/4G 미국 AMD는 4일(현지 시간) 폴라리스 아키텍처를 채택한 비디오 카드의 하위 모델 "Radeon RX 470" 및 "Radeon RX 460"을 공식 발표했다. 라데온 RX 470은 이미 투...

Date2016.08.05 CategoryGPU Views554

Read More
맥스웰 980보다 싸고 빠른 지포스GTX 1060 공식 발표

미국 NVIDIA는 Pascal 아키텍처를 채용한 미들 레인지 GPU "GeForce GTX 1060"을 발표했다. 전 세계에서 7월 19일부터 출시되고 미국에서의 가격은 일반 버전이 249달러, 파운더스 에디션(NVIDIA 직...

Date2016.07.20 CategoryGPU Views536

Read More
사파이어 AMD 라데온RX 480 분해 사진 공개

AMD 라데온 메이저 카드 제조사 사파이어의 RX480 레퍼런스 제품의 분해 사진 공개. RX480 레퍼런스는 14나노 "Ellesmere" 실리콘에 실제 PCB는 짧으며 6페이즈 전원부, LFPAK 모스펫, 삼성제 8Gbps G...

Date2016.06.23 CategoryGPU Views864

Read More
파스칼 베이스의 테슬라 P100 GPU 발표, HBM2 탑재

미국 NVIDIA는 19일(현지시간) "GeForce GTX 1080"등과 같은 파스칼 아키텍처를 채용한 슈퍼 컴퓨터용 GPU "테슬라 P100"을 발표했다. Tesla P100은 NVIDIA 자체 고속 인터 커넥트 "NVLin...

Date2016.06.21 CategoryGPU Views431

Read More
AMD 라데온RX 480에 이어 470 및 460 투입

미국 AMD는 13일(현지시간) 미국에서 진행되고 있는 게임쇼 "E3(Electronic Entertainment Expo)"에 맞춰 라데온RX 시리즈의 하위 모델에 대한 정보를 밝혔다. COMPUTEX TAIPEI 2016에서 199달러...

Date2016.06.15 CategoryGPU Views365

Read More
AMD 라데온RX 470은 지포스GTX 타이탄과 비슷한 성능?

AMD는 13일에 폴라리스 아키텍처를 바탕으로 한 라데온RX 480의 하위 모델, 라데온RX 470과 라데온RX 460을 발표했다. 동시에 공개한 슬라이드를 확인하면 라데온RX 470의 성능이 밝혀지고 있다. AM...

Date2016.06.15 CategoryGPU Views2847

Read More
COMPUTEX 2016) AMD 라데온RX 480 발표, 가격은 199달러

AMD는 폴라리스 아키텍처의 신세대 GPU 라데온RX 480을 발표했다. 1억명의 사용자에게 프리미엄 VR체험을 불과 199달러로 제공한다고 하며 출하는 6월 29일. 첫 폴라리스 아키텍처 기반의 GPU...

Date2016.06.01 CategoryGPU Views565

Read More
COMPUTEX 2016) 엔비디아 파스칼 GPU 전체 라인업 소개

NVIDIA는 30일(대만시간) COMPUTEX TAIPEI 2016 개막을 앞두고 Taipei International Convention Center 옆 그랜드 하얏트 타이베이에서 기자 회견을 개최하고 이 회사 창시자 겸 CEO 젠슨·황이...

Date2016.05.31 CategoryGPU Views381

Read More
컬러풀-MSI 지포스GTX 1080 제품 사진 모음

컬러풀 지포스GTX 1080 사진부터 MSI 카드 사진 모음. 출처 - http://www.techpowerup.com/ Colorful Technology Company Limited, professional manufacturer of graphics cards and motherboards, ...

Date2016.05.28 CategoryGPU Views433

Read More
게인워드 - inno3D - Palit 각각의 지포스GTX 1080 사진 모음

게인워드-inno3D-Palit 각각의 지포스GTX 1080 사진 모음 출처 - http://www.techpowerup.com/ inno3D 지포스GTX 1080 InnoVISION Multimedia Limited, a leading manufacturer of high-end...

Date2016.05.28 CategoryGPU Views897

Read More