2016.12.14 17:37

25TFLOPS 슈퍼 GPU, AMD 베가를 GPU 컴퓨트 시장에 투입

아키텍트

조회 수 655

Radeon Instinct 이니셔티브로 GPU 컴퓨트 시장을 겨냥

AMD는 1장의 카드로 25TFLOPS(FP16)의 성능을 실현하는 새로운 GPU "Radeon Instinct MI25"를 GPU 컴퓨트에 투입한다. 차세대 GPU 아키텍처 "베가(Vega)" 베이스의 GPU다. 등장하면 NVIDIA의 파스칼 베이스의 "Tesla P100(GP100)"의 21TFLOPS(FP16)을 넘어선다.

AMD가 GPU 컴퓨트를 위한 포괄적 전략과 하드웨어 제품 계열 소프트웨어 플랫폼을 발표했다. 뜨거워진 머신 러닝(AMD는 Machine Intelligence(MI)라고 부른다)에 초점을 맞추고 GPU 컴퓨트에 대한 새로운 제품 브랜드 "Radeon Instinct"을 투입한다. Radeon Instinct는 머신 러닝 액셀러레이터를 메인 타깃으로 한 GPU 제품으로 내년(2017년)전반에 시장에 투입된다. 앞으로는 이런 GPU 컴퓨트 제품도 Radeon 브랜드의 서브 브랜드가 된다.

Radeon Instinct에는 현재의 "Polaris","Fiji" 아키텍처 GPU 뿐 아니라 차세대 "Vega" 아키텍처 GPU도 라인 업되고 있다. 새로운 아키텍처 Vega 기반의 "Radeon Instinct MI25"에서는 SIMD 포맷의 FP16(16-bit 부동 소수점 연산)이 지원되는 것도 공식적으로 밝혀졌다.

AMD는 Radeon Instinct에 맞추어 오픈 소스 머신 러닝용 라이브러리 "MIOpen"을 내년(2017년) 1분기에 제공한다. 또한 AMD는 올해(2016년) 4월에 Radeon 상에 GPU 컴퓨트 소프트웨어 플랫폼 "Radeon Open Compute Platform(ROCm)"을 발표하고 있다. ROCm은 멀티 프로그래밍 언어 대응의 오픈 소스 GPU 컴퓨팅 플랫폼이다. HSA(Heterogeneous System Architecture)의 AMD GPU 용 확장 구현의 플러스 알파로 Radeon Instinct에 맞추어 AMD는 ROCm을 확장하는 딥 러닝 프레임워크로 최적화했다.

또 AMD의 Lisa Su(리사수, President and CEO, AMD)는 Radeon Instinct 배경으로 "컴퓨팅이 몰입적(Immersive)에서 본능적(Instinctive)화 되고 있다"고 설명하며 그런 시대에는 데이터 센터가 변화할 필요가 있으며 고성능 CPU 뿐 아니라 고성능 GPU와 CPU를 연계시키는 구조가 필요하다는 것이었다. 그 양쪽을 갖춘 것은 AMD 뿐이라는 주장이다.

만반의 준비를 하고 GPU 컴퓨트 시장에 참여하는 AMD

Radeon Instinct 이니셔티브는 한마디로 AMD의 GPU 컴퓨트 시장 "재" 참가 선언이다. GPU를 범용에 사용 GPU 컴퓨트는 현재 NVIDIA의 거의 독무대다. NVIDIA의 대항마는 지금까지는 AMD GPU가 아니라 인텔의 "Knights Landing(나이츠 랜딩:KNL)"과 FPGA(Field-Programmable Gate Array) 전용 엑셀러레이터다. AMD는 이 시장에 몇번 시도했으나 별다른 성공은 거두지 못하고 있다. 원인은 몇가지 있다.

하나는 2년전까지 AMD가 CPU와 GPU를 다이상에서 통합된 "APU(Accelerated Processing Unit)"에 초점을 맞추고 디스크리트 GPU를 적극적으로 GPU 컴퓨트에 추진하지 않은 것. GPU컴퓨트를 위한 소프트웨어 플랫폼을 "HSA"로 타사가 펼치겠다고 해서 책정에 시간이 걸린 것. 그리고 아마도 GPU 컴퓨트 시장의 급속한 확대를 예측하지 못한 것이다.

그러나 상황은 달라졌다. 현재 AMD는 APU를 모든 시장에 적용하는 전략을 세우고 하이엔드 CPU와 GPU는 각각 독립적인 전략으로 전환한 것으로 보인다. 두 프로세서 사이는 간섭성 인터 커넥트로 접속할 방침을 전하고 있다. 소프트웨어는 AMD는 GPU을 오픈화하는 "GPUOpen" 이니셔티브를 1년 전에 만들어 오픈 소스화를 추진하고 그 성과가 이제 나타나기 시작했다. 한편 GPU 컴퓨트는 머신 러닝의 발전으로 HPC(High Performance Computing)시장뿐 아니라 폭넓은 시장으로 급속히 보급되고 있다. 데이터 센터 뉴럴 네트워크의 "학습(Training)"과 에지 측에서 "추론(inference)"에 GPU가 사용된다.

현재 AMD는 머신 러닝의 물결에 대응한 GPU 컴퓨트 제품 투입을 요구 받고 있다. 여기서 뒤지면 HPC라는 상대적으로 좁은(금액은 크지만 노드가 적은)시장 뿐 아니라 "모든 데이터 센터에 GPU가 들어가는" 이란 절호의 기회를 치명적으로 놓치게 된다. AMD 역시 디스크리트 GPU의 센트릭 한 방향으로 전환하고 소프트웨어 토대도 오픈 소스 커뮤니티의 힘을 빌리게 되었다. 더욱이 FinFET 프로세스와 적층 DRAM에 의해서 GPU 자체의 성능도 급격히 오르면서 머신 러닝용으로 확장한 새로운 GPU "베가(Vega)"의 투입이라는 타이밍도 맞는다. Radeon Instinct는 이러한 상황에서 투입된다.

학습 페이즈에 Vega, 추론 페이즈에 Polaris

Radeon Instinct의 라인 업은 3세대의 AMD GPU에 걸치고 있다. 성능과 전력 차례대로 "MI6","MI8","MI25"다. MI는 기계 지능에서 유래 된 것으로 보인다. 숫자는 FP16 연산시 TFLOPS 수를 나타내는 것으로 추측된다. 참고로 MI6은 007이 소속됐던 영국 첩보 기관 MI6(Military Intelligence section 6)와 같은 명칭이다.

MI6는 패시브 냉각으로 5.7TFLOPS, 224GB/sec의 메모리 대역에서 150W 이하의 전력이다.스펙부터 14nm FinFET 프로세스의 "Polaris 10(그래픽 제품에는 Radeon RX 480)" 인 것으로 추측할 수 있다.

MI8은 스몰 폼 팩터에 8.2TFLOPS, 512GB/sec의 메모리 대역에서 175W 이하의 전력 스펙부터 28nm 공정의 "Fiji XT(그래픽 제품에는 Radeon R9 Nano)"인 것으로 추측할 수 있다. Fiji 아키텍처의 저전력판이다.

MI25가 Radeon Instinct의 차세대 Vega 구조 베이스로 패시브 냉각이다. 그림에서는 2배의 연산이며 AMD는 Q&A로 SIMD 포맷의 FP16(16-bit 부동 소수점)이라고 설명하고 있다. AMD GPU는 FP32(32-bit 부동 소수점) 연산에 최적화 된 파이프 라인을 갖추고 있다. 그러나 Vega는 32-bit 파이프에서 16-bit 부동 소수점 연산을 2병렬 SIMD(Single Instruction, Multiple Data)형식으로 행하여 FP16시 FP32의 2배 성능을 낼 수 있다.

이는 머신 러닝 학습 페이즈에서 데이터 밀도를 낮춘 FP16 이용이 진행되고 있는 상황에 대응한 것이다. 현재의 GPU 컴퓨트는 기계 학습 때문에 저 정도의 서포트 경쟁이 되고 있으며 NVIDIA도 Pascal(파스칼)에서는 FP16에 대응하고 있다.

AMD는 머신 러닝 시장에서 이 3개 제품이 나뉜다고 설명한다. 인식을 하는 추론 페이즈 전용은 Polaris의 MI6에서 MI8도 추론 페이즈를 위해 자리 매김된다. 반면 MI25는 학습 페이즈와 대형 추론용이라고 AMD는 설명한다. 데이터 센터에서 학습과 대형 스케일의 추론에 쓰이는 것은 MI25다.

오픈 전략을 추진하는 AMD

AMD의 Radeon Instinct GPU 컴퓨트 전략의 열쇠는 오픈화다.

"Radeon Instinct는 단순한 제품이 아니라 완전히 새로운 이니셔티브다. 기존 컴퓨트 인프라 스트럭처는 호모지니어스(Homogeneous) 프로세서에 전용화 된 엑셀러레이터, 인터커넥트, 엑셀러레이터 소프트웨어가 남는 세계였다. 그러나 차세대 컴퓨팅 인프라에서는 헤테로지니어스(Heterogeneous:이종 혼합) 프로세서로 오픈 소스 소프트웨어 계층, 개방적인 인터커넥트와 액셀러레이터가 된다".

AMD의 Raja Koduri(라자 코두리, Senior Vice President and Chief Architect, Radeon Technologies Group, AMD)는 Radeon Instinct에서 이렇게 말한다. 오픈화와 확장성이 열쇠가 될 것이라 보는 것이 AMD의 사상이다.

AMD는 우선 딥 러닝과 하드웨어 가상화에 의한 멀티 유저 GPU(Multiuser GPU:MxGPU)는 궁합이 좋다고 설명한다. GPU를 여러 클라이언트에서 원활히 공유할 수 있으며 하드웨어 콘텍스트 스위칭 베이스의 멀티 유저 GPU를 AMD GPU는 서포트하고 있다. 이 기능을 통하여 복수의 추론 인스턴스를 가상 GPU 상에서 PCI 디바이스의 가상화 "Single Root I/O Virtualization(SR-IOV)"에 의해 효율적으로 실현된다.

멀티 GPU에서는 ROCm 소프트웨어 인프라에서 "Remote Direct Memory Access(RDMA)"에 의한 멀티 GPU간 의사 소통이 가능하고 "Coarse-Grain Shared Virtual Memory"도 지원한다.

또한, AMD는 프로세서간 간섭성 인터커넥트의 표준 규격화에도 참여하고 있다. 현재 "OpenCAPI" "CCIX(Cache Coherent Interconnect for Accelerators)" "Gen-Z"의 3개 컨소시엄이 있는데 AMD는 모두 참여하고 있다.

서버 벤더도 Radeon Instinct 서버 제품을 준비한다. 모두 Radeon Instinct MI25 베이스의 시스템이다. MI25가 16유닛 시스템에서 400TFLOPS, 4유닛 시스템에서 100TFLOPS이다. 서두에 말했듯이 MI25가 25TFLOPS 정도로 예정된 것으로 나타났다. 최대 규모의 MI25 120 유닛의 시스템은 무려 총 3PFLOPS다. 단 모두 FP16의 값이다.

AMD는 내년(2017년), 새로운 CPU Zen과 새로운 GPU 베가, 2개의 대형 아키텍처 투입을 앞두고 있다. Zen 투입후 Zen+Vega의 조합의 Radeon Instinct 플랫폼을 앞세울 것이라 보인다.

출처 - http://pc.watch.impress.co.jp/docs/column/kaigai/1034800.html

Facebook Twitter Google Pinterest

Atachment
첨부 '1'	6.jpg,

위로 아래로 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

인텔, ‘모든 곳에 인공지능 구현(AI Everywhere)’에 박차

인텔은 핫칩스 2019 (Hot Chips 2019)에서 곧 출시를 앞둔 고성능 인공지능(AI) 가속기 인텔® 너바나™(Intel® Nervana™) 신경망 프로세서에 대한 세부 정보를 공개했다. 해당 제품군에는 트레이닝용...

Date2019.09.07 CategoryENTERPRISE Views10158

Read More
삼성전자, 5G 모바일 프로세서 ‘엑시노스 980’ 공개

삼성전자가 5세대 이동통신을 지원하는 '5G 통신 모뎀'과 고성능 '모바일 AP(Application Processor)'를 하나로 통합한 5G 모바일 프로세서 '엑시노스(Exynos) 980'을 공개했다. '엑시노스 980'은 삼...

Date2019.09.07 CategoryPROCESSOR Views345

Read More
인텔, 최초의 10나노 적용 2세대 하이퍼플렉스 FPGA 출시

인텔은 Agilex FPGA(Field Programmable Gate Array)를 초기 액세스 프로그램 고객에게 출하하기 시작했다고 발표했다. 초기 액세스 프로그램의 참가자는 Colorado Engineering Inc., Mantaro Networks...

Date2019.09.01 CategoryPROCESSOR Views311

Read More
애플의 2020년 아이맥 및 인텔 Comet Lake-S 로드맵 등

해외 언론들에 의하면 미국 인텔의 10세대 Core 프로세서 코멧레이크(Comet Lake)의 데스크탑용 프로세서인 Comet Lake-S가 내년 1분기에 투입될 것으로 전망되고 있습니다. 유출된 로드맵 정보에 따...

Date2019.08.25 CategoryPROCESSOR Views543

Read More
인텔, 최대 56코어 차세대 인텔 제온 스케일러블 '쿠퍼레이크' 발표

인텔은 차세대 인텔® 제온® 스케일러블 프로세서(Intel® Xeon® Scalable processor) 제품군(코드명 쿠퍼레이크(Cooper Lake))을 발표했다. 해당 프로세서는 인텔 제온 스케일러블 플랫폼의 일환으로 ...

Date2019.08.25 CategoryPROCESSOR Views391

Read More
인텔, 노트북을 재정의할 10세대 코어 프로세서 발표

인텔은 세련된 디자인의 투인원과 노트북용으로 설계된 고도로 통합된 새로운 10세대 인텔® 코어™ 프로세서 (10th Gen Intel® Core™ processors) 11개를 출시했다. 이 프로세서는 PC에서 대규모로 고성능...

Date2019.08.25 CategoryPROCESSOR Views1252

Read More
2019년 2분기 엔비디아 실적발표, 저조한 성적표

엔비디아가 2019년 7월 28일 마감 된 2분기 실적을 발표했다. 매출은 전년 동기 대비 17% 감소한 25억 8천만 달러, 영업이익은 전년 동기 대비 51% 감소한 5억 7100만 달러, 순이익은 전년 동기 대비 ...

Date2019.08.16 CategoryENTERPRISE Views901

Read More
AMD, GPU 메모리 명령 오류를 보호하기 위한 새로운 특허

AMD가 새로운 시스템 방법을 사용하여 결함으로부터 GPU 메모리 명령을 보호하는 새로운 방법을 특허했다. 제안 된 방법은 시스템의 "마스터 및 슬레이브" 장치를 사용해 해당 명령 스트림을...

Date2019.08.16 CategoryGPU Views370

Read More
삼성, 스마트폰용 최초 1억 800만 화소 ISOCELL Bright HMX 센서 발표

삼성전자는 12일, 업계 최초의 1억 800만 화소의 스마트폰용 카메라 센서 ISOCELL Bright HMX를 발표했다. 화소 사이즈 0.8μm 센서 ISOCELL Bright 시리즈의 라인 업을 확장한 것으로, 모바일용으...

Date2019.08.15 CategoryPROCESSOR Views261

Read More
ISSCC 2019, 셀당 5비트를 구현한 도시바 PLC 낸드플래시 기술 발표

국제 고체회로 학회(ISSCC 2019)에서 도시바 메모리가 셀당 5비트를 구현하는 PLC기술을 발표했다. 낸드 플래시 시장은 셀당 비트를 저장하는 량에 따라 SLC - MLC - TLC - QLC로 진화되며 현재 시...

Date2019.08.15 CategoryENTERPRISE Views403

Read More
AMD, 서버시장용 신규 x86 CPU "EPYC 7002" 시리즈 발표

세계 서버 시장은 현재 인텔이 독점하고 있다.(2018년 기준 인텔 점유율 98%, AMD+IBM 등 나머지 2%) AMD는 이를 공략하기 위해 새로운 64코어 2세대 서버 CPU로 AMD EPYC 7002 시리즈를 발표했다. 1...

Date2019.08.15 CategoryPROCESSOR Views13109

Read More
SK하이닉스, HBM2보다 50% 빠른 HBM2E 개발 완료

SK Hynix는 업계 최고의 HBM2E의 개발을 완료하고 2020년부터 양산을 시작한다고 밝혔다. HBM2E는 핀당 3.6Gbps 전송이 가능하고, 1024개의 데이터 입출력을 갖춰 HBM2 보다 50% 빠른 460GB/s ...

Date2019.08.15 CategoryENTERPRISE Views512

Read More
삼성전자, 2019년 2분기 실적 발표 "근본적 위기 시작"

삼성전자는 연결 기준으로 매출 56.13조원, 영업이익 6.6조원의 2019년 2분기 실적을 발표했다. 2분기에는 메모리 사업에서 판가 하락 영향을 받아 매출은 전년 동기 대비 약 4% 감소했고, 영업이익은...

Date2019.08.01 CategoryENTERPRISE Views272

Read More
애플, 인텔의 스마트폰 모뎀 사업을 10억 달러에 인수

지금도 경쟁상대가 없는 애플의 A칩은 이번 인수로 자체 기술 모뎀까지 융합 될 예정 미국 애플(Apple)이 26일, 인텔의 스마트폰 모뎀 사업을 10억 달러에 인수한다고 발표했다. 애플의 인수에 ...

Date2019.07.27 CategoryENTERPRISE Views389

Read More
화웨이(Huawei) 자체 개발 서버 CPU 'Kunpeng' 대규모 투자

화웨이(Huawei)는 자체 개발한 ARM 기반 서버용 CPU 'Kunpeng'의 보급을 위해 5년간 30억위안을 투자한다고 발표했다. 화웨이는 지난 1월 7나노 프로세스의 ARM 베이스 64코어 CPU로 Kunpeng 920을 ...

Date2019.07.27 CategoryPROCESSOR Views437

Read More
2019년 2분기 인텔 실적발표, 가이던스 초과 호조

Business Unit Summary Key Business Unit Revenue and Trends Q2 2019 vs. Q2 2018 PC-centric CCG $8.8 billion up 1% Data-centric DCG $5.0 billion down 10% Internet ...

Date2019.07.27 CategoryENTERPRISE Views557

Read More
SK하이닉스, 2019년 2분기 경영실적 발표

- 2019년 2분기 경영실적 • 매출액 6조4,522억 원, 영업이익 6,376억 원(영업이익률 10%), 순이익 5,370억 원(순이익률 8%) - D램·낸드 생산량 및 투자 탄력적으로 조정해 시장 하강국면에 대응 SK하이...

Date2019.07.27 CategoryENTERPRISE Views16658

Read More
AMD, 컴퓨트 익스프레스 링크(CXL) 컨소시엄 합류

AMD의 최고 기술 책임자(CTO) 마크 페이퍼 마스터(Mark Papermaster)는 블로그에 AMD가 Compute Express Link(CXL) 컨소시엄에 합류했다고 발표했습니다. AMD는 이전부터 CCIX, OpenCAPI, Gen-Z와 ...

Date2019.07.23 CategoryENTERPRISE Views344

Read More
엔비디아(NVIDIA), 699달러 지포스RTX 2080 Super 출시

엔비디아가 지포스 RTX 2080 수퍼 그래픽 카드를 출시했습니다. RTX 2080 Super는 기존과 동일한 12nm TU104 칩 기반이지만 몇 가지가 강화되고 있습니다. 강화되는 부문의 첫번째는 3072기의 CUDA 코어...

Date2019.07.23 CategoryGPU Views286

Read More
애플, 캐나다 홍콩 유럽 등에서 '애플 카드' 상표 신청

애플의 크레딧 카드 서비스 "애플 카드(Apple Card)"는 여름부터 미국에서 제공을 시작하는데 해외 정보에 의하면 애플은 캐나다 및 유럽 등에서도 서비스 시작을 준비하고 있는 것으로 나타났습니다. ...

Date2019.07.21 CategoryENTERPRISE Views557

Read More
마이크로소프트의 '어닝 서프라이즈' 실적, 순이익 49% 증가

Three Months Ended June 30, 2019 Percentage Change Y/Y (GAAP) Constant Currency Impact Percentage Change Y/Y Constant Currency Office Commercial products and cloud services 14% 2% 1...

Date2019.07.21 CategoryENTERPRISE Views469

Read More
삼성 갤럭시 S8, 20명 보트 승객 구조에 도움

삼성전자 스마트폰 갤럭시 S8이 최근 필리핀에서 일어난 보트 전복 사고에서 승객들을 무사히 구조하는 데 큰 역할을 한 것으로 밝혀졌다. 지난 8일, 필리핀 세부 보고시티 인근에서 20명의 승객이 탑...

Date2019.07.20 CategoryENTERPRISE Views244

Read More
10세대 코어 시리즈, 인텔 코멧레이크(Comet Lake) 정보

AMD의 3세대 Ryzen 프로세서 제품군에 대한 인텔의 단기 대응은 10세대 Core "코멧레이크(Comet Lake)"입니다. 이 프로세서는 기존의 "Skylake" 코어를 기반으로 하고 있지만 코어 수가 증가했으며 ...

Date2019.07.13 CategoryPROCESSOR Views816

Read More
인텔의 새로운 Co-EMIB, ODI, MDIO 반도체 패키징 기술 공개

인텔이 샌프란시스코에서 진행한 SEMICON West 행사에서 새로운 Co-EMIB 패키징 기술을 발표했다. Co-EMIB 기술은 인텔이 기존에 발표한 EMIB(Embedded Multi-die Interconnect Bridge) 및 논리...

Date2019.07.13 CategoryPROCESSOR Views577

Read More
삼성전자, 차세대 반도체·디스플레이 위한 핵심소재·신규소자 연구 집중 지원

삼성전자는 2019년 삼성미래기술육성사업 지정테마 연구지원 과제 15개를 선정해 발표했다. 삼성전자는 삼성미래기술육성사업 일환으로 국가적으로 연구가 필요한 미래 과학기술 분야의 혁신을 위해 2...

Date2019.07.12 CategoryENTERPRISE Views14624

Read More
NVIDIA 차세대 GPU, 삼성 EUV 7nm 공정 적용?

코리아 헤럴드(Korea Herald) 신문에 따르면 엔비디아(NVIDIA)의 차기 GPU 제조를 삼성 파운드리가 맡을 수 있는 것으로 전망되고 있다. 보도에 따르면 서울에서 개최된 NVIDIA AI 컨퍼런스에서 엔...

Date2019.07.06 CategoryGPU Views224

Read More
인공지능의 7가지 유형...“인간을 모방하는 수준과 기술적 특성에 따른 분류”

오늘날 우리가 경험하고 있는 놀라운 인공지능 응용 프로그램은 전체 인공지능 기술 중 빙산의 일각에 불과하며, 이미 구현된 인공지능뿐만 아니라 앞으로 실현 가능한 인공지능의 유형 유형까지 이해하...

Date2019.07.06 CategorySOFTWARE Views587

Read More
LG전자, 2019년 2분기 잠정실적 발표 (영업익 6500억)

LG전자가 2019년 2분기 잠정실적을 발표했다. LG전자는 연결기준 매출액 15조 6,301억원, 영업이익 6,522억원을 달성했다. 전년 동기 대비 매출액은 4.1% 증가하고 영업이익은 15.4% 감소했다. ...

Date2019.07.06 CategoryENTERPRISE Views249

Read More