4월 29일 (월) 오후 4:32

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2024.06.05. / 장르 드람 / 국가 대한민국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
개봉 2024.05.22. / 장르 액션 / 국가 미국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...

Radeon Instinct 이니셔티브로 GPU 컴퓨트 시장을 겨냥

AMD는 1장의 카드로 25TFLOPS(FP16)의 성능을 실현하는 새로운 GPU "Radeon Instinct MI25"를 GPU 컴퓨트에 투입한다. 차세대 GPU 아키텍처 "베가(Vega)" 베이스의 GPU다. 등장하면 NVIDIA의 파스칼 베이스의 "Tesla P100(GP100)"의 21TFLOPS(FP16)을 넘어선다.


AMD가 GPU 컴퓨트를 위한 포괄적 전략과 하드웨어 제품 계열 소프트웨어 플랫폼을 발표했다. 뜨거워진 머신 러닝(AMD는 Machine Intelligence(MI)라고 부른다)에 초점을 맞추고 GPU 컴퓨트에 대한 새로운 제품 브랜드 "Radeon Instinct"을 투입한다. Radeon Instinct는 머신 러닝 액셀러레이터를 메인 타깃으로 한 GPU 제품으로 내년(2017년)전반에 시장에 투입된다. 앞으로는 이런 GPU 컴퓨트 제품도 Radeon 브랜드의 서브 브랜드가 된다.


Radeon Instinct에는 현재의 "Polaris","Fiji" 아키텍처 GPU 뿐 아니라 차세대 "Vega" 아키텍처 GPU도 라인 업되고 있다. 새로운 아키텍처 Vega 기반의 "Radeon Instinct MI25"에서는 SIMD 포맷의 FP16(16-bit 부동 소수점 연산)이 지원되는 것도 공식적으로 밝혀졌다.


1_s.png
2_s.png
3_s.png


AMD는 Radeon Instinct에 맞추어 오픈 소스 머신 러닝용 라이브러리 "MIOpen"을 내년(2017년) 1분기에 제공한다. 또한 AMD는 올해(2016년) 4월에 Radeon 상에 GPU 컴퓨트 소프트웨어 플랫폼 "Radeon Open Compute Platform(ROCm)"을 발표하고 있다. ROCm은 멀티 프로그래밍 언어 대응의 오픈 소스 GPU 컴퓨팅 플랫폼이다. HSA(Heterogeneous System Architecture)의 AMD GPU 용 확장 구현의 플러스 알파로 Radeon Instinct에 맞추어 AMD는 ROCm을 확장하는 딥 러닝 프레임워크로 최적화했다.


4_s.png
5_s.png
6_s.png
7_s.png
8_s.png
9_s.png
10_s.png
11_s.png
12_s.png

또 AMD의 Lisa Su(리사수, President and CEO, AMD)는 Radeon Instinct 배경으로 "컴퓨팅이 몰입적(Immersive)에서 본능적(Instinctive)화 되고 있다"고 설명하며 그런 시대에는 데이터 센터가 변화할 필요가 있으며 고성능 CPU 뿐 아니라 고성능 GPU와 CPU를 연계시키는 구조가 필요하다는 것이었다. 그 양쪽을 갖춘 것은 AMD 뿐이라는 주장이다.


13_s.png
14_s.png
15_s.png
16_s.png
17_s.png


만반의 준비를 하고 GPU 컴퓨트 시장에 참여하는 AMD

Radeon Instinct 이니셔티브는 한마디로 AMD의 GPU 컴퓨트 시장 "재" 참가 선언이다. GPU를 범용에 사용 GPU 컴퓨트는 현재 NVIDIA의 거의 독무대다. NVIDIA의 대항마는 지금까지는 AMD GPU가 아니라 인텔의 "Knights Landing(나이츠 랜딩:KNL)"과 FPGA(Field-Programmable Gate Array) 전용 엑셀러레이터다. AMD는 이 시장에 몇번 시도했으나 별다른 성공은 거두지 못하고 있다. 원인은 몇가지 있다.


하나는 2년전까지 AMD가 CPU와 GPU를 다이상에서 통합된 "APU(Accelerated Processing Unit)"에 초점을 맞추고 디스크리트 GPU를 적극적으로 GPU 컴퓨트에 추진하지 않은 것. GPU컴퓨트를 위한 소프트웨어 플랫폼을 "HSA"로 타사가 펼치겠다고 해서 책정에 시간이 걸린 것. 그리고 아마도 GPU 컴퓨트 시장의 급속한 확대를 예측하지 못한 것이다.


그러나 상황은 달라졌다. 현재 AMD는 APU를 모든 시장에 적용하는 전략을 세우고 하이엔드 CPU와 GPU는 각각 독립적인 전략으로 전환한 것으로 보인다. 두 프로세서 사이는 간섭성 인터 커넥트로 접속할 방침을 전하고 있다. 소프트웨어는 AMD는 GPU을 오픈화하는 "GPUOpen" 이니셔티브를 1년 전에 만들어 오픈 소스화를 추진하고 그 성과가 이제 나타나기 시작했다. 한편 GPU 컴퓨트는 머신 러닝의 발전으로 HPC(High Performance Computing)시장뿐 아니라 폭넓은 시장으로 급속히 보급되고 있다. 데이터 센터 뉴럴 네트워크의 "학습(Training)"과 에지 측에서 "추론(inference)"에 GPU가 사용된다.


18_s.png
19_s.png


현재 AMD는 머신 러닝의 물결에 대응한 GPU 컴퓨트 제품 투입을 요구 받고 있다. 여기서 뒤지면 HPC라는 상대적으로 좁은(금액은 크지만 노드가 적은)시장 뿐 아니라 "모든 데이터 센터에 GPU가 들어가는" 이란 절호의 기회를 치명적으로 놓치게 된다. AMD 역시 디스크리트 GPU의 센트릭 한 방향으로 전환하고 소프트웨어 토대도 오픈 소스 커뮤니티의 힘을 빌리게 되었다. 더욱이 FinFET 프로세스와 적층 DRAM에 의해서 GPU 자체의 성능도 급격히 오르면서 머신 러닝용으로 확장한 새로운 GPU "베가(Vega)"의 투입이라는 타이밍도 맞는다. Radeon Instinct는 이러한 상황에서 투입된다.


20_s.png
21_s.png


학습 페이즈에 Vega, 추론 페이즈에 Polaris

Radeon Instinct의 라인 업은 3세대의 AMD GPU에 걸치고 있다. 성능과 전력 차례대로 "MI6","MI8","MI25"다. MI는 기계 지능에서 유래 된 것으로 보인다. 숫자는 FP16 연산시 TFLOPS 수를 나타내는 것으로 추측된다. 참고로 MI6은 007이 소속됐던 영국 첩보 기관 MI6(Military Intelligence section 6)와 같은 명칭이다.


MI6는 패시브 냉각으로 5.7TFLOPS, 224GB/sec의 메모리 대역에서 150W 이하의 전력이다.스펙부터 14nm FinFET 프로세스의 "Polaris 10(그래픽 제품에는 Radeon RX 480)" 인 것으로 추측할 수 있다.


22_s.png


MI8은 스몰 폼 팩터에 8.2TFLOPS, 512GB/sec의 메모리 대역에서 175W 이하의 전력 스펙부터 28nm 공정의 "Fiji XT(그래픽 제품에는 Radeon R9 Nano)"인 것으로 추측할 수 있다. Fiji 아키텍처의 저전력판이다.


MI25가 Radeon Instinct의 차세대 Vega 구조 베이스로 패시브 냉각이다. 그림에서는 2배의 연산이며 AMD는 Q&A로 SIMD 포맷의 FP16(16-bit 부동 소수점)이라고 설명하고 있다. AMD GPU는 FP32(32-bit 부동 소수점) 연산에 최적화 된 파이프 라인을 갖추고 있다. 그러나 Vega는 32-bit 파이프에서 16-bit 부동 소수점 연산을 2병렬 SIMD(Single Instruction, Multiple Data)형식으로 행하여 FP16시 FP32의 2배 성능을 낼 수 있다.


이는 머신 러닝 학습 페이즈에서 데이터 밀도를 낮춘 FP16 이용이 진행되고 있는 상황에 대응한 것이다. 현재의 GPU 컴퓨트는 기계 학습 때문에 저 정도의 서포트 경쟁이 되고 있으며 NVIDIA도 Pascal(파스칼)에서는 FP16에 대응하고 있다.


AMD는 머신 러닝 시장에서 이 3개 제품이 나뉜다고 설명한다. 인식을 하는 추론 페이즈 전용은 Polaris의 MI6에서 MI8도 추론 페이즈를 위해 자리 매김된다. 반면 MI25는 학습 페이즈와 대형 추론용이라고 AMD는 설명한다. 데이터 센터에서 학습과 대형 스케일의 추론에 쓰이는 것은 MI25다.


23_s.png


오픈 전략을 추진하는 AMD

AMD의 Radeon Instinct GPU 컴퓨트 전략의 열쇠는 오픈화다.


"Radeon Instinct는 단순한 제품이 아니라 완전히 새로운 이니셔티브다. 기존 컴퓨트 인프라 스트럭처는 호모지니어스(Homogeneous) 프로세서에 전용화 된 엑셀러레이터, 인터커넥트, 엑셀러레이터 소프트웨어가 남는 세계였다. 그러나 차세대 컴퓨팅 인프라에서는 헤테로지니어스(Heterogeneous:이종 혼합) 프로세서로 오픈 소스 소프트웨어 계층, 개방적인 인터커넥트와 액셀러레이터가 된다".


AMD의 Raja Koduri(라자 코두리, Senior Vice President and Chief Architect, Radeon Technologies Group, AMD)는 Radeon Instinct에서 이렇게 말한다. 오픈화와 확장성이 열쇠가 될 것이라 보는 것이 AMD의 사상이다.


24_s.png
25_s.png


AMD는 우선 딥 러닝과 하드웨어 가상화에 의한 멀티 유저 GPU(Multiuser GPU:MxGPU)는 궁합이 좋다고 설명한다. GPU를 여러 클라이언트에서 원활히 공유할 수 있으며 하드웨어 콘텍스트 스위칭 베이스의 멀티 유저 GPU를 AMD GPU는 서포트하고 있다. 이 기능을 통하여 복수의 추론 인스턴스를 가상 GPU 상에서 PCI 디바이스의 가상화 "Single Root I/O Virtualization(SR-IOV)"에 의해 효율적으로 실현된다.


멀티 GPU에서는 ROCm 소프트웨어 인프라에서 "Remote Direct Memory Access(RDMA)"에 의한 멀티 GPU간 의사 소통이 가능하고 "Coarse-Grain Shared Virtual Memory"도 지원한다.


또한, AMD는 프로세서간 간섭성 인터커넥트의 표준 규격화에도 참여하고 있다. 현재 "OpenCAPI" "CCIX(Cache Coherent Interconnect for Accelerators)" "Gen-Z"의 3개 컨소시엄이 있는데 AMD는 모두 참여하고 있다.


26_s.png
27_s.png
28_s.png


서버 벤더도 Radeon Instinct 서버 제품을 준비한다. 모두 Radeon Instinct MI25 베이스의 시스템이다. MI25가 16유닛 시스템에서 400TFLOPS, 4유닛 시스템에서 100TFLOPS이다. 서두에 말했듯이 MI25가 25TFLOPS 정도로 예정된 것으로 나타났다. 최대 규모의 MI25 120 유닛의 시스템은 무려 총 3PFLOPS다. 단 모두 FP16의 값이다.


29_s.png
30_s.png
31_s.png
32_s.png


AMD는 내년(2017년), 새로운 CPU Zen과 새로운 GPU 베가, 2개의 대형 아키텍처 투입을 앞두고 있다. Zen 투입후 Zen+Vega의 조합의 Radeon Instinct 플랫폼을 앞세울 것이라 보인다.


출처 - http://pc.watch.impress.co.jp/docs/column/kaigai/1034800.html






  1. 25TFLOPS 슈퍼 GPU, AMD 베가를 GPU 컴퓨트 시장에 투입

    Radeon Instinct 이니셔티브로 GPU 컴퓨트 시장을 겨냥AMD는 1장의 카드로 25TFLOPS(FP16)의 성능을 실현하는 새로운 GPU "Radeon Instinct MI25"를 GPU 컴퓨트에 투입한다. 차세대 GPU 아키텍처 "베가(Veg...
    Date2016.12.14 CategoryGPU Views655
    Read More
  2. AMD ZEN 아키텍처 CPU 명칭은 RYZEN, 인텔 6900k와 동급 주장

    AMD가 13일 내년초 정식 발매할 예정인 차세대 아키텍처 ZEN CPU를 RYZEN으로 공식 발표했다. 차세대 RYZEN은 최대 8코어 16스레드로 동작하는 하이엔드 프로세서로 20MB 캐시와 3.4GHz 이...
    Date2016.12.14 CategoryPROCESSOR Views487
    Read More
  3. 글로벌 가상현실 업계 단체 결성, 오큘러스+구글+HTC

    가상현실 업계를 주도하고 있는 오큘러스와 HTC, 구글의 가상현실 업계 단체 Global Virtual Reality Association(GVRA)가 결성됐다. Global Virtual Reality Association(GVRA) 단체는 오큘러스...
    Date2016.12.09 CategoryENTERPRISE Views407
    Read More
  4. 퀄컴, 10nm FinFET 서버용 프로세서 Centriq 2400 발표

    퀄컴이 12월 6일(미국 시간) 서버용 프로세서 Centriq 2400 패밀리를 발표했다. 세계 최초의 10nm FinFET 프로세스 제조의 서버용 프로세서로 ARMv8을 바탕으로 Qualcomm Datacenter Technologies가...
    Date2016.12.09 CategoryPROCESSOR Views265
    Read More
  5. AMD 라데온 소프트웨어 크림슨 리라이브 공개 (ReLive)

    Radeon Software Crimson ReLive는 가전용 Radeon과 프로용 Radeon Pro용 드라이버를 통합 미국 AMD는 8일(현지 시간) 라데온용 드라이버의 대형 업데이트 "Radeon Software Crimson ReLive"을 발표했다....
    Date2016.12.09 CategorySOFTWARE Views672
    Read More
  6. 마이크로소프트와 인텔의 새로운 PC 형태, Project Evo 협력

    마이크로소프트는 12월 8일 ~ 12월 9일(현지 시간) 개발자 전용 이벤트 WinHEC Shenzhen 2016을 중국 선전 시내 호텔에서 개최하고 있다. 퀄컴과의 전략적 제휴 및 ARM 버전 윈도우10의 내년(2017년) ...
    Date2016.12.09 CategoryENTERPRISE Views464
    Read More
  7. 미디어텍, 스마트폰용 10코어 헬리오 X23/X27 발표

    미디어텍이 스마트폰용 Helio X23, Helio X27 Soc를 발표했다. 두 프로세서 모두 20나노 공정이 적용되고, 미디어텍 트라이 클러스터 데카 코어 아키텍처와 미디어텍 코어 파일럿 3.0기술을 탑재한...
    Date2016.12.07 CategoryPROCESSOR Views635
    Read More
  8. 아마존, 점포 혁신 서비스 아마존 고(Amazon Go) 발표

    아마존이 5일(미국 시간), 계산없이 상품을 갖고 그대로 가게를 나가면 되는 차세대 점포형 서비스 아마존 고(Amazon Go)를 발표했다. 아마존 고는 계산을 하기 위해 줄을 설 필요가 사라...
    Date2016.12.07 CategoryENTERPRISE Views412
    Read More
  9. 오큘러스 리프트 전용 컨트롤러, 오큘러스 터치 발매

    VR HMD 오큘러스 리프트 전용 컨트롤러 오큘러스 터치가 발매됐다. 오큘러스 리프트 및 터치 컨트롤러는 현재 54개 타이틀에 대응하고 있으며 그 숫자가 빠르게 증가하고 있다. 오큘러스 터치는 일...
    Date2016.12.07 CategoryI/O ETC Views346
    Read More
  10. 크롬55 버전 공개, 36건의 보안 취약성 수정

    구글이 세계 1위 PC 웹브라우저 크롬의 최신 안정판 v55.0.2883.75를 공개했습니다. 크롬55 버전은 High가 12건, Medium이 9건, Low 5건등, 36건의 보안 취약성이 수정되고 HTML5의 디폴트화가 진행...
    Date2016.12.07 CategorySOFTWARE Views215
    Read More
  11. 서피스 스튜디오 분해 공개, 내부 하드웨어 구성 보기

    아이픽스잇(www.ifixit.com)이 서피스 스튜디오 PC의 분해 리포트를 공개했습니다. 서피스 스튜디오의 내부 하드웨어 구성은 다음과 같습니다. 스토리지는 샌디...
    Date2016.11.30 CategoryI/O ETC Views811
    Read More
  12. 그래핀을 이용한 저전력 디스플레이 기술 발견 (델프트 대학)

    네덜란드 델프트 공대 연구팀은 그래핀을 이용한 "변형 화소" 기술을 발표했다. 연구팀은 이 기술로 디스플레이 전력소모를 보다 더 절감시킬 것으로 기대하고 있다. 변형 화소는 실리콘 산화물...
    Date2016.11.30 CategoryGLOBAL Views410
    Read More
  13. 칼자이스의 가상현실 HMD, VR ONE Plus 발매

    VR ONE Plus 칼 자이스는 스마트폰을 이용하는 VR HMD "ZEISS VR ONE Plus"를 12 월 9일 발매한다. 4.7 ~ 5.5인치 스마트폰을 장착해 이용할 수 있는 범용 트레이 방식의 VR HMD로 광학 전문 제조 업체 ...
    Date2016.11.30 CategoryI/O ETC Views240
    Read More
  14. 카비레이크 i3-7350K는 하스웰 i5 4670K 보다 빠르다

    내년초 정식 발매 예정인 인텔의 신형 카비레이크는 메인스트림급 i3 라인업에도 배수락이 해제된 K 모델을 출시하는 것으로 알려졌다. 최근 해외 사이트에서 카비레이크 Core i3-7350K (2코어...
    Date2016.11.30 CategoryPROCESSOR Views481
    Read More
  15. 스팀(Steam)이 오픈 소스 OSVR 지원 발표

    미국 레이저(Razer)는 23일 (현지 시간) 스팀이 OSVR을 지원한다고 발표했다. 이미 스팀 상점에서 지원 컨텐츠로 검색이 가능하게되어 있으며 28개 타이틀이 공식적으로 지원한다. OSVR (Open Sou...
    Date2016.11.27 CategoryI/O ETC Views233
    Read More
  16. 단일 CPU로 32코어 64스레드 실현, 제온 E5-2699 V5

    인터넷에 공개된 인텔 스카이레이크-EP 제온 E5-2699 V5 엔지니어링 샘플. 단일 CPU로 물리 32코어 탑재 및 하이퍼스레딩으로 64스레드를 실현하는 수퍼 프로세서, 2-WAY 구성시 64코...
    Date2016.11.24 CategoryPROCESSOR Views546
    Read More
  17. 지포스vs라데온 GPU 점유율 분석 (from 2002 to Q3/2016)

    엔비디아의 지포스와 AMD 라데온의 2002년부터 2016년 3분기 현재까지 GPU 점유율 - 주요 시기별 점유율 추이 분석 2002년 4분기 지포스 VS 라데온 = 65 : 26 (라데온 9000 시리즈) 지포스 ...
    Date2016.11.24 CategoryGPU Views658
    Read More
  18. ARM에서 x86을 에뮬레이션한다 - 차기 레드스톤3 업데이트

    미국 ZDNet의 Mary Jo Foley가 마이크로소프트의 관계자 발언으로 동사가 2017년 가을에 발매 할 예정의 차기 윈도우10 대형 업데이트(코드네임: 레드스톤3)에서 ARM64 아키텍처에서 x86을 에뮬레이...
    Date2016.11.24 CategorySOFTWARE Views341
    Read More
  19. 마이크로소프트가 리눅스 파운데이션 멤버로 참여

    마이크로소프트가 뉴욕에서 개최된 Connect();//2016 이벤트에서 리눅스 파운데이션의 플래티넘 멤버로 참여한다고 발표했습니다. 마이크로소프트는 이번 행사에서 재단 참여와 함께 Do...
    Date2016.11.21 CategoryENTERPRISE Views1191
    Read More
  20. 인공지능 시대의 인텔, 2020년까지 딥러닝 성능을 100배로

    인텔은 미국 샌프란시스코 시내에서 AI(인공지능) 전략에 관한 기자 회견 "Intel AI Day"를 갖고 머신 러닝, 딥-러닝 등의 새로운 컴퓨팅 모델을 활용해 AI를 실현하는 반도체, 소프트웨어에 관한 발표를 ...
    Date2016.11.18 CategoryPROCESSOR Views550
    Read More
  21. 퀄컴 스냅드래곤835는 삼성의 10nm FinFET으로 제조

    퀄컴 및 삼성은 18일 차기 모바일 프로세서 Snapdragon 835를 삼성의 10nm FinFET 프로세스에서 제조한다고 발표했다. 삼성의 10nm FinFET 프로세스는 14nm FinFET 프로세스와 비교해 면적 효율이 30%...
    Date2016.11.18 CategoryPROCESSOR Views332
    Read More
  22. 마이크로소프트 비주얼 스튜디오 for Mac 발표

    마이크로소프트가 현지 시간 11월 16일부터 18일까지 개최하는 개발자용 온라인 이벤트 Connect();//2016에서 통합 개발 환경 비주얼 스튜디오의 맥 버전인 "Visual Studio for Mac"을 발표합니다. ...
    Date2016.11.15 CategorySOFTWARE Views893
    Read More
  23. 엔비디아 실적발표, 어닝 서프라이즈의 연속이 될 것

    Q3 FY2017 Summary  GAAP($ in millions except earnings per share) Q3 FY17 Q2 FY17 Q3 FY16 Q/Q Y/YRevenue $2,004 $1,428 $1,305 Up 40% Up 54%Gross margin  59.0%  57.9%  56.3% Up 110 bps Up 270 ...
    Date2016.11.13 CategoryENTERPRISE Views596
    Read More
  24. 카스퍼스키, 소규모 사무실용 스몰 오피스 보안 최신 버전 출시

    글로벌 유명 보안 기업 카스퍼스키가 소규모 사무실용 스몰 오피스 보안 제품의 최신 버전을 온라인 샵에서 발매했습니다. 스몰 오피스 보안은 종업원 10명 이하의 소규모 사무실을 대상으로 ...
    Date2016.11.13 CategorySOFTWARE Views346
    Read More
  25. 오큘러스, 중간 프레임으로 부하를 조정하는 ASW 기술 발표

    오큘러스는 10일(현지시간) 중간 프레임을 자동 생성함으로써 CPU와 GPU의 부하를 떨어뜨리는 Asynchronous Spacewarp(ASW) 기술을 발표했다. 원활한 가상현실 체험에는 90fps라는 높은 프레...
    Date2016.11.13 CategoryI/O ETC Views618
    Read More
  26. GitHub Enterprise 2.8 릴리스, 리뷰 및 관리 기능 개선

    미국 깃허브가 GitHub Enterprise 2.8을 발표했다. 개발팀 내 코드 검토와 토론, 프로젝트 관리, 보안 등의 기능 강화, 데이터 그래프화 등의 새로운 기능이 강화됐다. GitHub Enterprise(GHE...
    Date2016.11.11 CategoryENTERPRISE Views350
    Read More
  27. 엔씨소프트 실적 발표, 매출-영업이익-순익 증가

    연결재무제표 기준 영업(잠정)실적(공정공시) ※ 동 정보는 잠정치로서 향후 확정치와는 다를 수 있음. 1. 연결실적내용 구분(단위 : 백만원, %) 당기실적 전기실적 전기대...
    Date2016.11.10 CategoryENTERPRISE Views646
    Read More
  28. AMD Zen 엔지니어링 샘플, 인텔 10코어급 성능?

    AMD가 수 년간에 걸쳐 개발한 차세대 아키텍처 "젠"의 공식 발표가 불과 몇 개월 앞으로 다가온 가운데 해외 https://www.techpowerup.com 사이트에서 일부 성능 자료를 공개했다. 공개된...
    Date2016.11.07 CategoryPROCESSOR Views477
    Read More
Board Pagination Prev 1 ... 22 23 24 25 26 27 28 29 30 31 ... 119 Next
/ 119