4월 27일 (토) 오후 6:40

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2024.06.05. / 장르 드람 / 국가 대한민국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
개봉 2024.05.22. / 장르 액션 / 국가 미국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
03_s.jpg


6년만에 아키텍처가 쇄신 된 베가

AMD의 차세대 GPU 아키텍처 "Vega(베가)"의 개요를 밝힌다. Vega는 AMD의 FinFET 세대의 플래그십 GPU다. 큰 특징은 GPU 마이크로 아키텍처를 쇄신하고 하이 퍼포먼스 하이엔드 GPU에 도입되는 것이다.


AMD는 서던 아일랜드(Southern Islands) 패밀리의 "Radeon HD 7900(Tahiti)"에서 "GCN(Graphics Core Next)"을 도입한 이후 GPU의 컴퓨트 유닛"CU(Compute Unit)"의 메이저 업그레이드는 진행하지 않았다. 베이스 아키텍처는 GCN 상태에서 상대적으로 마이너적인 확장을 가해 왔다. 그러나 이번 Vega는 마이크로 아키텍처를 일신해 CU 뿐 아니라 세이더의 제어 및 메모리 계층까지 모두 크게 변혁한다. AMD에게는 6년만의 GPU 아키텍처의 대변혁이다.


AMD는 FinFET 3D 트랜지스터 프로세스는 지난해(2016년) 퍼포먼스 GPU "Polaris"에 도입했다. 그러나 Polaris의 하이엔드 GPU는 공석이었으며 Vega 세대 "Vega 10"은 AMD에게 2년 만의 하이엔드 GPU다.


Vega 아키텍처는 그래픽스, 컴퓨트, 메모리 용량과 모든 면에서 퍼포먼스를 비약시킨다. 컴퓨트에서는 딥 러닝 대응과 FinFET 프로세스를 활용한 마이크로 아키텍처로의 전환. 딥 러닝용 데이터 밀도 도입과 GPU의 동작 클럭을 대폭 올린 아키텍처를 향했다.


그래픽에서는 지오 메트리 파이프 라인의 제어를 바꿨다. 새로운 Primitive Shader를 도입, 지오 메트리 처리량을 2배로 끌어올린다. 또 래스터라이저도 일신하고 설계 가능한 메소드를 도입했다. 이어 온 칩 메모리 계층에서는 백엔드도 L2로 캐시하도록 했다.


메모리 계층은 GPU에서 처음으로 비휘발성 메모리의 도입을 전제로 한 메모리 제어를 도입한다. 이는 가까운 장래에 약진할 것이라 기대되는 새로운 비휘발성 메모리 기술을 감안한 대응이다. 이 메모리 아키텍처는 AMD가 엑사플롭 슈퍼 컴퓨터의 메모리 모델로서 제안하고 있는 것과 같다. 또한 데이터 이동의 최적화를 함으로써 데이터의 쓸데없는 트래픽도 없앤다.


AMD의 Vega는 이처럼 그래픽 뿐만 아니라 컴퓨트와 비주얼 라이제이션까지 퍼포먼스를 강화한 새로운 아키텍처다.


마이크로 아키텍처가 바뀐 컴퓨트 유닛

Vega의 CU(Compute Unit)는 "Next-Generation Compute Unit(NCU)"로 내부 마이크로 아키텍처가 일신된다. 아직 자세한 것은 밝혀지지 않았지만 핵심 차이는 밝혀졌다.


현재의 CU에서는 32-bit의 주산 16유닛으로 1개의 벡터 유닛을 구성하고 있다. 1개의 CU에는 4개의 벡터 유닛이 있어 합계 64의 32-bit 유닛을 갖춘다. 각 유닛이 평균 1클럭에 2작업 처리량이기 때문에 CU는 32-bit, 작업은 클럭당 128이 된다.


AMD GPU는 64스레드 배치인 Wavefront 단위로 처리 한다. 각 벡터 유닛은 16유닛으로 4사이클까지 Wavefront를 처리하는 구조다.


NCU에서는 새로운 저 데이터 밀도의 SIMD(Single Instruction, Multiple Data) 연산이 도입된다. 구체적으로는 2-way의 16-bit SIMD 연산과 4-way의 8-bit SIMD 연산이 가세한다. 이는 저 데이터 정밀도가 요구되는 머신 러닝 애플리케이션에 맞춘 확장이다.


AMD도 다른 GPU 제조 업체 같이 연산 유닛의 기본 데이터 밀도는 32-bit다. 그러나 딥 러닝에서는 성능을 올리기 위해 보다 정밀도가 낮은 16-bit와 8-bit가 사용되고 있다. AMD는 그러한 트렌드에 대응해 연산 유닛을 대폭 개편했다.


23_s.jpg
24_s.jpg
25_s.jpg


16-bit시 처리량은 32-bit시 2배, 8-bit시에는 처리량은 4배나 많다. AMD는 이미 Vega10 기반 GPU 컴퓨트용 "Radeon Instinct MI25"에서 하나의 카드로 16-bit 부동 소수점 연산에서 25TFLOPS를 달성하겠다고 밝혔다. NVIDIA의 Pascal(파스칼) 기준 "Tesla P100(GP100)"의 21TFLOPS(FP16)를 넘는다. 8-bit 운영은 더 배가되는 성능의 계산이다.


팩크드형 16-bit와 8-bit 연산 도입

AMD의 현재 아키텍처에서는 32-bit시 예측에 의해 조건 분기에 대응하고 있다. 단 벡터 유닛 속의 32-bit 각 레인은 같은 명령을 실행하는데 각각이 마스크 레지스터로 분기 패스만 실행되어 개별적으로 컨트롤 흐름이 제어된다. 그래서 32-bit시에는 외관상 독립된 스레드로 각 레인이 동작한다.


반면 이번에 도입된 16-bit와 8-bit의 연산은 팩크드(packed)형, 즉 SIMD다. 32-bit의 1레인에서 16-bit시에는 2데이터가, 8-bit시에는 4데이터가 포장되고 같은 명령을 실행한다. 16-bit와 8-bit는 각각 다른 분기 패스를 실행할 수 없다. 그러나 딥 러닝 용도의 경우 팩크드로 대응할 수 있기 때문에 연산 성능이 향상하는 만큼 성능이 올라간다.


GPU에 대한 팩크드 포맷의 저 데이터 밀도 연산의 도입은 딥 러닝 시대에 들어 트렌드다. NVIDIA도 대응을 추진하고 있고 Imagination Technologies의 PowerVR 등도 대응하고 있다.


02_s.jpg


Vega NCU의 또 한가지 중요한 특징은 고클럭화다. AMD는 클럭을 높이기 위해 파이프 라인을 변경했다고 본다. 파이프 라인 단수가 2배가 되면 원리적으로는 GPU 코어의 동작 주파수를 두배 가까이 올릴 수 있게 된다. 이것도 FinFET 프로세스 시대에 들어선 GPU 코어의 트렌드가 되고 있다.


26_s.jpg



FinFET에서는 리크 전류(Leakage)가 크게 떨어지면서 동작 주파수의 액티브 전력도 낮출 수 있다. 그래서 파이프 라인의 세분화에 의한 고클럭화를 행하는 것이 가능하게 된다. 전력 하락분을 고클럭화로 돌리는 것이다.


파이프 라인 단수를 늘리면 파이프 라인 중인 데이터를 유지하는 래치 회로가 늘어난다. 래치는 논리 회로 중의 큰 전력 소비원이기 때문에 누설 전류(Leakage)가 많은 프로세스에서는 파이프 라인 단수를 늘리기 어려웠다. 그러나 Vega는 저 누설 전류(Leakage)의 14nm FinFET 프로세스로 제조되기 때문에 파이프 라인 단수를 늘릴 수 있다.


폭발하는 데이터량에 대응하기 위한 메모리 계층

GPU는 현재 취급하는 데이터 양의 폭발적인 증대에 직면하고 있다. 게임 설치 크기는 격증했고 영화 제작 등 전문 그래픽 데이터 양도 급격히 대형화되고 빅 데이터 분석과 머신 러닝에 의해 컴퓨트의 데이터량은 천문학적인 숫자로 불어나고 있다.


문제는 GPU의 메모리 용량이 그러한 데이터량의 증대 및 GPU 연산 성능의 증대에 걸맞게 늘지 않는다는 것이다. 거기서 Vega는 새로운 메모리 계층의 어프로치를 도입한다. GPU 메모리를 광대역 캐시로 취급하고 GPU 외부의 메모리를 빠짐없이 다룰 수 있도록 한다.


구체적으로는 Vega는 스택 DRAM "HBM2"를 GPU 메모리로 도입한다. Vega10에서는 2스택이다. 그러나 GPU 패키지 인터포즈 위에 올라간 HBM2 만 아니라 오프 패키지의 메모리도 GPU가 다루도록 한다. HBM2는 마치 캐시처럼 다루는, 하드웨어 제어에서 태그 RAM을 갖춘 캐시가 아니라 메모리 제어로서 워킹 메모리로 다루는 이미지다.


비휘발성 메모리(NVRAM)를 포함한 메모리를 GPU가 직접 챙기면서 혹은 직접 다루고 있는 것 같이 할 수 있는 구조를 준비한다. GPU의 DRAM 용량을 그냥 늘리는 것이 아니라 어드레싱할 수 있는 메모리를 다양화하는 것으로 대용량화되는 데이터에 대응한다. 그래서 Vega10에서는 512TB까지 가상 주소 공간을 지원한다. 그리고 계층화된 메모리 간에 효율적으로 메모리를 얼로케이트함으로써 고성능으로 저전력 메모리를 실현한다.


14_s.jpg
15_s.jpg
16_s.jpg


새로운 세이더 스테이지와 래스터 라이저, 캐시 계층의 개량

지오 메트리 파이프 라인은 버텍스 세이더(Vertex Shader)와 함께 지오 메트리 세이더(Geometry Shader)을 거친다. Vega는 새로운 지오 메트리 경로로 Primitive Shader를 도입한다. Primitive 단위로 취급함으로써 피크 처리량을 높인다. 또 렌더링 파이프 라인 전체 워크 로드의 제어도 지능화된다.


AMD 아키텍쳐는 렌더링 백엔드와 텍스처 액세스는 일관되지 않는다. 그래서 렌더링 투 텍스처에 텍스처를 쓰는 경우에는 GPU 내부 캐시 계층을 쓰지 못했다. Vega는 렌더링 백엔드도 L2 캐시로 캐싱 되며 L2에서 캐시 하는 텍스쳐와 일관되며 지오 메트리에서 픽셀에 대한 래스터 라이즈도 스마트화됐다. 이는 VR(Virtual Reality) 같은 두가지 관점의 어플리케이션으로 효과를 발휘할 것으로 보인다.


출처 - http://pc.watch.impress.co.jp/docs/column/kaigai/1037849.html

  • profile
    랩터 인터내셔널 2017.01.06 13:12
    오늘도 즐거운 하루되세요^^
  • profile
    레오파드 2017.01.06 13:54
    대단해보이지만 결론은 파스칼과 맞다이 벤치마크 결과를 봐야
  • profile
    SK_C&C 2017.01.06 22:39
    hbm2까지 달았으면 당연히 파스칼 타이탄X는 가볍게 넘어야 할텐데 성능이 궁금하네요






  1. 마이크로소프트 DirectX HLSL 컴파일러를 오픈 소스화

    마이크로소프트가 새로운 DirectX HLSL(High Level Shading Language) 컴파일러를 오픈 소스로 공개한다고 발표했다. MS DirectX HLSL은 Clang/LLVM 프레임으로 구축되어 대규모 코드 베이스...
    Date2017.01.24 CategorySOFTWARE Views441
    Read More
  2. 폭스콘, 미국에 대규모 디스플레이 공장 설립?

    주요 외신들이 세계 최대 EMS 폭스콘(Foxconn)이 미국에 대규모 디스플레이 공장 설립을 검토하고 있다고 보도하고 있다. 이 계획은 도널드 트럼프 대통령의 취임 연설에서 언급된 미국 우선주의로 상징...
    Date2017.01.24 CategoryENTERPRISE Views313
    Read More
  3. 마이크로소프트, 3D 기술 솔루션 업체 Simplygon 인수

    마이크로소프트가 3D 최적화 솔루션을 제공하고 있는 Simplygon를 인수했다고 발표했다. Simplygon의 3D 솔루션은 코나미의 AAA급 타이틀 메탈 기어 솔리드(METAL GEAR SOLID V:THE PHANTOM ...
    Date2017.01.20 CategoryENTERPRISE Views329
    Read More
  4. 애플, 터치바에 대응한 로직 프로X 10.3 공개

    애플은 18일, iOS용 음악 제작 소프트웨어 GarageBand 2.2 for iOS, Mac OS용 DAW "Logic Pro X 10.3을 공개했다. GarageBand 2.2 for iOS에서는 사운드 브라우저를 재설계하여 보다 빠르게 To...
    Date2017.01.20 CategorySOFTWARE Views335
    Read More
  5. 연산 성능이 4배 향상된 이매지네이션 PowerVR Series8XE Plus 발표

    이매지네이션 테크놀로지(Imagination Technologies)가 스마트폰, 태블릿 등을 위한 모바일 GPU 코어 PowerVR Series8XE Plus를 발표했다. 새로운 Series8XE Plus의 라인업에는 클럭당 픽셀 수(p...
    Date2017.01.20 CategoryGPU Views284
    Read More
  6. 마이크로소프트 크리에이터스 업데이트에 게임 모드 추가

    마이크로소프트가 크리에이터스 업데이트(Creators Update)에 윈도우10 게임 모드를 추가한다고 발표했습니다. 크리에이터스 업데이트는 빔(Beam)으로 불리는 스트리밍 기능이 윈도우10과 엑스박스 ...
    Date2017.01.18 CategorySOFTWARE Views345
    Read More
  7. 어베스트와 AVG 기술을 결집한 AVG AntiVirus FREE 제공 시작

    어베스트 소프트웨어는 2016년 10월에 인수를 완료한 AVG의 윈도우용 보안 소프트웨어 2017년 버전으로 AVG AntiVirus FREE 제공을 시작했습니다. AVG AntiVirus FREE는 보안 기능이 자동적으...
    Date2017.01.18 CategorySOFTWARE Views971
    Read More
  8. 오페라 네온(Opera Neon)릴리스, 미래를 나타내는 브라우저

    Opera Software는 12일 새로운 컨셉 브라우저 Opera Neon을 발표했습니다. 시작하면 데스크톱의 배경 위에 Google 검색 창과 Facebook, YouTube, SoundCloud 등에 대한 원형 연결 아이콘이 ...
    Date2017.01.18 CategorySOFTWARE Views305
    Read More
  9. 닌텐도 스위치 3월 3일 발매, 테그라 탑재

    닌텐도가 13일 언론 프레젠테이션&체험회 이벤트를 개최하고 신형 게임기 닌텐도 스위치(Nintendo Switch)를 정식 발표했습니다. 닌텐도 스위치는 엔비디아의 테그라 프로세서가 탑재된 차세대...
    Date2017.01.13 CategoryGLOBAL Views334
    Read More
  10. 스위프트 언어 개발자 크리스 래트너 애플 퇴사

    애플의 오픈 소스 프로그래밍 언어 스위프트(Swift)의 개발자이며 프로젝트 책임자인 크리스 래트너가 애플을 퇴사해 테슬라(Tesla)로 이직한 것으로 확인됐습니다. 크리스 래트너는 2011년에 ...
    Date2017.01.13 CategorySOFTWARE Views369
    Read More
  11. OK Google로 가전과 연계 및 미래를 보인 새로운 실드

    엔비디아는 회사로써 처음으로 CES의 기조 강연을, 그것도 가장 격식이 높고 행사 전날 저녁에 열리는 개막 메인 강연에 사장 겸 CEO 젠슨황이 등단해 GPU의 연산 성능을 이용한 AI(Artificial Intelligenc...
    Date2017.01.08 CategoryENTERPRISE Views539
    Read More
  12. BMW 자동차는 MS 코타나와 아마존 프라임 접속

    최근 ICT와 IoT에 대한 관심이 높아지고 있는데 CES 2017에서도 인터넷에 접속된 자동차인 "커넥티드 카"나 자동 운전 기술과 같은 자동차 산업의 약진이 눈에 띈다. 그런 가운데 BMW는 2017년 1월 ...
    Date2017.01.08 CategoryENTERPRISE Views398
    Read More
  13. 인텔 10나노 캐논레이크 시연, 무어의 법칙은 계속된다

    인텔은 CES 2017 기자 회견(1월 3일~1월 4일) 회기 중에 기자 설명회를 갖고 개발 중인 제품 등에 대한 설명을 진행했다. 이 가운데 차세대 프로세스인 10나노로 제조되는 캐논 레이크(Cannon Lake)를 ...
    Date2017.01.06 CategoryPROCESSOR Views629
    Read More
  14. AMD 베가 GPU 아키텍처 개요 (HBM2, NCU, 캐시등)

    6년만에 아키텍처가 쇄신 된 베가AMD의 차세대 GPU 아키텍처 "Vega(베가)"의 개요를 밝힌다. Vega는 AMD의 FinFET 세대의 플래그십 GPU다. 큰 특징은 GPU 마이크로 아키텍처를 쇄신하고 하이 퍼포먼스 하...
    Date2017.01.06 CategoryGPU Views771
    Read More
  15. AMD 라이젠 프로세서와 베가 GPU 시스템 공개 시연

    AMD가 CES 2017 부스에서 차세대 프로세서 라이젠과 차세대 GPU 베가로 구성된 시스템을 공개했다. 공개된 시스템은 Star Wars Battlefront 게임에서 4K 해상도 풀 스크린, 모든 옵션을 울트라로...
    Date2017.01.06 CategoryPROCESSOR Views291
    Read More
  16. 알파고, 커제등 세계 최정상 바둑기사를 가볍게 격파

    구글 딥마인드의 데미스 허사비스 CEO는 비공개 온라인 경기로 세계 최정상 바둑기사를 모두 꺾었다고 발표했다. 알파고는 온라인 상에서 Magister 또는 Master 라는 ID를 사용해 대국...
    Date2017.01.05 CategoryENTERPRISE Views384
    Read More
  17. AMD, HDR 대응을 추가한 프리싱크2 기술 발표

    미국 AMD는 3일(현지 시간) HDR 대응 등의 추가 사양을 담은 동적 리프레시 레이트 동기화 기술 "Radeon FreeSync 2" 기술을 발표했다. FreeSync는 비디오 카드 출력과 디스플레이 리프레시 레이트를...
    Date2017.01.05 CategoryGPU Views259
    Read More
  18. 지포스도 서브 스크립션 시대로 (클라우드 게이밍)

    미국 NVIDIA는 4일(현지 시간) CES 2017에서 프레스 컨퍼런스를 개최하고 클라우드 경유로 지포스의 성능을 이용하여 최신 게임을 플레이할 수 있는 "GeForce Now" 서비스 전개를 발표했다. 그 동...
    Date2017.01.05 CategoryGPU Views336
    Read More
  19. AMD, 라이젠 대응 X370 칩셋 탑재 메인보드 공개

    미국 AMD는 1월 4일(현지 시간) CES 2017에서 차기 CPU "라이젠"에 대응한 2종류의 칩셋, Socket AM4 메인보드, 그리고 탑재 PC를 공개했다. 출하는 2017년 1분기부터로 알려졌다. Ryzen에 대응하는 ...
    Date2017.01.05 CategoryPROCESSOR Views331
    Read More
  20. 인텔, 7세대 프로세서에 데스크탑용 제온 등을 추가

    미국 인텔은 3일(현지 시간) 지금까지 노트 PC용으로 전개된 7세대 Core 프로세서에 데스크탑용 아키텍처를 채용한 Xeon 프로세서 등을 추가했다. 2016년 8월에 발표된 것은 TDP 4.5W의 Y시리즈와 15W...
    Date2017.01.05 CategoryPROCESSOR Views303
    Read More
  21. 인텔, 세계 최초의 글로벌 주파수 대응 5G 모뎀 발표

    인텔은 CES 2017 기자 회견에서 자사가 개발한 5G(5세대 휴대 전화) 전용의 모뎀 솔루션을 발표했다. 인텔이 발표한 5G 모뎀과 RFIC(고주파 집적 회로, 무선 신호를 처리하는 칩)는 5G 모뎀 최초로...
    Date2017.01.05 CategoryPROCESSOR Views1054
    Read More
  22. 인텔 카비레이크 i7-i5 CPU 종류 및 스펙 정보

    인텔 카비레이크 i7 - i5 라인업 및 스펙 정보 http://hothardware.com 라인업 : 7700K - 7600K - 7700 - 7600 - 7500 - 7700T - 7600T - 7500T i7 7700 시리즈 : 4코어 8스레드 (하이퍼스레딩) i...
    Date2017.01.04 CategoryPROCESSOR Views1108
    Read More
  23. 윈도우 블루 스크린이 그린 스크린으로 변경되다 (GSOD)

    윈도우에서 사용자들에게 친숙한 '블루 스크린'이 윈도우10 최신 프리뷰 빌드에서는 그린(녹색) 색상으로 변경된 "그린 스크린(Green Screen of Death)"이 확인되고 있습니다. 윈도우의 전통적인 BS...
    Date2017.01.02 CategorySOFTWARE Views648
    Read More
  24. AMD 라이젠 프로세서는 인텔 i7 6900K 급 성능?

    프랑스의 Canard PC 라는 잡지에서 AMD의 차세대 라이젠 프로세서의 벤치마크 정보를 공개했다. 공개 정보에 의하면 AMD 라이젠 8코어 16스레드 3.15GHz 클럭의 CPU 연산 성능은 인텔의 8코어 16...
    Date2017.01.02 CategoryPROCESSOR Views491
    Read More
  25. 아이언맨 자비스 같은 인공지능 개발한다 - 저커버그 CEO

    페이스북의 마크 저커버그 CEO가 12월 20일 자신의 페이스북 홈페이지에 "자비스(Jarvis) 같은 인공지능을 만드는 것에 도전했다"고 밝혔다. 자비스는 영화 아이언맨에 등장하는 인공지능 비...
    Date2016.12.23 CategoryENTERPRISE Views679
    Read More
  26. 팀쿡 CEO, 우리는 멋진 데스크톱 Mac을 개발중이다

    애플의 아이맥, 맥프로와 같은 데스크톱용 PC는 수 년간 업데이트되지 않고 있는데 이런 상황에서 테크크런치(TechCrunch)에 따르면 애플의 팀쿡 CEO는 애플 직원의 질문에 대해 "애플의 로드맵에...
    Date2016.12.21 CategoryGLOBAL Views486
    Read More
  27. 오버워치 패치 업데이트, 환상의 겨울나라

    패치 하이라이트 새로운 이벤트: 환상의 겨울나라 새로운 시즌 이벤트와 함께 연말 축제 분위기로 가득한 오버워치를 만끽하세요! 앞으로 3주 동안 하나무라와 왕의 길이 축제 분위기의 조명들...
    Date2016.12.19 CategoryGLOBAL Views376
    Read More
  28. 세계 최대 e스포츠, 'IEM 시즌11" 16일부터 경기도 고양에서

    IEM(Intel Extreme Masters) 시즌 11 주관 : 독일 ESL(Electronic Sports League) 후원 : 인텔 (Intel) 일시 : 2016년 12월 16일 ~ 18일 위치 : 경기도 고양 체육관 종목 : 오버워치, 스타...
    Date2016.12.15 CategoryGLOBAL Views482
    Read More
Board Pagination Prev 1 ... 21 22 23 24 25 26 27 28 29 30 ... 119 Next
/ 119