4월 25일 (목) 오후 4:09
랩터 인터내셔널에 오신걸 환영 합니다
>

logo

  • head
  • news
  • product
  • mobile
  • benchmark
  • analysis
  • computing
  • multimedia

"SAN"은 "Storage Area Network"...
웹 애플리케이션에서의 버퍼 오버...
XSS(크로스 사이트 스크립팅) 취...
03_s.jpg


6년만에 아키텍처가 쇄신 된 베가

AMD의 차세대 GPU 아키텍처 "Vega(베가)"의 개요를 밝힌다. Vega는 AMD의 FinFET 세대의 플래그십 GPU다. 큰 특징은 GPU 마이크로 아키텍처를 쇄신하고 하이 퍼포먼스 하이엔드 GPU에 도입되는 것이다.


AMD는 서던 아일랜드(Southern Islands) 패밀리의 "Radeon HD 7900(Tahiti)"에서 "GCN(Graphics Core Next)"을 도입한 이후 GPU의 컴퓨트 유닛"CU(Compute Unit)"의 메이저 업그레이드는 진행하지 않았다. 베이스 아키텍처는 GCN 상태에서 상대적으로 마이너적인 확장을 가해 왔다. 그러나 이번 Vega는 마이크로 아키텍처를 일신해 CU 뿐 아니라 세이더의 제어 및 메모리 계층까지 모두 크게 변혁한다. AMD에게는 6년만의 GPU 아키텍처의 대변혁이다.


AMD는 FinFET 3D 트랜지스터 프로세스는 지난해(2016년) 퍼포먼스 GPU "Polaris"에 도입했다. 그러나 Polaris의 하이엔드 GPU는 공석이었으며 Vega 세대 "Vega 10"은 AMD에게 2년 만의 하이엔드 GPU다.


Vega 아키텍처는 그래픽스, 컴퓨트, 메모리 용량과 모든 면에서 퍼포먼스를 비약시킨다. 컴퓨트에서는 딥 러닝 대응과 FinFET 프로세스를 활용한 마이크로 아키텍처로의 전환, 딥 러닝용 데이터 밀도 도입과 GPU의 동작 클럭을 대폭 올린 아키텍처를 향했다.


그래픽에서는 지오 메트리 파이프 라인의 제어를 바꿨다. 새로운 Primitive Shader를 도입, 지오 메트리 처리량을 2배로 끌어올린다. 또 래스터라이저도 일신하고 설계 가능한 메소드를 도입했다. 이어 온 칩 메모리 계층에서는 백엔드도 L2로 캐시하도록 했다.


메모리 계층은 GPU에서 처음으로 비휘발성 메모리의 도입을 전제로 한 메모리 제어를 도입한다. 이는 가까운 장래에 약진할 것이라 기대되는 새로운 비휘발성 메모리 기술을 감안한 대응이다. 이 메모리 아키텍처는 AMD가 엑사플롭 슈퍼 컴퓨터의 메모리 모델로서 제안하고 있는 것과 같다. 또한 데이터 이동의 최적화를 함으로써 데이터의 쓸데없는 트래픽도 없앤다.


AMD의 Vega는 이처럼 그래픽 뿐만 아니라 컴퓨트와 비주얼라이제이션까지 퍼포먼스를 강화한 새로운 아키텍처다.


마이크로 아키텍처가 바뀐 컴퓨트 유닛

Vega의 CU(Compute Unit)는 "Next-Generation Compute Unit(NCU)"로 내부 마이크로 아키텍처가 일신된다. 아직 자세한 것은 밝혀지지 않았지만 핵심 차이는 밝혀졌다.


현재의 CU에서는 32-bit의 주산 16유닛으로 1개의 벡터 유닛을 구성하고 있다. 1개의 CU에는 4개의 벡터 유닛이 있어 합계 64의 32-bit 유닛을 갖춘다. 각 유닛이 평균 1클럭에 2작업 처리량이기 때문에 CU는 32-bit, 작업은 클럭당 128이 된다.


AMD GPU는 64스레드 배치인 Wavefront 단위로 처리 한다. 각 벡터 유닛은 16유닛으로 4사이클까지 Wavefront를 처리하는 구조다.


NCU에서는 새로운 저 데이터 밀도의 SIMD(Single Instruction, Multiple Data) 연산이 도입된다. 구체적으로는 2-way의 16-bit SIMD 연산과 4-way의 8-bit SIMD 연산이 가세한다. 이는 저 데이터 정밀도가 요구되는 머신 러닝 애플리케이션에 맞춘 확장이다.


AMD도 다른 GPU 제조 업체 같이 연산 유닛의 기본 데이터 밀도는 32-bit다. 그러나 딥 러닝에서는 성능을 올리기 위해 보다 정밀도가 낮은 16-bit와 8-bit가 사용되고 있다. AMD는 그러한 트렌드에 대응해 연산 유닛을 대폭 개편했다.


23_s.jpg
24_s.jpg
25_s.jpg


16-bit시 처리량은 32-bit시 2배, 8-bit시에는 처리량은 4배나 많다. AMD는 이미 Vega10 기반 GPU 컴퓨트용 "Radeon Instinct MI25"에서 하나의 카드로 16-bit 부동 소수점 연산에서 25TFLOPS를 달성하겠다고 밝혔다. NVIDIA의 Pascal(파스칼) 기준 "Tesla P100(GP100)"의 21TFLOPS(FP16)를 넘는다. 8-bit 운영은 더 배가되는 성능의 계산이다.


팩크드형 16-bit와 8-bit 연산 도입

AMD의 현재 아키텍처에서는 32-bit시 예측에 의해 조건 분기에 대응하고 있다. 단 벡터 유닛 속의 32-bit 각 레인은 같은 명령을 실행하는데 각각이 마스크 레지스터로 분기 패스만 실행되어 개별적으로 컨트롤 흐름이 제어된다. 그래서 32-bit시에는 외관상 독립된 스레드로 각 레인이 동작한다.


반면 이번에 도입된 16-bit와 8-bit의 연산은 팩크드(packed)형, 즉 SIMD다. 32-bit의 1레인에서 16-bit시에는 2데이터가, 8-bit시에는 4데이터가 포장되고 같은 명령을 실행한다. 16-bit와 8-bit는 각각 다른 분기 패스를 실행할 수 없다. 그러나 딥 러닝 용도의 경우 팩크드로 대응할 수 있기 때문에 연산 성능이 향상하는 만큼 성능이 올라간다.


GPU에 대한 팩크드 포맷의 저 데이터 밀도 연산의 도입은 딥 러닝 시대에 들어 트렌드다. NVIDIA도 대응을 추진하고 있고 Imagination Technologies의 PowerVR 등도 대응하고 있다.


02_s.jpg


Vega NCU의 또 한가지 중요한 특징은 고클럭화다. AMD는 클럭을 높이기 위해 파이프 라인을 변경했다고 본다. 파이프 라인 단수가 2배가 되면 원리적으로는 GPU 코어의 동작 주파수를 두배 가까이 올릴 수 있게 된다. 이것도 FinFET 프로세스 시대에 들어선 GPU 코어의 트렌드가 되고 있다.


26_s.jpg



FinFET에서는 리크 전류(Leakage)가 크게 떨어지면서 동작 주파수의 액티브 전력도 낮출 수 있다. 그래서 파이프 라인의 세분화에 의한 고클럭화를 행하는 것이 가능하게 된다. 전력 하락분을 고클럭화로 돌리는 것이다.


파이프 라인 단수를 늘리면 파이프 라인 중인 데이터를 유지하는 래치 회로가 늘어난다. 래치는 논리 회로 중의 큰 전력 소비원이기 때문에 누설 전류(Leakage)가 많은 프로세스에서는 파이프 라인 단수를 늘리기 어려웠다. 그러나 Vega는 저 누설 전류(Leakage)의 14nm FinFET 프로세스로 제조되기 때문에 파이프 라인 단수를 늘릴 수 있다.


폭발하는 데이터량에 대응하기 위한 메모리 계층

GPU는 현재 취급하는 데이터 양의 폭발적인 증대에 직면하고 있다. 게임 설치 크기는 격증했고 영화 제작 등 전문 그래픽 데이터 양도 급격히 대형화되고 빅 데이터 분석과 머신 러닝에 의해 컴퓨트의 데이터량은 천문학적인 숫자로 불어나고 있다.


문제는 GPU의 메모리 용량이 그러한 데이터량의 증대 및 GPU 연산 성능의 증대에 걸맞게 늘지 않는다는 것이다. 거기서 Vega는 새로운 메모리 계층의 어프로치를 도입한다. GPU 메모리를 광대역 캐시로 취급하고 GPU 외부의 메모리를 빠짐없이 다룰 수 있도록 한다.


구체적으로는 Vega는 스택 DRAM "HBM2"를 GPU 메모리로 도입한다. Vega10에서는 2스택이다. 그러나 GPU 패키지 인터포즈 위에 올라간 HBM2 만 아니라 오프 패키지의 메모리도 GPU가 다루도록 한다. HBM2는 마치 캐시처럼 다루는, 하드웨어 제어에서 태그 RAM을 갖춘 캐시가 아니라 메모리 제어로서 워킹 메모리로 다루는 이미지다.


비휘발성 메모리(NVRAM)를 포함한 메모리를 GPU가 직접 챙기면서 혹은 직접 다루고 있는 것 같이 할 수 있는 구조를 준비한다. GPU의 DRAM 용량을 그냥 늘리는 것이 아니라 어드레싱할 수 있는 메모리를 다양화하는 것으로 대용량화되는 데이터에 대응한다. 그래서 Vega10에서는 512TB까지 가상 주소 공간을 지원한다. 그리고 계층화된 메모리 간에 효율적으로 메모리를 얼로케이트함으로써 고성능으로 저전력 메모리를 실현한다.


14_s.jpg
15_s.jpg
16_s.jpg


새로운 세이더 스테이지와 래스터 라이저, 캐시 계층의 개량

지오 메트리 파이프 라인은 버텍스 세이더(Vertex Shader)와 함께 지오 메트리 세이더(Geometry Shader)을 거친다. Vega는 새로운 지오 메트리 경로로 Primitive Shader를 도입한다. Primitive 단위로 취급함으로써 피크 처리량을 높인다. 또 렌더링 파이프 라인 전체 워크 로드의 제어도 지능화된다.


AMD 아키텍쳐는 렌더링 백엔드와 텍스처 액세스는 일관되지 않는다. 그래서 렌더링 투 텍스처에 텍스처를 쓰는 경우에는 GPU 내부 캐시 계층을 쓰지 못했다. Vega는 렌더링 백엔드도 L2 캐시로 캐싱 되며 L2에서 캐시 하는 텍스쳐와 일관되며 지오 메트리에서 픽셀에 대한 래스터 라이즈도 스마트화됐다. 이는 VR(Virtual Reality) 같은 두가지 관점의 어플리케이션으로 효과를 발휘할 것으로 보인다.


출처 - http://pc.watch.impress.co.jp/docs/column/kaigai/1037849.html






  1. 가격 하락 중인 DRAM, 2분기 이후로도 지속 하락 전망

    시장 조사 기관 트렌드포스(TrendForce) 산하 DRAMeXchange는 3월 25일, 과잉 재고에 의해 2019년 DRAM 제품의 평균 판매 가격이 시장 전체에서 20% 이상 하락한다는 조사 결과를 발표했다. 시장에서 DRAM의 재고 수준(웨이퍼 포함)은 1...
    Date2019.04.06 Reply0 Views1172
    Read More
  2. 미 에너지부, 최초의 엑사스케일 슈퍼컴퓨터 오로라(Aurora) 계약

    미국 인텔(Intel)은 미국 크레이(Cray)와 공동으로 미 에너지부에 슈퍼 컴퓨터 오로라(Aurora)를 2021년에 납품하는 계약을 체결했다고 발표했다. 신규 오로라는 세계 최초의 초당 100경 회의 부동 소수점 연산이 가능한 엑사 스케일 슈퍼 컴퓨터 시스...
    Date2019.03.21 Reply0 Views1376
    Read More
  3. Intel Architecture Day) 인텔의 차세대 아키텍처 기술 방향

    미국 인텔(Intel)은 창업자 고 로버트 노이스의 사저에서 기자설명회 "인텔 아키텍처 데이(Intel Architecture Day)"를 12월 11일 개최했다. 본 기사에서는 현지에서 취재하면서 알 수 있었던 Intel의 큰 개발 전략 변경에 필자의 고찰을 섞어 전하고 ...
    Date2018.12.15 Reply0 Views5009
    Read More
  4. 세계 스마트폰/태블릿 시장 점유율, 삼성 모바일 사업 최대 위기 직면

    글로벌 시장 조사 기관 미국 IDC가 2018년 3분기 세계 모바일(스마트폰/태블릿) 시장 보고서를 발표했습니다. 먼저 세계 스마트폰 시장은 예상대로 시장이 계속 축소되며 전년 대비 6% 감소했습니다. 내리막 길 시장속의 1위는 삼성으로 전년 대...
    Date2018.11.03 Reply4 Views2184
    Read More
  5. 3분기 애플 실적 발표, ASP 상승 효과에 따른 순이익 32% 증가

    미국 애플이 2018년 7월 ~ 9월 실적 발표 실적 데이터 - 애플 프레스 릴리스 (괄호는 전년 동기 대비 비교폭) 이전 실적 확인 - https://raptor-hw.net/xe/rapter_analysis/166408 총합 매출액 : 629억 0000만 달러 (20% 증가)...
    Date2018.11.03 Reply0 Views1472
    Read More
  6. 마침내 인텔 Core i9-9900K, Core i7-9700K, Core i5-9600K 공식 발표

    그 동안 루머로만 소식을 접할 수 있었던 인텔의 새로운 9세대 Core 시리즈가 공식 발표됐다. 인텔은 한국 시간으로 오늘 새벽 라이브 스트림 이벤트를 개최하고, 새로운 9세대 Core i9-9900K, Core i7-9700K, Core i5-9600K 제품에 대한 발표를 진...
    Date2018.10.09 Reply4 Views1897
    Read More
  7. 애플, 대화면 스마트폰 대중화를 선언한 아이폰XS, XS MAX, 아이폰XR 발표

    애플이 마침내 대화면 스마트폰의 대중화를 선언하는 새로운 아이폰XS, 아이폰XS MAX, 아이폰XR 시리즈를 정식 발표했습니다. 새로운 아이폰 시리즈의 주요 특징은 다음과 같습니다. 5.8인치 iPhone XS / 6.5인치 iPhone XS Max 유기 EL ...
    Date2018.09.15 Reply2 Views2525
    Read More
  8. 엔비디아, 새로운 시대의 GPU 튜링 아키텍처 공식 발표 (NVIDIA Turing)

    세계 최정상 GPU 기업 엔비디아(NVIDIA)가 SIGGRAPH 기조 강연에서 새로운 GPU 아키텍처 Turing을 공식 발표했다. CEO 젠슨황은 Turing은 NVIDIA의 GeForce와 Quadro를 위한 새로운 GPU이며 과거 GTX 8800과 같이 혁신적인 제품이라고 설명했다. ...
    Date2018.08.19 Reply2 Views1349
    Read More
  9. 다나와 CPU / GPU 인기순위, 인텔+엔비디아 시장 독점

    다나와 CPU 인기 순위 (8월 4일 기준) 1위 인텔 8700부터 2위 8700K, 이어 8500, 8400 등 인텔 독점, 7위에 AMD 라이젠 2600 단 한가지 모델만 존재 다나와 GPU 인기 순위 (8월 4일 기준) 1위부터 모두 브랜드만 다른 온리 지포스 시...
    Date2018.08.04 Reply5 Views1761
    Read More
  10. 2018년 2분기 전세계 태블릿 시장, 몰락속에 "애플만 잘나가"

    Top Five Tablet Companies, Worldwide Shipments, Market Share, and Year-Over-Year Growth, Second Quarter 2018 (Preliminary results, combined company view for the current quarter only, shipments in millions) Company 2Q18 Unit Shipments 2...
    Date2018.08.04 Reply2 Views1396
    Read More
  11. Toshiba, QLC 기술로 96층 BiCS FLASH 개발

    도시바 메모리는 4비트 셀 (쿼드 레벨 셀, QLC) 기술을 적용한 3D 플래시 메모리로 96층 BiCS FLASH 프로토 타입 샘플을 개발했다고 발표했다. 싱글 칩 메모리 용량을 최고 수준으로 끌어 올렸으며 9월초부터 SSD 및 SSD 컨트롤러 제조업체에 샘플을 제...
    Date2018.07.21 Reply0 Views944
    Read More
  12. 인텔 10나노 기술, 14나노 대비 2.7배 트랜지스터 밀도 향상

    Tech Insights 연구원은 Lenovo Ideapad330 내부에 장착된 인텔 캐논 레이크 기반 "코어 i3-8121U" 프로세서의 칩을 분석한 보고서를 발표했다. 원문 - http://www.techinsights.com/technology-intelligence/overview/latest-reports/intel-10-nm-logic-...
    Date2018.07.01 Reply2 Views2070
    Read More
  13. 구리 배선 미세화 과제를 위한 나노초 레이저 어닐 기술(nS Laser Anneal)

    미세한 구리 배선의 전기 저항을 대폭 낮추어 가열 처리하는 기술이 VLSI 토론회에서 발표됐다. 펄스폭이 나노초로 짧은 레이저와 구리 배선을 급속히 가열하여 급속히 냉각함으로써 동작의 결정 입자를 크게 성장시키는 기술이다. 14nm세대의 FinFET을 ...
    Date2018.06.23 Reply0 Views2012
    Read More
  14. 인텔, 양자 컴퓨터용 스핀 큐비트(spin Qubit) 칩 테스트 시작

    인텔 연구원들은 작은 "스핀 큐비트(spin qubit)" 칩을 테스트함으로써 양자 컴퓨터에 새로운 단계를 밟고 있다. 이 새로운 칩은 오레곤의 인텔 D1D 팹에서 수 십억 개의 전통적인 컴퓨터 칩을 제작할 수 있는 완벽한 실리콘 제조 기술을 사용하...
    Date2018.06.13 Reply0 Views2595
    Read More
  15. [선거결과] 보수 진영의 완전한 퇴출, 급변하는 한국 정치판

    유권자 매서운 회초리에 ‘보수 몰락’… 지방권력 초유의 쏠림 제7회 전국동시 지방선거에서 여당인 더불어민주당이 사상 최대 압승을 거둔 것으로 나타났다. 원문보기 - http://news.naver.com/main/ranking/read.nhn?mid=etc&sid1=111&rank...
    Date2018.06.14 Reply4 Views2292
    Read More
  16. 인공지능 날개 단 화질 끝판왕, LG 올레드 TV

    1,000개 이상의 화질요소를 꼼꼼히 관리하는 ‘화질 측정 시스템’ – 좌우상하, 대각선 방향까지 총 720도 회전하며, 120인치 디스플레이까지 측정 가능 – 2중 암막커튼으로 암실 환경 만들어 휘도, 명암비, 시야각 등 1,000여개 세부 특성 측정 2년여 개발기...
    Date2018.05.27 Reply3 Views3512
    Read More
  17. 인텔, 기존의 DRAM을 대체하는 3D XPoint NVDIMM 연내 투입

    인텔은 17일, 도내에서 회사의 데이터 센터 사업에 관한 기자 설명회를 개최했다. 설명회에는 미국 Intel 데이터 센터 사업 부사장 겸 Intel Xeon 프로세서/데이터 센터·마케팅 사업 부장 Lisa Spelman(리사 스펠먼)이 등단하여 설명했다. ...
    Date2018.05.21 Reply3 Views2184
    Read More
  18. 메모리 가격 장난질? 삼성전자-하이닉스-마이크론 집단 소송

    하겐스 버먼 (Hagens Berman) 법률 회사는 캘리포니아 북부 지방 법원에 삼성전자, 하이닉스, 마이크론에 대한 집단 소송을 제기했다. 이 회사의 조사에 따르면 3개의 DRAM 제조업체들은 2016년과 2017년 사이 가격을 올릴 목적으로 DRAM 칩의 공급을 고...
    Date2018.05.13 Reply5 Views1886
    Read More
  19. 중국 대규모 메모리 반도체 제조, 내년부터 본격 가동 시작

    드디어 올것이 오는 것인가, 대만 시장 조사 회사 DRAMeXchange는 중국 내 3개 반도체 제조 업체가 낸드 플래시 및 DRAM 생산을 2019년부터 시작한다고 보고했다. 보고서에 따르면 대규모 생산 체제로 이행하는 것은 YMTC, Innotron, JHICC 3개 업체로 In...
    Date2018.04.29 Reply0 Views2813
    Read More
  20. 경제) 한국의 주식 시장은 완전한 사기극으로 판명?

    삼성증권 '112조 실수'…방치한 시스템, 이용한 직원들 실제보다 30배 넘는 유령주식이 발행됐지만 증권사 시스템은 이를 걸러내지 못했습니다. 이 실체없는 주식은 거래도 됐습니다. 주식이 새로 발행되려면 회사의 이사회와 주주총회...
    Date2018.04.07 Reply13 Views15255
    Read More
  21. AMD 라이젠 CPU 보안 결함 내용 (마스터키, 라이젠폴, 키메라, 폴아웃)

    AMD 라이젠 CPU(젠 아키텍처)의 치명적인 보안 결함이 이슈가 되고 있다. 이스라엘 CTS-Labs가 공개한 주요 보안 결함 내용은 4대 취약점으로 나뉘며 해당 내용은 다음과 같다. 라이젠 CPU의 치명적인 보안 결함은 크게 4가지로 분류된다. 라이...
    Date2018.03.15 Reply2 Views4244
    Read More
  22. 인텔, 외장형 GPU 프로토 타입 발표 (ISSCC)

    인텔은 AMD에서 Radeon GPU 부문의 수장이였던 Raja Koduri(라자 코두리)를 영입해 Core and Visual Computing Group의 Chief Architect & Senior Vice President로 임명했다. 이 극적인 이적으로 인텔이 디스크 리트 GPU(외장형 GPU)에 진출하는 것 아니...
    Date2018.02.19 Reply4 Views2776
    Read More
  23. 이더리움(암호화폐) 효과 - 상상 초월의 그래픽 카드 가격

    가상화폐(전문용어 : 암호화폐)의 전 세계적인 IT + 금융 혁명으로 2017년부터 시작되고 있는 그래픽카드 부족 현상이 지속되고 있다. 이런 현상으로 인해 GPU 제조사인 엔비디아와 AMD는 함박 웃음을 짓고 있지만 일반 게이머들은 최악의 나날...
    Date2018.02.17 Reply0 Views3174
    Read More
  24. 4분기 애플 실적, "사상 최대" 전세계 모든 지역에서 성장

    미국 애플이 2017년 10월 ~ 12월 실적 발표 실적 데이터 - 애플 프레스 릴리스 (괄호는 전년 동기 대비 비교폭) 이전 실적 확인 - http://raptor-hw.net/xe/rapter_analysis/153375 총합 매출액 : 882억 9300만 달러 (13% 증가) 순이익 : 200...
    Date2018.02.03 Reply3 Views1630
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 16 Next
/ 16