2014.04.28 12:50

1TB/sec를 실현하는 차세대 GPU 메모리 HBM DRAM이 양산 단계로

연대생

조회 수 2927

HBM DRAM이 마침내 양산 페이즈로 진입

차세대 고성능 DRAM "HBM DRAM"이 마침내 양산 초읽기에 들어갔다. 1TB/sec의 초 광대역 메모리를 목표로 한 적층 DRAM 규격 HBM(High Bandwidth Memory) DRAM으로 JEDEC(반도체 표준화 단체)에서 표준화 작업이 끝났고 현재는 SK hynix가 샘플을 출하하기 시작했다. 2014년 후반부터 양산이 시작되고, 2015년에는 최초의 탑재 제품이 등장할 것이라 밝혀졌다.

HBM의 스펙

HBM은 실리콘 관통 전극(TSV:Through Silicon Via) 기술로 다이 스택킹(적층)형의 DRAM 기술이다. 인터페이스 폭은 1,024-bit(x1024), 메모리 대역은 첫세대에서 1스택 128GB/sec, 2세대 256GB/sec. 4개의 HBM 스택을 사용한 시스템이라면 512GB/sec ~ 1TB/sec의 메모리 대역을 실현한다.

실리콘 다이를 직접 적층한 TSV기술

2개의 다이 스택킹 기술

DRAM 업계에서는 HBM DRAM을 광대역 GDDR5의 후속으로 하려 하고 있다. HBM DRAM은 그래픽 카드, HPC(High Performance Computing) 전용의 GPU와 스루풋 프로세서의 메모리, 서버 CPU 캐시, 네트워크 프로세서 전용 메모리 등의 용도가 상정되고 있다.

HBM은 GDDR5 보다 광대역 뿐만 아닌 저전력(약 3배의 퍼포먼스/전력)의 강점을 갖는다. PHY 전력 소비가 GDDR5에 비해 압도적으로 적어 4개의 스택 HBM DRAM을 1Gtps으로 추진해도 전력은 30W이하인 반면 GDDR5에서 이 대역을 실현하려면 전력은 80W 이상이 된다.

HBM은 전력당 대역이 뛰어나

그러나 현재 발표된 HBM 탑재는 고 비용이라는 문제도 있다. DRAM을 TSV에서 스택할 뿐 만 아니라 버튼 로직 다이 사양으로 되어 있기 때문이다. 또 풀 대역을 얻기 위해서는 DRAM 칩을 4층으로 적층 해야 하며 메모리 정도가 크다.

그 때문에 현재의 GDDR5의 모든 포지션을 바꿀 수 있을지 의문이 있다. 그리고 GDDR5 계열 메모리 기술은 메모리 모듈에 대응한 신 규격 GDDR5M으로 파생되고 있어 전체적인 흐름은 메모리 기술이 다양화 시대로 향하고 있는 것처럼 보인다.

DRAM 기술 동향

AMD와 NVIDIA 양쪽 모두 HBM으로

HBM은 현재 JEDEC으로부터 JESD235 규격이 발표되고 있으며 SK hynix가 2014년 2월 반도체 컨퍼런스 ISSCC(IEEE International Solid-State Circuits Conference)에서 실제 실리콘 성과를 발표하고 있다. SK hynix의 HBM은 JEDEC 규격에 준거한 것이지만 JEDEC의 규격 자체는 비교적 유연하게 수립되어 SK hynix가 발표한 사양 외의 탑재도 가능하다.

SK hynix가 발표한 HBM

SK hynix는 4월 중국 선전에서 열린 인텔의 기술 컨퍼런스 Intel Developer Forum(IDF)shenzhen 2014 에서 HBM의 제품 계획을 발표했다. 현재의 예정으로는 2014년 중반까지 최초 2G-bit 첨단 제품 생산을 시작하고 2016년에는 더 용량이 증가된 고속의 2세대의 8G-bit 칩을 생산하는 계획이다. SK hynix는 3월 GPU Technology Conference(GTC)에서도 2G-bit HBM의 웨이퍼를 전시했다.

GTC에서 HBM 웨이퍼 전시

SK hynix의 TSV 로드맵

SK hynix의 HBM스펙. 2세대는 용량/대역을 향상

HBM장착 제품은 NVIDIA가 HBM을 장착할 것으로 보인다. 3D DRAM을 올린 차세대 GPU Pascal(파스칼)의 계획을 GTC에서 발표하고 있다. 또, AMD도 HBM의 GPU 탑재에 적극적으로 움직이고 있고 원래 HBM의 규격을 책정하고 있는 JEDEC의 DRAM 규격 책정 JC-42.3 Subcommittee의 의장은 AMD의 Joe Macri(Corporate VP&Product CTO of AMD Global Business Unit). 또, AMD는 2013년 12월 CPU 회의 Micro46(International Symposium on Microarchitecture 46)에서도 HBM을 포함한 다이 스택킹에 관한 키노트 스피치를 했다. 그리고 Micro46에서 키노트 스피치를 한 AMD의 Bryan Black(Senior AMD Fellow)은 원래 인텔에서 화제가 된 CPU를 분할하여 TSV를 접속하는 논문("Design and Fabrication of 3D Microprocessors"등)를 발표한 인물이다. TSV 기술 응용 중요 인물이 인텔에서 AMD로 이적하고 있다.

NVIDIA의 Pascal 샘플

AMD의 Bryan Black이 2006년 Micro39에서 발표한 TSV CPU

HBM의 개념이 된 TSV 기술

GPU나 GPU코어를 통합한 CPU/SoC(System on a Chip) 또는 네트워크 프로세서는 연산 성능을 프로세스 세대마다 배가시킨다. 그래서 현재 프로세서는 메모리 대역이 장벽이 되어 퍼포먼스를 발휘할 수 없는 상태에 빠져 있다. 이전의 솔루션은 메모리 인터페이스를 고전송, 인터페이스 폭을 확대하는 것으로써 메모리 대역을 올려 왔다. 그러나 소비 전력이 시스템 설계의 큰 문제가 되어 메모리와 메모리 인터페이스가 소비하는 전력을 늘리는 것이 어려워졌다.

그 때문에 지금은 "넓고 늦은" 메모리나 "좁고 빠른" 2가지 메모리 방향으로 진화 방향이 한정되고 있다. DRAM 업계는 현재 좁고 빠른 방향이 아닌 넓고 늦은 메모리가 이익이 있다고 보고 진화했으며 HBM은 그 대표격이다. HBM은 TSV 기술을 사용하여 현재의 DRAM이 안고 있는 제반 문제 해결을 노린다.

광대역 개선은 넓고 늦은 / 좁고 빠른 2가지 방향

미래의 DRAM 방향성

TSV가 차세대 메모리 기술이 된다는 SK hynix 슬라이드

통상의 실리콘 칩은 다이의 한쪽 면에만 접속용 단자를 마련할 수 있다. 그래서 기존의 다이 스택킹에서는 겹친 다이의 단자 간을 가늘게 와이어로 연결한 와이어 본딩 배선이 사용되어 왔다. 이것에 비해 TSV는 다이의 실리콘 기판을 관통한 구멍으로 다이의 후면에도 단자를 배치한다. 그래서 TSV를 사용하면 다이들을 직접 접속할 수 있다.

TSV의 이점

TSV의 기본 구조

기존 보드 상의 배선이나 와이어 본딩에 의한 배선은 칩 간 배선 수가 한정되어 있었다. 그러나 TSV는 적층한 다이 사이를 수천 단자로 접속 할 수 있다. 기존의 DRAM 칩의 몇 배에서 수십 배의 인터페이스를 실현할 수 있어 비교적 낮은 전송 속도에서도 초 광대역 메모리를 실현한다.

JEDEC에서는 TSV를 차세대 DRAM 기술의 핵심으로 규정하고, TSV를 전제로 한 DRAM 기술로서 모바일 Wide I/O, Wide I/O2와 하이 퍼포먼스를 위한 HBM 2가지 규격을 책정해 왔다. 또, DDR4도 모듈상에서는 TSV 적층을 하며 Micron Technology가 주도하는 TSV 기반의 스택 DRAM "Hybrid Memory Cube(HMC)"도 있다. DRAM은 TSV로 향해서 크게 움직이고 있다. TSV 자체는 DRAM 인터페이스만 아니라 다방면에 걸친 응용이 예상되지만 현재 양산 가능한 TSV로 적용하기 용이한 것은 I/O 분야로 CPU 내부 배선에 TSV를 사용하는 응용은 아직 거리가 있다.

TSV기술의 의한 비교

1스택으로 128~256GB/sec의 메모리 대역

HBM DRAM에서 메모리 인터페이스는 1,024-bit(x1024) 이를 1~2Gtps의 전송 속도로 구동한다. 그래서 x1024에서 메모리 대역은 128GB/sec(1,024Gtps)~256GB/sec(2,048Gtps). 또 어떤 JEDEC 관계자는 HBM 세대에서 최대 3Gtps까지 달성할 것으로 예측했고, 그 경우 x1024에서 메모리 대역은 최대 384GB/sec(3,072Gtps).

HBM DRAM은 DRAM을 TSV에서 스택(적층)하지만 CPU나 GPU는 여러개의 HBM 스택을 배치할 수 있다. 예를 들면 4스택을 GPU/CPU에 접속하는 경우 GPU의 메모리 대역은 1Gtps 때 512GB/sec, 2Gtps시에 1TB/sec. 그 경우 GPU 전체 메모리 인터페이스의 데이터 버스 폭은 4,096-bit나 된다. 현재의 GDDR5 메모리 대역은 현실적인 차원에서 300GB/sec대이므로 4스택의 HBM DRAM은 계산적으로 2Gtps때 GDDR5의 3배 메모리 대역을 실현한다.

DRAM 대역의 로드맵

1TB/sec 메모리 대역을 시사하는 NVIDIA의 슬라이드

HBM DRAM은 1,024-bit의 DRAM 인터페이스를 8채널로 분할해 쓴다. 각 채널은 각각 128-bit(x128)의 인터페이스 폭으로 채널은 완전히 독립해 동작하고 채널별로 다른 DRAM 뱅크 그룹에 접근한다. DRAM 메모리 뱅크는 채널마다 완전히 분할되고, HBM DRAM의 DRAM 셀 선반입은 2 Prefetch(2비트씩 읽기)이므로, 128-bit 인터페이스에서 메모리 액세스 입도는 256-bit(32-byte)다.

메모리 액세스 입도는 32Byte

현재의 SK hynix의 HBM DRAM의 경우 1024-bit의 DRAM 인터페이스는 아래와 같이 각 다이로 분할되고 있다. SK hynix는 2개의 채널이 1개의 다이에 접속한다. 각 2채널에서 4장의 다이를 적층 하는 것으로 8채널 풀 접근이 가능하게 된다. 즉, 1다이면 2채널에서 메모리 대역은 1Gtps시에 32GB/sec다. 다이를 적층 하면 할수록 메모리 대역이 올라 거꾸로 말하면 적층 하지 않으면 메모리 대역을 얻을 수 없다.

HBM의 bit너비(PDF판은 이쪽)

현재 예정된 HBM DRAM은 모두 SK hynix와 같은 2채널/다이 사양이다. 다만 JEDEC의 HBM DRAM 스펙에서 사실 다이당의 채널 수는 한정되지 않고 있다. DRAM 벤더의 선택 사항으로서 1개의 다이로 많은 채널을 할당하여 예를 들면 4채널 및 8채널 다이를 만들 수 있다. 혹은 그 반대로 1채널/다이, 1채널을 복수의 다이로 분산하는 것도 허용되고 있다. 탑재 상의 자유도가 높은 것이 HBM DRAM 규격의 특징으로 규격화는 독립 동작하는 채널 단위로 정해져 있다.

간단히 말하자면 HBM DRAM의 경우는 스택의 밖으로 동작 규격이 있는 한 스택 내부는 DRAM 벤더가 어느 정도 자유를 갖고 있다. SK hynix는 DRAM 스택 아래 기반 논리 다이를 두고 있지만 이것도 스펙상 옵션이며 논리 다이를 사용하지 않는 방법도 가능하다. HMC와 달리 DRAM이나 논리 다이 모두 외부 인터페이스는 동일하다.

논리 다이를 쓴 HBM 솔루션

SK hynix의 HBM 구조

기반 논리를 사용하는 것이 현실적인 솔루션

단일 칩 메모리 대역에서 최고의 HBM DRAM

HBM DRAM의 인터페이스를 다른 JEDEC 계열 DRAM과 비교하면 그 특징이 더욱 명료하다. PC&서버의 메인 메모리용 DRAM의 인터페이스는 4/8/16-bit(x4/x8/x16)의 범위에서 GDDR5는 16또는 32-bit(동일 칩으로 전환 가능)이다. 모바일 스택 DRAM의 Wide I/O2가 되면 채널 구성은 HBM DRAM과 같은 최대 8채널(4채널의 사양도 있다)에서 각 채널이 64-bit(x64)로 합계 512-bit(x512)다. HBM DRAM의 인터페이스 폭은 가장 넓게 1,024-bit.

JEDEC메모리의 bit 대역 비교

DDR3, GDDR5, HBM 비교

이들 JEDEC DRAM의 인터페이스 폭과 최대 전송 속도, 최대 메모리 대역 관계를 보면 아래 사진과 같이 된다. 이 사진을 보면 HBM DRAM의 스택당 대역이 뛰어나고 다이당 대역으로 봐도 HBM DRAM에 육박하는 것은 Wide I/O2 뿐이다.

JEDEC 메모리의 대역 인터페이스

DDR4, Wide I/O, GDDR5, HBM 비교

보도 - http://pc.watch.impress.co.jp/docs/column/kaigai/20140428_646233.html

Facebook Twitter Google Pinterest

Atachment
첨부 '1'	tsv.jpg,

위로 아래로 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

엔비디아, 맥스웰 아키텍처 최상위 GPU 지포스 타이탄X 공개

미국 샌프란시스코에서 열린 Game Developer Conference 2015에서 엔비디아가 최상위 GPU 지포스 타이탄X를 공개 했다. 지포스 타이탄X는 현행 맥스웰 아키텍처가 풀 스펙으로 구성된 최상위 GPU로 세부...

Date2015.03.09 CategoryGPU Views999

Read More
엔비디아, 맥스웰 기반 지포스GTX 960 발표 (GM206)

미국 NVIDIA는 22일(현지 시간) 맥스웰(Maxwell) 베이스의 미들 레인지 게이머용 GPU "지포스GTX 960"을 발표했다. 미국에서 판매 예상 가격은 199달러 안팎. 앞선 세대 케플러 아키텍처에서 전력...

Date2015.01.23 CategoryGPU Views1257

Read More
AMD has no plans to reconsider recommended prices of radeon R9 Graphics Cards

Traditionally, when companies add new products into their lineups, they reconsider prices of other family members in order to better position them within their lineups and against compe...

Date2014.12.02 CategoryGPU Views1609

Read More
AMD의 차세대 라데온R9 380X(코드명 캡틴잭) 성능 유출?

[ 성능 ] 중국의 칩헬(CHIPHELL) 사이트에 개발중인 AMD의 차세대 라데온의 성능과 전력소모에 관한 자료가 공개되고 있습니다. 공개된 모델은 AMD의 차세대 R9 3XX 라데온(코드명:Captain Jack=...

Date2014.12.01 CategoryGPU Views854

Read More
차세대 AMD 라데온 390X 정보 유출 - 하이닉스 HBM 메모리 적용

해외 (http://wccftech.com) 사이트에서 AMD의 차세대 플래그십 라데온 390X의 정보가 유출 되었습니다. 자료에 따르면 코드명 FIJI XT(R9 390X)는 TSMC의 20나노 공정과 SK 하이닉스가 주...

Date2014.11.16 CategoryGPU Views1186

Read More
PowerVR 신형 GPU 시리즈 7 발표 - GT7900/7800/7600/7400/7200

영국 이매지네이션(Imagination Technologies)은 차기 모바일 GPU, PowerVR Series7을 발표했다. 라인업은 미들레인지 ~ 하이엔드용 Series7XT와 로우엔드용 Series7XE 2종류가 준비된다. 모두 Po...

Date2014.11.11 CategoryGPU Views1184

Read More
맥북 프로(Early 2011)의 GPU관련 오류 복구를 위한 서명이 19000명 돌파

[ MacBook Pro 2011 모델의 화면 깨짐 증상 ] 과거부터 문제가 되고 있는 MacBook Pro(Early 2011) 모델의 AMD 라데온 GPU에 대한 불만이 올해 8월부터 온라인 서명 플랫폼 change.org에서 시작되...

Date2014.10.19 CategoryGPU Views862

Read More
매트록스(Matrox), 차기 비디오 카드에 AMD 라데온 GPU 채용

Matrox는 3일(현지시간) 새로운 멀티 디스플레이 대응 비디오 카드에 AMD의 GPU을 채택한다고 밝혔다. Matrox는 그 동안 독자적인 GPU을 개발해 왔으나 35년을 고비로 마침내 AMD산 GPU로 전환한...

Date2014.09.10 CategoryGPU Views2354

Read More
1TB/sec를 실현하는 차세대 GPU 메모리 HBM DRAM이 양산 단계로

HBM DRAM이 마침내 양산 페이즈로 진입 차세대 고성능 DRAM "HBM DRAM"이 마침내 양산 초읽기에 들어갔다. 1TB/sec의 초 광대역 메모리를 목표로 한 적층 DRAM 규격 HBM(High Bandwidth Memory) DRAM으...

Date2014.04.28 CategoryGPU Views2927

Read More
엔비디아, GK110을 2개 탑재한 현존 최강 지포스GTX 타이탄Z 발표 (파스칼)

엔비디아는 25일(현지시간) GTC 2014에서 2,999달러의 최고급 VGA 지포스GTX 타이탄Z를 발표했다. 현재 시장에 발매된 최상위 지포스GTX 타이탄 블랙의 상위 기종으로 하나의 카드에 풀 스펙 GK110...

Date2014.03.26 CategoryGPU Views1452

Read More
맥스웰 아키텍처는 엔비디아 APU에 대한 포석(지포스GTX 750ti,볼타)

케플러에서 전력 효율을 발전시킨 맥스웰 NVIDIA는 신세대 GPU 아키텍처 맥스웰을 투입했다. 요란하게 등장하지 않은 것은 저 성능의 메인 스트림 GPU 투입 때문이다. 예전과 같이 하이엔드 GPU와 퍼포먼스...

Date2014.03.01 CategoryGPU Views1272

Read More
엔비디아 신형 지포스 타이탄 블랙 출격, 780TI 마이너 업그레이드 모델

http://videocardz.com 에서 엔비디아의 새로운 윈칩 플래그십, 지포스 타이탄 블랙 정보를 공개했습니다. GTX TITANGTX 780 TIGTX TITAN BLACKGPUGK110-400GK110-425GK110-430Base Clock836 MH...

Date2014.02.16 CategoryGPU Views1717

Read More
엔비디아, 케플러 아키텍처 기반 차세대 모바일 SOC 테그라 K1 발표

엔비디아가 5일(현지시간) 라스 베가스에서 기자 회견을 갖고 차세대 SoC 시리즈 테그라 K1을 발표했다. 테그라 K1의 GPU코어는 케플러 아키텍처의 192 CUDA (FMAD 유닛)을 탑재한다. GPU 코어의 ...

Date2014.01.06 CategoryGPU Views804

Read More
맨틀API 지원 AMD의 퍼포먼스 메인스트림급 라데온 R9 270 공식 발표

AMD는 13일(현지시간)데스크탑용 GPU 라데온R9 270을 공식 발표했다. 라데온R9 270은 SP가 1280개 코어 클럭이 925MHz, 256비트 인터페이스의 5.6GHz GDDR5 2GB를 탑재하며 연산 성능은 2.37TFLO...

Date2013.11.13 CategoryGPU Views1532

Read More
ARM, 최대 16코어 말리(Mali)-T760과 안드로이드에 특화된 말리-T720 발표

영국 ARM은 29일(현지시간) 전력 효율성을 높인 GPU 말리 T760"과 안드로이드에 특화된 GPU 말리-T720을 발표했다. 말리-T760은 말리-T600의 후속 모델로 기존의 말리-T604와 비교해 와트당 성...

Date2013.10.31 CategoryGPU Views1629

Read More
엔비디아 지포스GTX 780, 770 가격 인하, AMD 라데온R9 290X/280X에 맞불

최근 AMD가 하와이 아키텍쳐 기반의 신형 R9 290X와 하이엔드 280X의 발표와 동시에 파격적인 가격대로 출시하자 엔비디아는 경쟁력 확보를 위해 마침내 지포스GTX 780과 770의 가격인하를 발표 했습...

Date2013.10.29 CategoryGPU Views2062

Read More
지포스GTX 780Ti의 다음은? 로드맵으로 맥스웰의 투입 시기를 예상

GeForce GTX 780 Ti 2012~2014년 NVIDIA 로드맵 저전력과 저가격에 힘쓴 Kepler 1.0 ~ 2.0 세대 우선 Kepler 1.0 세대의 업데이트를 보면 2013년 4월에는 OEM 전용으로 GeForce...

Date2013.10.28 CategoryGPU Views2175

Read More
엔비디아, 매끄러운 프레임을 위한 지싱크(G-SYNC) 테크놀로지 발표

엔비디아(www.nvidia.co.kr, CEO 젠슨황)는 수 십 년 동안 게임 그래픽에서 발생해온 고질적인 문제인 화면 잘림(tearing), 왜곡(stuttering) 및 지연(lag) 현상을 해결해 최초로 GPU와 모니터의 완...

Date2013.10.25 CategoryGPU Views1502

Read More
엔비디아가 새로운 게임웍스 테크놀로지 발표 (HBAO+,TXAA,테그라5)

NVIDIA는 10월 17일 캐나다 몬트리올에서 NVIDIA Editor's Day를 개최하고 새로운 게임 테크놀로지를 발표했다. 보통 NVIDIA가 주최하는 프레스 행사는 게임 미디어가 대상이 되는 경우는 적고, 대체로 ...

Date2013.10.21 CategoryGPU Views2703

Read More
이매지네이션의 첫 MIPS 시리즈5 프로세서 MIPS P5600 워리어 발표

영국 이매지네이션 테크놀로지는 14일, 최신 MIPS 아키텍처 MIPS Series 5(개발 코드명:워리어)을 적용한 MIPS P5600을 발표했다. 2012년 이매지네이션이 MIPS를 인수한 이후, 2013년 6월 발표된 ...

Date2013.10.15 CategoryGPU Views1416

Read More