Graphcore, 7나노 AI 프로세서 'IPU-Machine M2000' 발표

by 아키텍트 posted Jul 18, 2020
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

GC011_IPURACK_009_W4K-2_compressed_1600px.jpg


Graphcore는 AI(인공지능) 전용 IPU(Intelligence Processing Unit) 플랫폼으로 IPU-Machine M2000을 발표했다.


IPU-Machine M2000은 1U 랙 제품으로, 동사가 개발한 새로운 프로세서 Colossus Mk2 GC200 IPU를 4기 탑재하여 1PFLOPS의 연산 성능을 나타내고, 1세대와 비교해서 8배의 성능 향상을 구가한다.


ipu.jpg


Colossus Mk2 GC200 IPU는 TSMC의 7nm 프로세스로 제조되어 823mm2 다이에 594억개 이상의 트랜지스터를 탑재하고, 1472개의 IPU 코어를 내장, 8832개의 병렬계산 스레드 실행이 가능하다. Mk2 GC200 IPU는 프로세서 내 메모리로서 종래의 3배가 되는 900MB의 초고속 SRAM을 각 코어에 배치하여 대규모 모델 등을 프로세서 내에 유지할 수 있는 구조로 했다. 독자 개발한 부동소수점 연산 AI-Float에 의해 성능 향상을 도모하는 것 외 FP16.32 및 FP16.16에 추가로 하드웨어 레벨에서 Stochastic Rounding을 지원한다. 연산 등에 필요한 에너지를 절감하면서 최고 정밀도의 결과를 출력할 수 있다.


또, 동사의 소프트웨어 Poplar에 의해 독자적인 Exchange-Memory를 통한 Streaming Memory 액세스가 가능하고, 1000억개의 파라메타를 갖는 큰 모델에도 대응하며 각 IPU-Machine M2000은 대역폭 180TB/s와 용량 450GB까지의 Exchange-Memory를 지원해 현행의 7nmGPU에 비해 10배 이상의 용량과 100배 이상의 대역을 실현할 수 있다고 밝혔다.



그 외, 새롭게 개발한 GC4000 IPU-Gateway 칩에 의해, IPU-MachineM2000에 대해 2.8Tbps의 광대역 - 저지연 통신을 제공하는.IPU-POD64 랙 시스템을 이용해 16대를 정리한 대규모 시스템도 구축할 수 있으며 도선 및 광 OSFP 커넥터를 통해 IPU-Machine M2000 간을 접속해 확장성을 실현하는 IPU-Fabric 테크놀로지에도 대응한다.


제품의 예약접수가 이미 진행 중이며 2020년 4분기부터 본격적인 생산을 시작한다.


제품 링크 - https://www.graphcore.ai/products/mk2/ipu-machine-ipu-pod






Articles

1 2 3 4 5 6 7 8 9 10