인텔 60코어를 내장한 몬스터, 제온 파이(Xeon Phi) 공식 발표

by RAPTER posted Nov 13, 2012
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

02.jpg

 

인텔이 하나의 다이에 62개의 코어를 탑재한 매니 코어 프로세서 제온 파이 5110 P를 공식 발표했다. 코드명 Knights Corner(나이츠코너)는 22나노 프로세스로 물리적으로 62개의 CPU 코어를 탑재하는 매니코어 프로세서. 1개의 칩으로 단정도 부동 소수점 연산이 2 TFLOPS 이상, 배정도 연산이 1 TFLOPS 이상의 퍼포먼스를 실현한다. 칩 당 퍼포먼스는 고급형 GPU 수준이면서 CPU 형태의 명령어 셋을 갖춘 하이브리드 프로세서인 점이 특징이다. 아키텍쳐적으로는 시장 투입을 취소한 그래픽 프로세서 Larrabee(라라비)를 계승하는 MIC(Many Integrated Core=매니 인터그레이티드 코어)아키텍쳐다.

인텔은 이 괴물 프로세서를 HPC(High Performance Computing) 시장에 투입한다. HPC 시장에서 슈퍼컴퓨터 타겟의 순항을 이어가고 있는 NVIDIA의 케플러 GPU와 IBM의 매니코어 프로세서 BlueGene/Q, 또 일본 후지쯔의 SPARC64 VIIIfx에 도전한다. GPU와 전용 아키텍쳐에 석권 된 시장에 진입하는 것을 목표로 하고 있다.

현재 개최중인 슈퍼 컴퓨팅 컨퍼런스 SC12에서 슈퍼 컴퓨터 탑 500 리스트가 발표되었다. 현재 글로벌 1위는 NVIDIA의 K20x GPU를 탑재한 Titan(타이탄)(ORNL:Oak Ridge National Laboratory). 2위는 IBM의 BlueGene/Q의 Sequoia (LLNL:Lawrence Livermore National Laboratory), 3위는 일본 후지쯔 SPARC64 VIIIfx의 K(이화학 연구소)로 IBM의 Sequoia를 엔비디아의 GPU 탑재 시스템이 다시 한번 밀어냈다. 인텔의 제온 파이는 Stampede (Texas Advanced Computing Center/Univ. of Texas)로 7위에 올라서 있다.(Intel CPU 시스템에서는 SuperMUC가 6위).

인텔은 HPC의 성장이 데이터 센터의 성장을 견인하고 있다고 판단하고 HPC 시장을 중시하고 있다. 또, 인텔은 빅 데이터 해석의 필요성이 높아지면서 매니코어의 수요가 향후로도 높아질 것이라고 예측하고 있다.

 

07.jpg

 

제온파이 5110 P는 62 코어중 60 코어가 유효하게 동작하고, 클럭은 1.053GHz. 코어가 512-bit의 벡터 유닛을 갖춰 배정도 1,011 GFLOPS, 단정도는 2배의 퍼포먼스를 발휘한다. 각 코어가 4 스레드의 SMT(Simultaneous Multithreading)에 대응하기 때문에 칩 전체적으로는 240 스레드가 된다.

60 코어 각각 512 KB씩 L2가 부속되어 칩 전체의 L2캐쉬 양은 30MB에 이른다. 메모리 인터페이스는 512-bit GDDR5로 5 Gtps로 전송, 피크메모리 대역은 320GB/sec. GPU라고 해도 하이엔드의 메모리 대역이다. 메모리 인터페이스는 32-bit 단위로 동작하고, 카드의 메모리량은 8GB. 열설계 소비전력은225W.

저렴한 제온파이 3100 시리즈는 2013년 전반에 발매될 전망. 이 모델은 62 코어중 57 코어가 유효하게 동작한다. 즉, 5개의 코어가 비활성화 되고 있다. 제온파이 3100은 데이터 센터 전용의 패시브 냉각 이외에 액티브 냉각도 준비된다. 현재로서 동작 클럭은 1.1 GHz로 배정도 1,003 GFLOPS로 전망된다.

L2 캐쉬의 양은 칩 전체로 28.5MB. 메모리 인터페이스는 384-bit로 전송 레이트는 5 Gtps로, 메모리량은 6GB. 피크 메모리 대역은 240 GB/sec,TDP는 300W.

제온파이 시리즈는 5100 / 3100 모두 호스트 버스는 PCI Express Gen2. 이것은 칩의 설계 단계 당시에  PCI Express Gen3가 확정되지 않았기 때문이다.

시판된 2가지 버전 외에 인텔은 스페셜 에디션도 제공하고 있다. 현재 밝혀진 것은 벤치마크나 Texas Advanced Computing Center(TACC)의 Stampede 전용으로 제공하고 있는 SE10으로 불리는 모델. 이것은 61 코어가 유효하고, 1.1 GHz 동작, 352 GB/sec의 메모리 대역, TDP 300 W의 카드.

제온파이 5100과 3100을 비교하면 피크 퍼포먼스로 차별화하는 것이 아니라, 메모리 대역과 TDP로 차별화를 도모하고 있다. 5110P와 3120A는 양쪽 모두 1,000 GFLOPS 이상의 퍼포먼스지만 5100은 메모리 인터페이스가 넓고, TDP가75% 낮다. HPC 시장에서는 실제 프로그램의 성능에 영향이 큰 메모리와 서버 센터의 운영 비용에 크게 영향을 주는 것이 전력 소모이기 때문이다.






Articles

5 6 7 8 9 10 11 12 13 14