ISSUE

엔비디아, GPU 컴퓨팅의 가능성을 어필 (Accelerated Computing)

by RAPTER posted Feb 01, 2010
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄 수정 삭제

Fermi 베이스의 Tesla

            [ GPU Accelerated Computing 토론회 ] 

              - 1월 28일 ~ 29일 / NVIDIA CEO 젠슨·황

                 - 페르미 베이스의 테슬라 카드 공개,시연


 

NVIDIA는 1월 28/29일,「Accelerated Computing」이라는 타이틀의 컨퍼런스를 개최했다. 이 컨퍼런스는 HPC 분야에 종사하는 사람들에게 병렬 가속기의 가능성에 대해 토론하는 장을 마련한 것으로 첫날의 기조 강연에는 NVIDIA의 CEO 젠슨·황씨가 등장했다.

 

HPC의 상품화와 신 아키텍쳐의 요구
NVIDIA의 CEO 젠슨·황씨

황씨는 이번 강연을 3개의 토픽으로 나누어 GPU 컴퓨팅에 대해 소개했다.「Why supercomputing needs new architecture? (왜 슈퍼컴퓨팅은 새로운 아키텍쳐를 필요로 하는가?)」, 「Why GPU is the best choice? (왜 GPU가 최고의 선택인가?)」, 「Why NVIDIA is so passionate abour GPGPU? (왜 NVIDIA는 GPGPU에 열정적인가?)」 


우선 황씨는 NERSC(National Energy Research Scientific Computing Center)의 연구 내용을 소개. 여기에 따르면 2008년 이후 "시뮬레이션”에 대한 수요의 고조로부터 컴퓨팅의 자원이 절대적으로 부족하다고 나타나고 있다고 한다. 시뮬레이션은 과학 분야 뿐 만 아니라 공업 분야에 있어서도 프로토 타입 제작 단계 등, 다양한 분야로 폭넓게 이용되고 있다고는 하지만 그 자원이 압도적으로 부족한 것이다. 


한편으로 HPC(하이 퍼포먼스 컴퓨팅)의 프로세서는 99년 이후 이전과는 다른 큰 발전을 했다.'99년 이전에는 벡터나 SIMD, MIMD, 멀티 프로세서등, 다양한 접근의 프로세서를 슈퍼컴퓨터 메이커가 직접 개발하고 비즈니스를 펼치는 상황이었다. 


그러나 99년에 벡터 인스트럭션(instruction)인 SSE를 인텔이 발표한 이후 x86 계의 CPU를 다수 이용한 슈퍼컴퓨터가 전체 점유율의 대부분을 차지하게 되어 여기서부터 슈퍼컴퓨터 프로세서의 상품화가 시작됐다. 무어의 법칙에 의해 18개월에 2배의 성능을 얻을 수 있게 되어 그와 동시에 가격 하락으로도 연결되었다고 황씨는 설명했다. 


그러나 문제가 발생했다. 그것은 프로세서의 스케일링이 멈추어 버린 것이다. 황씨는 버클리 대학의 데이빗·페터슨씨가 주장한 「The Brick Wall」을 소개했다. 이것은 명령 레벨로의 병렬성의 벽, 메모리의 벽, 소비 전력의 벽이라고 하는 3개의 벽에 의해서 컴퓨터의 성능은 큰 벽이 생기고 있다는 것이다. 


이것의 예로써는 연 52%로 성장해 온 프로세서의 성능이 2002년경을 경계로 “벽”에 도달하여 이후로는 연 20%의 성장으로 감쇄한 것. 이러한 성능 향상 폭의 감소는 만약 연 52%를 유지하고 있었다고 가정한다면 2016년에는 1,000배 분의 성능이 없어진 것으로 계산이 된다고 한다.  


이러한 부문으로부터 소프트웨어 개발자에게도 대응이 요구되고 있다고 설명했다. 지금까지의 소프트웨어 패키지는 베이스가 되는 부분의 코드는 유지하고, 주로 기능 추가로 다음 버젼의 제품을 투입해 왔다. 기능 추가에 의해서 늦어졌다고는 해도 18개월에 2배의 기세로 성장해 온 프로세서의 성능이 소프트웨어에 의해 상쇄되어 왔던 것이다. 그에 따라 소프트웨어도 코드를 고쳐 쓸 필요성이 생기고 있다. 


현재는 프로세서의 멀티 코어화 라고 하는 새로운 아키텍처가 태어나고 있어 소프트웨어 개발자도 당연히 그것을 의식해야 한다. 황씨는 이러한 흐름에 따라 다수의 패러렐 프로세서를 갖는 퍼포먼스의 성장이 무궁한 GPU 컴퓨팅이 높은 가능성이 있다고 어필했다. 

 

 과학, 산업계에서 시뮬레이션이 필수가 되어, 2008년 이후에 컴퓨팅 자원의 요구가 상승. HPC의 진화로 성능은 상승했지만 채울 수 없는 요구도 큰 폭으로 늘어나고 있다. 시뮬레이션이 강력한 부동 소수점 연산 능력을 요구하는 것을 세포의 시뮬레이션으로 나타낸 것. 현재 세계 최고 성능의 슈퍼컴퓨터는 1 PFLOPS 선.
 SSE의 등장 이후, x86계의 CPU를 채용하는 슈퍼컴퓨터가 시장쉐어를 확대. 퍼포먼스당 코스트를 중시한CPU에 의한 슈퍼컴퓨터가 당연하게 되었다. 멀티 코어 CPU에 비해서 GPU의 성능 향상이 눈부신 점을 어필.

GPU 컴퓨팅의 활용, 사례등을 소개
황씨는 GPU 컴퓨팅의 활용 사례에 대해서도 소개했다. 700만개의 광자를 사용한 레이 트래싱의 데모에서 구세대의 GT200에 비해 차세대 Fermi는 4배의 성능을 낼 수 있다는 점을 어필. 아울러 테셀레이션의 예도 나타내 보였다.

레이 트래싱 데모. 700만개의 광자를 시뮬레이션 한 것 이것은 Fermi에 탑재된 테셀레이터를 사용한 데모로, 디스프레이스먼트맵을 조합해 수면의 물결을 표현하고 있다

Adobe의 Mercury Playback Engine은 Adobe Premiere CS5에 탑재될 예정의 동영상 편집 가속 엔진이지만 CUDA를 이용하여 리얼타임 프리뷰를 실행하면서 동영상 편집을 할 수 있다는 점도 소개됐다.    


또한 GPU 활용에 있어서의 코스트 퍼포먼스도 어필하고 있다. 시스템 상품인 Xeon 환경에 2개의 Tesla를 탑재했을 때 분자 동역학 계산으로 19배, 분자 모델링으로 25배의 성능 향상, 퍼포먼스 당의 코스트는 각각 14배, 19배가 된다고 밝혔다.  


그 외 CUDA의 성장에 대해서도 설명했다. CUDA가 릴리즈 된 것은 2006년이고 그 다음해 Super Computing 07 에서는 CUDA 관련 부스가 NVIDIA 뿐이였던 것이 2009년에는 75개 부스, 90개의 관련 포스터가 열리기도 했다. 또한 300여개의 대학/기업이 CUDA를 교육하고 있다고 한다. 일정수준 이상의 유저가 이미 NVIDIA의 CUDA 대응 GPU를 사용하고 있다는 점부터 CUDA를 이용한 어플리케이션을 당장이라도 이용할 수 있는 유저가 많다는 점도 부각하고 있다.  


또한 NVIDIA는 Visual Studio의 어플리케이션 개발 환경인 「NEXUS」를 릴리즈 하여 개발자들을 지원하고, HPC 시장은 더욱 더 커질 것이라는 예상부터 지금까지와 같이 GPU 컴퓨팅에 관련하여 고액의 투자를 계속해 나갈것이라고 밝혔다.

 

차기 Adobe Premiere에 탑재되는 Mercury Playback Engine은 CUDA를 이용하여 동영상 편집 처리를 가속한다. Tesla를 도입하는 추가 코스트에 비해서 얻을 수 있는 퍼포먼스가 더 높다는 점을 어필. 불황시에도 GPU 컴퓨팅에 대한 연구 개발비의 투자액을 늘린 것을 나타내 보이며 이 분야에 주력한다는 점을 어필했다.

 

 

보도 - http://pc.watch.impress.co.jp 






Articles

1 2