3월 29일 (금) 오후 5:42

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2023.11.22. / 등급: 12세 관람가 / 장르: 드라마 / 국가: 대한민국 감독 : 김성수 출연 : 황정민, 정우...
노량: 죽음의 바다 / 개봉 2023.12. / 장르: 액션, 드라마 / 국가: 대한민국 감독 : 김한민 출연 : 김윤석, ...

Fermi 베이스의 Tesla

            [ GPU Accelerated Computing 토론회 ] 

              - 1월 28일 ~ 29일 / NVIDIA CEO 젠슨·황

                 - 페르미 베이스의 테슬라 카드 공개,시연


 

NVIDIA는 1월 28/29일,「Accelerated Computing」이라는 타이틀의 컨퍼런스를 개최했다. 이 컨퍼런스는 HPC 분야에 종사하는 사람들에게 병렬 가속기의 가능성에 대해 토론하는 장을 마련한 것으로 첫날의 기조 강연에는 NVIDIA의 CEO 젠슨·황씨가 등장했다.

 

HPC의 상품화와 신 아키텍쳐의 요구
NVIDIA의 CEO 젠슨·황씨

황씨는 이번 강연을 3개의 토픽으로 나누어 GPU 컴퓨팅에 대해 소개했다.「Why supercomputing needs new architecture? (왜 슈퍼컴퓨팅은 새로운 아키텍쳐를 필요로 하는가?)」, 「Why GPU is the best choice? (왜 GPU가 최고의 선택인가?)」, 「Why NVIDIA is so passionate abour GPGPU? (왜 NVIDIA는 GPGPU에 열정적인가?)」 


우선 황씨는 NERSC(National Energy Research Scientific Computing Center)의 연구 내용을 소개. 여기에 따르면 2008년 이후 "시뮬레이션”에 대한 수요의 고조로부터 컴퓨팅의 자원이 절대적으로 부족하다고 나타나고 있다고 한다. 시뮬레이션은 과학 분야 뿐 만 아니라 공업 분야에 있어서도 프로토 타입 제작 단계 등, 다양한 분야로 폭넓게 이용되고 있다고는 하지만 그 자원이 압도적으로 부족한 것이다. 


한편으로 HPC(하이 퍼포먼스 컴퓨팅)의 프로세서는 99년 이후 이전과는 다른 큰 발전을 했다.'99년 이전에는 벡터나 SIMD, MIMD, 멀티 프로세서등, 다양한 접근의 프로세서를 슈퍼컴퓨터 메이커가 직접 개발하고 비즈니스를 펼치는 상황이었다. 


그러나 99년에 벡터 인스트럭션(instruction)인 SSE를 인텔이 발표한 이후 x86 계의 CPU를 다수 이용한 슈퍼컴퓨터가 전체 점유율의 대부분을 차지하게 되어 여기서부터 슈퍼컴퓨터 프로세서의 상품화가 시작됐다. 무어의 법칙에 의해 18개월에 2배의 성능을 얻을 수 있게 되어 그와 동시에 가격 하락으로도 연결되었다고 황씨는 설명했다. 


그러나 문제가 발생했다. 그것은 프로세서의 스케일링이 멈추어 버린 것이다. 황씨는 버클리 대학의 데이빗·페터슨씨가 주장한 「The Brick Wall」을 소개했다. 이것은 명령 레벨로의 병렬성의 벽, 메모리의 벽, 소비 전력의 벽이라고 하는 3개의 벽에 의해서 컴퓨터의 성능은 큰 벽이 생기고 있다는 것이다. 


이것의 예로써는 연 52%로 성장해 온 프로세서의 성능이 2002년경을 경계로 “벽”에 도달하여 이후로는 연 20%의 성장으로 감쇄한 것. 이러한 성능 향상 폭의 감소는 만약 연 52%를 유지하고 있었다고 가정한다면 2016년에는 1,000배 분의 성능이 없어진 것으로 계산이 된다고 한다.  


이러한 부문으로부터 소프트웨어 개발자에게도 대응이 요구되고 있다고 설명했다. 지금까지의 소프트웨어 패키지는 베이스가 되는 부분의 코드는 유지하고, 주로 기능 추가로 다음 버젼의 제품을 투입해 왔다. 기능 추가에 의해서 늦어졌다고는 해도 18개월에 2배의 기세로 성장해 온 프로세서의 성능이 소프트웨어에 의해 상쇄되어 왔던 것이다. 그에 따라 소프트웨어도 코드를 고쳐 쓸 필요성이 생기고 있다. 


현재는 프로세서의 멀티 코어화 라고 하는 새로운 아키텍처가 태어나고 있어 소프트웨어 개발자도 당연히 그것을 의식해야 한다. 황씨는 이러한 흐름에 따라 다수의 패러렐 프로세서를 갖는 퍼포먼스의 성장이 무궁한 GPU 컴퓨팅이 높은 가능성이 있다고 어필했다. 

 

 과학, 산업계에서 시뮬레이션이 필수가 되어, 2008년 이후에 컴퓨팅 자원의 요구가 상승. HPC의 진화로 성능은 상승했지만 채울 수 없는 요구도 큰 폭으로 늘어나고 있다. 시뮬레이션이 강력한 부동 소수점 연산 능력을 요구하는 것을 세포의 시뮬레이션으로 나타낸 것. 현재 세계 최고 성능의 슈퍼컴퓨터는 1 PFLOPS 선.
 SSE의 등장 이후, x86계의 CPU를 채용하는 슈퍼컴퓨터가 시장쉐어를 확대. 퍼포먼스당 코스트를 중시한CPU에 의한 슈퍼컴퓨터가 당연하게 되었다. 멀티 코어 CPU에 비해서 GPU의 성능 향상이 눈부신 점을 어필.

GPU 컴퓨팅의 활용, 사례등을 소개
황씨는 GPU 컴퓨팅의 활용 사례에 대해서도 소개했다. 700만개의 광자를 사용한 레이 트래싱의 데모에서 구세대의 GT200에 비해 차세대 Fermi는 4배의 성능을 낼 수 있다는 점을 어필. 아울러 테셀레이션의 예도 나타내 보였다.

레이 트래싱 데모. 700만개의 광자를 시뮬레이션 한 것 이것은 Fermi에 탑재된 테셀레이터를 사용한 데모로, 디스프레이스먼트맵을 조합해 수면의 물결을 표현하고 있다

Adobe의 Mercury Playback Engine은 Adobe Premiere CS5에 탑재될 예정의 동영상 편집 가속 엔진이지만 CUDA를 이용하여 리얼타임 프리뷰를 실행하면서 동영상 편집을 할 수 있다는 점도 소개됐다.    


또한 GPU 활용에 있어서의 코스트 퍼포먼스도 어필하고 있다. 시스템 상품인 Xeon 환경에 2개의 Tesla를 탑재했을 때 분자 동역학 계산으로 19배, 분자 모델링으로 25배의 성능 향상, 퍼포먼스 당의 코스트는 각각 14배, 19배가 된다고 밝혔다.  


그 외 CUDA의 성장에 대해서도 설명했다. CUDA가 릴리즈 된 것은 2006년이고 그 다음해 Super Computing 07 에서는 CUDA 관련 부스가 NVIDIA 뿐이였던 것이 2009년에는 75개 부스, 90개의 관련 포스터가 열리기도 했다. 또한 300여개의 대학/기업이 CUDA를 교육하고 있다고 한다. 일정수준 이상의 유저가 이미 NVIDIA의 CUDA 대응 GPU를 사용하고 있다는 점부터 CUDA를 이용한 어플리케이션을 당장이라도 이용할 수 있는 유저가 많다는 점도 부각하고 있다.  


또한 NVIDIA는 Visual Studio의 어플리케이션 개발 환경인 「NEXUS」를 릴리즈 하여 개발자들을 지원하고, HPC 시장은 더욱 더 커질 것이라는 예상부터 지금까지와 같이 GPU 컴퓨팅에 관련하여 고액의 투자를 계속해 나갈것이라고 밝혔다.

 

차기 Adobe Premiere에 탑재되는 Mercury Playback Engine은 CUDA를 이용하여 동영상 편집 처리를 가속한다. Tesla를 도입하는 추가 코스트에 비해서 얻을 수 있는 퍼포먼스가 더 높다는 점을 어필. 불황시에도 GPU 컴퓨팅에 대한 연구 개발비의 투자액을 늘린 것을 나타내 보이며 이 분야에 주력한다는 점을 어필했다.

 

 

보도 - http://pc.watch.impress.co.jp 






List of Articles
제목 조회 수
ITU 글로벌 인터넷 통계 발표 - 선진국은 포화, 성장은 넥스트 빌리언 9474
IBM, 빅데이터 타겟 소프트웨어 정의 스토리지 포트폴리오 공개 4083
5월 - 7월 인터내셔널 커스텀 [ INTERNATIONAL CUSTOM ] 11053
네이버 라인은 일본 국민 메신저 임을 재확인, 성인 81.6%가 라인 사용 5036
IPv6 네트워크에서 IPv4 주소를 공유하는 SA46T-AS 대규모 실험 성공 2625
히타치 플래시 미디어 스토리지 - 유니파이드 HUS150 ALL FLASH 3406
미션 크리티컬 타겟 델 파워에지 R920 / 1U 파워에지 R220 발표 3162
2014년 3월 세계 웹브라우저 및 OS 점유율 - 파이어폭스vs크롬의 2위 경쟁 치열 6943
페이스북의 가상현실? 리프트 헤드셋 제조 업체 오큘러스VR 인수 4220
글로벌 서버 시장 점유율 - 메인프레임/유닉스 몰락, x86의 시장 통일 13104
네이버vs다음 국내 포털 점유율 - 확대되는 격차 (네이버,다음 실적) 13696
시스코, 사물 인터넷 시대에 대응하는 포그 컴퓨팅 플랫폼 IOx 발표 6946
IBM 최초의 상용 오픈플로우 컨트롤러 발표 (SDN VE,오픈스택 뉴트론,KVM) 5344
세계 모바일AP 시장 점유율, 퀄컴의 독주와 애플/미디어텍 약진, 엑시노스 추락 (ARM) 13357
2월 - 4월 인터내셔널 커스텀 [ INTERNATIONAL CUSTOM ] 12386
구글이 스마트 컨택트 렌즈 개발, 눈물로 당뇨병 환자의 혈당치 측정 (구글X) 3573
개발자들의 비트코인 관심 급증 ― 비트코인 관련 프로젝트 17.8% 증가 1 6336
시스코와 Netapp, 플렉스팟 (FlexPod) 아키텍쳐로 양사의 제휴를 확대한다 6383
AMD, x86과 ARM의 갭을 중개하는 동작 기반을 개발한다 5390
IPv4, 마침내 한계에 도달 (IPv6) 3373
오라클, 5TB의 테이프 드라이브 발표 4514
윈도우 태블릿의 전망은? 14899
인텔, HPC 타겟 “초 고밀도 집적 회로”의 개발에 착수 5856
ARM, 차세대 모바일 기기를 위한 GPU "Mali-T658" 발표 4746
글로벌 OS 점유율, 윈도우 시리즈의 패권은 절대적 外 웹 브라우저 점유율(윈도우 점유율,데스크탑vs모바일) 11553
HP의 프로젝트 문샷 (ARM 키스톤 II 아키텍쳐) 5955
마침내 1GB당 1달러에 도달한 SSD의 가격, 더 가까워진 대중화 11819
인텔의 신형 아이태니엄부터 아톰S 까지 서버 프로세서 로드맵 8198
구글 클라우드 서비스 컴퓨트 엔진의 일반 제공 시작, 데비안, 레드햇/수세 리눅스, FreeBSD 등 지원 4460
인텔 베이트레일 태블릿 종합 - 델 베뉴 8/11 프로,아수스 T100,레노버 믹스2,아이코니아W4등 14461
주니퍼 네트웍스의 차세대 클라우드 아키텍처 메타 패브릭(MetaFabric)+QFX5100 스위치 발표 4950
라우터와 스위치, 글로벌 네트워크 시대의 핵심 (이더넷,프레임릴레이) 1 23852
MS 윈도우XP 의 서비스 지원 종료를 실시간으로 확인 3314
11월 - 1월 인터내셔널 커스텀 [ INTERNATIONAL CUSTOM / 조립PC 견적 ] 12405
네이버vs다음 국내 포털 점유율, 대한민국은 네이버가 지배한다 (네이버 각 데이터센터) 16176
마이크로소프트의 새로운 시작, 제품별 직종별 대규모 조직 개편 시행 5283
인텔, 대규모 빅 데이터를 위한 독자적인 Hadoop(하둡) 배포판을 릴리즈 8548
사타3의 후속 규격, 사타 익스프레스의 본격적인 규격 작업 시작 8196
베이트레일, 메리필드를 위한 인텔 실버몬트 아키텍처 분석 1 24827
마이크로소프트 인터넷 익스플로러10 사용 캠페인 (IE10) 1 5344
유튜브의 랩터 인터내셔널 버전이 추가 되었습니다. 4892
서버 / PC 성능 저하의 원인은 하드디스크 단편화, 그 해결책은? (디스크키퍼) 12497
인텔의 매니코어 아키텍쳐 MIC와 아톰 SoC 메드필드 5922
스마트폰 랩터 사운드 벨소리 다운로드 17408
인텔 아이비 브릿지와 AMD의 파일 드라이버 [ ISSCC ] 1 8299
차세대 반도체(DRAM), DDR4와 LPDDR3 칩이 등장 17152
태블릿 시장 및 엔비디아 쿼드코어 테그라3 4935
차세대 윈도우8의 주요 특징 정리 2 22799
IT 관리자의 퍼블릭 클라우드 선택의 포인트 (PUBLIC CLOUD) 32748
쿼드로 3000M을 탑재한 파워풀 노트북, 후지쯔 FMV LIFEBOOK NH90/DN 8697
AMD 라노(Llano) 아키텍쳐에 대하여 7433
애플의 최신 OS 라이언은 맥OS 의 보급을 가속할 수 있을까 8229
모빌리티로의 추진이 비지니스의 지속성과 생산성을 향상 (인텔 vPro) 5948
인텔 IDF 2011 (베이징) 주요 내용 요약 (시더트레일/오크트레일/아이태니엄) 2 15589
고품격 컨슈머를 위한 ASUS 람보르기니 VX7 노트북 1 5220
랩터 인터내셔널 RSS 주소 입니다. 1 17675
MS 윈도우의 25년 역사 간단 정리 (윈도우 역사) 25542
GPU 시장 분석 <Chaos / take off> by_페르미 아키텍처 6 62751
테슬라 GPU, 세계 최고 페타플롭급 슈퍼컴퓨터 탑재 7303
OCZ의 초고속 SSD, "레보 드라이브 X2(RevoDrive X2)" 8848
인텔 샌디브릿지 아키텍처 분석 (링버스,AVX,SSE,uOP 캐시,SIMD) 1 52084
AMD의 차세대 불도저 아키텍처 분석 (모듈, 공유 FMAC) 2 25963
삼성의 아이피니티 지원 멀티 디스플레이 (AMD 아이피니티) 2 5973
엔비디아, GPU 컴퓨팅의 가능성을 어필 (Accelerated Computing) 1 5738
2009년도 글로벌 IT 10대 뉴스 (M&A,WIN7,스티브 잡스,스마트폰 등) 2 14096
2009년도 스토리지 업계 주요 포커스 - Cloud, Ssd, Deduplicate, FcoE 1 5517
GPU 시장 분석 <Transition> 5 15870
NVIDIA의 GPU 진화상 (GTC 2009) 4 7542
인텔 네할렘 아키텍처, 로드맵 분석 (SMT,터보부스트) 3 35587
넷북 사용자들을 위한 S/W 4127
인텔 / AMD의 x86 CPU 아키텍처 동향(CELL,멀티코어,불도저,나노공정) 1 8535
와이브로(WIBRO)의 간략한 소개 3058
랩터 인터내셔널 배경화면 배포 4498
CPU 구매 가이드 VER 1.0 1 8291
< 엔비디아 지포스 9000 시리즈 > 3123
한계에 도달한 하드디스크의 대안 SSD 5156
Board Pagination Prev 1 2 Next
/ 2