3월 28일 (목) 오후 10:57

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2023.11.22. / 등급: 12세 관람가 / 장르: 드라마 / 국가: 대한민국 감독 : 김성수 출연 : 황정민, 정우...
노량: 죽음의 바다 / 개봉 2023.12. / 장르: 액션, 드라마 / 국가: 대한민국 감독 : 김한민 출연 : 김윤석, ...

Fermi 베이스의 Tesla

            [ GPU Accelerated Computing 토론회 ] 

              - 1월 28일 ~ 29일 / NVIDIA CEO 젠슨·황

                 - 페르미 베이스의 테슬라 카드 공개,시연


 

NVIDIA는 1월 28/29일,「Accelerated Computing」이라는 타이틀의 컨퍼런스를 개최했다. 이 컨퍼런스는 HPC 분야에 종사하는 사람들에게 병렬 가속기의 가능성에 대해 토론하는 장을 마련한 것으로 첫날의 기조 강연에는 NVIDIA의 CEO 젠슨·황씨가 등장했다.

 

HPC의 상품화와 신 아키텍쳐의 요구
NVIDIA의 CEO 젠슨·황씨

황씨는 이번 강연을 3개의 토픽으로 나누어 GPU 컴퓨팅에 대해 소개했다.「Why supercomputing needs new architecture? (왜 슈퍼컴퓨팅은 새로운 아키텍쳐를 필요로 하는가?)」, 「Why GPU is the best choice? (왜 GPU가 최고의 선택인가?)」, 「Why NVIDIA is so passionate abour GPGPU? (왜 NVIDIA는 GPGPU에 열정적인가?)」 


우선 황씨는 NERSC(National Energy Research Scientific Computing Center)의 연구 내용을 소개. 여기에 따르면 2008년 이후 "시뮬레이션”에 대한 수요의 고조로부터 컴퓨팅의 자원이 절대적으로 부족하다고 나타나고 있다고 한다. 시뮬레이션은 과학 분야 뿐 만 아니라 공업 분야에 있어서도 프로토 타입 제작 단계 등, 다양한 분야로 폭넓게 이용되고 있다고는 하지만 그 자원이 압도적으로 부족한 것이다. 


한편으로 HPC(하이 퍼포먼스 컴퓨팅)의 프로세서는 99년 이후 이전과는 다른 큰 발전을 했다.'99년 이전에는 벡터나 SIMD, MIMD, 멀티 프로세서등, 다양한 접근의 프로세서를 슈퍼컴퓨터 메이커가 직접 개발하고 비즈니스를 펼치는 상황이었다. 


그러나 99년에 벡터 인스트럭션(instruction)인 SSE를 인텔이 발표한 이후 x86 계의 CPU를 다수 이용한 슈퍼컴퓨터가 전체 점유율의 대부분을 차지하게 되어 여기서부터 슈퍼컴퓨터 프로세서의 상품화가 시작됐다. 무어의 법칙에 의해 18개월에 2배의 성능을 얻을 수 있게 되어 그와 동시에 가격 하락으로도 연결되었다고 황씨는 설명했다. 


그러나 문제가 발생했다. 그것은 프로세서의 스케일링이 멈추어 버린 것이다. 황씨는 버클리 대학의 데이빗·페터슨씨가 주장한 「The Brick Wall」을 소개했다. 이것은 명령 레벨로의 병렬성의 벽, 메모리의 벽, 소비 전력의 벽이라고 하는 3개의 벽에 의해서 컴퓨터의 성능은 큰 벽이 생기고 있다는 것이다. 


이것의 예로써는 연 52%로 성장해 온 프로세서의 성능이 2002년경을 경계로 “벽”에 도달하여 이후로는 연 20%의 성장으로 감쇄한 것. 이러한 성능 향상 폭의 감소는 만약 연 52%를 유지하고 있었다고 가정한다면 2016년에는 1,000배 분의 성능이 없어진 것으로 계산이 된다고 한다.  


이러한 부문으로부터 소프트웨어 개발자에게도 대응이 요구되고 있다고 설명했다. 지금까지의 소프트웨어 패키지는 베이스가 되는 부분의 코드는 유지하고, 주로 기능 추가로 다음 버젼의 제품을 투입해 왔다. 기능 추가에 의해서 늦어졌다고는 해도 18개월에 2배의 기세로 성장해 온 프로세서의 성능이 소프트웨어에 의해 상쇄되어 왔던 것이다. 그에 따라 소프트웨어도 코드를 고쳐 쓸 필요성이 생기고 있다. 


현재는 프로세서의 멀티 코어화 라고 하는 새로운 아키텍처가 태어나고 있어 소프트웨어 개발자도 당연히 그것을 의식해야 한다. 황씨는 이러한 흐름에 따라 다수의 패러렐 프로세서를 갖는 퍼포먼스의 성장이 무궁한 GPU 컴퓨팅이 높은 가능성이 있다고 어필했다. 

 

 과학, 산업계에서 시뮬레이션이 필수가 되어, 2008년 이후에 컴퓨팅 자원의 요구가 상승. HPC의 진화로 성능은 상승했지만 채울 수 없는 요구도 큰 폭으로 늘어나고 있다. 시뮬레이션이 강력한 부동 소수점 연산 능력을 요구하는 것을 세포의 시뮬레이션으로 나타낸 것. 현재 세계 최고 성능의 슈퍼컴퓨터는 1 PFLOPS 선.
 SSE의 등장 이후, x86계의 CPU를 채용하는 슈퍼컴퓨터가 시장쉐어를 확대. 퍼포먼스당 코스트를 중시한CPU에 의한 슈퍼컴퓨터가 당연하게 되었다. 멀티 코어 CPU에 비해서 GPU의 성능 향상이 눈부신 점을 어필.

GPU 컴퓨팅의 활용, 사례등을 소개
황씨는 GPU 컴퓨팅의 활용 사례에 대해서도 소개했다. 700만개의 광자를 사용한 레이 트래싱의 데모에서 구세대의 GT200에 비해 차세대 Fermi는 4배의 성능을 낼 수 있다는 점을 어필. 아울러 테셀레이션의 예도 나타내 보였다.

레이 트래싱 데모. 700만개의 광자를 시뮬레이션 한 것 이것은 Fermi에 탑재된 테셀레이터를 사용한 데모로, 디스프레이스먼트맵을 조합해 수면의 물결을 표현하고 있다

Adobe의 Mercury Playback Engine은 Adobe Premiere CS5에 탑재될 예정의 동영상 편집 가속 엔진이지만 CUDA를 이용하여 리얼타임 프리뷰를 실행하면서 동영상 편집을 할 수 있다는 점도 소개됐다.    


또한 GPU 활용에 있어서의 코스트 퍼포먼스도 어필하고 있다. 시스템 상품인 Xeon 환경에 2개의 Tesla를 탑재했을 때 분자 동역학 계산으로 19배, 분자 모델링으로 25배의 성능 향상, 퍼포먼스 당의 코스트는 각각 14배, 19배가 된다고 밝혔다.  


그 외 CUDA의 성장에 대해서도 설명했다. CUDA가 릴리즈 된 것은 2006년이고 그 다음해 Super Computing 07 에서는 CUDA 관련 부스가 NVIDIA 뿐이였던 것이 2009년에는 75개 부스, 90개의 관련 포스터가 열리기도 했다. 또한 300여개의 대학/기업이 CUDA를 교육하고 있다고 한다. 일정수준 이상의 유저가 이미 NVIDIA의 CUDA 대응 GPU를 사용하고 있다는 점부터 CUDA를 이용한 어플리케이션을 당장이라도 이용할 수 있는 유저가 많다는 점도 부각하고 있다.  


또한 NVIDIA는 Visual Studio의 어플리케이션 개발 환경인 「NEXUS」를 릴리즈 하여 개발자들을 지원하고, HPC 시장은 더욱 더 커질 것이라는 예상부터 지금까지와 같이 GPU 컴퓨팅에 관련하여 고액의 투자를 계속해 나갈것이라고 밝혔다.

 

차기 Adobe Premiere에 탑재되는 Mercury Playback Engine은 CUDA를 이용하여 동영상 편집 처리를 가속한다. Tesla를 도입하는 추가 코스트에 비해서 얻을 수 있는 퍼포먼스가 더 높다는 점을 어필. 불황시에도 GPU 컴퓨팅에 대한 연구 개발비의 투자액을 늘린 것을 나타내 보이며 이 분야에 주력한다는 점을 어필했다.

 

 

보도 - http://pc.watch.impress.co.jp 






List of Articles
제목 조회 수
히타치 플래시 미디어 스토리지 - 유니파이드 HUS150 ALL FLASH 3406
후지쯔, 사물인터넷 기기의 고속 암호 통신 인증 기술 개발 (TLS) 2 2948
한계에 도달한 하드디스크의 대안 SSD 5156
프로젝트 올림푸스(Open Compute Project), 데이터 센터 기술 동향 3937
포티넷(Fortinet), FortiOS 6.2에 대거 기능 강화 및 확충 2071
페이스북의 가상현실? 리프트 헤드셋 제조 업체 오큘러스VR 인수 4220
테슬라 GPU, 세계 최고 페타플롭급 슈퍼컴퓨터 탑재 7303
태블릿 시장 및 엔비디아 쿼드코어 테그라3 4935
클라우드 게임 서비스 시대로, 소니가 주목한 MS 게임 플랫폼 2964
쿼드로 3000M을 탑재한 파워풀 노트북, 후지쯔 FMV LIFEBOOK NH90/DN 8697
차원이 다른 올 플래시 스토리지, EMC DSSD D5 출격 3 15119
차원이 다른 x86 서버, HP Integrity Superdome X 발매 4747
차세대 윈도우8의 주요 특징 정리 2 22799
차세대 윈도우10은 7가지 에디션 - 모든 플랫폼을 통합 15727
차세대 반도체(DRAM), DDR4와 LPDDR3 칩이 등장 17152
중국 텐허2가 슈퍼컴퓨터 1위 / 제온파이 라인업 추가 100206
주니퍼 네트웍스의 차세대 클라우드 아키텍처 메타 패브릭(MetaFabric)+QFX5100 스위치 발표 4950
전세계 게이머들의 CPU, GPU, S/W 등 사용 동향 3 12011
자율 주행 자동차와 엔비디아 (DRIVE PX2, DGX-1) 2 24481
인텔의 신형 아이태니엄부터 아톰S 까지 서버 프로세서 로드맵 8198
인텔의 매니코어 아키텍쳐 MIC와 아톰 SoC 메드필드 5922
인텔, 대규모 빅 데이터를 위한 독자적인 Hadoop(하둡) 배포판을 릴리즈 8548
인텔, HPC 타겟 “초 고밀도 집적 회로”의 개발에 착수 5856
인텔 아이비 브릿지와 AMD의 파일 드라이버 [ ISSCC ] 1 8299
인텔 실적 발표, 어닝 서프라이즈 및 최고 주가 경신 4 3219
인텔 실적 발표 - 2014년 브라이언 크르자니크의 경영 성과는? 2 3195
인텔 샌디브릿지 아키텍처 분석 (링버스,AVX,SSE,uOP 캐시,SIMD) 1 52084
인텔 베이트레일 태블릿 종합 - 델 베뉴 8/11 프로,아수스 T100,레노버 믹스2,아이코니아W4등 14461
인텔 네할렘 아키텍처, 로드맵 분석 (SMT,터보부스트) 3 35587
인텔 IDF 2011 (베이징) 주요 내용 요약 (시더트레일/오크트레일/아이태니엄) 2 15589
인텔 / AMD의 x86 CPU 아키텍처 동향(CELL,멀티코어,불도저,나노공정) 1 8535
인공지능(AI) 및 클라우드, 5G를 위한 Xeon Scalable 출시 4226
인간vs기계, 구글 인공지능 알파고와 이세돌의 경기에 집중 4 2843
유튜브의 랩터 인터내셔널 버전이 추가 되었습니다. 4892
윈도우 태블릿의 전망은? 14899
웨스턴디지털의 샌디스크 인수 - 백그라운드는 중국 3 4284
와이브로(WIBRO)의 간략한 소개 3058
오라클, 솔라리스(Solaris)에 Docker 통합 계획 발표 2166
오라클, 5TB의 테이프 드라이브 발표 4514
오라클 올 플래시 스토리지 신제품 Oracle FS1 발표 - 하이브리드 지원 3431
오라클 엑사데이터X5(Exadata) 제공 시작, 올 플래시 구성 대응 3176
엔씨소프트 실적 발표, 매출-영업이익-순익 증가 3 2891
엔비디아, GPU 컴퓨팅의 가능성을 어필 (Accelerated Computing) 1 5738
엔비디아 실적발표 - 글로벌 4차 산업혁명의 중심 기업 3 4657
엔비디아 실적 발표, 인텔과 "패권" 전쟁 돌입 3 8002
엔비디아 실적 발표 - 매출 21% / 순익 48% 증가 (Nvidia earnings) 2 4758
애플의 최신 OS 라이언은 맥OS 의 보급을 가속할 수 있을까 8229
애플실적 발표 - 사상 최대 실적의 어닝 서프라이즈 4 3798
애플 실적발표, "다각화 된 비지니스 포트폴리오의 견고함" 2 3094
애플 실적 발표, 다가올 사상 최대 실적의 서막 3 3795
애플 실적 발표 - 한계에 도달한 모바일 사업 3 86452
애플 실적 발표 - 아이폰 판매량 35% 증가 7935
애플 실적 발표 - 아이폰 및 맥PC 판매 호조, 아이패드 판매 감소 지속 4331
애저 네트워크 컨테이너와 광통신 기술의 오픈 소스화 2159
아마존, 음성 인식 비서 아마존 에코 발표 (Amazon Echo) 12106
아마존 웹 서비스, 보다 대용량 및 고속 SSD 기반 EBS 볼륨 제공 4267
아마존 AWS CloudTrail, Glue, EFS 등 서비스 개선 및 추가 5427
시스코와 Netapp, 플렉스팟 (FlexPod) 아키텍쳐로 양사의 제휴를 확대한다 6383
시스코, 사물 인터넷 시대에 대응하는 포그 컴퓨팅 플랫폼 IOx 발표 6946
시스코, 기업 iOS 디바이스를 보호하는 Security Connector 발표 2393
시스코 테트레이션 애널리틱스, 데이터 센터를 가시화 (Tetration analytics) 3768
스마트폰 랩터 사운드 벨소리 다운로드 17408
소프트웨어 정의 시대, SD-WAN 네트워크 기술 동향 (ISP) 3 121336
소프트웨어 정의 스토리지 - 레노버 Storage DX8200C 3493
세계 웹브라우저 점유율 및 OS 시장 점유율 1 4168
세계 사물인터넷 기업 순위는? 인텔-IBM-MS가 IoT 리더 2 14501
세계 모바일AP 시장 점유율, 퀄컴의 독주와 애플/미디어텍 약진, 엑시노스 추락 (ARM) 13357
서버/PC/모바일, 인텔 CPU-메인보드-SSD 종류 및 스펙 4387
서버 / PC 성능 저하의 원인은 하드디스크 단편화, 그 해결책은? (디스크키퍼) 12497
삼성전자 2분기 실적 발표 - 모바일 사업 급락, 반도체/소비자 가전 선방 2 12347
삼성의 아이피니티 지원 멀티 디스플레이 (AMD 아이피니티) 2 5973
사타3의 후속 규격, 사타 익스프레스의 본격적인 규격 작업 시작 8196
빅데이터 플래시 시스템, 샌디스크 인피니플래시 발표(InfiniFlash) 1 4523
베이트레일, 메리필드를 위한 인텔 실버몬트 아키텍처 분석 1 24827
반도체 아키텍처 분석) x86, HSA, HBM, TSV, 3D V-NAND 3 72131
미션 크리티컬 타겟 델 파워에지 R920 / 1U 파워에지 R220 발표 3162
미래는 해저 데이터 센터? Project Natick 실증 실험 1931
모빌리티로의 추진이 비지니스의 지속성과 생산성을 향상 (인텔 vPro) 5948
만물 인터넷(IoE) 대응, 시스코 인터클라우드 강화(Cisco Live US 2015) 2 13938
마침내 1GB당 1달러에 도달한 SSD의 가격, 더 가까워진 대중화 11819
마이크로소프트의 새로운 시작, 제품별 직종별 대규모 조직 개편 시행 5283
마이크로소프트, 애저 PaaS 기반 서비스 패브릭(Service Fabric) 오픈 소스화 3834
마이크로소프트 인터넷 익스플로러10 사용 캠페인 (IE10) 1 5344
리눅스 파운데이션, 드론(무인항공기) SW를 위한 드론코드 프로젝트(Dronecode Project) 발족 16059
레드햇(Red Hat), CoreOS를 2억 5000만 달러에 인수 3141
랩터 인터내셔널 배경화면 배포 4498
랩터 인터내셔널 RSS 주소 입니다. 1 17675
라우터와 스위치, 글로벌 네트워크 시대의 핵심 (이더넷,프레임릴레이) 1 23852
디도스(DDos) 공격 동향 보고서 - 아카마이 테크놀로지 3 5353
델 테크놀로지스 탄생, 세계 최대 비상장 통합 IT 기업 4 4239
델 소닉월 캡처 제공 시작 (Dell SonicWALL UTM Capture) 2088
델 EMC 인수 - 엔터프라이즈 시장 경쟁력 강화 5 9715
뉴 패러다임 메모리 기반 컴퓨팅 - HPE The Machine 4595
넷북 사용자들을 위한 S/W 4127
네트워크 가상화를 위한 VMware NSX의 최신 동향 4081
네이버vs다음 국내 포털 점유율, 대한민국은 네이버가 지배한다 (네이버 각 데이터센터) 16176
네이버vs다음 국내 포털 점유율 - 확대되는 격차 (네이버,다음 실적) 13696
네이버 라인은 일본 국민 메신저 임을 재확인, 성인 81.6%가 라인 사용 5036
기업 스토리지의 41%는 방치 데이터 - 베리타스 (Veritas) 2 3546
글로벌 서버 시장 점유율 - 메인프레임/유닉스 몰락, x86의 시장 통일 13104
Board Pagination Prev 1 2 Next
/ 2