4월 20일 (토) 오후 9:25

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2023.11.22. / 등급: 12세 관람가 / 장르: 드라마 / 국가: 대한민국 감독 : 김성수 출연 : 황정민, 정우...
노량: 죽음의 바다 / 개봉 2023.12. / 장르: 액션, 드라마 / 국가: 대한민국 감독 : 김한민 출연 : 김윤석, ...
조회 수 7546






NVIDIA CEO 젠슨·황

 


   일시 : 9월 30일 - 10월 2일(현지시간) 


   회장 : The Fairmont San Jose


 

   < 젠슨·황씨 기조 강연편 > 

 

  - NVIDIA의 차기 GPU 「Fermi」가 마침내 공개

 


엔비디아가 9월 30일부터 10월 2일(현지시간) 기간동안 주최하는 GPU 개발자 회의 「GPU Technology Conference (GTC)」를 미국 캘리포니아주 The Fairmont San Jose에서 개막했다. 2008년의 이 시기에는 컨슈머(consumer)를 메인 타겟으로 한 「NVISION08」가 개최되었으나, 이번에는 타겟 대상을 개발자로 완전히 좁히고 있다. 그 때문에 첫날 오전에 진행된 세션은 DirectX 11의 구체적인 코딩 방법등 꽤 전문적인 내용을 다루고 있었다.


 


그러나 오후에 행해진 엔비디아의 CEO 젠슨·황씨의 기조 강연 후반에는 엔비디아의 차기 GPU 「Fermi」(페르미, 코드네임)이 처음으로 공개되는등  화제가 더 풍부해 졌다. 따라서 기조 강연의 모습을 차례대로 소개한다. 덧붙여 초반의 프리젠테이션 자료나 무대 데모는 모두 특수 안경을 이용하고 스테레오 3D로 스크린에 투영 되었기 때문에 첨부하는 사진의 우측과 좌측의 그림이 겹치고 있어 보기에 좋지 않은 점을 이해해 주셨으면 싶다.


 










NVIDIA GPU의 진화의 역사


황씨는 우선 이번 GTC가 업계에서도 첫 GPU 프로그래머를 위한 개발자 회의인 것을 설명하며, 엔비디아의 GPU 역사를 되돌아 보았다. Riva 128 로 시작하는 초기의 GPU 에서는 표시 가능한 다각형수를 늘리는 것으로 진화를 반복해 왔다. 그리고 그 와중에 GPU는 황씨가 「세컨드 국면」이라고 부르는 상태로 이행 한다. 이것이, 쉐이더의 프로그래머블화.
 
여기서 엔비디아는 그래픽 언어 「Cg (C for Graphics)」를 공개, 이것에 의해  컴퓨터 그래픽으로 표현할 수 있는 것이 늘어났고, GPU를 범용 목적 연산에 사용하는 GPGPU가 시작되어 이러한 상황에 맞물려 2006년, NVIDIA는 CUDA를 개발, 공개했다. 황씨는 이러한 흐름으로 현재는 93년도 세계 최고급의 슈퍼컴퓨터 성능이  개인 컨슈머(consumer) PC의 케이스안에 들어가기까지 도달했다고 GPU의 현재까지 진화상을 표현했다.


 


계속해서  황씨는 현재의 GPU들의 3가지 용도에 대하여 이야기를 바꾸었다. 그 하나가 비주얼 컴퓨팅이다. 황씨는, 비주얼 컴퓨팅이란 컴퓨터 그래픽을 사용한 사이언스 아트라고 설명했다. 여기서 황씨는 비주얼 컴퓨팅의 진화의 예로서 10년전의 GPU에 의한 소방차 렌더링을 선보였다. 물론 당시로서는 최고 성능의 것으로 큐브 환경 매핑이라고 하는 최신 기술도 구사하고 있었지만 지금으로 보면 꽤 열등한 것이다.

 

이것이 수년후 2003년에는 「타임 머신」이라고 불리는 데모로 진화했다. 이것은 차의 몸체가 반짝이는 새것부터 서서히 낡고, 녹슬어가는 데모다. 이 표면의 변화는 1개의 프로그램으로 실현되고 있다. 그리고 한층 더 수년이 지난 현재는 어떻게 되었는가 하면, 엔비디아는 사실적인 레이 트래싱을 GPU로 실현하는 「OptiX 엔진」을 릴리스 하기에 이르렀다. 레이 트래싱은 모든 광선의 진행이나 반사를 계산하기 때문에, 방대한 처리 능력을 필요로 하여 CPU에서는 1 프레임 렌더링 하는데 몇분 이상 필요로 한다. GPU에서도 그 처리는 아직 무겁지만 OptiX에서는 실용적인 레벨의 성능을 실현하고 있다.

 












10년전 GPU로 이용된 데모 그리고 수년후에는 프로그래머블로 표현력이 증가 현재 레이 트래싱까지 도달









「FinePix REAL 3D W1」를 소개하는 젠슨황

 


비주얼 컴퓨팅의 새로운 영역으로서 NVIDIA가 최근 임하고 있는 것이 스테레오 글래스 솔루션, 「3D Vision」이다. 120Hz 대응의 액정과 셔터식의 전용 안경을 사용하는 것으로,  입체시야를 실현한다. 황씨는 NVIDIA의 게임 업계에서의 긴 역사와 경험에 의해 드라이버의 확장만으로, 기존의 게임에서도 입체시야를 가능하게 한 것을 어필했다.


 


또, 입체시야는 영화 업계나 TV업계에서도 향후 표준 기술로서 채용이 전망되고 있는 것 외에 후지 필림의 3D 대응 디지탈카메라 「FinePix REAL 3D W1」에 의해, 3D Vision 과의 조합으로, 사진도 입체시야가 가능하게 된 것을 재차 표명해 보였다.


 


그리고 황씨는「그래픽은 향후로도 리얼하게 되어 간다」라고 계속해서 설명했다. 그것은, 물리 연산을 GPU로 처리시키는 것이 가능하게 되었기 때문이다. 그래픽 디자이너는 대상이 되는 오브젝트가 적은 동안 수작업으로 상호 간섭이 있는 애니메이션을 표현할 수 있지만 오브젝트가 증가하면 제어가 곤란해 지게된다. 여기서, 물리 연산을 GPU에 계산시키는 것으로 자동화시켜 보다 리얼하고 아름다운 그래픽 표현을 실현하자고 하는 것이 황씨가 의도하는 것중 하나이다.


 


여기서 황씨는 몇개의 세계 최초로 시연이 되는 물리 연산을 이용한 데모를 공개했다. 모두 종래의 PC에 의한 리얼타임 3D로서는 구별을 분명히 하는 것으로, 특히 유체의 데모는 확실히 컴퓨터 그래픽의 새로운 차원을 엿보게 하는 것이다.


 

















GPU에 의한 유체 물리 연산 데모


GPU에 의한 유체 물리 연산 데모2


GPU에 의한 충돌 물리 연산 데모


 

계속해서 황씨는, GPU의 제2의 용도로서 병렬 컴퓨팅을 채택했다. 이것은 현재 엔비디아가 가장 주력 하고 있는 분야로서, 황씨에 의하면 CUDA를 개발할 즈음에 행한 최대의 결단이 향후 모든 GPU를 CUDA에 대응시키는 것이었다고 한다. 그 결과적으로, 현재는 1억 8 천만개의 CUDA 대응 GPU가 출시되어 9만명의 개발자가 CUDA를 사용해 200개의 대학에서 관련 강좌가 열리고 있다고 한다.


 









CUDA의 기본사상은 CPU와 GPU의 코프로세싱


CUDA의 기본사상은 CPU에 의한 중앙 집중적 처리로부터 CPU+GPU에 의한 공동 처리의 이행에 있다. 프로그램의 병렬화를 진행시켜도 반드시 시리얼의 부분은 남는다. 그 때문에 병렬 프로세서(GPU)만의 구성에서는 시리얼 프로세서(CPU)보다 상황에 따라서는 성능이 떨어진다. 황씨에 의하면 이상적인 것은 1개 정도의 쿼드 코어 CPU 와 4개 정도의 GPU의 편성이라고 한다. 이것에 의해, 모든 코드의 처리가 고속화되어 병렬화가 진행된 프로그램에서는 수십 수백배까지 빨라진다.


 


이러한 극적인 고속화는, 단순히 빠르고 느림을 넘은 이전까지는 불가능했던 실현을 가져온다. 지금까지 이러한 병렬화의 혜택이 큰 영역으로서는 지질 조사나 금융 분석, 유체 역학등을 들수 있었지만, 황씨는 이번 병렬 컴퓨팅에 의해서 인명을 구할 수 있다는 사례를 표명했다.


 


그 예로 화상 진단에 의한 유방암 검진으로 TechniScan의 검사기에서는 4 CPU 구성을 2GPU 구성으로 바꾸는 것으로, 이전까지 1시간 이상 걸렸던 처리가 30분 이하로 단축되었다고 한다. 현재 암은 조기 발견되면 치료가 가능해지고 있어 GPU가 완수하는 역할이 더욱 더 커지고 있는 것을 나타냈다. 그러나 NVIDIA는 GPU의 성능, 그리고 적용 영역을 한층 더 넓히고 싶다고 한다. 그것을 위한 포석이 차기 GPU 아키텍쳐 「Fermi」이다.


 


Fermi는 GPGPU를 위해서 풀 스크래치로 개발되었다고 하는 점이 지금까지의 GPU와는 크게 다르다. 이미 실제로 동작하는 칩도 있지만, 그 데모 내용도 그래픽이나 게임에 관한 것이 아니고 현행의 Tesla C1060에 비해 배정도 부동 소수점 연산 성능이 8배가 된 것을 나타내 보이는 GPGPU에 관한 것이었다. 황씨가 공개한 자료에 의하면 Fermi의 트랜지스터 카운트는 30억. SP수는 512개로 GPGPU에 불가결한 ECC도 서포트했다. 또한, VisualStudio 개발 환경 「Nexus」를 제공한다는 것도 발표했다.


 


 상세한 부분에 대해서는 고토씨의 칼럼 및 GTC의 해당 리포트를 참조해 주었으면 한다.


 









현행의 Tesla C1060(왼쪽)과 Fermi(오른쪽)의 배정도 부동 소수점 연산 성능의 비교










Fermi를 공개하는 젠슨황


Fermi의 다이 사진과 특징



마지막으로 GPU의 적용 영역의 3번째로서 황씨는 Web 컴퓨팅을 들었다. 여기서 말하는 Web 컴퓨팅의 정의는 약간 애매하지만, 첫번째의 사례로서 소개된 것이 GPU에 의한 Flash의 고속화. 현재 Web상의 비디오 컨텐츠의 8할은 Flash를 사용하고 있지만, 향후 이것이 GPU에 의한 가속화의 효과가 있게 되어, HD컨텐츠도 부드럽게 재생할 수 있게 된다.

 









일반적인 넷북(왼쪽)과 ION 탑재 넷북(오른쪽)에 의한 Flash HD동영상 재생 데모


 


앞서 설명한 대로, 레이 트래싱에는 방대한 처리 능력이 필요하지만, 그 계산을 GPU에서 행하게 하여 그 출력을 스트리밍으로으로 유저의 단말기에 송신하는 것으로, 넷북과 같은 PC 에서도 리얼타임과는 같지 않아도 실용적인 속도로 레이 트래싱을 행할 수 있다고 하는 것.


 


이와 같이 현재의 GPU는, 그 용도를 그래픽 처리 중심으로부터 범용 연산을 위한 프로세서로의 열쇠를 나타내고 있다. 황씨는, 현재는 「연산 GPU의 시대」이며, 높아지는 GPU의 처리 능력이 새로운 어플리케이션을 낳고, 컴퓨팅 업계를 초월하며 퍼져 간다라는 전망을 표명하고 강연을 매듭지었다.


 











iRay 실시간 레이 트래이싱


현재는 연산 GPU의 시대


 


보도 : http://pc.watch.impress.co.jp/ 


해석 : RAPTER

  • profile
    프로그래머 2009.10.03 17:03
    <P>페르미의 실성능공개가 없어서 아쉽긴 하지만 엔비디아도 나름대로 노력하고 있군요.</P>
  • profile
    PC전문가 2009.10.03 20:23
    연산 gpu의 시대,,멋지기는 한데 엔비디아가 리드해 나갈수 있을지 약간 걱정....
  • ?
    김지환 2009.10.04 14:23
    <P>이..이거 페이크 카드입니다. </P>
    <P> </P>
    <P>얼마전에 공개했던 페르미 시제품은 기존 기판에다가 톱질한 후에 쿨러를 대충 얹어서 <BR><BR>만든 페이크 카드였으며 아직 제대로된 시제품은 있지도 않다는 내용입니다. 이미 공개<BR><BR>된 카드에 톱질한 흔적이나 전원부 연결이 제대로 안되있다는 증거가 속속 나오고 있네요.<BR><BR>아직 완성도 안된 제품을 가지고 있다는 듯이 프레젠 테이션 한것에 대해서는 상당한<BR><BR>비난을 받을거 같습니다. </P>
  • profile
    드림시어터 2009.10.04 16:18
    엔비디아의 최근 배트맨사건도 그렇고 왜이렇게 좋지않을 길로 가는걸까요,, 엔비디아 이번에는 좀 위험해 보입니다...






List of Articles
제목 조회 수
히타치 플래시 미디어 스토리지 - 유니파이드 HUS150 ALL FLASH 3410
후지쯔, 사물인터넷 기기의 고속 암호 통신 인증 기술 개발 (TLS) 2 2960
한계에 도달한 하드디스크의 대안 SSD 5161
프로젝트 올림푸스(Open Compute Project), 데이터 센터 기술 동향 3946
포티넷(Fortinet), FortiOS 6.2에 대거 기능 강화 및 확충 2086
페이스북의 가상현실? 리프트 헤드셋 제조 업체 오큘러스VR 인수 4228
테슬라 GPU, 세계 최고 페타플롭급 슈퍼컴퓨터 탑재 7308
태블릿 시장 및 엔비디아 쿼드코어 테그라3 4939
클라우드 게임 서비스 시대로, 소니가 주목한 MS 게임 플랫폼 2979
쿼드로 3000M을 탑재한 파워풀 노트북, 후지쯔 FMV LIFEBOOK NH90/DN 8702
차원이 다른 올 플래시 스토리지, EMC DSSD D5 출격 3 15130
차원이 다른 x86 서버, HP Integrity Superdome X 발매 4757
차세대 윈도우8의 주요 특징 정리 2 22807
차세대 윈도우10은 7가지 에디션 - 모든 플랫폼을 통합 15734
차세대 반도체(DRAM), DDR4와 LPDDR3 칩이 등장 17156
중국 텐허2가 슈퍼컴퓨터 1위 / 제온파이 라인업 추가 100384
주니퍼 네트웍스의 차세대 클라우드 아키텍처 메타 패브릭(MetaFabric)+QFX5100 스위치 발표 4956
전세계 게이머들의 CPU, GPU, S/W 등 사용 동향 3 12019
자율 주행 자동차와 엔비디아 (DRIVE PX2, DGX-1) 2 24490
인텔의 신형 아이태니엄부터 아톰S 까지 서버 프로세서 로드맵 8203
인텔의 매니코어 아키텍쳐 MIC와 아톰 SoC 메드필드 5927
인텔, 대규모 빅 데이터를 위한 독자적인 Hadoop(하둡) 배포판을 릴리즈 8554
인텔, HPC 타겟 “초 고밀도 집적 회로”의 개발에 착수 5862
인텔 아이비 브릿지와 AMD의 파일 드라이버 [ ISSCC ] 1 8303
인텔 실적 발표, 어닝 서프라이즈 및 최고 주가 경신 4 3228
인텔 실적 발표 - 2014년 브라이언 크르자니크의 경영 성과는? 2 3202
인텔 샌디브릿지 아키텍처 분석 (링버스,AVX,SSE,uOP 캐시,SIMD) 1 52090
인텔 베이트레일 태블릿 종합 - 델 베뉴 8/11 프로,아수스 T100,레노버 믹스2,아이코니아W4등 14466
인텔 네할렘 아키텍처, 로드맵 분석 (SMT,터보부스트) 3 35594
인텔 IDF 2011 (베이징) 주요 내용 요약 (시더트레일/오크트레일/아이태니엄) 2 15594
인텔 / AMD의 x86 CPU 아키텍처 동향(CELL,멀티코어,불도저,나노공정) 1 8541
인공지능(AI) 및 클라우드, 5G를 위한 Xeon Scalable 출시 4234
인간vs기계, 구글 인공지능 알파고와 이세돌의 경기에 집중 4 2852
유튜브의 랩터 인터내셔널 버전이 추가 되었습니다. 4901
윈도우 태블릿의 전망은? 14906
웨스턴디지털의 샌디스크 인수 - 백그라운드는 중국 3 4291
와이브로(WIBRO)의 간략한 소개 3062
오라클, 솔라리스(Solaris)에 Docker 통합 계획 발표 2173
오라클, 5TB의 테이프 드라이브 발표 4519
오라클 올 플래시 스토리지 신제품 Oracle FS1 발표 - 하이브리드 지원 3439
오라클 엑사데이터X5(Exadata) 제공 시작, 올 플래시 구성 대응 3183
엔씨소프트 실적 발표, 매출-영업이익-순익 증가 3 2901
엔비디아, GPU 컴퓨팅의 가능성을 어필 (Accelerated Computing) 1 5745
엔비디아 실적발표 - 글로벌 4차 산업혁명의 중심 기업 3 4667
엔비디아 실적 발표, 인텔과 "패권" 전쟁 돌입 3 8013
엔비디아 실적 발표 - 매출 21% / 순익 48% 증가 (Nvidia earnings) 2 4776
애플의 최신 OS 라이언은 맥OS 의 보급을 가속할 수 있을까 8234
애플실적 발표 - 사상 최대 실적의 어닝 서프라이즈 4 3808
애플 실적발표, "다각화 된 비지니스 포트폴리오의 견고함" 2 3107
애플 실적 발표, 다가올 사상 최대 실적의 서막 3 3805
애플 실적 발표 - 한계에 도달한 모바일 사업 3 86636
애플 실적 발표 - 아이폰 판매량 35% 증가 7942
애플 실적 발표 - 아이폰 및 맥PC 판매 호조, 아이패드 판매 감소 지속 4338
애저 네트워크 컨테이너와 광통신 기술의 오픈 소스화 2169
아마존, 음성 인식 비서 아마존 에코 발표 (Amazon Echo) 12114
아마존 웹 서비스, 보다 대용량 및 고속 SSD 기반 EBS 볼륨 제공 4275
아마존 AWS CloudTrail, Glue, EFS 등 서비스 개선 및 추가 5455
시스코와 Netapp, 플렉스팟 (FlexPod) 아키텍쳐로 양사의 제휴를 확대한다 6390
시스코, 사물 인터넷 시대에 대응하는 포그 컴퓨팅 플랫폼 IOx 발표 6955
시스코, 기업 iOS 디바이스를 보호하는 Security Connector 발표 2401
시스코 테트레이션 애널리틱스, 데이터 센터를 가시화 (Tetration analytics) 3776
스마트폰 랩터 사운드 벨소리 다운로드 17417
소프트웨어 정의 시대, SD-WAN 네트워크 기술 동향 (ISP) 3 121606
소프트웨어 정의 스토리지 - 레노버 Storage DX8200C 3502
세계 웹브라우저 점유율 및 OS 시장 점유율 1 4177
세계 사물인터넷 기업 순위는? 인텔-IBM-MS가 IoT 리더 2 14511
세계 모바일AP 시장 점유율, 퀄컴의 독주와 애플/미디어텍 약진, 엑시노스 추락 (ARM) 13363
서버/PC/모바일, 인텔 CPU-메인보드-SSD 종류 및 스펙 4396
서버 / PC 성능 저하의 원인은 하드디스크 단편화, 그 해결책은? (디스크키퍼) 12502
삼성전자 2분기 실적 발표 - 모바일 사업 급락, 반도체/소비자 가전 선방 2 12357
삼성의 아이피니티 지원 멀티 디스플레이 (AMD 아이피니티) 2 5979
사타3의 후속 규격, 사타 익스프레스의 본격적인 규격 작업 시작 8202
빅데이터 플래시 시스템, 샌디스크 인피니플래시 발표(InfiniFlash) 1 4532
베이트레일, 메리필드를 위한 인텔 실버몬트 아키텍처 분석 1 24832
반도체 아키텍처 분석) x86, HSA, HBM, TSV, 3D V-NAND 3 72147
미션 크리티컬 타겟 델 파워에지 R920 / 1U 파워에지 R220 발표 3168
미래는 해저 데이터 센터? Project Natick 실증 실험 1937
모빌리티로의 추진이 비지니스의 지속성과 생산성을 향상 (인텔 vPro) 5954
만물 인터넷(IoE) 대응, 시스코 인터클라우드 강화(Cisco Live US 2015) 2 13949
마침내 1GB당 1달러에 도달한 SSD의 가격, 더 가까워진 대중화 11826
마이크로소프트의 새로운 시작, 제품별 직종별 대규모 조직 개편 시행 5288
마이크로소프트, 애저 PaaS 기반 서비스 패브릭(Service Fabric) 오픈 소스화 3844
마이크로소프트 인터넷 익스플로러10 사용 캠페인 (IE10) 1 5349
리눅스 파운데이션, 드론(무인항공기) SW를 위한 드론코드 프로젝트(Dronecode Project) 발족 16071
레드햇(Red Hat), CoreOS를 2억 5000만 달러에 인수 3151
랩터 인터내셔널 배경화면 배포 4504
랩터 인터내셔널 RSS 주소 입니다. 1 17681
라우터와 스위치, 글로벌 네트워크 시대의 핵심 (이더넷,프레임릴레이) 1 23857
디도스(DDos) 공격 동향 보고서 - 아카마이 테크놀로지 3 5365
델 테크놀로지스 탄생, 세계 최대 비상장 통합 IT 기업 4 4251
델 소닉월 캡처 제공 시작 (Dell SonicWALL UTM Capture) 2097
델 EMC 인수 - 엔터프라이즈 시장 경쟁력 강화 5 9725
뉴 패러다임 메모리 기반 컴퓨팅 - HPE The Machine 4606
넷북 사용자들을 위한 S/W 4135
네트워크 가상화를 위한 VMware NSX의 최신 동향 4088
네이버vs다음 국내 포털 점유율, 대한민국은 네이버가 지배한다 (네이버 각 데이터센터) 16183
네이버vs다음 국내 포털 점유율 - 확대되는 격차 (네이버,다음 실적) 13721
네이버 라인은 일본 국민 메신저 임을 재확인, 성인 81.6%가 라인 사용 5051
기업 스토리지의 41%는 방치 데이터 - 베리타스 (Veritas) 2 3556
글로벌 서버 시장 점유율 - 메인프레임/유닉스 몰락, x86의 시장 통일 13109
Board Pagination Prev 1 2 Next
/ 2