4월 26일 (금) 오전 5:44

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2023.11.22. / 등급: 12세 관람가 / 장르: 드라마 / 국가: 대한민국 감독 : 김성수 출연 : 황정민, 정우...
노량: 죽음의 바다 / 개봉 2023.12. / 장르: 액션, 드라마 / 국가: 대한민국 감독 : 김한민 출연 : 김윤석, ...
조회 수 5679

GPU 컴퓨팅 또는 GPGPU는 과학 및 엔지니어링 컴퓨팅의 일반적인 목적에 그래픽 처리 장치(GPU)를 사용하는 것을 말합니다.

GPU 컴퓨팅 모델은 이질적인 공동 프로세싱 컴퓨팅 모델에 CPU와 GPU를 함께 사용하는 것입니다. 어플리케이션의 순차적 부분은 CPU에서 실행하고, 계산 집약적인 부분은 GPU를 통해 보다 빠르게 처리됩니다. 사용자 관점에서는 GPU가 성능을 크게 향상시켜 주기 때문에 더욱 향상된 어플리케이션성능을 경험하게 됩니다.

Heterogeneous Computing



GPU는 지난 수년 간에 걸쳐 빠르게 발전하였으며 현재 수 테라플롭 부동 소수점의 성능을 발휘하는 단계에 이르고 있습니다. NVIDIA는 GPGPU의 혁신을 이끌어 왔으며, 지난 2006~2007년 “CUDA”라는 새로운 대규모 병렬 아키텍처를 도입함으로써 컴퓨팅 업계의 엄청난 발전에 기여하고 있습니다. CUDA 아키텍처는 수백 개의 프로세서 코어로 구성되어 있으며, 이들 코어가 함께 작동함으로써 어플리케이션 데이터 셋을 경이로운 속도로 처리합니다.

지난 수년 동안 GPGPU의 비약적인 발전을 통해 CUDA 병렬 프로그래밍 모델을 이용한 프로그래밍도 훨씬 용이해졌습니다. 이 프로그래밍 모델을 통해 어플리케이션 개발자는 계산 집약적 커널을 GPU에 매핑하도록 어플리케이션을 수정할 수 있습니다. 어플리케이션의 일부는 CPU에서 처리됩니다. 함수를 GPU에 매핑하려면 함수에서 병렬 처리가 가능하도록 함수를 새롭게 작성하고 “C” 키워드를 추가하여 데이터를 GPU로 전달해야 합니다. 개발자는 수천 개의 쓰레드 가운데 수십 개의 쓰레드를 동시에 실행시켜야 합니다. GPU 하드웨어가 이러한 쓰레드를 관리하고 스케줄링을 진행합니다.

Tesla 20 시리즈 GPU는 최신 CUDA 아키텍처인 “페르미(Fermi)”를 기반으로 하고 있습니다. 페르미는 500기가플롭 이상의 IEEE 표준 2배 정도 부동 소수점 하드웨어 지원, L1 및 L2 캐시, ECC 메모리 오류 보호, GPU 전반에 걸쳐 분산된 공유 메모리 형태의 로컬 사용자 관리 데이터 캐시, 집합적 메모리 액세스 등 주요한 기능들을 포함하고 있으며 과학 어플리케이션에 최적화되어 있습니다.

"GPU는 많은 현실 세계의 어플리케이션을 쉽게 실행할 수 있게 하고 있으며, 멀티 코어 시스템보다 훨씬 더 빨라질 정도로 발전해 왔다. 미래의 컴퓨팅 아키텍처는 멀티 코어 CPU와 병렬 코어 GPU가 함께 작동하는 하이브리드 시스템이 될 것이다."

Jack Dongarra 교수
이노베이티브 컴퓨팅 연구실 책임자
The University of Tennessee

GPU 컴퓨팅의 역사
그래픽 칩은 고정된 기능의 그래픽 파이프라인으로부터 시작되었다. 이후, 이러한 그래픽 칩들이 점점 더 프로그래밍할 수 있게 되면서, 엔비디아가 최초의 GPU (Graphics Processing Unit)를 발표하게 되었다. 1999년에서 2000년경에는 전자기학 및 의료 이미징과 같은 분야의 연구원들 그리고 특히 컴퓨터 과학자들이 다용도의 컴퓨팅 애플리케이션을 구동하는 데 GPU를 사용하기 시작했다. 이들은 GPU의 뛰어난 부동소수점 성능이 광범위한 과학 애플리케이션들의 성능을 높인다는 사실을 알게 되었으며, 이것이 GPU를 통한 일반 목적의 컴퓨팅을 일컫는 ‘GPGPU’ (General Purpose computing on GPU)의 시작이 되었다.

문제는 GPGPU에서 GPU를 프로그래밍 하기 위해서는 OpenGL이나 CG와 같은 그래픽 프로그래밍 언어를 사용해야 된다는 점이었다. 개발자들은 과학 애플리케이션을 그래픽 애플리케이션처럼 보이게 하기 위해, 삼각형과 폴리곤을 그리는 맵핑 작업을 해야 했으며, 이는 과학계가 GPU의 뛰어난 성능을 누리는데 상당한 제약이 되었다.

엔비디아는 이러한 성능이 보다 다양한 과학분야에 가져다 줄 수 있는 이점과 그 잠재력을 간파하여, 과학 애플리케이션 및 C, C++ 와 Fortran같은 고급언어의 추가지원을 위해 완전히 프로그래밍화 할 수 있도록 GPU를 변환하는데 투자하기로 결정했다. 이러한 노력 끝에 GPU를 위한 CUDA 아키텍처가 탄생하게 되었다.

CUDA 병렬 아키텍처 및 프로그래밍 모델
CUDA 병렬 하드웨어 아키텍처는 태스크 병렬뿐 아니라 미세하게 그레인화 (grained) 되었거나 개략적으로 그레인화된 데이터를 표현하는 abstraction을 제공하는 CUDA 병렬 프로그래밍 모델을 동반한다. 프로그래머는 C, C++, Fortran과 같은 고급언어 또는 OpenCL™, DirectX-11 Compute와 같은 드라이버 API를 선택하여 병렬표현 할 수 있다.

Programming Model



NVIDIA는 현재 C, C++, Fortran, OpenCL 및 DirectCompute를 이용한 GPU 프로그래밍을 지원합니다. 개발자는 위 그림에 나타나 있는 것처럼 라이브러리 및 미들웨어와 함께 다양한 소프트웨어 개발 도구를 이용할 수 있습니다(참조).

CUDA 병렬 프로그래밍 모델은 프로그래머들이 문제(problem)를 개략적인 하위 문제로 분할할 수 있도록 한다. 이에 따라, 하위문제에서의 미세 그레인 병렬화는 각각의 개별 하위문제가 협동 병렬로 해결될 수 있도록 표현된다.

CUDA GPU 아키텍처와 해당 CUDA 병렬 컴퓨팅 모델은 수천 개의 어플리케이션과 수천 건의 논문을 통해 폭넓게 배포되고 있으며, CUDA Zone 에서 다양한 어플리케이션 및 관련 자료들을 확인할 수 있습니다.

OpenCL™는 애플사의 상표이며 크로노스 그룹이 배포한 OpenCL™을 사용하고 있습니다.
DirectX는 Microsoft의 등록상표입니다.

 

NVIDIA® CUDA™ 병렬 컴퓨팅 아키텍처는 GeForce®, Quadro®, Tesla™ 제품에서 지원합니다. GeForce와 Quadro는 각각 소비자용 그래픽과 전문 시각화를 위해 개발되었으며, Tesla 제품군은 병렬 컴퓨팅의 기반이 되어 다양한 컴퓨팅 기능을 지원합니다.

Tesla의 장점

 

    성능     신뢰성     HPC 솔루션
하드웨어
완벽한 이중 정밀 부동 소수점 성능
보다 빠른 PCIe 통신
대용량 데이터셋 지원
ECC 보호
스트레스 테스트
NVIDIA가 직접 제조하여 신뢰성 보장
통합 OEM 시스템
18-24개월 효용성
3년 보증
소프트웨어
(자세한 내용은 여기를 참조하세요.)
InfiniBand를 포함한NVIDIA GPUDirect™
Windows용 성능 드라이버
전사적 수준에서의 지원
ISV 인증
클러스터 관리
HPC 전문업체를 통한 판매 전/후 지원

성능을 고려한 구성
Tesla 제품은 컴퓨팅 전문가를 위해 성능을 극대화할 수 있는 다양한 기능을 포함하고 있습니다.

  • 완벽한 이중 정밀 부동 소수점 성능
    • Tesla C2050, M2050, S2050 제품에서 515GigaFlops
    • 소비자용 제품보다 훨씬 높은 이중 정밀성
  • 보다 빠른 PCIe 통신
    • 양방향 PCIe 통신을 위해 DMA 엔진 두 개를 장착한 NVIDIA의 유일한 제품군
  • 대용량 데이터셋을 포함해 전문 어플리케이션에서 보다 높은 성능 구현
    • 대용량 온보드 메모리(3GB 및 6GB)
  • NVIDIA GPUDirect™를 통해 InfiniBand와의 통신 속도 향상
    • 특수 Linux 패치, InfiniBand 드라이버, CUDA 드라이버
  • Windows 운영체제에서 보다 높은 성능을 구현하는 CUDA 드라이버
    • TCC 드라이버는 CUDA 커널 오버헤드를 줄이고 Windows 원격 데스크톱과 Windows 서비스 지원

Tesla GFlops-Chart

x86 CPU와 기타 GPU에서 N-body 성능.

탁월한 신뢰성
컴퓨팅 전문가는 데이터 오류 없이 신뢰성 있는 작업을 진행해야만 하기 때문에 미션 크리티컬 어플리케이션에 의존합니다. Tesla 제품은 다른 어떠한 NVIDIA 제품보다도 오랜 시간에 걸쳐 가장 까다로운 조건에서 제로 오차 허용 테스트를 거칩니다. Tesla 전용 기능은 다음과 같습니다.

  • 데이터 신뢰성을 보장하기 위한 ECC 보호
    • GPU 내 메모리 및 외장형 GDDR5 메모리
  • 제로 오차 범위의 스트레스 테스트
    • 수일에 걸쳐 제작 과정에서 스트레스 테스트 수행
  • NVIDIA가 직접 제조하여 품질 보장
    • 추가된 메모리 마진 및 코어 클럭을 통한 신뢰성 보장
  • 엔터프라이즈 레벨 지원
    • 3년 보증을 통해 우선순위에 따른 버그 해결 및 기능 요청 지원을 수행하며, 18~24개월에 이르는 제품 라이프사이클 보장
  • ISV 인증
    • HPC 소프트웨어 벤더는 Tesla 제품에 한하여 소프트웨어 인증

HPC 솔루션을 위한 구성
HPC 고객은 고유한 요구조건을 가지고 있습니다. Tesla 비즈니스 부서만이 이러한 특별한 요구에 부합하는 제품과 솔루션을 제공할 수 있습니다.

  • 통합 OEM 시스템
    • Tesla 제품용으로 특별 제작한 혁신적인 OEM 서버 및 블레이드, 워크스테이션
  • Tesla 제품의 정기적인 공급 및 가용성
    • 18~24개월 가용성 및 라이프사이클
  • 데이터 센터 보증
    • Tesla 제품에 대한 NVIDIA와 OEM 파트너의 3년 보증
  • 클러스터 관리 및 GPU 모니터링 소프트웨어
    • GPU 온도 모니터링, 팬 속도, 전력
    • 클러스터에서 GPU에 독점 액세스
  • HPC 전문업체를 통한 판매 전/후 지원
    • CUDA/OpenCL 튜닝 엔지니어, 솔루션 아키텍트, 전담 영업팀이 제공하는 토털 HPC 솔루션 전문 기술지원

위에서 언급한 이점은 대부분 Quadro 제품군에서도 경험할 수 있습니다.

 

 






  1. 라우터(ROUTER) 명령어 모음

    backspace : 한 문자를 삭제 bandwidth : 시리얼 인터페이스에 대역폭을 세팅 banner : 라우터에 로그인하는 사용자를 위한 배너 생성 clear counters : 인터페...
    Date2015.10.27 CategoryIT KNOWLEDGE
    Read More
  2. 유용한 리눅스 명령어 모음

    adduser : 유저를 만들때 사용하는 명령 cd (change directory) : 디렉토리(윈도우에선 폴더) 변경할때 사용 chmod (change mode) : 파일의 허가상태 변경 chown (change owner) : 파일 소유권 병경 cp...
    Date2015.10.27 CategoryIT KNOWLEDGE
    Read More
  3. 윈도우 텔넷(telnet) 명령어 모음

    ■ ls : 현재 파일을 보여줍니다. 일반적으로 여러 옵션을 줄수 있습니다 ■ ls -al : 파일의 크기부터 파일의 퍼미션, 그리고 히든 파일까지 보여줍니다 ■ ls -at : 파일이 생성된 시간까지 보...
    Date2015.10.27 CategoryIT KNOWLEDGE
    Read More
  4. L4/L7 스위치의 대안, 오픈 소스 로드 밸런서 HAProxy

    Ncloud에서 하드웨어로 구성된 기존의 로드 밸런서(load balancer)를 대체할 수 있는 솔루션을 찾던 중 소프트웨어 로드 밸런서인 HAProxy를 검토하게 됐습니다. HAProxy를 검토하면서 정리한 자료와 사내 ...
    Date2015.09.25 CategoryIT KNOWLEDGE
    Read More
  5. 인 메모리 (In-memory Database)

    인메모리 데이터베이스(In-memory Database)는 데이터 스토리지의 메인 메모리에 설치되어 운영되는 방식의 데이터베이스 관리 시스템이다. 디스크에 설치되는 방식에 비해 처리 속도가 빠르...
    Date2015.08.28 CategoryIT KNOWLEDGE
    Read More
  6. MySQL(Structured Query Language)

    1.MySQL 이란 무엇인가? 표준 데이터베이스 질의 언어인 SQL(Structured Query Language)을 사용하는 개방 소스의 관계형 데이터베이스 관리 시스템(RDBMS). 매우 빠르고, 유...
    Date2015.08.03 CategoryIT KNOWLEDGE
    Read More
  7. NUMA와 SMP(Symmetric Multi Processing)

    하드웨어가 발전하면서 하나의 메인보드에 여러개의 CPU, 버스, 메모리 컨트롤러를 구성할 수 있게 되었습니다. Numa는 간단하게 CPU와 메모리가 한 Set를 이루는 것을 의미합니다. [그림1] Numa 관...
    Date2015.06.15 CategoryIT KNOWLEDGE
    Read More
  8. 프로비저닝과 멀티테넌트 (Provisioning,Multi Tenant)

    프로비저닝(Provisioning)이란? 사전적의미 - 준비, 예비, 설비 make provisioning=준비하다 [IT에서 사용하는 의미] 무엇인가 여럿 중에 최적인 것을 찾기 위해 필요한 지...
    Date2015.05.29 CategoryIT KNOWLEDGE
    Read More
  9. QoS 이론 및 기초

    1. 트래픽 관리의 기초 "인터넷이 왜 이렇게 느려요?" "네트워크 접속이 잘 안되거든요?" 이 말은 네트워크 관리자들이 가장 듣기 싫어하는 말 중의 하나죠. ^^ 하지만 아무리 골치아픈 상...
    Date2015.05.11 CategoryIT KNOWLEDGE
    Read More
  10. NPS / RADIUS 서버

    NPS ( Network Policy Server ) 네트워크 정책 서버는 MS사에서 부른 명칭으로서 일반적으로 정식 명칭은 RADIUS ( Remote Authentication Dial-In User Service ) Server이다. @ RADIUS Server 구성 ...
    Date2015.04.18 CategoryIT KNOWLEDGE
    Read More
  11. DNS 정의와 계층 구조

    DNS 개관, 역사, 표준 초기 DNS의 개발과 계층 도메인으로의 이동1981년 9월 발표된 RFC 799, "Internet name domains"이 처음으로 이 개념을 도입실제로 도메인 자체보다는 도메인 간의 이메일 전송 ...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  12. MBR & GPT 구조적 차별성

    MBR(Master Boot Record)와 GPT(GUID Partition Table)의 구조적 차이 - 윈도우에서 사용할 수 있는 디스크 종류는 크게 2가지가 있다. : 전통적인 BIOS 방식의 시스템에서 사용되는 디스크 형식인 MBR 디...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  13. 서브넷 마스크 정의 및 나누기

    비트 서브넷 갯수 호스트 갯수 서브넷 주소 서브넷 표기/25 2 128 0,128 128/26 4 64 0,64,128,192 192/27 8 32 0,32,64,96,128,160,192,224 224/28 16 16 0,16,32,48,64,80,96,11...
    Date2015.04.09
    Read More
  14. OFDM (Orthogonal Frequency Division Multiplexing)

    OFDM (Orthogonal Frequency Division Multiplexing) => OFDM이란 주파수 분할 다중화 방식(FDM)보다 진보된 기술로 직교성을 갖고 있다. OFDM을 설명하기 앞서서 Single Carrier와 Multi Car...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  15. 4G 이야기 - IEEE 802 무선 기술의 흐름

    광대역 통합망인 BcN은 무선 가입자망, 유선 가입자망, 방송 가입자망으로 크게 나눕니다. 무선 가입자망은 WiBro, WCDMA, HSDSPA, CDMA, 4G 등이 있을 것입니다. 향후 BcN에서는 유무선 통합망, 유무선 통...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  16. 무선 인터넷 망의 종류와 특성 (HSPDA,EV-DO,LTE-A 등)

    국내 무선 망의 현황 현재 한국은 CDMA-2000 의 무선 기술로 3G (3세대)에 이어 4G LTE가 보급되었다. ITU-T 4세대 표준은 Wi-Bro를 개선한 Wibro Advanced 와 LTE를 개선한 LTE-A 을 말한다. ...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  17. WINS(Windows Internet Name Service) 정의 / 서버 설치

    마이크로소프트의 네트워크 환경에서 여러 가지 서비스를 하는 서버들이 있지만, 역시 빼 놓을 수 없는 서비스가 하나 있다. Windows NT4.0 에 비하면 Windows 2000 환경에서는 그 역할이 많이 줄어들었지...
    Date2015.04.09
    Read More
  18. 스토리지 레이드 구성 정의 (RAID0,1,2,3,4,5,6,10)

    정의 Redundant Array of Inexpensive/Independent Disk 저장장치 여러 개를 묶어 고용량·고성능 저장 장치 한 개와 같은 효과를 얻기 위해 개발된 기법이다. 초기에는 업그레이드 후 '폐기하기엔 아깝...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  19. Iaas, Paas, SaaS, HaaS, BaaS 개념

    클라우드 서비스에 사용되는 as a Service 개념에 대해서 알아 본다. [그림 : https://www.simple-talk.com/cloud/development/a-comprehensive-introduction-to-cloud-computing/] [IaaS ...
    Date2015.04.09
    Read More
  20. EIGRP(Enhanced Interior Gateway Routing Protocol) 이론 정리

    EIGRP(Enhanced Interior Gateway Routing Protocol)은 시스코에서 개발한 Distance Vector 라우팅 프로토콜이다. 단, Distance Vector 라우팅 프로토콜과 Link State 라우팅 프로토콜의 장점만을 채택했다...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  21. TCP/UDP 이더넷 패킷 구조

    - 크기 : 바이트 (실제값 설명) * Ethernet header : 14 - 목적지 MAC 주소 : 6 - 출발지 MAC 주소 : 6 - 타입 : 2 (0x0800=이더넷) - 데이터 : 46~1500 (IP Header + TCP 헤더 + TCP ...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  22. SSD 구조 및 원리, 기술 설명

    타이틀 세부설명 Alignment (정렬) Alignment는 저장 장치의 파티션 정렬을 의미합니다. 이것은 최적의 성능을 만들기 위하여 파티션의 시작점을 결정하는 것...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  23. 리눅스(linux)vs유닉스(unix) 역사 및 차이 비교

    History of Unix 1960년대 GE(General Electrics) 는 MIT, AT&T Bell Labs 과 컴퓨터 개발을 시작하였다. 그들이 만든 GE645로 알려진 컴퓨터와 OS 인 Multics 는 멀티 태스크 기능에서 뛰어난 성능을 ...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  24. DAS, NAS, SAN 스토리지

    Chris Evans 09.28.2009 www.nextreme.co.kr 데이터센터 통합과 비용절감은 엔터프라이즈 데이터 스토리지 환경에서 가상서버 기술의 지속적인 도입을 가져왔다. 주요 벤더 Microsoft, VMWARE, Xe...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  25. iSCSI란 무엇이며 어떤 이점이 있습니까?

    iSCSI(Internet Small Computer System Interface)는 인터넷 프로토콜(IP) 기반의 스토리지 네트워킹 표준이며 데이터 스토리지 장치의 연결에 사용됩니다. SCSI 명령을 IP 네트워크를 이용해 전달함으로써...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  26. PCI 익스프레스 1.0/2.0/3.0/4.0

    PCI 익스프레스(PCI Express)는 2002년 PCI SIG가 책정한 입출력을 위한 직렬 구조의 인터페이스이며 인텔 주도하에 만들어졌다. 공식적인 약어로 PCIe로 표기한다. 옛 PCI, PCI-X와 AGP 버스를 대체하기 ...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
  27. DB(데이터베이스) / SQL

      [ DB ] 여러 사람에 의해 공유되어 사용될 목적으로 통합하여 관리되는 데이터의 집합을 말한다. 자료항목의 중복을 없애고 자료를 구조화하여 저장함으로써 자료 검색과 갱신의 효율을 높...
    Date2015.04.09
    Read More
  28. TCP 통신 방식 3way handshake (SYN, SYN/ACK, ACK)

    Client와 Server 또는 P2P Socket 통신 등, 네트워크를 사용한 통신시 TCP 통신을 많이 사용한다. TCP 통신을 위한 네트워크 연결은 3 way handshake 라는 방식으로 연결된다. 쉽게 이야...
    Date2015.04.09 CategoryIT KNOWLEDGE
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 Next
/ 7