NVIDIA Volta 기반 Tesla V100의 PCI Ex 버전 연내 투입

by 아키텍트 posted Jun 24, 2017
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

01.jpg



미국 NVIDIA는 19일(미국 시간) PCI Express 카드 버전 GPU 액셀러레이터 "Tesla V100"을 발표했다.


이미 SXM2 버전과 함께 PCIe 버전이 존재하는 것이 발표됐으며 이번 발표에서 사양의 상세 내용이 밝혀졌다.


CUDA 코어과 딥 러닝 연산에 특화된 Tensor 코어의 수는 PCIe/SXM2 버전과 공통이지만 PCIe 버전은 소비 전력이 SXM2 버전의 300W에서 250W로 감소되고 연산 성능도 SXM2에서 약간 떨어졌다. 이는 Pascal 아키텍처를 채용한 "Tesla P100"과 같은 구성이다.


PCIe 버전 Tesla V100의 발매 시기를 NVIDIA는 Hewlett Packard Enterprise 등의 리셀러 파트너부터 올해 안에 제공된다고 밝혔다.


출처 - http://pc.watch.impress.co.jp/docs/news/1066480.html


모델Tesla V100 PCIeTesla V100 SXM2Tesla P100 PCIeTesla P100 SXM2
아키텍처VoltaPascal
프로세스12 nm FFN16 nm FinFET+
트랜지스터 수21.1억15.3억
CUDA 코어 수5,1203,584
Tensor 코어 수640-
베이스 클럭?1,126MHz1,328MHz
부스트 클럭?1,455 MHz1,303MHz1,480 MHz
배정밀도 성능(FP64)7 TFLOPs7.5 TFLOPs4.7 TFLOPs5.3TFLOPs
단정밀도 성능(FP32)14 TFLOPs15 TFLOPs9.3 TFLOPs10.6 TFLOPs
반정밀도 성능(FP16)-18.7 TFLOPs21.2 TFLOPs
Tensor 연산 성능112 TFLOPs120 TFLOPs-
메모리4,096-bit HBM2 16GB3,072-bit HBM2 12GB
4,096-bit HBM2 16GB
4,096-bit HBM2 16GB
메모리 대역900 GB/s549 GB/s (12GB HBM2)
732 GB/s (16GB HBM2)
732 GB/s
접속 인터페이스PCI Express 3.0NVLinkPCI Express 3.0NVLink
폼 팩터PCIe FHFLSXM2PCIe FHFLSXM2
소비 전력250W300W250W300W







Articles

6 7 8 9 10 11 12 13 14 15