PROCESSOR

구글, 클라우드 전용 ASIC을 사용하는 Cloud TPU 베타 제공 시작

by 아키텍트 posted Feb 16, 2018
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

tpu.png

미국 구글은 12일(미국 시간) 동사의 클라우드 서비스 "Google Cloud Platform(GCP)" 위에서 "Cloud TPU"의 베타 제공 시작을 발표했다. 이용 비용은 1시간당 6.5달러.


Cloud TPU는 Google이 설계한 머신러닝용 액셀러레이터 "TPU(Tensor Processing Unit)"를 클라우드 상에서 이용할 수 있는 것으로 TPU는 머신러닝 프레임워크 "TensorFlow"로 프로그래밍 된 머신러닝 워크로드의 고속화와 스케일 업에 최적화 된 전용 엑셀러레이터다. 각 Cloud TPU는 4기의 커스텀 ASIC, 64GB의 HBM을 1개의 보드에 탑재하여 최대 180TFLOPS의 부동 소수점 연산 성능을 발휘한다.


기존에는 며칠~수주일 동안 머신러닝 모델을 훈련한 반면 Cloud TPU에서는 같은 모델의 복수의 바리에이션을 하룻밤 만에 훈련시켜 모델을 운용할 수 있다. 구체적으로는 200달러 이하의 비용으로 "ResNet-50"을 하루 이내에 ImageNet 벤치마크로 훈련할 수 있다.


또 Cloud TPU는 공유 컴퓨팅 클러스터에서 작업의 스케줄을 기다리는 대신 Google Compute Engine VM 경유로 네트워크에 접속된 Cloud TPU에 배타적인 접근을 하기 때문에 시간을 절약할 수 있다. Google은 TPU에서 훈련을 간단히 하기 때문에 화상 분류를 위한 "ResNet-50" 머신 번역과 언어 모델링을 위한 "Transformer", 물체 검출 "RetinaNet" 같은 대표적인 모델 TPU에 실장을 오픈 소스화해 공개하고 있다.


또한 TPU의 각 보드를 초고속 전용 네트워크를 매개로 접속하고 PFLOPS 규모의 머신러닝 슈퍼 컴퓨터로 이용하는 "TPU Pod"도 2018년 후반에 GCP에서 이용 가능하게 될 예정이다. 동사는 TPU Pod를 사용하면 지금까지 하루가 걸린 ResNet-50과 Transformer의 학습을 30분 만에 끝낼 수 있다고 밝혔다.


출처 - https://pc.watch.impress.co.jp/docs/news/1106629.html






Articles

13 14 15 16 17 18 19 20 21 22