4월 29일 (월) 오후 7:41

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2024.06.05. / 장르 드람 / 국가 대한민국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
개봉 2024.05.22. / 장르 액션 / 국가 미국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...

 newsroom-vision-habana-card.jpg.rendition.intel.web.1920.1080.jpg

하바나 가우디2 메자닌 카드


하바나 가우디2 메자닌 카드 이미지 2022년 5월 10일, AI 딥러닝 프로세서 기술에 중점을 둔 인텔의 데이터 센터 팀인 하바나 랩스는 학습 및 추론을 위한 2세대 딥 러닝 프로세서인 하바나 가우디2와 하바나 그레코를 출시했습니다. (크레딧: 인텔)

 

인텔은 오늘 자사 2세대 하바나® 가우디®2 딥 러닝 프로세서와 엔비디아 A100의 AI 총 학습 시간 (Time-to-Train, 이하 TTT) 성능을 MLPerf 산업 벤치마크 상에서 측정한 결과, 하바나® 가우디®2 딥 러닝 프로세서의 성능이 월등했다고 밝혔다. 인텔은 지난 5월 인텔 비전에서 발표한 가우디 2 프로세서가 비전 (ResNet-50) 및 언어(BERT) 부문에서 뛰어난 TTT를 기록했다고 밝혔다.

 

“가우디2가 출시 한 달 만에 MLPerf 벤치마크에서 뛰어난 성능을 기록해 매우 기쁘며, 동시에 이러한 결과를 가져올 수 있도록 노력한 팀원에 자부심을 느낀다”며 “인텔은 비전 및 언어 모델 모두에서 동급 최고의 성능을 제공해, 고객에 가치를 제공하고 AI 딥러닝 솔루션 개발을 가속화하도록 지원할 것”이라고 말했다.

 

산드라 리베라(Sandra Rivera), 인텔 수석부사장 겸 데이터센터 및 AI 그룹 총괄은
인텔 데이터 센터 팀은 하바나 랩스(Habana Labs)의 가우디 플랫폼을 활용해 딥 러닝 프로세서 기술에 중점을 두었으며, 데이터 과학자 및 머신러닝 엔지니어가 학습을 가속화할 수 있도록 지원했다. 아울러, 단 몇 줄의 코드로 새로운 모델을 구축하거나 기존 모델을 이전해 생산성을 높이고 운영 비용을 절감할 수 있도록 구현했다.

 

하바나 가우디2는 1세대 가우디 제품 대비 TTT 부문에 있어 획기적인 발전을 이루었다. 하바나 랩스는 지난 2022년 5월 진행한 MLPerf 벤치마크를 통해 가우디2가 8개의 가속기를 사용하는 비전 및 언어 모델에서 엔비디아 A100-80G 대비 월등한 성능을 기록했다고 밝혔다. ResNet-50 모델의 경우, 가우디2는 엔비디아 A100-80G 제품 대비 학습 시간이 36% 단축됐다. 델(Dell)이 진행한 8개의 가속기 서버에서 진행한 ResNet-50 모델 및 BERT 모델 학습 테스트 결과 가우디2가 엔비디아 A100-40GB 대비 학습 시간을 45% 단축했다.

가우디2 RES BERT 그래프
 
가우디 BERT 시간

가우디2 RES BERT 그래프
가우디 BERT 시간
MLCommons에서 발표한 지표, 2022년 6월, https://mlcommons.org/en/training-normal-20/

 

가우디2는 1세대 가우디 대비, ResNet-50 및 BERT 모델에서 각각 3배와 4.7배 높은 학습 처리량을 기록했다. 인텔은 해당 프로세서를 기존 16나노 공정에서 7나노 공정으로 전환해 텐서 프로세서 코어 수를 3배 증가했고, GEMM 엔진 컴퓨팅 용량 증설, 패키지 내 고대역폭 메모리 용량 3배 확대, 대역폭 및 SRAM 크기 2배 확장을 통해 이번 성과를 달성했다. 비전 모델의 경우 가우디2는 독립적으로 작동해 AI 학습에 필요한 데이터 증강을 포함, 압축 영상화를 위한 전반적인 전처리 파이프를 처리할 수 있는 통합 미디어 엔진 형태의 기능을 갖췄다.

 

가우디1 및 가우디2 프로세서는 특별한 소프트웨어 조작 없이도 고객에게 최고의 성능을 제공한다.

 

하바나 랩스는 8개의 GPU 서버 및 HLS-가우디2 레퍼런스 서버 상에서 가우디1 및 가우디2와 기존 상용 소프트웨어 간 성능을 비교했다. 학습 처리량은 NGC 및 하바나 공용 저장소의 텐서플로우 도커를 사용해 측정했으며, 제조사에서 권장하는 최고의 성능 매개 변수를 채택했다. 교육 시간 처리량은 결과 교육 시간 수렴에 영향을 주는 핵심 요소입니다.

가우디2 RES BERT 그래프
 

 

"The Small Print" 섹션에 제공된 그래픽의 구성을 테스트합니다.

 

 
가우디2 RES BERT 그래프

가우디2 RES BERT 그래프
"The Small Print" 섹션에 제공된 그래픽의 구성을 테스트합니다.

가우디2 RES BERT 그래프
"The Small Print" 섹션에 제공된 그래픽의 구성을 테스트합니다.

 

MLPerf을 통해 측정된 가우디2 제품의 성능 외에도, 가우디1은 고효율 시스템 스케일링을 지원하는 128-가속기 및 256-가속기를 위한 ResNet 모델에서 강력한 성능 및 선형 스케일을 제공했다.

 

에이탄 메디나(Eitan Medina) 하바나 랩스 최고운영책임자는 “가우디2는 최신 MLPerf 결과로도 입증됐듯이 모델 학습에 있어 업계 선도적인 성능을 제공한다”며 “하바나 랩스는 비용 경쟁력이 높은 AI 학습 솔루션을 제공하기 위해 딥 러닝 교육 아키텍처와 소프트웨어를 지속적으로 혁신하고 있다”고 말했다.

 

MLPerf 벤치마크에 대하여: MLPerf 공동체는 머신러닝 솔루션에 대해 “정확성, 속도, 효율성에 대한 일관적인 측정치”를 제공하는 공정하고 유용한 벤치마크를 설계하는 것을 목표로 한다. 학계, 연구실, 업계의 AI 분야 리더들이 벤치마크를 결정하고, 모든 공급업체 간 공정한 비교를 보장하는 일련의 엄격한 규칙을 정의해 만들었다. MLPerf 벤치마크는 엔드-투-엔드 작업에 대한 공정한 비교를 가능하게 하는 명시적인 규칙 집합으로 인해 AI 산업에 유일하게 신뢰할 수 있는 벤치마크다. 아울러, MLPerf에 결과를 제출하는 경우, 이를 검증하기 위해 한 달 동안의 동료 검토 프로세스를 거친다.

 

통지 및 고지사항 :

ResNet-50 성능 비교를 위한 테스트 구성
A100-80GB: NGC의 TF docker 22.03-tf2-py3을 사용하여 단일 A100-80GB를 사용하여 Azure 인스턴스 Standard_ND96amsr_A100_v4에서 Habana가 2022년 4월에 측정했습니다(옵티마이저=sgd, BS=256).
A100-40GB: NGC의 TF 도커 22.03-tf2-py3를 사용하여 단일 A100-40GB를 사용하여 DGX-A100에서 하바나가 2022년 4월에 측정했습니다(옵티마이저=sgd, BS=256).
V100-32GB¬: NGC의 TF 도커 22.03-tf2-py3를 사용하여 단일 V100-32GB를 사용하여 p3dn.24xlarge에서 하바나가 2022년 4월에 측정했습니다(옵티마이저=sgd, BS=256).
가우디2: SynapseAI TF 도커 1.5.0을 사용하여 단일 Gaudi2를 사용하여 가우디2-HLS 시스템에서 하바나가 2022년 5월에 측정(BS=256)
결과는 다를 수 있다.

BERT 성능 비교를 위한 테스트 구성
A100-80GB: NGC의 TF docker 22.03-tf2-py3이 있는 단일 A100-80GB를 사용하여 Azure 인스턴스 Standard_ND96amsr_A100_v4에서 Habana가 2022년 4월에 측정했습니다(Phase-1: Seq len=128, BS=312, accu steps=256; 페이즈-2: 시퀀스렌=512, BS=40, 아큐스텝=768)
A100-40GB: 2022년 4월 하바나가 NGC의 TF 도커 22.03-tf2-py3와 함께 단일 A100-40GB를 사용하여 DGX-A100에서 측정했습니다(Phase-1: Seq len=128, BS=64,
accu 단계 = 1024; Phase-2: seq len=512, BS=16, accu steps=2048)
V100-32GB: NGC의 TF 도커 21.12-tf2-py3가 있는 단일 V100-32GB를 사용하여 p3dn.24xlarge에서 하바나에 의해 2022년 4월에 측정됨(Phase-1: Seq len=128, BS=64, accu steps=1024; Phase-2: seq len=512, BS=8, accu steps=4096)
가우디2: SynapseAI TF 도커 1.5.0이 있는 단일 가우디2를 사용하여 가우디2-HLS 시스템에서 하바나에 의해 2022년 5월에 측정됨(Phase-1: Seq len=128, BS=64, accu steps=1024; Phase-2: seq len=512, BS=16, accu steps=2048)
결과는 다를 수 있다.

하바나 연구소. Habana, Habana 로고, Gaudi 및 SynapseAI는 Habana Labs의 상표입니다.

 

보도 - 인텔






  1. 서울에 아마존 웹 서비스의 12번째 거점 개설

    아마존 웹 서비스(Amazon Web Services, AWS)는 1월 6일, 12번째 거점으로 "아시아 퍼시픽(서울)" 지역을 개설했다. 서울 리전은 2개의 AZ(가용성 지역)를 포함한다. 서울에서는 Amazon EC2와...
    Date2016.01.10 CategorySRV Views518
    Read More
  2. 시스코 ACI, 마이크로 분할 및 Docker 컨테이너 등 기능 확장

    시스코 시스템즈는 12월 21일, 시스코 ACI(Application Centric Infrastructure)의 신규 소프트웨어를 발표했다. 지원 대상으로 Docker 컨테이너를 추가하고 마이크로 분할에 의한 보안 기능을 강화...
    Date2015.12.24 CategorySRV Views546
    Read More
  3. 중소 기업용 HPE 프로라이언트Gen9 서버 2종 발매

    휴렛 팩커드 엔터프라이즈(HPE)는 엔트리용 프로라이언트 서버 Gen9 2종과 이 서버를 이용하는 중견/중소 기업용 IT 솔루션 개발 지원 프로그램을 발표했다. 판매를 시작한 서버는 1소켓/1U서버 ...
    Date2015.12.21 CategorySRV Views544
    Read More
  4. 델, 하이퍼스케일 클래스 DSS 7000,2500등 발표

    델이 새로운 제품 라인업으로 DSS 브랜드의 제품군을 발표했다. 올해 8월에 설립된 DSS 사업 부문은 Web기술, 석유/가스, EC 서비스, 클라우드/호스팅 사업자 등을 상정하는 하이퍼 스케일(서...
    Date2015.11.30 CategorySRV Views619
    Read More
  5. DELL, 13세대 파워엣지 엔트리급 R330-R230 발표

    델(DELL)은 11월 17일, 13세대가 되는 델 파워엣지(Dell PowerEdge)서버 라인업에 엔트리 클래스급 신 모델 4제품을 출시했다. 새로운 모델은 1소켓 1U서버와 미니 타워형 서버로 중견/중소 기업...
    Date2015.11.19 CategorySRV Views777
    Read More
  6. 포티게이트 NGFW 신모델 FortiGate-3200D, 600D 투입

    포티게이트가 차세대 방화벽(NGFW)의 하이엔드급 신형 FortiGate-3200D 및 미들 레인지급 신형 FortiGate-600D의 시장 투입을 시작했다. 신형 3200D는 방화벽 스루풋이 최대 80Gbps, IPS 스루풋은 ...
    Date2015.11.12 CategorySRV Views688
    Read More
  7. FireEye HX 3.0 발표 - 엔드포인트 방어 솔루션

    파이어·아이(FireEye)는 11월 11일, 엔드 포인트 위협 대책 플랫폼의 최신 FireEye HX Endpoint 3.0을 발표했다. FireEye HX는 엔드 포인트를 위한 통합 보안 솔루션으로서 위협의 검출/방어 뿐...
    Date2015.11.12 CategorySRV Views503
    Read More
  8. 빅데이터 플래시 시스템, 샌디스크 인피니플래시 발표(InfiniFlash)

    플래시 전문업체 샌디스크가 10월 26일, 3U 케이스에 최대 512TB의 플래시를 탑재하는 올 플래시 어레이 인피니플래시(InfiniFlash)를 발표했다. 인피니플래시는 빅데이터 시장을 상정하는 신형 플래...
    Date2015.10.28 CategorySRV Views1077
    Read More
  9. 베리타스 넷백업 5330 발매, 100TB이상의 어플라이언스

    베리타스 테크놀로지(시만텍에서 분사)는 10월 15일, 스토리지 내장 백업 전용 장치의 최신판 베리타스 넷백업 5330(Veritus NetBackup 5330)을 발매했다. 최대 용량은 229TB. 베리타스는 코스트...
    Date2015.10.19 CategorySRV Views620
    Read More
  10. EMC의 신형 SAN 스토리지 VNXe1600 발표

    EMC는 엔트리용 SAN 스토리지 VNXe1600을 공식 발표했다. VNXe1600은 이전 VNXe 시리즈의 사용 편이성을 계승하며 중견·중소 기업 외 지사, 사무실, 부서 수준 등의 애플리케이션 등의 용도를 ...
    Date2015.09.30 CategorySRV Views577
    Read More
  11. 인텔, 데이터 센터 전용 P3608 NVMe SSD 발표

    인텔은 23일(현지시간) 데이터 센터 전용 초고속 스토리지로 SSD "P3608"을 발표했다. P3608은 2014년에 발매된 "P3600/3700"의 후계가 되는 데이터 센터 전용 SSD. SATA나 SAS라는 종래의 프로...
    Date2015.09.25 CategorySRV Views558
    Read More
  12. 소프트웨어 정의 스토리지, IBM 스펙트럼 스토리지 기능 확장

    IBM은 Software-Defined Storage(SDS, 소프트웨어 정의 스토리지) 솔루션 IBM 스펙트럼 스토리지 패밀리의 기능 확장을 발표했다. 퍼블릭 클라우드에 대한 데이터 백업 대응 및 SoftLayer를 ...
    Date2015.09.20 CategorySRV Views567
    Read More
  13. HP, 플래시 스토리지 신제품 HP 3PAR StoreServ 8000 발표

    HP가 플래시 스토리지 신 모델 HP 3PAR StoreServ 시리즈를 발표했다. 신 모델은 비용 대비 효과를 중시한 미들 레인지 모델 StoreServ 8200/8400, 확장성을 중시한 하이엔드 모델 StoreServ 844...
    Date2015.09.14 CategorySRV Views767
    Read More
  14. 오픈스택 기반 IBM Blue Box Cloud 전 세계 제공 시작

    IBM은 미국 시간 8월 26일, 오픈스택(OpenStack) 베이스의 프라이빗 클라우드 서비스 "블루박스 클라우드(Blue Box Cloud)"를 SoftLayer 클라우드 데이터 센터에서 사용할 수 있다고 밝혔다....
    Date2015.09.01 CategorySRV Views684
    Read More
  15. 구글, 가정용 기가비트 Wi-Fi 라우터 OnHub 발표

    구글이 가정용 Wi-Fi 라우터 OnHub를 발표 했습니다. OnHub는 IEEE 802.11ac/a/b/g/n에 대응하는 최대 1900Mbps의 Wi-Fi 라우터지만 특징은 독특한 형상 입니다. 지름 11cm정도 높이에 ...
    Date2015.08.20 CategorySRV Views816
    Read More
  16. 고밀도 x86서버용 GPU 확장 트레이 발표 (레노버)

    레노버는 8월 18일, 고밀도 x86서버 NeXtScale System nx360 M5용 확장 트레이 NeXtScale PCIe 2U NeX트레이를 발표했다. 4개의 풀 사이즈-더블 와이드 GPU나 코 프로세서를 탑재할 수 있다. ...
    Date2015.08.19 CategorySRV Views1098
    Read More
  17. 오라클, 솔라리스(Solaris)에 Docker 통합 계획 발표

    미국 오라클은 7월 30일, 오라클 솔라리스(Oracle Solaris) OS에 대한 Docker 통합 계획을 발표했다. 이 계획은 Solaris의 OS 가상화 기술인 Solaris Zone에 Docker를 통합하고 Solaris Zone으로...
    Date2015.08.11 CategorySRV Views940
    Read More
  18. Adaptec, SAS 대응 RAID 카드 ASR-81605Z V2 SINGLE 발매

    PMC-Sierra의 Adaptec 브랜드 SAS 대응 RAID 어댑터 "ASR-81605Z V2 SINGLE"이 8월 상순부터 발매된다. 가격은 오픈 프라이스.   호스트 인터페이스는 PCI Express 3.0 x8 채용, Mini SAS HD(SFF-8643...
    Date2015.08.04 CategorySRV Views591
    Read More
  19. 인 메모리 DB서버 프로라이언트 DL560, BL660c Gen9 발매

    HP는 대용량 메모리를 탑재한 HP ProLiant DL560 Gen9과 HP ProLiant BL660c Gen9을 발매했다. 인 메모리 데이터베이스 서버의 가상화 통합, HPC 등 대량의 데이터를 취급하는 워크 로드에 적합한 서버. ...
    Date2015.07.22 CategorySRV Views695
    Read More
  20. 2U 서버에 224테라, HP Apollo 4200 및 4530 출시

    HP가 최신 고밀도 스토리지 서버 HP Apollo 4200 / Apollo 4530 2가지 제품을 출시했다. 신형 Apollo 4000 시리즈는 빅데이터에 최적화 된 스토리지 서버 제품군으로 컴팩트한 서버 케이스에 하드 디...
    Date2015.07.17 CategorySRV Views738
    Read More
Board Pagination Prev 1 ... 4 5 6 7 8 9 10 11 12 13 14 Next
/ 14