4월 23일 (화) 오후 10:41

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2023.11.22. / 등급: 12세 관람가 / 장르: 드라마 / 국가: 대한민국 감독 : 김성수 출연 : 황정민, 정우...
노량: 죽음의 바다 / 개봉 2023.12. / 장르: 액션, 드라마 / 국가: 대한민국 감독 : 김한민 출연 : 김윤석, ...

 newsroom-vision-habana-card.jpg.rendition.intel.web.1920.1080.jpg

하바나 가우디2 메자닌 카드


하바나 가우디2 메자닌 카드 이미지 2022년 5월 10일, AI 딥러닝 프로세서 기술에 중점을 둔 인텔의 데이터 센터 팀인 하바나 랩스는 학습 및 추론을 위한 2세대 딥 러닝 프로세서인 하바나 가우디2와 하바나 그레코를 출시했습니다. (크레딧: 인텔)

 

인텔은 오늘 자사 2세대 하바나® 가우디®2 딥 러닝 프로세서와 엔비디아 A100의 AI 총 학습 시간 (Time-to-Train, 이하 TTT) 성능을 MLPerf 산업 벤치마크 상에서 측정한 결과, 하바나® 가우디®2 딥 러닝 프로세서의 성능이 월등했다고 밝혔다. 인텔은 지난 5월 인텔 비전에서 발표한 가우디 2 프로세서가 비전 (ResNet-50) 및 언어(BERT) 부문에서 뛰어난 TTT를 기록했다고 밝혔다.

 

“가우디2가 출시 한 달 만에 MLPerf 벤치마크에서 뛰어난 성능을 기록해 매우 기쁘며, 동시에 이러한 결과를 가져올 수 있도록 노력한 팀원에 자부심을 느낀다”며 “인텔은 비전 및 언어 모델 모두에서 동급 최고의 성능을 제공해, 고객에 가치를 제공하고 AI 딥러닝 솔루션 개발을 가속화하도록 지원할 것”이라고 말했다.

 

산드라 리베라(Sandra Rivera), 인텔 수석부사장 겸 데이터센터 및 AI 그룹 총괄은
인텔 데이터 센터 팀은 하바나 랩스(Habana Labs)의 가우디 플랫폼을 활용해 딥 러닝 프로세서 기술에 중점을 두었으며, 데이터 과학자 및 머신러닝 엔지니어가 학습을 가속화할 수 있도록 지원했다. 아울러, 단 몇 줄의 코드로 새로운 모델을 구축하거나 기존 모델을 이전해 생산성을 높이고 운영 비용을 절감할 수 있도록 구현했다.

 

하바나 가우디2는 1세대 가우디 제품 대비 TTT 부문에 있어 획기적인 발전을 이루었다. 하바나 랩스는 지난 2022년 5월 진행한 MLPerf 벤치마크를 통해 가우디2가 8개의 가속기를 사용하는 비전 및 언어 모델에서 엔비디아 A100-80G 대비 월등한 성능을 기록했다고 밝혔다. ResNet-50 모델의 경우, 가우디2는 엔비디아 A100-80G 제품 대비 학습 시간이 36% 단축됐다. 델(Dell)이 진행한 8개의 가속기 서버에서 진행한 ResNet-50 모델 및 BERT 모델 학습 테스트 결과 가우디2가 엔비디아 A100-40GB 대비 학습 시간을 45% 단축했다.

가우디2 RES BERT 그래프
 
가우디 BERT 시간

가우디2 RES BERT 그래프
가우디 BERT 시간
MLCommons에서 발표한 지표, 2022년 6월, https://mlcommons.org/en/training-normal-20/

 

가우디2는 1세대 가우디 대비, ResNet-50 및 BERT 모델에서 각각 3배와 4.7배 높은 학습 처리량을 기록했다. 인텔은 해당 프로세서를 기존 16나노 공정에서 7나노 공정으로 전환해 텐서 프로세서 코어 수를 3배 증가했고, GEMM 엔진 컴퓨팅 용량 증설, 패키지 내 고대역폭 메모리 용량 3배 확대, 대역폭 및 SRAM 크기 2배 확장을 통해 이번 성과를 달성했다. 비전 모델의 경우 가우디2는 독립적으로 작동해 AI 학습에 필요한 데이터 증강을 포함, 압축 영상화를 위한 전반적인 전처리 파이프를 처리할 수 있는 통합 미디어 엔진 형태의 기능을 갖췄다.

 

가우디1 및 가우디2 프로세서는 특별한 소프트웨어 조작 없이도 고객에게 최고의 성능을 제공한다.

 

하바나 랩스는 8개의 GPU 서버 및 HLS-가우디2 레퍼런스 서버 상에서 가우디1 및 가우디2와 기존 상용 소프트웨어 간 성능을 비교했다. 학습 처리량은 NGC 및 하바나 공용 저장소의 텐서플로우 도커를 사용해 측정했으며, 제조사에서 권장하는 최고의 성능 매개 변수를 채택했다. 교육 시간 처리량은 결과 교육 시간 수렴에 영향을 주는 핵심 요소입니다.

가우디2 RES BERT 그래프
 

 

"The Small Print" 섹션에 제공된 그래픽의 구성을 테스트합니다.

 

 
가우디2 RES BERT 그래프

가우디2 RES BERT 그래프
"The Small Print" 섹션에 제공된 그래픽의 구성을 테스트합니다.

가우디2 RES BERT 그래프
"The Small Print" 섹션에 제공된 그래픽의 구성을 테스트합니다.

 

MLPerf을 통해 측정된 가우디2 제품의 성능 외에도, 가우디1은 고효율 시스템 스케일링을 지원하는 128-가속기 및 256-가속기를 위한 ResNet 모델에서 강력한 성능 및 선형 스케일을 제공했다.

 

에이탄 메디나(Eitan Medina) 하바나 랩스 최고운영책임자는 “가우디2는 최신 MLPerf 결과로도 입증됐듯이 모델 학습에 있어 업계 선도적인 성능을 제공한다”며 “하바나 랩스는 비용 경쟁력이 높은 AI 학습 솔루션을 제공하기 위해 딥 러닝 교육 아키텍처와 소프트웨어를 지속적으로 혁신하고 있다”고 말했다.

 

MLPerf 벤치마크에 대하여: MLPerf 공동체는 머신러닝 솔루션에 대해 “정확성, 속도, 효율성에 대한 일관적인 측정치”를 제공하는 공정하고 유용한 벤치마크를 설계하는 것을 목표로 한다. 학계, 연구실, 업계의 AI 분야 리더들이 벤치마크를 결정하고, 모든 공급업체 간 공정한 비교를 보장하는 일련의 엄격한 규칙을 정의해 만들었다. MLPerf 벤치마크는 엔드-투-엔드 작업에 대한 공정한 비교를 가능하게 하는 명시적인 규칙 집합으로 인해 AI 산업에 유일하게 신뢰할 수 있는 벤치마크다. 아울러, MLPerf에 결과를 제출하는 경우, 이를 검증하기 위해 한 달 동안의 동료 검토 프로세스를 거친다.

 

통지 및 고지사항 :

ResNet-50 성능 비교를 위한 테스트 구성
A100-80GB: NGC의 TF docker 22.03-tf2-py3을 사용하여 단일 A100-80GB를 사용하여 Azure 인스턴스 Standard_ND96amsr_A100_v4에서 Habana가 2022년 4월에 측정했습니다(옵티마이저=sgd, BS=256).
A100-40GB: NGC의 TF 도커 22.03-tf2-py3를 사용하여 단일 A100-40GB를 사용하여 DGX-A100에서 하바나가 2022년 4월에 측정했습니다(옵티마이저=sgd, BS=256).
V100-32GB¬: NGC의 TF 도커 22.03-tf2-py3를 사용하여 단일 V100-32GB를 사용하여 p3dn.24xlarge에서 하바나가 2022년 4월에 측정했습니다(옵티마이저=sgd, BS=256).
가우디2: SynapseAI TF 도커 1.5.0을 사용하여 단일 Gaudi2를 사용하여 가우디2-HLS 시스템에서 하바나가 2022년 5월에 측정(BS=256)
결과는 다를 수 있다.

BERT 성능 비교를 위한 테스트 구성
A100-80GB: NGC의 TF docker 22.03-tf2-py3이 있는 단일 A100-80GB를 사용하여 Azure 인스턴스 Standard_ND96amsr_A100_v4에서 Habana가 2022년 4월에 측정했습니다(Phase-1: Seq len=128, BS=312, accu steps=256; 페이즈-2: 시퀀스렌=512, BS=40, 아큐스텝=768)
A100-40GB: 2022년 4월 하바나가 NGC의 TF 도커 22.03-tf2-py3와 함께 단일 A100-40GB를 사용하여 DGX-A100에서 측정했습니다(Phase-1: Seq len=128, BS=64,
accu 단계 = 1024; Phase-2: seq len=512, BS=16, accu steps=2048)
V100-32GB: NGC의 TF 도커 21.12-tf2-py3가 있는 단일 V100-32GB를 사용하여 p3dn.24xlarge에서 하바나에 의해 2022년 4월에 측정됨(Phase-1: Seq len=128, BS=64, accu steps=1024; Phase-2: seq len=512, BS=8, accu steps=4096)
가우디2: SynapseAI TF 도커 1.5.0이 있는 단일 가우디2를 사용하여 가우디2-HLS 시스템에서 하바나에 의해 2022년 5월에 측정됨(Phase-1: Seq len=128, BS=64, accu steps=1024; Phase-2: seq len=512, BS=16, accu steps=2048)
결과는 다를 수 있다.

하바나 연구소. Habana, Habana 로고, Gaudi 및 SynapseAI는 Habana Labs의 상표입니다.

 

보도 - 인텔






  1. SK하이닉스, 생성형 AI에 특화된 GDDR6-AiM 기반 가속기 카드 ‘AiMX’ 시제품 최초...

    SK하이닉스가 지난 12일(미국시간)부터 사흘간 미국 캘리포니아주 메리어트 산타클라라 호텔에서 열린 ‘AI Hardware & Edge AI Summit(이하 AI 서밋) 2023’에서 GDDR6-AiM 기반의 생성형 A...
    Date2023.09.18 CategorySRV Views445
    Read More
  2. 엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

    엔비디아® L40S GPU를 탑재한 엔비디아 OVX™ 서버가 공개되었습니다! 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse)™ 플랫폼을 통해 AI 훈련과 추론, 3D 디자인과 시각...
    Date2023.08.09 CategorySRV Views361
    Read More
  3. 엔비디아 H100 GPU, 이제 AWS 클라우드에서 이용

      이제 AWS 사용자라면 업계 벤치마크에서 입증된 강력한 AI 훈련 및 추론 성능에 액세스할 수 있답니다! 이 거대한 클라우드 기업은 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)로 ...
    Date2023.07.31 CategorySRV Views316
    Read More
  4. Solidigm, 세계 최대 61테라바이트 서버용 SSD 발표

    SSD 제조사 Solidigm은 24일, 세계 최대 용량을 자랑하는 61.44테라바이트(TB) 서버용 D5-P5336을 발표했다. 현재 E1.L 폼팩터로 최대 30.72TB의 용량을 제공하기 시작했으며 올해 하반기에는 61.44TB의 용...
    Date2023.07.25 CategorySSD Views265
    Read More
  5. 삼성전자, 업계 최초 GDDR7 D램 개발

    삼성전자가 차세대 그래픽 시장의 성장을 주도할 ‘32Gbps GDDR7(Graphics Double Data Rate) D램’을 업계 최초로 개발했다. * Gbps(Gigabit per second): 1초당 전송되는 기가비트 단위의 데이터 삼성...
    Date2023.07.21 CategoryMEMORY Views248
    Read More
  6. 엔비디아, 하이퍼스케일 생성형 AI용 가속 이더넷 플랫폼 ‘엔비디아 스펙트럼-X’ 출시

    엔비디아 스펙트럼-X™(NVIDIA Spectrum-X™)이 출시되었습니다. 스펙트럼-X는 이더넷 기반 AI 클라우드의 성능과 효율을 개선하도록 고안된 가속 네트워킹 플랫폼입니다. 엔비디아 스펙트럼-X는 엔비디...
    Date2023.06.05 CategorySRV Views232
    Read More
  7. NVIDIA Announces Third-Generation OVX Computing Systems to Power Industrial Metaverse Applications

    Digitalization that combines AI and simulation is redefining how industrial products are created and transforming how people interact with the digital world. To help enterprises tackle c...
    Date2023.03.26 CategorySRV Views249
    Read More
  8. 삼성전자 '1Tb(테라비트) 8세대 V낸드’ 양산

    삼성전자가 세계 최고 용량의 ‘1Tb(테라비트) 8세대 V낸드’ 양산에 들어갔다.   삼성전자 ‘1Tb TLC(Triple Level Cell) 8세대 V낸드’는 업계 최고 수준의 비트 밀도(Bit Density)의 고용량제품으로, 웨...
    Date2022.11.17 CategoryTECH Views373
    Read More
  9. Meta, 퀘스트 프로(Quest Pro) 발표, Snapdragon XR2+ 탑재 및 광학성능 개선

    미국 메타는 11일(현지시간) VR 헤드셋 '퀘스트 프로'를 발표했다. 총 10개의 센서를 통해 MR 커뮤니케이션을 가능하게 한 VR 헤드셋으로, 지난 5월 프로젝트 캠브리아로 2022...
    Date2022.10.13 CategoryGLOBAL Views443
    Read More
  10. 인텔, 엔비디아 A100 성능을 뛰어넘는 2세대 하바나 가우디2 성능 공개

      하바나 가우디2 메자닌 카드 하바나 가우디2 메자닌 카드 이미지 2022년 5월 10일, AI 딥러닝 프로세서 기술에 중점을 둔 인텔의 데이터 센터 팀인 하바나 랩스는 학습 및 추론을 위한 2세대 딥 러...
    Date2022.10.01 CategorySRV Views468
    Read More
  11. [체험기] “게이밍에 진심” 오디세이 아크, 로스트아크에 상륙하다

    2022 게임스컴과 IFA에서 전 세계 게이머들의 주목을 받은 오디세이 아크가 대한민국의 대표 인기 게임 ‘로스트아크’와 만났다. 화려한 그래픽과 탄탄한 세계관으로 많은 게이머들의 꾸준한 사랑을 받고 ...
    Date2022.09.25 CategoryGLOBAL Views358
    Read More
  12. 세계 가전 황제 LG, 올레드 TV 1분기 출하량 역대 최대

    LG전자의 최상위 프리미엄 라인업인 LG 올레드 TV가 역대 1분기 출하량 기록을 새롭게 썼다. 세계 시장 수요 위축에도 불구하고 LG 올레드 TV는 압도적 화질과 디자인의 고객 가치를 인정받으며 차세대 프...
    Date2022.06.03 CategoryGLOBAL Views1372
    Read More
  13. LG전자, 울트라기어 고성능 게이밍 모니터 3종 출시

    LG전자는 ▲고사양 게임을 쾌적하게 즐기기 위한 최적의 게이밍 성능과 ▲선명한 화질 ▲다양한 편의 기능과 연결성까지 두루 갖춘 LG 울트라기어 게이밍 모니터 신제품 3종(모델명: 32GQ950, 32GQ850, 48GQ...
    Date2022.06.03 CategoryLCD Views1460
    Read More
  14. LG전자, 獨 「메르세데스-벤츠 AG」에 ‘올레드 기반 인포테인먼트 시스템’ 공급

    LG전자가 독일 자동차 제조사 「메르세데스-벤츠(Mercedes-Benz) AG」에 플라스틱 올레드(Plastic OLED, 이하 P-OLED) 기반 인포테인먼트(IVI; In-Vehicle Infotainment) 시스템을 공급했다. LG전자와 메...
    Date2022.01.15 CategoryGLOBAL Views3234
    Read More
  15. 소니, ‘CES 2022’에서 혁신 기술 및 이니셔티브 공개

    소니는 1월 5일부터 1월 7일까지(현지시간), 미국 네바다주 라스베이거스에서 온 · 오프라인으로 개최되는 세계 최대 국제전자쇼 ‘CES 2022(Consumer Electronics Show 2022)’에 참가해 미래 혁신을 이끌...
    Date2022.01.06 CategoryGLOBAL Views3446
    Read More
  16. LG전자, CES 2022서 고객 위한 혁신 제품 및 솔루션 공개

    LG전자가 美 현지시간 이달 4일부터 31일까지 4주간 ‘모두가 누릴 수 있는 더 좋은 일상(The Better Life You Deserve)’을 주제로 CES 2022 온라인 전시관을 열고 고객경험 혁신을 위한 제품과 솔루션을 대...
    Date2022.01.06 CategoryGLOBAL Views3399
    Read More
  17. Apple AR 헤드셋, M1 동급 프로세서 탑재로 내년 10~12월 발매?

    맥루머스(MacRumors)가 Apple 관련 정보로 유명한 Ming-ChiKuo의 정보로 Apple이 2022년 4분기(2022년 10~12월)에 M1 칩과 비슷한 레벨의 프로세서를 탑재한 AR(증강현실) 헤드셋을 발매할 것 같다고 ...
    Date2021.11.27 CategoryNET Views3342
    Read More
  18. 삼성전자, 차세대 2.5D 패키징 솔루션 ‘H-Cube’ 개발

    삼성전자가 반도체 패키징 기술 혁신을 통해 고성능 반도체용 2.5D 패키징 솔루션 ‘H-Cube(Hybrid-Substrate Cube)’를 개발하고, 고성능 반도체 공급을 확대한다. 삼성전자는 기존 2.5D 패키징 솔루션 I-...
    Date2021.11.27 CategoryMEMORY Views3132
    Read More
  19. 샤오미(Xiaomi), 모바일 장치를 위한 새로운 수냉 기술 공개

    Xiaomi는 열 방출의 최신 기술인 Loop Liquid Cool Technology를 발표했다. 항공 우주 산업에서 사용되는 냉각 솔루션에서 영감을 받은 Loop Liquid Cool Technology는 액체 냉각제를 열원으로 기화...
    Date2021.11.09 CategoryCOOL Views2242
    Read More
  20. LG전자, 울트라기어 게이밍스피커 출시

    LG전자가 LG 울트라기어(UltraGearTM) 게이밍스피커를 출시하며 게이밍 시장 공략을 가속화한다. LG 울트라기어는 고성능 게이밍 기기 브랜드로, 승리를 안겨주는 최강의 무기라는 의미를 담았다. LG전자...
    Date2021.08.30 CategoryTECH Views984
    Read More
  21. 삼성전자, 인공지능 탑재 메모리 제품군 확대

    삼성전자가 AI엔진을 탑재한 메모리 반도체 제품군을 확대한다. 삼성전자는 메모리와 시스템반도체의 융복합화를 주도하며, 다양한 글로벌 기업들과 협력을 통해 차세대 메모리 반도체 생태계를 빠르게 ...
    Date2021.08.24 CategorySRV Views1092
    Read More
  22. AMD, RDNA 2 기반 전문가용 카드 Radeon PRO W6000 발매

    AMD가 RDNA 2 아키텍처를 채용한 전문가용 카드 Rade on PRO W66000을 발매했다. 2021년 6월에 발표된 W6000 시리즈에 속하는 라인업으로 건축 분야에서 복잡한 설계, 엔지니어링 시뮬레이션, 레이트...
    Date2021.08.12 CategoryGPU Views649
    Read More
  23. NVIDIA, Ampere 아키텍처 기반 전문가용 NVIDIA RTX A2000 발표

    NVIDIA가 전문가 전용 미들레인지 GPU, NVIDIA RTX A2000을 발표했다. RTX A2000은 전문가용 RTX 시리즈 GPU로는 최초의 미들레인지 제품으로 Ampere 아키텍처를 채택하여 3328기 CUDA 코어, 26기 2세대...
    Date2021.08.12 CategoryGPU Views427
    Read More
  24. LG전자, ‘LG 울트라기어’ 모니터 신제품 34GP950G 출시

    LG전자가 게이밍 모니터 ‘LG 울트라기어’ 34형 신제품을 출시한다. 신제품(모델명: 34GP950G)은 글로벌 그래픽 전문 ‘엔비디아’社가 인증하는 디스플레이 기술 중 최상위 버전인 지싱크 얼티밋(G-SYNC® UL...
    Date2021.08.06 CategoryLCD Views231
    Read More
  25. 인텔, 서버 타겟 새로운 제온 W-3300 프로세서 시리즈 발표

    인텔이 최신 Intel Xeon W-3300 프로세서 시리즈를 출시했다. Intel Xeon W-3300 프로세서는 스레드가 많고 입출력 집약적인 워크로드에 특화되어 전문 응용 프로그램을 위해 설계됐다. 그에 따라 ...
    Date2021.08.02 CategorySRV Views340
    Read More
  26. 삼성전자, 커브드 게이밍 오디세이 Neo G9 출시

    삼성전자가 업계 최초로 커브드 게이밍 모니터에 미니 LED를 적용한 ‘오디세이 Neo(Odyssey Neo) G9’을 국내를 포함한 전 세계 주요 시장에 29일 출시한다. 오디세이 Neo G9(모델명 S49AG950)은 49형 크...
    Date2021.07.28 CategoryLCD Views319
    Read More
  27. Valve, AMD APU 탑재 7형 핸드헬드 게임기 "스팀덱" 발표

    밸브(Valve)는 동사의 스팀 운영체제(Steam OS)가 작동하며 다양한 PC용 게임을 플레이할 수 있는 7형 핸드헬드 게임기 스팀덱(Steam Deck)을 발표했다. 2021년 12월 발매되고, 가격은 64GB eMMC 모델...
    Date2021.07.18 CategoryTECH Views871
    Read More
  28. HBM2E 통합 Xilinx Versal HBM 시리즈 발표, 네트워크 및 클라우드 빅데이터 대응

    적응형 컴퓨팅의 선두주자인 자일링스(Xilinx, Inc)가 Versal 포트폴리오의 최신 시리즈인 Versal HBM 적응형 컴퓨팅 가속 플랫폼(ACAP)을 출시했다.  Versal HBM 시리즈는 단일 플랫폼에서 빠른 메모리, ...
    Date2021.07.18 CategorySRV Views294
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 65 Next
/ 65