2023.07.31 16:40

엔비디아 H100 GPU, 이제 AWS 클라우드에서 이용

파시스트

조회 수 318

이제 AWS 사용자라면 업계 벤치마크에서 입증된 강력한 AI 훈련 및 추론 성능에 액세스할 수 있답니다!

이 거대한 클라우드 기업은 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)로 구동되는 새로운 아마존 EC2 P5 인스턴스(Amazon EC2 P5 instance)를 공식적으로 출시했는데요, 이 서비스를 통해 AWS 사용자는 브라우저에서 클릭 한 번으로 생성형 AI, 고성능 컴퓨팅(HPC)을 포함한 다양한 애플리케이션으로 확장할 수 있습니다.

이 새로운 소식은 AI가 바야흐로 아이폰 모멘텀(iPhone moment)을 맞이한 직후 나왔는데요, 전 세계의 많은 개발자와 연구원들은 거의 매일 대규모 언어 모델(LLM)을 사용하여 AI 기반 새로운 애플리케이션을 개발하고 있습니다. 이러한 새로운 애플리케이션을 시장에 출시하기 위해서는 가속화된 컴퓨팅의 효율성이 필요합니다.

엔비디아 H100 GPU는 4세대 텐서 코어, LLM 가속화를 위한 새로운 트랜스포머 엔진, 초당 900GB의 속도로 GPU가 서로 통신할 수 있는 최신 NV링크 기술 등의 아키텍처 혁신을 통해 슈퍼 컴퓨팅급 성능을 제공합니다.

P5 인스턴스로 확장

아마존 EC2 P5 인스턴스는 점점 더 복잡해지는 LLM 및 컴퓨터 비전 모델을 위한 추론 훈련 및 실행에 이상적인 서비스입니다. 이러한 뉴럴 네트워크(Neural network)는 질문 답변, 코드 생성, 영상 및 이미지 생성, 음성 인식 등 가장 까다롭고 컴퓨팅 집약적인 생성형 AI 애플리케이션을 구동합니다.

P5 인스턴스는 클라우드의 고성능 컴퓨팅, 네트워킹, 스토리지로 구성된 하이퍼스케일 클러스터인 EC2 울트라클러스터(EC2 UltraClusters)에 배포할 수 있습니다. 각 EC2 울트라클러스터는 강력한 슈퍼컴퓨터로, 고객이 여러 시스템에서 가장 복잡한 AI 트레이닝과 분산된 HPC 워크로드를 실행할 수 있도록 지원합니다.

컴퓨팅 노드 간에 높은 수준의 통신이 필요한 대규모 애플리케이션을 실행할 수 있도록 P5 인스턴스는 아마존 EC2 인스턴스를 위한 3,200Gbps 네트워크 인터페이스인 AWS EFA를 기반으로 하는 페타비트 규모의 논블럭킹 네트워크를 지원합니다.

P5 인스턴스를 통해 머신 러닝 애플리케이션은 엔비디아 콜랙티브 커뮤니케이션 라이브러리(NVIDIA Collective Communications Library)를 사용하여 최대 20,000개의 H100 GPU를 사용할 수 있습니다.

엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)는 100개 이상의 프레임워크, 사전 학습된 모델, AI 워크플로우와 AI 인프라 조정을 위한 도구가 포함된 풀스택 소프트웨어 제품군을 통해 사용자가 P5 인스턴스를 최대한 활용할 수 있도록 지원합니다.

AI 애플리케이션의 개발 및 배포를 간소화하도록 설계된 엔비디아 AI 엔터프라이즈는 고성능의 안전한 클라우드 네이티브 AI 소프트웨어 플랫폼 구축 및 유지 관리의 복잡성을 해결합니다. AWS 마켓플레이스에서 사용할 수 있으며, 지속적인 보안 모니터링, 일반적인 취약성과 노출에 대한 정기적이고 시기 적절한 패치, API 안정성, 엔터프라이즈 지원은 물론 엔비디아 AI 전문가의 지원까지 제공합니다.

주요 고객들의 후기

엔비디아와 AWS는 클라우드에 GPU 가속화를 제공하기 위해 지난 10여년 동안 협력해 왔습니다. 이러한 협업의 최신 사례인 새로운 P5 인스턴스는 개발자가 차세대 AI를 개발할 수 있는 최첨단 성능을 제공하기 위한 중요한 진전을 의미합니다.

다음은 현재 사용하고 있는 고객 사례들입니다:

Anthropic은 신뢰할 수 있고 해석 가능하며 조정 가능한 AI 시스템을 구축하여 상업적으로나 공익을 위해 가치를 창출할 수 있는 많은 기회를 갖게 될 것입니다.

“오늘 날의 대규모 일반 AI 시스템은 상당한 이점을 제공할 수 있지만 예측할 수 없고 신뢰할 수 없으며 불투명할 수 있으므로 이러한 문제를 해결하고 사람들이 유용하다고 생각하는 시스템을 배포하는 것이 저희의 목표입니다.”라고 Anthropic의 공동 설립자 Tom Brown이 밝혔습니다. “P5 인스턴스는 P4d 인스턴스보다 상당한 가격 대비 성능 이점을 제공할 것으로 기대하며, 차세대 LLM 및 관련 제품을 구축하는 데 필요한 대규모로 사용할 수 있을 것입니다.”

언어 AI 분야의 선도적인 선구자인 Cohere는 모든 개발자와 기업이 데이터를 안전하게 보호하면서 세계 최고의 자연어 처리(NLP) 기술로 제품을 구축할 수 있도록 지원합니다.

“Cohere는 모든 기업이 언어 AI의 힘을 활용하여 자연스럽고 직관적인 방식으로 정보를 탐색, 생성, 검색, 그리고 조치하고, 각 고객에게 가장 적합한 데이터 환경에서 여러 클라우드 플랫폼에 배포할 수 있도록 지원하는 데 앞장서고 있습니다.”라고 Cohere의 CEO인 Aidan Gomez는 말합니다. “엔비디아 H100 기반 아마존 EC2 P5 인스턴스는 컴퓨팅 성능과 Cohere의 최첨단 LLM 및 생성형 AI 기능을 결합하여 기업이 더 빠르게 생성, 성장 및 확장할 수 있는 능력을 발휘할 것입니다.”라고 소감을 마쳤습니다.

Hugging Face는 우수한 머신러닝을 대중화시킨다는 사명을 가지고 있습니다.

“저희는 머신 러닝을 위한 가장 빠르게 성장하는 오픈 소스 커뮤니티로서, 우리는 NLP, 컴퓨터 비전, 생물학, 강화 학습 등을 위한 플랫폼에서 150,000개 이상의 사전 학습된 모델과 25,000개 이상의 데이터 세트를 제공하고 있습니다.”라고 Hugging Face의 최고 기술 책임자이자 공동 창립자인 Julien Chaumond는 밝혔습니다. “저희는 모든 사람을 위한 새로운 파운데이션 AI 모델의 제공을 가속화하기 위해 EFA가 포함된 UltraClusters에서 Amazon SageMaker를 통해 아마존 EC2 P5 인스턴스를 대규모로 사용할 수 있다는 사실에 매우 기대하고 있습니다.”

오늘날 전 세계 4억5천만 명 이상의 사람들이 Pinterest를 시각적 영감 플랫폼으로 사용하여 자신의 취향에 맞는 제품을 쇼핑하고, 아이디어를 찾고, 영감을 주는 크리에이터와 만나고 있습니다.

“저희는 플랫폼에 업로드되는 수십억 장의 사진에 라벨을 붙이고 분류하는 작업과 사용자가 영감에서 행동으로 옮길 수 있는 시각적 검색과 같은 사용 사례를 위해 플랫폼 전반에 걸쳐 딥러닝을 광범위하게 사용하고 있습니다.”라고 Pinterest의 수석 아키텍트인 David Chaiken이 밝혔습니다. “엔비디아 H100 GPU, AWS EFA, 울트라클러스터가 탑재된 아마존 EC2 P5 인스턴스를 사용하여 제품 개발을 가속화하고 고객에게 새로운 공감형 AI 기반 경험을 제공할 수 있기를 기대하고 있습니다.”라고 소감을 마쳤습니다.

엔비디아 H100 기반의 새로운 AWS P5 인스턴스에 대해 자세히 알아보세요.

출처 - 엔비디아

Facebook Twitter Google Pinterest

Atachment
첨부 '1'	aws_nvidia.JPG,

위로 아래로 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

SK하이닉스, 생성형 AI에 특화된 GDDR6-AiM 기반 가속기 카드 ‘AiMX’ 시제품 최초...

SK하이닉스가 지난 12일(미국시간)부터 사흘간 미국 캘리포니아주 메리어트 산타클라라 호텔에서 열린 ‘AI Hardware & Edge AI Summit(이하 AI 서밋) 2023’에서 GDDR6-AiM 기반의 생성형 A...

Date2023.09.18 CategorySRV Views449

Read More
엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

엔비디아® L40S GPU를 탑재한 엔비디아 OVX™ 서버가 공개되었습니다! 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse)™ 플랫폼을 통해 AI 훈련과 추론, 3D 디자인과 시각...

Date2023.08.09 CategorySRV Views363

Read More
엔비디아 H100 GPU, 이제 AWS 클라우드에서 이용

이제 AWS 사용자라면 업계 벤치마크에서 입증된 강력한 AI 훈련 및 추론 성능에 액세스할 수 있답니다! 이 거대한 클라우드 기업은 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)로 ...

Date2023.07.31 CategorySRV Views318

Read More
Solidigm, 세계 최대 61테라바이트 서버용 SSD 발표

SSD 제조사 Solidigm은 24일, 세계 최대 용량을 자랑하는 61.44테라바이트(TB) 서버용 D5-P5336을 발표했다. 현재 E1.L 폼팩터로 최대 30.72TB의 용량을 제공하기 시작했으며 올해 하반기에는 61.44TB의 용...

Date2023.07.25 CategorySSD Views266

Read More
삼성전자, 업계 최초 GDDR7 D램 개발

삼성전자가 차세대 그래픽 시장의 성장을 주도할 ‘32Gbps GDDR7(Graphics Double Data Rate) D램’을 업계 최초로 개발했다. * Gbps(Gigabit per second): 1초당 전송되는 기가비트 단위의 데이터 삼성...

Date2023.07.21 CategoryMEMORY Views250

Read More
엔비디아, 하이퍼스케일 생성형 AI용 가속 이더넷 플랫폼 ‘엔비디아 스펙트럼-X’ 출시

엔비디아 스펙트럼-X™(NVIDIA Spectrum-X™)이 출시되었습니다. 스펙트럼-X는 이더넷 기반 AI 클라우드의 성능과 효율을 개선하도록 고안된 가속 네트워킹 플랫폼입니다. 엔비디아 스펙트럼-X는 엔비디...

Date2023.06.05 CategorySRV Views233

Read More
NVIDIA Announces Third-Generation OVX Computing Systems to Power Industrial Metaverse Applications

Digitalization that combines AI and simulation is redefining how industrial products are created and transforming how people interact with the digital world. To help enterprises tackle c...

Date2023.03.26 CategorySRV Views249

Read More
삼성전자 '1Tb(테라비트) 8세대 V낸드’ 양산

삼성전자가 세계 최고 용량의 ‘1Tb(테라비트) 8세대 V낸드’ 양산에 들어갔다. 삼성전자 ‘1Tb TLC(Triple Level Cell) 8세대 V낸드’는 업계 최고 수준의 비트 밀도(Bit Density)의 고용량제품으로, 웨...

Date2022.11.17 CategoryTECH Views374

Read More
Meta, 퀘스트 프로(Quest Pro) 발표, Snapdragon XR2+ 탑재 및 광학성능 개선

미국 메타는 11일(현지시간) VR 헤드셋 '퀘스트 프로'를 발표했다. 총 10개의 센서를 통해 MR 커뮤니케이션을 가능하게 한 VR 헤드셋으로, 지난 5월 프로젝트 캠브리아로 2022...

Date2022.10.13 CategoryGLOBAL Views444

Read More
인텔, 엔비디아 A100 성능을 뛰어넘는 2세대 하바나 가우디2 성능 공개

하바나 가우디2 메자닌 카드 하바나 가우디2 메자닌 카드 이미지 2022년 5월 10일, AI 딥러닝 프로세서 기술에 중점을 둔 인텔의 데이터 센터 팀인 하바나 랩스는 학습 및 추론을 위한 2세대 딥 러...

Date2022.10.01 CategorySRV Views470

Read More
[체험기] “게이밍에 진심” 오디세이 아크, 로스트아크에 상륙하다

2022 게임스컴과 IFA에서 전 세계 게이머들의 주목을 받은 오디세이 아크가 대한민국의 대표 인기 게임 ‘로스트아크’와 만났다. 화려한 그래픽과 탄탄한 세계관으로 많은 게이머들의 꾸준한 사랑을 받고 ...

Date2022.09.25 CategoryGLOBAL Views359

Read More
세계 가전 황제 LG, 올레드 TV 1분기 출하량 역대 최대

LG전자의 최상위 프리미엄 라인업인 LG 올레드 TV가 역대 1분기 출하량 기록을 새롭게 썼다. 세계 시장 수요 위축에도 불구하고 LG 올레드 TV는 압도적 화질과 디자인의 고객 가치를 인정받으며 차세대 프...

Date2022.06.03 CategoryGLOBAL Views1373

Read More
LG전자, 울트라기어 고성능 게이밍 모니터 3종 출시

LG전자는 ▲고사양 게임을 쾌적하게 즐기기 위한 최적의 게이밍 성능과 ▲선명한 화질 ▲다양한 편의 기능과 연결성까지 두루 갖춘 LG 울트라기어 게이밍 모니터 신제품 3종(모델명: 32GQ950, 32GQ850, 48GQ...

Date2022.06.03 CategoryLCD Views1461

Read More
LG전자, 獨「메르세데스-벤츠 AG」에 ‘올레드 기반 인포테인먼트 시스템’ 공급

LG전자가 독일 자동차 제조사 「메르세데스-벤츠(Mercedes-Benz) AG」에 플라스틱 올레드(Plastic OLED, 이하 P-OLED) 기반 인포테인먼트(IVI; In-Vehicle Infotainment) 시스템을 공급했다. LG전자와 메...

Date2022.01.15 CategoryGLOBAL Views3234

Read More
소니, ‘CES 2022’에서 혁신 기술 및 이니셔티브 공개

소니는 1월 5일부터 1월 7일까지(현지시간), 미국 네바다주 라스베이거스에서 온 · 오프라인으로 개최되는 세계 최대 국제전자쇼 ‘CES 2022(Consumer Electronics Show 2022)’에 참가해 미래 혁신을 이끌...

Date2022.01.06 CategoryGLOBAL Views3446

Read More
LG전자, CES 2022서 고객 위한 혁신 제품 및 솔루션 공개

LG전자가 美 현지시간 이달 4일부터 31일까지 4주간 ‘모두가 누릴 수 있는 더 좋은 일상(The Better Life You Deserve)’을 주제로 CES 2022 온라인 전시관을 열고 고객경험 혁신을 위한 제품과 솔루션을 대...

Date2022.01.06 CategoryGLOBAL Views3400

Read More
Apple AR 헤드셋, M1 동급 프로세서 탑재로 내년 10~12월 발매?

맥루머스(MacRumors)가 Apple 관련 정보로 유명한 Ming-ChiKuo의 정보로 Apple이 2022년 4분기(2022년 10~12월)에 M1 칩과 비슷한 레벨의 프로세서를 탑재한 AR(증강현실) 헤드셋을 발매할 것 같다고 ...

Date2021.11.27 CategoryNET Views3343

Read More
삼성전자, 차세대 2.5D 패키징 솔루션 ‘H-Cube’ 개발

삼성전자가 반도체 패키징 기술 혁신을 통해 고성능 반도체용 2.5D 패키징 솔루션 ‘H-Cube(Hybrid-Substrate Cube)’를 개발하고, 고성능 반도체 공급을 확대한다. 삼성전자는 기존 2.5D 패키징 솔루션 I-...

Date2021.11.27 CategoryMEMORY Views3132

Read More
샤오미(Xiaomi), 모바일 장치를 위한 새로운 수냉 기술 공개

Xiaomi는 열 방출의 최신 기술인 Loop Liquid Cool Technology를 발표했다. 항공 우주 산업에서 사용되는 냉각 솔루션에서 영감을 받은 Loop Liquid Cool Technology는 액체 냉각제를 열원으로 기화...

Date2021.11.09 CategoryCOOL Views2243

Read More
LG전자, 울트라기어 게이밍스피커 출시

LG전자가 LG 울트라기어(UltraGearTM) 게이밍스피커를 출시하며 게이밍 시장 공략을 가속화한다. LG 울트라기어는 고성능 게이밍 기기 브랜드로, 승리를 안겨주는 최강의 무기라는 의미를 담았다. LG전자...

Date2021.08.30 CategoryTECH Views985

Read More
삼성전자, 인공지능 탑재 메모리 제품군 확대

삼성전자가 AI엔진을 탑재한 메모리 반도체 제품군을 확대한다. 삼성전자는 메모리와 시스템반도체의 융복합화를 주도하며, 다양한 글로벌 기업들과 협력을 통해 차세대 메모리 반도체 생태계를 빠르게 ...

Date2021.08.24 CategorySRV Views1093

Read More
AMD, RDNA 2 기반 전문가용 카드 Radeon PRO W6000 발매

AMD가 RDNA 2 아키텍처를 채용한 전문가용 카드 Rade on PRO W66000을 발매했다. 2021년 6월에 발표된 W6000 시리즈에 속하는 라인업으로 건축 분야에서 복잡한 설계, 엔지니어링 시뮬레이션, 레이트...

Date2021.08.12 CategoryGPU Views649

Read More
NVIDIA, Ampere 아키텍처 기반 전문가용 NVIDIA RTX A2000 발표

NVIDIA가 전문가 전용 미들레인지 GPU, NVIDIA RTX A2000을 발표했다. RTX A2000은 전문가용 RTX 시리즈 GPU로는 최초의 미들레인지 제품으로 Ampere 아키텍처를 채택하여 3328기 CUDA 코어, 26기 2세대...

Date2021.08.12 CategoryGPU Views428

Read More
LG전자, ‘LG 울트라기어’ 모니터 신제품 34GP950G 출시

LG전자가 게이밍 모니터 ‘LG 울트라기어’ 34형 신제품을 출시한다. 신제품(모델명: 34GP950G)은 글로벌 그래픽 전문 ‘엔비디아’社가 인증하는 디스플레이 기술 중 최상위 버전인 지싱크 얼티밋(G-SYNC® UL...

Date2021.08.06 CategoryLCD Views232

Read More
인텔, 서버 타겟 새로운 제온 W-3300 프로세서 시리즈 발표

인텔이 최신 Intel Xeon W-3300 프로세서 시리즈를 출시했다. Intel Xeon W-3300 프로세서는 스레드가 많고 입출력 집약적인 워크로드에 특화되어 전문 응용 프로그램을 위해 설계됐다. 그에 따라 ...

Date2021.08.02 CategorySRV Views341

Read More
삼성전자, 커브드 게이밍 오디세이 Neo G9 출시

삼성전자가 업계 최초로 커브드 게이밍 모니터에 미니 LED를 적용한 ‘오디세이 Neo(Odyssey Neo) G9’을 국내를 포함한 전 세계 주요 시장에 29일 출시한다. 오디세이 Neo G9(모델명 S49AG950)은 49형 크...

Date2021.07.28 CategoryLCD Views320

Read More
Valve, AMD APU 탑재 7형 핸드헬드 게임기 "스팀덱" 발표

밸브(Valve)는 동사의 스팀 운영체제(Steam OS)가 작동하며 다양한 PC용 게임을 플레이할 수 있는 7형 핸드헬드 게임기 스팀덱(Steam Deck)을 발표했다. 2021년 12월 발매되고, 가격은 64GB eMMC 모델...

Date2021.07.18 CategoryTECH Views872

Read More
HBM2E 통합 Xilinx Versal HBM 시리즈 발표, 네트워크 및 클라우드 빅데이터 대응

적응형 컴퓨팅의 선두주자인 자일링스(Xilinx, Inc)가 Versal 포트폴리오의 최신 시리즈인 Versal HBM 적응형 컴퓨팅 가속 플랫폼(ACAP)을 출시했다. Versal HBM 시리즈는 단일 플랫폼에서 빠른 메모리, ...

Date2021.07.18 CategorySRV Views295

Read More