2023.07.31 16:40

엔비디아 H100 GPU, 이제 AWS 클라우드에서 이용

파시스트

조회 수 316

이제 AWS 사용자라면 업계 벤치마크에서 입증된 강력한 AI 훈련 및 추론 성능에 액세스할 수 있답니다!

이 거대한 클라우드 기업은 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)로 구동되는 새로운 아마존 EC2 P5 인스턴스(Amazon EC2 P5 instance)를 공식적으로 출시했는데요, 이 서비스를 통해 AWS 사용자는 브라우저에서 클릭 한 번으로 생성형 AI, 고성능 컴퓨팅(HPC)을 포함한 다양한 애플리케이션으로 확장할 수 있습니다.

이 새로운 소식은 AI가 바야흐로 아이폰 모멘텀(iPhone moment)을 맞이한 직후 나왔는데요, 전 세계의 많은 개발자와 연구원들은 거의 매일 대규모 언어 모델(LLM)을 사용하여 AI 기반 새로운 애플리케이션을 개발하고 있습니다. 이러한 새로운 애플리케이션을 시장에 출시하기 위해서는 가속화된 컴퓨팅의 효율성이 필요합니다.

엔비디아 H100 GPU는 4세대 텐서 코어, LLM 가속화를 위한 새로운 트랜스포머 엔진, 초당 900GB의 속도로 GPU가 서로 통신할 수 있는 최신 NV링크 기술 등의 아키텍처 혁신을 통해 슈퍼 컴퓨팅급 성능을 제공합니다.

P5 인스턴스로 확장

아마존 EC2 P5 인스턴스는 점점 더 복잡해지는 LLM 및 컴퓨터 비전 모델을 위한 추론 훈련 및 실행에 이상적인 서비스입니다. 이러한 뉴럴 네트워크(Neural network)는 질문 답변, 코드 생성, 영상 및 이미지 생성, 음성 인식 등 가장 까다롭고 컴퓨팅 집약적인 생성형 AI 애플리케이션을 구동합니다.

P5 인스턴스는 클라우드의 고성능 컴퓨팅, 네트워킹, 스토리지로 구성된 하이퍼스케일 클러스터인 EC2 울트라클러스터(EC2 UltraClusters)에 배포할 수 있습니다. 각 EC2 울트라클러스터는 강력한 슈퍼컴퓨터로, 고객이 여러 시스템에서 가장 복잡한 AI 트레이닝과 분산된 HPC 워크로드를 실행할 수 있도록 지원합니다.

컴퓨팅 노드 간에 높은 수준의 통신이 필요한 대규모 애플리케이션을 실행할 수 있도록 P5 인스턴스는 아마존 EC2 인스턴스를 위한 3,200Gbps 네트워크 인터페이스인 AWS EFA를 기반으로 하는 페타비트 규모의 논블럭킹 네트워크를 지원합니다.

P5 인스턴스를 통해 머신 러닝 애플리케이션은 엔비디아 콜랙티브 커뮤니케이션 라이브러리(NVIDIA Collective Communications Library)를 사용하여 최대 20,000개의 H100 GPU를 사용할 수 있습니다.

엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)는 100개 이상의 프레임워크, 사전 학습된 모델, AI 워크플로우와 AI 인프라 조정을 위한 도구가 포함된 풀스택 소프트웨어 제품군을 통해 사용자가 P5 인스턴스를 최대한 활용할 수 있도록 지원합니다.

AI 애플리케이션의 개발 및 배포를 간소화하도록 설계된 엔비디아 AI 엔터프라이즈는 고성능의 안전한 클라우드 네이티브 AI 소프트웨어 플랫폼 구축 및 유지 관리의 복잡성을 해결합니다. AWS 마켓플레이스에서 사용할 수 있으며, 지속적인 보안 모니터링, 일반적인 취약성과 노출에 대한 정기적이고 시기 적절한 패치, API 안정성, 엔터프라이즈 지원은 물론 엔비디아 AI 전문가의 지원까지 제공합니다.

주요 고객들의 후기

엔비디아와 AWS는 클라우드에 GPU 가속화를 제공하기 위해 지난 10여년 동안 협력해 왔습니다. 이러한 협업의 최신 사례인 새로운 P5 인스턴스는 개발자가 차세대 AI를 개발할 수 있는 최첨단 성능을 제공하기 위한 중요한 진전을 의미합니다.

다음은 현재 사용하고 있는 고객 사례들입니다:

Anthropic은 신뢰할 수 있고 해석 가능하며 조정 가능한 AI 시스템을 구축하여 상업적으로나 공익을 위해 가치를 창출할 수 있는 많은 기회를 갖게 될 것입니다.

“오늘 날의 대규모 일반 AI 시스템은 상당한 이점을 제공할 수 있지만 예측할 수 없고 신뢰할 수 없으며 불투명할 수 있으므로 이러한 문제를 해결하고 사람들이 유용하다고 생각하는 시스템을 배포하는 것이 저희의 목표입니다.”라고 Anthropic의 공동 설립자 Tom Brown이 밝혔습니다. “P5 인스턴스는 P4d 인스턴스보다 상당한 가격 대비 성능 이점을 제공할 것으로 기대하며, 차세대 LLM 및 관련 제품을 구축하는 데 필요한 대규모로 사용할 수 있을 것입니다.”

언어 AI 분야의 선도적인 선구자인 Cohere는 모든 개발자와 기업이 데이터를 안전하게 보호하면서 세계 최고의 자연어 처리(NLP) 기술로 제품을 구축할 수 있도록 지원합니다.

“Cohere는 모든 기업이 언어 AI의 힘을 활용하여 자연스럽고 직관적인 방식으로 정보를 탐색, 생성, 검색, 그리고 조치하고, 각 고객에게 가장 적합한 데이터 환경에서 여러 클라우드 플랫폼에 배포할 수 있도록 지원하는 데 앞장서고 있습니다.”라고 Cohere의 CEO인 Aidan Gomez는 말합니다. “엔비디아 H100 기반 아마존 EC2 P5 인스턴스는 컴퓨팅 성능과 Cohere의 최첨단 LLM 및 생성형 AI 기능을 결합하여 기업이 더 빠르게 생성, 성장 및 확장할 수 있는 능력을 발휘할 것입니다.”라고 소감을 마쳤습니다.

Hugging Face는 우수한 머신러닝을 대중화시킨다는 사명을 가지고 있습니다.

“저희는 머신 러닝을 위한 가장 빠르게 성장하는 오픈 소스 커뮤니티로서, 우리는 NLP, 컴퓨터 비전, 생물학, 강화 학습 등을 위한 플랫폼에서 150,000개 이상의 사전 학습된 모델과 25,000개 이상의 데이터 세트를 제공하고 있습니다.”라고 Hugging Face의 최고 기술 책임자이자 공동 창립자인 Julien Chaumond는 밝혔습니다. “저희는 모든 사람을 위한 새로운 파운데이션 AI 모델의 제공을 가속화하기 위해 EFA가 포함된 UltraClusters에서 Amazon SageMaker를 통해 아마존 EC2 P5 인스턴스를 대규모로 사용할 수 있다는 사실에 매우 기대하고 있습니다.”

오늘날 전 세계 4억5천만 명 이상의 사람들이 Pinterest를 시각적 영감 플랫폼으로 사용하여 자신의 취향에 맞는 제품을 쇼핑하고, 아이디어를 찾고, 영감을 주는 크리에이터와 만나고 있습니다.

“저희는 플랫폼에 업로드되는 수십억 장의 사진에 라벨을 붙이고 분류하는 작업과 사용자가 영감에서 행동으로 옮길 수 있는 시각적 검색과 같은 사용 사례를 위해 플랫폼 전반에 걸쳐 딥러닝을 광범위하게 사용하고 있습니다.”라고 Pinterest의 수석 아키텍트인 David Chaiken이 밝혔습니다. “엔비디아 H100 GPU, AWS EFA, 울트라클러스터가 탑재된 아마존 EC2 P5 인스턴스를 사용하여 제품 개발을 가속화하고 고객에게 새로운 공감형 AI 기반 경험을 제공할 수 있기를 기대하고 있습니다.”라고 소감을 마쳤습니다.

엔비디아 H100 기반의 새로운 AWS P5 인스턴스에 대해 자세히 알아보세요.

출처 - 엔비디아

Facebook Twitter Google Pinterest

Atachment
첨부 '1'	aws_nvidia.JPG,

위로 아래로 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

SK하이닉스, 생성형 AI에 특화된 GDDR6-AiM 기반 가속기 카드 ‘AiMX’ 시제품 최초...

SK하이닉스가 지난 12일(미국시간)부터 사흘간 미국 캘리포니아주 메리어트 산타클라라 호텔에서 열린 ‘AI Hardware & Edge AI Summit(이하 AI 서밋) 2023’에서 GDDR6-AiM 기반의 생성형 A...

Date2023.09.18 CategorySRV Views446

Read More
엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

엔비디아® L40S GPU를 탑재한 엔비디아 OVX™ 서버가 공개되었습니다! 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse)™ 플랫폼을 통해 AI 훈련과 추론, 3D 디자인과 시각...

Date2023.08.09 CategorySRV Views361

Read More
엔비디아 H100 GPU, 이제 AWS 클라우드에서 이용

이제 AWS 사용자라면 업계 벤치마크에서 입증된 강력한 AI 훈련 및 추론 성능에 액세스할 수 있답니다! 이 거대한 클라우드 기업은 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)로 ...

Date2023.07.31 CategorySRV Views316

Read More
엔비디아, 하이퍼스케일 생성형 AI용 가속 이더넷 플랫폼 ‘엔비디아 스펙트럼-X’ 출시

엔비디아 스펙트럼-X™(NVIDIA Spectrum-X™)이 출시되었습니다. 스펙트럼-X는 이더넷 기반 AI 클라우드의 성능과 효율을 개선하도록 고안된 가속 네트워킹 플랫폼입니다. 엔비디아 스펙트럼-X는 엔비디...

Date2023.06.05 CategorySRV Views232

Read More
NVIDIA Announces Third-Generation OVX Computing Systems to Power Industrial Metaverse Applications

Digitalization that combines AI and simulation is redefining how industrial products are created and transforming how people interact with the digital world. To help enterprises tackle c...

Date2023.03.26 CategorySRV Views249

Read More
인텔, 엔비디아 A100 성능을 뛰어넘는 2세대 하바나 가우디2 성능 공개

하바나 가우디2 메자닌 카드 하바나 가우디2 메자닌 카드 이미지 2022년 5월 10일, AI 딥러닝 프로세서 기술에 중점을 둔 인텔의 데이터 센터 팀인 하바나 랩스는 학습 및 추론을 위한 2세대 딥 러...

Date2022.10.01 CategorySRV Views468

Read More
삼성전자, 인공지능 탑재 메모리 제품군 확대

삼성전자가 AI엔진을 탑재한 메모리 반도체 제품군을 확대한다. 삼성전자는 메모리와 시스템반도체의 융복합화를 주도하며, 다양한 글로벌 기업들과 협력을 통해 차세대 메모리 반도체 생태계를 빠르게 ...

Date2021.08.24 CategorySRV Views1092

Read More
인텔, 서버 타겟 새로운 제온 W-3300 프로세서 시리즈 발표

인텔이 최신 Intel Xeon W-3300 프로세서 시리즈를 출시했다. Intel Xeon W-3300 프로세서는 스레드가 많고 입출력 집약적인 워크로드에 특화되어 전문 응용 프로그램을 위해 설계됐다. 그에 따라 ...

Date2021.08.02 CategorySRV Views340

Read More
HBM2E 통합 Xilinx Versal HBM 시리즈 발표, 네트워크 및 클라우드 빅데이터 대응

적응형 컴퓨팅의 선두주자인 자일링스(Xilinx, Inc)가 Versal 포트폴리오의 최신 시리즈인 Versal HBM 적응형 컴퓨팅 가속 플랫폼(ACAP)을 출시했다. Versal HBM 시리즈는 단일 플랫폼에서 빠른 메모리, ...

Date2021.07.18 CategorySRV Views295

Read More
인텔, 10나노 Ice Lake 기반 3세대 Xeon 스케일러블 프로세서 출시

인텔이 오늘 출시한 3세대 인텔® 제온® 스케일러블(Intel® Xeon® Scalable) 프로세서는 고객이 멀티 클라우드 환경에 최적화된 유연한 인프라를 구축할 수 있도록 설계되었으며, 5G 네트워킹, 인공지능(...

Date2021.04.17 CategorySRV Views556

Read More
삼성전자, 세계 최초 인공지능 HBM-PIM 개발

삼성전자가 세계 최초로 메모리 반도체와 인공지능 프로세서를 하나로 결합한 HBM-PIM(Processing-in-Memory)을 개발했다. PIM(Processing-in-Memory)은 메모리 내부에 연산 작업에 필요한 프로세서 ...

Date2021.02.17 CategorySRV Views254

Read More
Microsoft, 클라우드 게임 서비스 xCloud의 웹 버전 테스트 시작

The Verge에 따르면 Microsoft가 클라우드 게임 서비스 xCloud의 웹 사이트 내부 테스트를 시작한 것으로 확인됐다. 이는 Microsoft에 정통한 관계 소식통의 정보로 퍼블릭 프리뷰 전에 종업원...

Date2021.02.16 CategorySRV Views280

Read More
Western Digital, 18TB G-Technology G-DRIVE, G-RAID, G-SPEED 발표

웨스턴디지털(Western Digital)은 업계 최고 용량의 Ultrastar HDD를 전문가의 강력한 크리에이티브 워크 플로우에 대응하기 위한 솔루션을 제공 할 것이라고 발표했다. 상용 엔터프라이즈 급 18...

Date2020.07.28 CategorySRV Views1694

Read More
QNAP, 최초의 2.5GbE 네트워크 스위치 QSW-1105-5T 출시

네트워킹 및 스토리지 솔루션 전문 업체 QNAP Systems, Inc.은 최초의 2.5GbE 네트워크 스위치 QSW-1105-5T를 출시했다. QSW-1105-5T는 5개의 2.5GbE 포트, 플러그 앤 플레이 설정, 자동 루프 감지 ...

Date2020.07.18 CategorySRV Views2035

Read More
시스코(Cisco) 위조 스위치 유통? 확인 및 주의 필요

보안업체 F-Secure는 15일(현지시간), 미국 시스코(Cisco Systems)의 기업용 스위치 Catalyst 2960-X의 위조품이 유통되고 있는 것이 확인되었다고 주의를 당부했다. 이것은 Catalyst2960-X를 도입한 기...

Date2020.07.18 CategorySRV Views2397

Read More
Graphcore, 7나노 AI 프로세서 'IPU-Machine M2000' 발표

Graphcore는 AI(인공지능) 전용 IPU(Intelligence Processing Unit) 플랫폼으로 IPU-Machine M2000을 발표했다. IPU-Machine M2000은 1U 랙 제품으로, 동사가 개발한 새로운 프로세서 Colossus Mk2 ...

Date2020.07.18 CategorySRV Views2042

Read More
HPE Nimble Storage dHCI 발표, 심플함과 확장성을 양립

휴렛 팩커드 엔터프라이즈(HPE)는 하이퍼 컨버지드 인프라(HCI) 플랫폼의 신제품으로 HPE Nimble Storage dHCI의 제공을 시작했다. 모델명 dHCI 중 d의 의미는 disaggregate로 구성요소로 나...

Date2020.02.02 CategorySRV Views436

Read More
시스코(Cisco), AMD CEO 리사수를 이사회에 임명

네트워크 장비 전문 기업 시스코(Cisco)가 AMD 회장 겸 CEO 리사수(Lisa T. Su) 박사를 자사 이사회에 임명한다고 발표했다. Cisco CEO 척 로빈스(Chuck Robbins)는 “리사수는 반도체 산업에 대한 깊...

Date2020.02.02 CategorySRV Views320

Read More
HighPoint, 최대 14GB/s 속도의 M.2 NVMe SSD 4베이 스토리지 발표

HighPoint가 M.2 NVMe SSD 대응 드라이브 베이를 4기 갖춘 외장형 SSD 인클로저 SSD6540M을 발매했다. SSD6540M은 외장 SSD 인클로저와 PCI Express 3.0 x16 접속의 컨트롤러 카드 및 그것들을 접속...

Date2020.01.19 CategorySRV Views313

Read More
HPE 서버용 특정 SAS SSD, 가동 32,768시간이 넘으면 데이터 상실?

Hewlett Packard Enterprise(HPE)가 지난 11월 29일 공개한 문서에 따르면 동사의 서버와 스토리지 제품에 사용되는 특정 SAS SSD에서 가동 시간이 32,768시간을 넘으면 복구가 불가능한 심각한 오류가 발...

Date2020.01.19 CategorySRV Views497

Read More