1월 13일 (월) 오후 1:56

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

Mission: Impossible – The Final Reckoning | Teaser Trailer (2025 Movie) - Tom Cruise
Top Gun 3 is officially in production! 탑건 시리즈의 세 번째 영화 주연 : 톰 크루즈 등

NVIDIA는 오늘 개발자가 의료, 금융, 제조, 리테일 및 기타 모든 산업 분야의 상용 애플리케이션을 위한 거대 언어 모델(LLM)을 훈련하기 위한 합성 데이터를 생성하는 데 사용할 수 있는 개방형 모델 제품군인 Nemotron-4 340B를 발표했습니다.

고품질 학습 데이터는 맞춤형 LLM의 성능, 정확도 및 응답 품질에 중요한 역할을 하지만, 강력한 데이터 세트는 엄청나게 비싸고 접근하기 어려울 수 있습니다.

독특하게 허용되는 개방형 모델 라이선스를 통해 Nemotron-4 340B는 개발자에게 강력한 LLM을 구축하는 데 도움이 되는 합성 데이터를 무료로 확장 가능한 방식으로 생성할 수 있는 방법을 제공합니다.

Nemotron-4 340B 제품군에는 LLM의 훈련 및 개선에 사용되는 합성 데이터를 생성하는 파이프라인을 구성하는 기본, 인스트럭트 및 보상 모델이 포함되어 있습니다. 이 모델들은 데이터 큐레이션, 커스터마이징, 평가를 포함한 엔드투엔드 모델 트레이닝을 위한 오픈 소스 프레임워크인 NVIDIA NeMo와 함께 작동하도록 최적화되어 있습니다. 또한 오픈 소스 NVIDIA TensorRT-LLM 라이브러리를 사용한 추론에도 최적화되어 있습니다.

Nemotron-4 340B는 지금 NVIDIA NGC 카탈로그와 Hugging Face에서 다운로드할 수 있습니다. 개발자들은 곧 ai.nvidia.com에서 이 모델에 액세스할 수 있으며, 표준 애플리케이션 프로그래밍 인터페이스가 포함된 NVIDIA NIM 마이크로서비스로 패키징되어 어디서나 배포할 수 있게 될 것입니다.

합성 데이터 생성을 위한 Nemotron 탐색하기

LLM은 개발자가 대규모의 다양한 레이블이 지정된 데이터 세트에 대한 액세스가 제한된 시나리오에서 합성 훈련 데이터를 생성하는 데 도움이 될 수 있습니다.

Nemotron-4 340B Instruct 모델은 실제 데이터의 특성을 모방한 다양한 합성 데이터를 생성하여 데이터 품질을 개선함으로써 다양한 도메인에서 맞춤형 LLM의 성능과 견고성을 높일 수 있도록 지원합니다.

그런 다음 개발자는 AI 생성형 데이터의 품질을 높이기 위해 Nemotron-4 340B Reward 모델을 사용하여 고품질 응답을 필터링할 수 있습니다. Nemotron-4 340B Reward는 유용성, 정확성, 일관성, 복잡성, 장황함의 다섯 가지 속성에 따라 응답의 등급을 매깁니다. 현재 AI2가 보상 모델의 기능, 안전성 및 함정을 평가하기 위해 만든 Hugging Face RewardBench 리더보드에서 1위를 차지하고 있습니다.

Synthetic-Data-Generation-Pipeline-scale

이 합성 데이터 생성 파이프라인에서는 (1) Nemotron-4 340B Instruct 모델이 먼저 합성 텍스트 기반 출력을 생성하는 데 사용됩니다. 그런 다음 평가자 모델인 (2) Nemotron-4 340B Reward가 이 생성된 텍스트를 평가하여 반복적인 개선을 안내하고 합성 데이터가 정확하고 관련성이 있으며 특정 요구사항에 부합하는지 확인하는 피드백을 제공합니다.

또한 연구자는 포함된 HelpSteer2 데이터 세트와 결합된 자체 데이터를 사용하여 Nemotron-4 340B 기본 모델을 사용자 지정하여 자체 지침 또는 보상 모델을 만들 수 있습니다.

NeMo를 통한 파인 튜닝, TensorRT-LLM을 통한 추론 최적화

개발자는 오픈 소스 NVIDIA NeMo 및 NVIDIA TensorRT-LLM을 사용하여 지시 및 보상 모델의 효율성을 최적화하여 합성 데이터를 생성하고 응답을 점수화할 수 있습니다.

모든 Nemotron-4 340B 모델은 개별 가중치 행렬을 여러 GPU와 서버에 분할하여 대규모로 효율적으로 추론할 수 있는 모델 병렬화의 일종인 Tensor 병렬화를 활용하도록 TensorRT-LLM으로 최적화되어 있습니다.

9조 개의 토큰으로 훈련된 Nemotron-4 340B Base는 특정 사용 사례나 도메인에 맞게 NeMo 프레임워크를 사용하여 사용자 정의할 수 있습니다. 이 파인 튜닝 프로세스는 광범위한 사전 학습 데이터를 활용하여 특정 다운스트림 작업에 대해 보다 정확한 결과물을 산출합니다.

감독형 파인 튜닝과 로우랭크 적응 또는 LoRA와 같은 파라미터 효율적인 파인 튜닝 방법 등 다양한 커스터마이징 방법을 NeMo 프레임워크를 통해 사용할 수 있습니다.

모델 품질을 향상시키기 위해 개발자는 NeMo Aligner와 Nemotron-4 340B Reward로 주석이 달린 데이터 세트를 사용하여 모델을 정렬할 수 있습니다. 얼라인먼트는 인간의 피드백을 통한 강화 학습(RLHF)과 같은 알고리즘을 사용하여 모델의 동작을 파인 튜닝하여 안전하고 정확하며 상황에 적합하고 의도한 목표와 일치하는 결과물을 보장하는 LLM 학습의 핵심 단계입니다.

프로덕션 환경에 대한 엔터프라이즈급 지원과 보안을 원하는 기업은 생성형 AI 파운데이션 모델을 위한 가속화된 효율적인 런타임을 제공하는 클라우드 네이티브 NVIDIA AI 엔터프라이즈 소프트웨어 플랫폼을 통해 NeMo 및 TensorRT-LLM에 액세스할 수도 있습니다.

모델 보안 평가 및 시작하기

Nemotron-4 340B Instruct 모델은 적대적 테스트를 포함한 광범위한 안전성 평가를 거쳤으며, 광범위한 위험 지표에서 우수한 성능을 보였습니다. 하지만 사용자는 합성적으로 생성된 데이터가 사용 사례에 적합하고 안전하며 정확한지 확인하기 위해 모델의 출력을 신중하게 평가해야 합니다.

모델 보안 및 안전성 평가에 대한 자세한 내용은 모델 카드를 참조하세요.

NVIDIA NGC 및 Hugging Face를 통해 Nemotron-4 340B 모델을 다운로드하세요. 자세한 내용은 모델 및 데이터 세트에 대한 연구 논문을 읽어보세요.

 

출처 - https://blogs.nvidia.co.kr/blog/nemotron-4-synthetic-data-generation-llm-training/






  1. SK하이닉스, 세계 최초 10나노급 6세대 D램 ‘1c DDR5’ 개발

    · 세계 최고 성능 1b 플랫폼 확장해 가장 효율화된 방식으로 1c 개발 · 신규 소재 적용, EUV 공정 최적화 통해 원가 경쟁력 확보… 전력효율도 개선해 데이터센터 전력비용 최대 30% 절감 · 연내 양산 준...
    Date2024.08.29 CategoryMEMORY Views756
    Read More
  2. NVIDIA, 거대 언어 모델 훈련용 개방형 합성 데이터 생성 파이프라인 출시

    NVIDIA는 오늘 개발자가 의료, 금융, 제조, 리테일 및 기타 모든 산업 분야의 상용 애플리케이션을 위한 거대 언어 모델(LLM)을 훈련하기 위한 합성 데이터를 생성하는 데 사용할 수 있는 개방형 모델 제품...
    Date2024.07.04 CategorySRV Views651
    Read More
  3. SK하이닉스, 생성형 AI에 특화된 GDDR6-AiM 기반 가속기 카드 ‘AiMX’ 시제품 최초...

    SK하이닉스가 지난 12일(미국시간)부터 사흘간 미국 캘리포니아주 메리어트 산타클라라 호텔에서 열린 ‘AI Hardware & Edge AI Summit(이하 AI 서밋) 2023’에서 GDDR6-AiM 기반의 생성형 A...
    Date2023.09.18 CategorySRV Views608
    Read More
  4. 엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

    엔비디아® L40S GPU를 탑재한 엔비디아 OVX™ 서버가 공개되었습니다! 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse)™ 플랫폼을 통해 AI 훈련과 추론, 3D 디자인과 시각...
    Date2023.08.09 CategorySRV Views514
    Read More
  5. 엔비디아 H100 GPU, 이제 AWS 클라우드에서 이용

      이제 AWS 사용자라면 업계 벤치마크에서 입증된 강력한 AI 훈련 및 추론 성능에 액세스할 수 있답니다! 이 거대한 클라우드 기업은 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)로 ...
    Date2023.07.31 CategorySRV Views467
    Read More
  6. Solidigm, 세계 최대 61테라바이트 서버용 SSD 발표

    SSD 제조사 Solidigm은 24일, 세계 최대 용량을 자랑하는 61.44테라바이트(TB) 서버용 D5-P5336을 발표했다. 현재 E1.L 폼팩터로 최대 30.72TB의 용량을 제공하기 시작했으며 올해 하반기에는 61.44TB의 용...
    Date2023.07.25 CategorySSD Views392
    Read More
  7. 삼성전자, 업계 최초 GDDR7 D램 개발

    삼성전자가 차세대 그래픽 시장의 성장을 주도할 ‘32Gbps GDDR7(Graphics Double Data Rate) D램’을 업계 최초로 개발했다. * Gbps(Gigabit per second): 1초당 전송되는 기가비트 단위의 데이터 삼성...
    Date2023.07.21 CategoryMEMORY Views380
    Read More
  8. 엔비디아, 하이퍼스케일 생성형 AI용 가속 이더넷 플랫폼 ‘엔비디아 스펙트럼-X’ 출시

    엔비디아 스펙트럼-X™(NVIDIA Spectrum-X™)이 출시되었습니다. 스펙트럼-X는 이더넷 기반 AI 클라우드의 성능과 효율을 개선하도록 고안된 가속 네트워킹 플랫폼입니다. 엔비디아 스펙트럼-X는 엔비디...
    Date2023.06.05 CategorySRV Views413
    Read More
  9. NVIDIA Announces Third-Generation OVX Computing Systems to Power Industrial Metaverse Applications

    Digitalization that combines AI and simulation is redefining how industrial products are created and transforming how people interact with the digital world. To help enterprises tackle c...
    Date2023.03.26 CategorySRV Views387
    Read More
  10. 삼성전자 '1Tb(테라비트) 8세대 V낸드’ 양산

    삼성전자가 세계 최고 용량의 ‘1Tb(테라비트) 8세대 V낸드’ 양산에 들어갔다.   삼성전자 ‘1Tb TLC(Triple Level Cell) 8세대 V낸드’는 업계 최고 수준의 비트 밀도(Bit Density)의 고용량제품으로, 웨...
    Date2022.11.17 CategoryTECH Views516
    Read More
  11. Meta, 퀘스트 프로(Quest Pro) 발표, Snapdragon XR2+ 탑재 및 광학성능 개선

    미국 메타는 11일(현지시간) VR 헤드셋 '퀘스트 프로'를 발표했다. 총 10개의 센서를 통해 MR 커뮤니케이션을 가능하게 한 VR 헤드셋으로, 지난 5월 프로젝트 캠브리아로 2022...
    Date2022.10.13 CategoryGLOBAL Views570
    Read More
  12. 인텔, 엔비디아 A100 성능을 뛰어넘는 2세대 하바나 가우디2 성능 공개

      하바나 가우디2 메자닌 카드 하바나 가우디2 메자닌 카드 이미지 2022년 5월 10일, AI 딥러닝 프로세서 기술에 중점을 둔 인텔의 데이터 센터 팀인 하바나 랩스는 학습 및 추론을 위한 2세대 딥 러...
    Date2022.10.01 CategorySRV Views535
    Read More
  13. [체험기] “게이밍에 진심” 오디세이 아크, 로스트아크에 상륙하다

    2022 게임스컴과 IFA에서 전 세계 게이머들의 주목을 받은 오디세이 아크가 대한민국의 대표 인기 게임 ‘로스트아크’와 만났다. 화려한 그래픽과 탄탄한 세계관으로 많은 게이머들의 꾸준한 사랑을 받고 ...
    Date2022.09.25 CategoryGLOBAL Views428
    Read More
  14. 세계 가전 황제 LG, 올레드 TV 1분기 출하량 역대 최대

    LG전자의 최상위 프리미엄 라인업인 LG 올레드 TV가 역대 1분기 출하량 기록을 새롭게 썼다. 세계 시장 수요 위축에도 불구하고 LG 올레드 TV는 압도적 화질과 디자인의 고객 가치를 인정받으며 차세대 프...
    Date2022.06.03 CategoryGLOBAL Views1439
    Read More
  15. LG전자, 울트라기어 고성능 게이밍 모니터 3종 출시

    LG전자는 ▲고사양 게임을 쾌적하게 즐기기 위한 최적의 게이밍 성능과 ▲선명한 화질 ▲다양한 편의 기능과 연결성까지 두루 갖춘 LG 울트라기어 게이밍 모니터 신제품 3종(모델명: 32GQ950, 32GQ850, 48GQ...
    Date2022.06.03 CategoryLCD Views1517
    Read More
  16. LG전자, 獨 「메르세데스-벤츠 AG」에 ‘올레드 기반 인포테인먼트 시스템’ 공급

    LG전자가 독일 자동차 제조사 「메르세데스-벤츠(Mercedes-Benz) AG」에 플라스틱 올레드(Plastic OLED, 이하 P-OLED) 기반 인포테인먼트(IVI; In-Vehicle Infotainment) 시스템을 공급했다. LG전자와 메...
    Date2022.01.15 CategoryGLOBAL Views3298
    Read More
  17. 소니, ‘CES 2022’에서 혁신 기술 및 이니셔티브 공개

    소니는 1월 5일부터 1월 7일까지(현지시간), 미국 네바다주 라스베이거스에서 온 · 오프라인으로 개최되는 세계 최대 국제전자쇼 ‘CES 2022(Consumer Electronics Show 2022)’에 참가해 미래 혁신을 이끌...
    Date2022.01.06 CategoryGLOBAL Views3512
    Read More
  18. LG전자, CES 2022서 고객 위한 혁신 제품 및 솔루션 공개

    LG전자가 美 현지시간 이달 4일부터 31일까지 4주간 ‘모두가 누릴 수 있는 더 좋은 일상(The Better Life You Deserve)’을 주제로 CES 2022 온라인 전시관을 열고 고객경험 혁신을 위한 제품과 솔루션을 대...
    Date2022.01.06 CategoryGLOBAL Views3462
    Read More
  19. Apple AR 헤드셋, M1 동급 프로세서 탑재로 내년 10~12월 발매?

    맥루머스(MacRumors)가 Apple 관련 정보로 유명한 Ming-ChiKuo의 정보로 Apple이 2022년 4분기(2022년 10~12월)에 M1 칩과 비슷한 레벨의 프로세서를 탑재한 AR(증강현실) 헤드셋을 발매할 것 같다고 ...
    Date2021.11.27 CategoryNET Views3393
    Read More
  20. 삼성전자, 차세대 2.5D 패키징 솔루션 ‘H-Cube’ 개발

    삼성전자가 반도체 패키징 기술 혁신을 통해 고성능 반도체용 2.5D 패키징 솔루션 ‘H-Cube(Hybrid-Substrate Cube)’를 개발하고, 고성능 반도체 공급을 확대한다. 삼성전자는 기존 2.5D 패키징 솔루션 I-...
    Date2021.11.27 CategoryMEMORY Views3187
    Read More
  21. 샤오미(Xiaomi), 모바일 장치를 위한 새로운 수냉 기술 공개

    Xiaomi는 열 방출의 최신 기술인 Loop Liquid Cool Technology를 발표했다. 항공 우주 산업에서 사용되는 냉각 솔루션에서 영감을 받은 Loop Liquid Cool Technology는 액체 냉각제를 열원으로 기화...
    Date2021.11.09 CategoryCOOL Views2305
    Read More
  22. LG전자, 울트라기어 게이밍스피커 출시

    LG전자가 LG 울트라기어(UltraGearTM) 게이밍스피커를 출시하며 게이밍 시장 공략을 가속화한다. LG 울트라기어는 고성능 게이밍 기기 브랜드로, 승리를 안겨주는 최강의 무기라는 의미를 담았다. LG전자...
    Date2021.08.30 CategoryTECH Views1045
    Read More
  23. 삼성전자, 인공지능 탑재 메모리 제품군 확대

    삼성전자가 AI엔진을 탑재한 메모리 반도체 제품군을 확대한다. 삼성전자는 메모리와 시스템반도체의 융복합화를 주도하며, 다양한 글로벌 기업들과 협력을 통해 차세대 메모리 반도체 생태계를 빠르게 ...
    Date2021.08.24 CategorySRV Views1156
    Read More
  24. AMD, RDNA 2 기반 전문가용 카드 Radeon PRO W6000 발매

    AMD가 RDNA 2 아키텍처를 채용한 전문가용 카드 Rade on PRO W66000을 발매했다. 2021년 6월에 발표된 W6000 시리즈에 속하는 라인업으로 건축 분야에서 복잡한 설계, 엔지니어링 시뮬레이션, 레이트...
    Date2021.08.12 CategoryGPU Views710
    Read More
  25. NVIDIA, Ampere 아키텍처 기반 전문가용 NVIDIA RTX A2000 발표

    NVIDIA가 전문가 전용 미들레인지 GPU, NVIDIA RTX A2000을 발표했다. RTX A2000은 전문가용 RTX 시리즈 GPU로는 최초의 미들레인지 제품으로 Ampere 아키텍처를 채택하여 3328기 CUDA 코어, 26기 2세대...
    Date2021.08.12 CategoryGPU Views493
    Read More
  26. LG전자, ‘LG 울트라기어’ 모니터 신제품 34GP950G 출시

    LG전자가 게이밍 모니터 ‘LG 울트라기어’ 34형 신제품을 출시한다. 신제품(모델명: 34GP950G)은 글로벌 그래픽 전문 ‘엔비디아’社가 인증하는 디스플레이 기술 중 최상위 버전인 지싱크 얼티밋(G-SYNC® UL...
    Date2021.08.06 CategoryLCD Views298
    Read More
  27. 인텔, 서버 타겟 새로운 제온 W-3300 프로세서 시리즈 발표

    인텔이 최신 Intel Xeon W-3300 프로세서 시리즈를 출시했다. Intel Xeon W-3300 프로세서는 스레드가 많고 입출력 집약적인 워크로드에 특화되어 전문 응용 프로그램을 위해 설계됐다. 그에 따라 ...
    Date2021.08.02 CategorySRV Views445
    Read More
  28. 삼성전자, 커브드 게이밍 오디세이 Neo G9 출시

    삼성전자가 업계 최초로 커브드 게이밍 모니터에 미니 LED를 적용한 ‘오디세이 Neo(Odyssey Neo) G9’을 국내를 포함한 전 세계 주요 시장에 29일 출시한다. 오디세이 Neo G9(모델명 S49AG950)은 49형 크...
    Date2021.07.28 CategoryLCD Views406
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 66 Next
/ 66