V3의 성능과 오픈AI의 GPT-4o, 페이스북 모회사 메타플랫폼(이하 메타)의 AI 모델 라마 3.1, 앤스로픽의 AI 모델 클로드 3.5 소네트를 비교했다. 딥시크는 V3가 22개 평가 테스트 가운데 13개 부문에서 다른 경쟁 모델 중 가장 뛰어났다고 설명했다. V3는 선별된 500개의 수학 문제 테스트(MATH-500)에서 90.2%의 정확도를 보여 80%에 그친 다른 모델보다 앞서나갔다. 다중 언어 코드 생성 평가(HumanEval-Mul)에서는 82.6%로 GPT-4o(80.5%)와 라마3.1(77.2%)을 앞섰다.
원문보기 - https://n.news.naver.com/mnews/article/016/0002421477
원문보기 - https://n.news.naver.com/mnews/article/016/0002421477