4월 19일 (금) 오전 12:17

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2023.11.22. / 등급: 12세 관람가 / 장르: 드라마 / 국가: 대한민국 감독 : 김성수 출연 : 황정민, 정우...
노량: 죽음의 바다 / 개봉 2023.12. / 장르: 액션, 드라마 / 국가: 대한민국 감독 : 김한민 출연 : 김윤석, ...

ARM은 미국 새너제이에서 동사의 기술 콘퍼런스 "ARM Techcon"을 10월 8일~10일까지 개최했다. 첫날 키노트 스피치에서는 차 차세대 Cortex-A 클래스 CPU 코어 아키텍처 "Matterhorn(매터호른/매터폰)의 신 연산 명령이나 Cortex-A코어로의 사이드 채널 어택 대응 보안 기능 실장, Cortex-M의 커스텀 명령 도입, 게임 엔진 Unity의 ARM 코어군에 최적화 등이 발표되었다. 새로운 서버 CPU 코어 IP 등도 컨퍼런스 기간중에 발표될 전망이다.

 

Arm의 Ian Smythe(Vice President Marketing Operations, Arm)는 Cortex계 CPU 코어의 향후 기술적인 방향에 대해 설명했다.그는 업계의 트렌드로서 반도체 프로세스가 점점 복잡해져 고비용으로 변하고 있다고 지적했다. 그 문제에 대한 확실한 해답은 도메인 스페시피크(영역특화) 컴퓨팅이라고 설명한다.


083_l.jpg
095_l.jpg

 

또 사이버 범죄가 큰 과제가 되고 있어 제품 포커스에서 솔루션 포커스로 바뀌고 있는 것, IP의 경계를 넘어 최적화할 필요가 있음을 지적했다. 그런 문제에 대해 Arm은 시스템적 접근으로 "토탈 컴퓨트(Total Compute)"를 추진한다.


1_l.jpg


Arm이 토탈컴퓨트라고 말하는 것은 컴퓨팅의 성능을 끌어올릴 뿐만 아니라 보안이나 소프트웨어&툴까지 포괄적인 솔루션의 제안이다. 토탈컴퓨트 자체는 마케팅 캐치프레이즈지만 수요적인 요소를 포함하고 있다.

 

098_l.jpg


Matterhorn에서는 새 명령어 집합 ARMv8.6-A 서포트

우선 성능 확장이 도메인 스페시픽 확장으로서 심층 학습용 새 명령을 Matterhorn에 도입한다. 새 명령에 의해 기계 학습 매트릭스 연산 성능을 Cortex-A73보다 10배로 끌어올린다.

 

"기계 학습에서는 Cortex-A75/55에 닷 프로덕트 명령을(SIMD)에 도입했다. Cortex-A76에서는 성능을 2배로 올렸다. 그리고 Hercules 후 세대가 되는 Matterhorn에서는 k, 새로운 명령을 아키텍처에 도입한다. 매트릭스 곱셈(Matrix Multiply), 『 MatMul』라고 부르는 명령으로 CPU의 성능이 더 많이 오른다"고 Smythe는 말한다.


112_l.jpg
117_l.jpg


Arm의 Cortex-A/Neoverse 클래스 CPU 명령 세트는 "ARMv8-A", 현재 ARMv8-A는 소수점 아래 버전업이 계속되고 있다. 이번에 발표된 새로운 매트릭스 곱셈 명령 MatMul은 차기 버전의 "ARMv8.6-A"에서 끌어들인다. CPU에 벡터 명령뿐만 아니라 매트릭스 연산형의 명령이 더해지게 된다. NVIDIA가 벡터프로세서인 GPU에 본격적인 매트릭스 연산 유닛 "텐서코어"를 넣은 예와는 조금 다르다.


ARM이 ARMv8.6에서 스캔 매트릭스 명령 MatMul의 실행 유닛은 비교적 소규모 유닛이다.레지스터도 128-bit의 기존 벡터장을 쓴다. 데이터 밀도는 16-bit의 "bfloat16"에서 128-bit 레지스터에 2x4의 bfloat16 값을 다시 1개의 레지스터 2x4의 bfloat16과 곱셈, 그 결과를 32-bit 단정밀도 FP32로서 출력하고 다른 FP32 값과 가산한다. 성능 향상은 현행 Cortex-A77에 비해 5배 정도가 된다.

 

여기서 핵심은 ARM이 bfloat16을 데이터 포맷으로 채용한 것이다. bfloat16(Brain Floating Point 16)은 뉴럴 네트워크(용도를 전제로 제안된 새로운 부동 소수점 포맷)으로 Google이 채용하고 인텔도 이어지고 있는데 ARM도 2020년 Matterhorn 코어에서 채용한다.



2_l.jpg



기존의 IEEE 754의 부동 소수점은 FP32(32-bit 단위)가 부호부(Sign)1-bit, 지수부(Exponent)8-bit, 가수부(Mantissa) 23-bit로 구성되어 있다. bfloat16에서는 부호부(Sign)1-bit, 지수부(Exponent)8-bit, 가수부(Mantissa)7-bit와 FP32와 같은 지수부의 다이내믹 레인지를 갖춘다. 데이터 사이즈를 절반으로 하면서 다이내믹 레인지는 FP32와 비슷하다. 다이내믹 레인지가 뉴럴 네트워크에 중요한 적절한 포맷.

 

 ARM은 심층 학습용 프로세서인 "ARM ML" 아키텍처에서는 bfloat16을 채택하지 않는다. 이는 타깃이 추론이기 때문에서 훈련에서 유용성이 높은 bfloat16은 대응하지 않았다. 그러나 CPU 측은 향후 bfloat16을 채용한다. 이는 데이터 센터 전용 Neoverse를 위한 확장으로 보인다.



3_l.jpg


사이드 채널 공격에 대한 보안 대책

보안에서는 최근 몇 년간 화제인 CPU 아키텍처에 대한 사이드 채널 공격(Meltdown, Spectre등)에 대한 대책이 꼽혔다. ARM은 이 문제에 대해 마이크로 아키텍처 레벨에서 대책을 강구한다. 구체적으로는 "메모리 태깅(Memory Tagging)", "포인터 인증(Pointer Authentication)" 등을 구현한다.


메모리 태깅은 메모리 범위에 4-bit의 태그를 단다. CPU의 메모리 액세스는 접근하는 주소를 저장한 레지스터의 태그와 메모리 태그를 비교한다. 태그는 4-bit로 작기 때문에 재이용되지만 그래도 악의 있는 프로그램의 액세스를 높은 확률로 막을 수 있다.


154_l.jpg
174_l.jpg


게임 엔진과의 제휴 발표

 그 밖에 Smythe의 세션에서는 소프트웨어 에코 시스템 발전의 일환으로서 게임 엔진 벤더 Unity와의 파트너십이 발표되었다. 지금까지도 Unity의 엔진은 Arm계 SoC에 달리고 있었다.앞으로 양 회사는 파트너십을 발전시켜 보다 최적화가 진행된 소프트웨어와 하드웨어의 통합을 목표로 한다.

 

구체적으로는 Unity의 렌더링 파이프라인을 Arm 코어에 최적화, 멀티 코어에서의 성능을 발휘하는 멀티 스레드 코드를 생성할 수 있는 "Data Oriented Tech Stack(DOTS)"을 Arm 코어에 최적화, Unity의 AR 솔루션 "AR Foundation"도 Arm 코어의 성능을 이끌어낼 수 있도록 한다.Unity는 Unity 엔진에서 Arm의 뉴럴 네트워크 코어에도 대응한다고 밝혔다.


출처 - https://pc.watch.impress.co.jp/docs/column/kaigai/1211845.html






  1. AMD, 2세대 EPYC에 HPC/HCI용 고성능 프로세서 추가

    AMD는 4월 14일(미국 시간) 제 2세대 EPYC에 "7F32","7F52","7F72"의 3가지 모델을 추가했다.   이 회사의 Infinity 아키텍처와 Zen 2코어를 조합함으로써 데이터베이스와 HPC(High Performance Comp...
    Date2020.04.16 CategoryPROCESSOR Views260
    Read More
  2. 인텔 등, -272°C '고온'에서 동작 가능한 양자비트 실증

    Intel과 QuTech는 4월 16일(현지시간) 1켈빈(약 272°C)이 넘는 온도에서 양자 컴퓨팅의 기본 단위인 양자 비트 실증에 성공했다는 논문이 Nature지에 실렸다고 발표했다.   양자컴퓨팅을 현실적...
    Date2020.04.16 CategoryPROCESSOR Views375
    Read More
  3. 퀄컴(Qualcomm), 3세대 5G 모뎀-RF 시스템 Snapdragon X60 발표

    퀄컴(Qualcomm)이 3세대 5G 모뎀으로 Snapdragon X60 5G 모뎀-RF 시스템을 발표했다. Snapdragon X60은 세계 최초의 5나노 5G 베이스 밴드를 특징으로 하며 주파수 분할 듀플렉스(FDD) 및 시분할 듀플렉...
    Date2020.02.21 CategoryPROCESSOR Views384
    Read More
  4. 인텔 10세대 코어 Comet Lake-S, IGP 비활성화 프로세서 라인업 공개

    인텔은 9세대 코어 프로세서 시리즈를 통해 데스크탑 프로세서의 수율을 극대화하고 경쟁력을 높이기 위해 흥미로운 전략을 채택했다. "F" 모델 번호 확장자는 통합 그래픽이 없음을 나타내고, 통합 그...
    Date2020.02.21 CategoryPROCESSOR Views519
    Read More
  5. 인텔, "레이크필드" Foveros 패키지 기술 실물 공개

    Foveros 기술이 적용된 손톱 크기의 인텔 칩은 최초다. Foveros를 사용하면 프로세서가 완전히 새로운 방식으로 구축되며 다양한 IP가 2차원으로 평평하게 퍼지지 않고 3차원으로 쌓여 있다. 더 전통...
    Date2020.02.17 CategoryPROCESSOR Views518
    Read More
  6. 인텔 코멧레이크, 코어 i9-10900 10코어 CPU 사진 유출

    인텔의 데스크탑 코멧레이크(Comet Lake-S) 라인업이 출시 될 예정이며 그 안에 포함 된 CPU 모델에 대해 더 많은 유출이 발생되고 있다. Comet Lake-S 시리즈의 가장 흥미로운 점 중 하나는 코어 i9...
    Date2020.02.17 CategoryPROCESSOR Views571
    Read More
  7. 삼성전자, ‘노나셀’ 기반 차세대 1억 8백만 화소 이미지센서 출시

    삼성전자가 업계 최초로 최첨단 ‘노나셀(Nonacell)’ 기술을 적용해 기존보다 카메라 감도를 최대 2배 이상 향상시킨 차세대 모바일 이미지센서 ‘아이소셀 브라이트 HM1’을 출시했다. * 감도(Sensitivity)...
    Date2020.02.17 CategoryPROCESSOR Views257
    Read More
  8. 유럽, 맞춤형 HPC 프로세서의 첫 번째 프로토 타입 준비

    EPI(European Processor Initiative)는 유럽 연합이 필요로 하는 다양한 사용 모델에 맞춘 맞춤형 프로세서의 자체 개발을 시작하기 위한 유럽의 프로젝트다. EPI의 첫 번째 과제는 머신 러닝과 ...
    Date2020.02.02 CategoryPROCESSOR Views357
    Read More
  9. 인텔 Core i5-L16G7, 최초의 레이크필드이자 새로운 명명법에 대한 전조?

    Intel Core i5-L16G7은 Intel의 레이크필드(Lakefield) 이기종 x86 프로세서 아키텍처를 구현하는 최초의 상업용 SKU다. 이 5코어 칩은 고성능 Sunny Cove CPU 코어와 4개의 더 작은 Tremont 저전력 코...
    Date2020.02.02 CategoryPROCESSOR Views1490
    Read More
  10. 리테일 시장에 상용화 된 중국 Zhaoxin KaiXian x86 프로세서

    Zhaoxin은 중국 국가 IT 인프라에서 사용하기 위한 멀티 코어 64비트 x86 프로세서 브랜드로, 그것은 IT 하드웨어를 완전히 토착시키려는 중국 정부의 야심 찬 계획의 일부다. Zhaoxin의 x86-64 CPU 코어는...
    Date2020.02.02 CategoryPROCESSOR Views275
    Read More
  11. 아이폰12 시리즈, TSMC 5나노 공정의 A14 프로세서 탑재?

    차이나 타임즈가 유통 업계의 이야기로 차기 아이폰12 시리즈에는 보다 강력한 A14 Bionic 프로세서 외 Qualcomm의 Snapdragon X55 모뎀 칩이 탑재되어 5G 통신에 대응할 것이라고 보도했습니다. A1...
    Date2020.01.04 CategoryPROCESSOR Views548
    Read More
  12. 인텔, 10세대 코멧레이크 프로세서 라인업 공개 (10900k)

    인텔의 10세대 코멧레이크 시대가 다가옴과 동시에 사양과 라인업이 공개됐다. 공개된 정보에 의하면 10세대 코멧레이크 시리즈는 최상위 10코어 20스레드의 i9 10900K 모델부터 10코어 20스...
    Date2020.01.03 CategoryPROCESSOR Views680
    Read More
  13. MediaTek 5G대응 SoC, 안투투 스코어 51만점 기록

    미디어텍(MediaTek)은 5G 모뎀을 내장한 최신 하이엔드 SoC, Dimensity 1000의 안투투 벤치마크 v8의 점수를 공개했다.   공개된 종합 점수는 511,363점에 이르며 퀄컴 스냅드래곤 855 플러스 탑재 장비 ...
    Date2019.11.30 CategoryPROCESSOR Views262
    Read More
  14. 인텔, 세계 최대 FPGA 칩 "Stratix 10 GX 10M" 발표

    인텔은 14nm 기술에 기반한 놀라운 FPGA(Field Programmable Gate Array, FPGA) Stratix 10 GX 10M을 발표했다. 이는 세계에서 가장 큰 FPGA로 이전에 가장 큰 자일링스의 Virtex VU19P FPGA를 제압...
    Date2019.11.10 CategoryPROCESSOR Views418
    Read More
  15. 인텔, 세계 1위 수퍼 게이밍 프로세서 코어i9-9900KS 발표

    인텔이 새로운 9세대 인텔 코어 i9-9900KS 스페셜 에디션 프로세서를 발표했다. i9-9900KS는 최고의 게이밍 경험을 위해 올 코어 부스트 클럭이 최대 5.00GHz에 도달하는 무지막지한 프...
    Date2019.11.10 CategoryPROCESSOR Views405
    Read More
  16. AMD, 라이젠9 3950X, 3세대 스레드리퍼 3970X-3960X, 애슬론 3000G 발표

    AMD는 3가지 다양한 시장에서 4개의 새로운 데스크탑 프로세서를 발표했다. 우선 새로운 Ryzen 9 3950X 프로세서, 다음 새로운 기본 엔트리 레벨 APU Athlon 3000G를 출시, 마지막으로 Ryzen Threadrip...
    Date2019.11.10 CategoryPROCESSOR Views612
    Read More
  17. 120Hz, 1.08억화소 지원 삼성 '엑시노스 990' 발표

    삼성전자가 Samsung Tech Day 2019에서 스마트폰용 SoC, Exynos 990을 발표했다. 제품은 EUV를 이용한 7nm 공정으로 제조. Exynos 990은 Arm의 Valhall 아키텍처 GPU인 Mali-G77을 GPU에 채용하며 그...
    Date2019.10.27 CategoryPROCESSOR Views269
    Read More
  18. ARM, 차세대 CPU 코어 "Matterhorn" 기술 발표

    ARM은 미국 새너제이에서 동사의 기술 콘퍼런스 "ARM Techcon"을 10월 8일~10일까지 개최했다. 첫날 키노트 스피치에서는 차 차세대 Cortex-A 클래스 CPU 코어 아키텍처 "Matterhorn(매터호른/매터폰)의 신...
    Date2019.10.27 CategoryPROCESSOR Views326
    Read More
  19. 인텔, 차세대 저전력 아키텍처 트레몬트(Tremont) 공개

    미국 인텔은 산타클라라에서 열린 Linley Fall Processor Conference에서 차기 저전력 코어 Tremont의 마이크로 아키텍처를 공개했다.   저전력 IoT와 데이터 센터 전용으로 개발된 CPU 코어로 인텔의 ...
    Date2019.10.27 CategoryPROCESSOR Views154
    Read More
  20. AMD 12코어 65W "Ryzen 9 3900", OEM으로만 판매

     AMD는 9일 제품 라인업 페이지를 갱신하여 12코어/24스레드 CPU인 Ryzen 9 3900을 발표했다.   9월 24일 출시되고 있으며 Ryzen 9 3900X에서 베이스 클럭을 3.1GHz, 최대 부스트 클럭을 4.3GHz로 낮춤...
    Date2019.10.13 CategoryPROCESSOR Views238
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 33 Next
/ 33