4월 30일 (화) 오전 4:00

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2024.06.05. / 장르 드람 / 국가 대한민국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
개봉 2024.05.22. / 장르 액션 / 국가 미국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...

전회까지는 CRAY 시리즈, 정확히는 CRI(Cray Research Inc.)와 CCI(Cray Computer Inc.)의 계보를 설명했으나 이쪽은 기본적으로 벡터형 머신이다.

명령 포맷은 SIMD(Single Instruction Multi Data)에서 1개의 명령으로 복수의 데이터에 같은 처리를 한다는 것이다.

SIMD의 경우 명령의 해석은 처음 1회뿐 이후 오로지 데이터 읽기 → 실행 → 시작을 하기 때문에 메모리 로드-스토어만 맞추면 피크 성능을 내세우기 쉽다.

반대로 말하면 이 메모리 로드-스토어가 느리면 성능이 전혀 나오지 않는 것으로 CRAY-3가 유령 같은 메모리 시스템을 탑재한 것도 무리는 아니지만 이는 당연히 비용 상승으로 이어져 소비 전력도 만만치 않다.


Thinking Machines사의 커넥션 머신 CM-1. 사진은 Computer History Museum

이런 트렌드와 또 다른 방향의 연구도 이뤄졌다. 그것은 멀티 프로세서의 방향성이다. 1990년대에는 Massively parallel 이라고 불리는 것이 그 후에는 Grid Computing 이라는 말로 바뀌었지만 내용은 멀티 프로세서다.

단적인 이야기로, 지금은 싱글 코어의 CPU는 PC의 세계에서도 극히 소수로, 보통 2P 또는 4P 의 코어가 탑재되어 그것을 다 사용해 나름대로 쾌적한 PC 환경이 실현되고 있다.

이처럼 복수의 CPU 코어를 마련해 각각 독자적으로 프로그램을 실행시키면 그 만큼 성능이 올라간다. 이를 많이 나열하면 그 만큼 성능이 올라간다는 것이다.

물론 이것은 간단하지 않다. 예를 들면 모든 CPU에서 메모리를 공유하면 우선 메모리가 병목이 된다. 또 어느 정도 이상 숫자의 프로세서를 접속하려면 이번에는 프로세서 간의 접속도 병목이 된다.

이는 OS가 긴밀하게 연결된 멀티 프로세서를 전제로 한 것으로 되어 있는 것이 최대 이유로 대규모 멀티 프로세서 구성은 취하기 어렵게 되어 있다.

다만 그런 소프트웨어 호환성을 무시하면 예를 들어 CPU와 메모리를 한 덩어리로 그 덩어리들을 네트워크로 연결하면 병목은 상대적으로 발생하기 어려워진다. 이른바 PC 클러스터를 더 작은 단위로 구현하는 것이다. 물론 이 경우에 네트워크를 어떻게 구축할지가 최대의 관건이 된다.

그 대규모 멀티 프로세서에 관한 연구는 특히 80년대 들어 활발해졌다. 그러한 가운데 매사추세츠 공과 대학의 William Daniel Hillis 박사가 1981년 9월 내놓은 "The Connection Machine(Computer Architecture for the New Wave)" 라는 메모에서 비롯된 것이 지금 소개할 Thinking Machines 사의 커넥션 머신이다.


William Daniel Hillis 박사가 1981년 9월 내놓은 커넥션 시스템 메모

병렬 컴퓨팅을 실현한 커넥션 머신

Hillis 박사는 당시 MIT의 AI Lab에 속해 그 안에서 차세대 프로세서의 기본 방향에 대한 여러가지 연구를 했다. 이 메모를 보면 알겠지만 내용은 프로세서의 아키텍처보다 더 큰 Massive Parallel 이라는 시스템을 어떻게 구축할 것인지에 대해 논한 것이다.

사실 이는 Hillis(당시는 석사)의 박사 논문의 소재도 있는데 여기서 박사 학위를 취득하려면 메모의 내용을 실현할 필요가 있었다.

거기서 그는 Sheryl Handler 와 공동으로 Thinking Machines 사를 1983년에 설립했다. 이곳에서 그의 메모 내용을 CM-1(Connection Machine-1)으로 구현해 최종적으로는 이 CM-1에 관한 논문으로 그는 박사 학위를 취득했다.


CM-1과 그 내부. 사진은 Computer History Museum


6만 5536개의 프로세서를 병렬 처리하는 대규모 멀티 프로세서 구성

CM-1의 최초 목적은 뉴런(신경 세포)을 본뜬 모델의 시뮬레이션이었다고 한다. 따라서 프로세서 1개 1개의 성능은 낮아도 그 대신 다수의 프로세서를 집적한 머신이 필요했다.

이 목적에 따라 CM-1은 4Kbit의 RAM을 탑재한 1bit(정확히는 3bit 입력, 2bit 출력)의 프로세서(이를 node라고 칭함)을 합계 6만 5536개 집적한 것이 됐다.

워낙 규모가 작아 당시의 반도체 기술로 높은 집적화는 쉬웠기 때문에 16node을 1개의 칩으로 집적했으며 1장의 기판에는 이 칩이 32개 탑재되고 있다.

이 기판을 16장 탑재한 상자를 Cube 라고 부르며 Cube을 8개 연결했다. 16×32×16×8=6만 5536 따라서 실제로 CM-1은 Cube을 8개, 정육면체 모양으로 구성한 것이다. 이 정육면체 크기는 각변 1.5m 정도였다.


CM-1의 내부 구조. CM1과 CM-2는 이 수준에서는 동일한 아키텍처이다


그리고 이 node 만으로는 아무것도 할 수 없으므로 실제로는 프론트 엔드에 DEC(Digital Equipment Corporation)의 VAX 또는 Symbolics 3600 워크 스테이션을 4대 준비해 4×4의 크로스 바 스위치(위의 사진으로 Nexus 한 것)을 거쳐 4개의 Sequencers 에 명령을 발행하는 형태가 되어 있었다.

이 시퀀서(Sequencer)란 자신의 부하에 있는 2cube(1만 6384개)의 node 들에게 일제히 명령을 배포하고 브로드캐스트 작업을 벌이는 SIMD 명령을 해석하는 타입의 것이었다.

각각의 칩속의 16node는 2차원 그물 모양 구조에서 인접한 node와 통신이 가능하게 되어 있다. 한편 칩과는 node와 별도로 라우터라고 하는 통신 채널이 마련되어 이 라우터를 통해 칩간의 통신이 이루어지는 방식이었다.


CM-1의 에어 플로우. 사진은 Computer History Museum

비싸서 살 수 없는 꿈의 머신 "CM-1"

CM-1 최초의 프로토 타입은 4MHz 동작으로 시스템 전체의 소비 전력은 12KW. node1개 당의 소비 전력은 0.1W 안팎이지만 루터와 시퀀서, 다음으로 통신 등이 있기 때문에 타당한 숫자다.

그리고 CM-1 전체에서 32bit의 가산을 할 경우의 성능은 대체로 1000MIPS, 메모리 대역은 최저치에서 32Mbit/초, 전형치에서 1Gbit/초 정도. 고속 변환을 한 경우의 성능은 50Gbit/초에 이른다는 숫자가 논문에 기재되어 있다.

32bit의 가산은 node를 32개 나란히 각각 1bit씩 가산 하는 구조다. 캐리의 처리 등을 무시하면 동시에 2048개의 가산을 실행할 수 있게 되어 4MHz 동작에는 8192MIPS의 성능이 되는데 실제로는 부하(헤드)가 꾀 있기 때문에 그렇게는 잘 안됐다.

하지만 프로토 타입에서 1000MIPS 라는 것은 대단한 성능으로 이 당시 이곳까지 성능을 낼 수 있는 머신은 아니었기에 CM-1은 크게 유망해졌다.


CM-1은 프로그램이 머신상에서 실행됐는지를 LED에서 확인. 사진은 Computer History Museum


또 CM-1은 가상 프로세서를 구성하는 것도 가능 했었다. 실제로는 1bit의 프로세서이기 때문에 구성을 자유롭게 조합함으로써 임의의 CPU의 명령을(완전히는 아니라도)모방할 수 있는 것도 특징이었다.

그러나 이건 하드웨어적으로는 가능해도 그런 소프트웨어가 움직이지 않으면 불 가능한 까닭에 그렇게 쉽지 않았을 것이다.

그런데 이야기를 되돌리면 CM-1는 원래 연구 목적의 머신 구현이었다. 특히 AI 계열의 시뮬레이션을 위해 LIPS가 이용한 만큼 AI 계열 연구자에게는 꿈의 머신이었던 것 같다. "다운"이란 CM-1은 당시 가격으로 500만 달러 정도로 AI 계열 연구 기관에서는 어찌할 수 없었기 때문이다.

CM-1은 통산 7대가 판매됐는데 이는 DARPA(Defense Advanced Research Projects Agency:국방 고등 연구 계획)의 후원과 보조금 덕분으로 평범하게 판매해도 팔릴 전망은 낮았다.


CRAY Y-MP의 2배 이상의 성능을 기록한 후계 "CM-2"

비싸서 팔릴 가망이 없었던 CM-1을 좀 더 범용적인 용도로 쓸 수 있도록 하겠다는 아이디어가 나온다. 이에 따라 1987년에 제품화 된 것이 CM-2.

CM-1과 CM-2의 아키텍처 면에서 가장 큰 차이는 부동 소수점 연산 능력의 강화다. CM-1의 정수 연산은 매우 고속이지만 부동 소수점 연산을 같이 하면 성능이 떨어졌다.

거기서 이를 보완하기 위해 하드웨어에서 부동 소수점 연산을 구현하게 됐다. 실제로는 32node에 1개꼴, 즉 시스템 전체로는 2048개의 Weitek WTL3132 FPU가 탑재됐다.

 

CM-2의 내부 구조. 1990년판 Connection Machine Model CM-2 Technical Summary(Version 6.0)에서 발췌. 하단의 "Floating-Point Execution"이 WTL3132.


WTL3132는 범용 32bit 부동 소수점 프로세서에 사이클 시간 100나노초의 WTL3132-100이 20MFLOPS, 120나노초의 WTL3132-120이 16MFLOPS의 성능으로 알려졌다.

100나노초 즉 10MHz 동작이라면 보통 10MFLOPS 지만, WTL3132는 MAC 연산(곱셈+가산)을 1주기로 실행할 수 있으므로 2배인 20MFLOPS.

그리고 자료가 없지만 부동 소수점 연산 성능과 밝혀진 것으로 역산하면 탑재된 것은 WTL3132-120 이었던 것 같다. 또 메모리도 node 당 4Kbit에서 8Kbit(32node 모두 256Kbit)로 배가되고 있다. 또 ECC도 추가됐다.

또한 위의 이미지에서 NEWS Grid 문구는 North/East/West/South에서 찍은 것이다. 본래 CM-2는 입방체 구성 그리드로 물리적으로는 접속되는데 이를 가상적으로 2차원 그리드에 매핑한 것이 NEWS Grid로 생각하면 된다.

참고로 CM-2와 동시에 제공된 것으로 Data Vault 라는 RAID 배열이 있다. 42대의 HDD(3대가 스페어)을 스트라이핑으로 움직여 100MB/초 이상의 전송 속도와 최대 480GB의 용량을 실현하는 것이었다.


CM-2. CM-1과 구조가 거의 변하지 않아 외형은 비슷. CM-2의 오른쪽에 있는 것이 Data Vault. 사진은 Computer History Museum


CM-2는 사이클 시간이 142나노초(약 7MHz)로 CM-1 보다는 꾀 빠른 것으로 당시로서는 그렇게 고속의 부류는 아니다. 그러나 그 성능은 무시무시해 6만 5536node 구성 CM-2는 이론상의 피크 성능에서 28GFLOPS, 실제 성능에서도 5.2GFLOPS의 성능을 기록하고 있다.

1987년이라면 CRAY Y-MP가 완성하기 전이지만, 다음 1988년에 등장한 CRAY Y-MP가 8프로세서 구성으로 실효 2.1GFLOPS 였음을 감안하면 CM-2의 숫자는 상당히 훌륭하다.

CM-2는 최대 구성이 64Knode지만 16K/32Knode 구성도 가능했다. 이 CM-2의 저가판으로 4K/8Knode의 구성 CM-2a도 뒤에 추가된다.

또 정확한 등장 시기가 불명이지만 아마 1980년대 후반에는 사이클 시간을 100나노초(10MHz)로 올린 CM-200도 출시한다. 이것은 64Knode 구성에서 실효 성능 9.8GFLOPS를 기록하고 있다.

Thinking Machines 사는 CM-2를 발표한 후 절정기에 들어간다. 1989년 이 회사 매출은 4500만 달러로 이익은 70만 달러 가량으로 알려졌다. 이 시기는 다양한 정부 조직이 고성능 컴퓨터를 조달하려던 시기였다.

NSF(National Science Foundation:미국 국립 과학 재단) HPCC(High Performance Computing and Communication)프로그램은 실제로는 12개 정부 조직이 참여했으며 Thinking Machines에 편향된 DAPRA도 이에 가담했다. 

HPCC는 1996년까지 1TFLOPS의 머신을 구축한다는 것으로 Thinking Machines도 이에 응모할 수 있도록 CM-5를 구축한다. 다음은 이것을 설명 한다.

출처 - http://ascii.jp






  1. 인텔 기조 강연) 큐리, 리얼센스, 리젠스, 웨어러블, 사물인터넷 등 설명

    큐리를 발표하는 Intel CEO 브라이언 크르자니크 Intel의 CEO 브라이언 크르자니크는 1월 6일~9일(현지시간) 미국 라스 베이거스에서 진행되고 있는 International CES의 기조 강연에 등단...
    Date2015.01.08 CategoryENTERPRISE Views2272
    Read More
  2. 퀄컴 스냅드래곤 810은 실제품에 탑재 - IEEE 802.11ad/트라이밴드

    Qualcomm은 International CES의 프레스 데이 기자 회견을 개최하고 CES에서 전시하는 솔루션 등에 대한 설명을 진행했다. Qualcomm은 예년 International CES의 타이밍에 맞춰 신제품 발표를 했...
    Date2015.01.07 CategoryENTERPRISE Views965
    Read More
  3. 에어플레이 대항 Google Cast for Audio 발표, 클라우드에서 스피커로 직접 재생

    구글이 크롬캐스트의 오디오 버전이라 할 수 있는 Google Cast for Audio를 발표 했습니다. 대응 앱 및 브라우저에서 Cast 아이콘을 탭 하여 대응 음악 서비스의 소리를 스피커 사운드 바, 오디오...
    Date2015.01.06 CategoryENTERPRISE Views1066
    Read More
  4. 중국 스마트폰 업체 샤오미도 PC 사업 시작, 애플 맥북에어 카피

    중국의 인기 스마트폰 업체, 중국의 애플로 불리는 샤오미(Xiaomi)가 동사의 첫번째 노트북 PC를 발표할 예정이며 그 PC는 애플의 맥북에어를 카피하고 있는 것으로 확인 되었습니다. 이번에 유출된 샤...
    Date2014.12.30 CategoryENTERPRISE Views961
    Read More
  5. 애플의 팀쿡 CEO, CNN 선정 올해의 최고 CEO (CNNMoney)

    미국 CNN 머니가 The best CEOs of 2014(2014년 베스트 CEO 톱 10)을 발표 했습니다. 그 결과 CEO of the year(올해의 베스트 CEO)로 애플의 팀쿡 CEO가 선정 되었습니다. 팀쿡은 애플의 주가를 40% 상승...
    Date2014.12.24 CategoryENTERPRISE Views1045
    Read More
  6. 도시바, 낸드플래시 기밀 유출 소송건에 대해 SK 하이닉스와 화해

    도시바는 2014년 3월 13일에 제소한 SK 하이닉스에 대한 낸드플래시 소송에 대해 SK 하이닉스가 도시바에 2억 7800만 달러를 지불하는 것으로 합의했다고 밝혔다. 이 소송은 SK 하이닉스로 이적한...
    Date2014.12.20 CategoryENTERPRISE Views895
    Read More
  7. 미국 IBM + Apple 협업의 첫번째 성과 IBM MobileFirst for iOS Apps 발표

    IBM + Apple은 협업의 첫번째 성과인 은행, 소매, 보험, 금융 서비스, 통신, 행정, 항공 분야의 고객을 대상으로 한 IBM MobileFirst for iOS 솔루션을 발표했다. IBM MobileFirst for iOS 솔루션...
    Date2014.12.20 CategoryENTERPRISE Views1447
    Read More
  8. 슈퍼컴퓨터 계보> 연구자들이 동경했던 커넥션 머신 CM-1

    전회까지는 CRAY 시리즈, 정확히는 CRI(Cray Research Inc.)와 CCI(Cray Computer Inc.)의 계보를 설명했으나 이쪽은 기본적으로 벡터형 머신이다. 명령 포맷은 SIMD(Single Instruction Multi Data)...
    Date2014.12.16 CategoryENTERPRISE Views1109
    Read More
  9. 델과 인텔, 세계 사무실 종업원의 IT 이용 실태 조사 (Global Evolving Workforce Study)

    델(Dell)과 인텔(Intel)은 2일(현지시간) 전 세계 사무실 종업원의 IT 이용 실태 조사 Global Evolving Workforce Study 결과를 발표했다. 이 조사는 12개국의 중소 규모/대규모 조직 약 5,000명의 ...
    Date2014.12.08 CategoryENTERPRISE Views805
    Read More
  10. 마이크로소프트, 메일 앱 벤처기업 어컴플리(Acompli) 인수 발표

    마이크로소프트는 1일, 인수 금액 등의 자세한 부분은 미공개로 샌프란시스코의 메일 앱 개발 벤처 어컴플리(Acompli)를 인수했다고 밝혔습니다. Acompli의 메일 앱은 Microsoft Exchange, Office...
    Date2014.12.03 CategoryENTERPRISE Views984
    Read More
  11. 싸이프레스와 스팬션 합병, 세계 최대 SRAM/NOR Flash 기업으로

    미국 Cypress Semiconductor와 Spansion은 1일(현지시간) 약 40억달러의 전액 주식 교환으로 합병을 진행한다고 발표했다. 새로운 통합 회사명은 Cypress Semiconductor. 합병에 의해 탄생하는 새...
    Date2014.12.03 CategoryENTERPRISE Views711
    Read More
  12. IDC, 세계 스마트폰 시장 출하 전망 발표 - 큰 돈 벌기 힘들다

    iCharts IDC(International Data Corporation)가 2018년까지 세계 스마트폰 시장 출하 전망을 발표했다. 발표된 내용에 따르면 2014년 스마트폰 출하 대수는 12억 8800만대로 전년 대비 26.3% 증가한 성장...
    Date2014.12.03 CategoryENTERPRISE Views774
    Read More
  13. 슈퍼컴퓨터 계보> CRAY Y-MP 이후의 벡터형 머신

    이번에는 CRAY Y-MP 이후의 CRAY 벡터 프로세서 시리즈를 묶어 설명한다. CRAY X-MP 개발에 이어CRI는 CRAY Y-MP의 개발을 시작한다.  CRAY Y-MP 이는 CRAY X-MP EA 기준(즉 32bit주소)로 하면서 최...
    Date2014.11.27 CategoryENTERPRISE Views931
    Read More
  14. 슈퍼컴퓨터 계보> 멀티코어화로 대성공한 CRAY X-MP (레스 데이비스)

    이번에 해설하는 것은 CRAY-1에서 분가한 CRAY X-MP다. 연재 276회에서 설명한 대로 CRAY-1의 설계가 일단락 된 시점에서 세이모어 크레이(Seymour Cray)의 관심은 CRAY-2로 옮겨졌다. CRAY X-MP 다만 CRAY...
    Date2014.11.27 CategoryENTERPRISE Views665
    Read More
  15. 엔비디아 실적 발표, 지포스 GPU / 테그라 SOC 판매 호황

    NVIDIA가 2014년 8월~10월 결산 내용을 발표 했습니다. 엔비디아의 실적은 전년 동기 대비 16% 증가된 역대 최대의 12억 2500만 달러의 분기 매출과 45% 증가된 1억 7300만 달러의 순익, 1주당 이익은 55%...
    Date2014.11.10 CategoryENTERPRISE Views841
    Read More
  16. 삼성전자, 서버용 SSD 소프트웨어 업체 '프록시멀 데이터' 인수

    [ 보도 - 삼성전자 ] 삼성전자가 미국의 서버용 SSD(Solid State Drive) 캐싱(Caching) 소프트웨어 전문업체인 '프록시멀 데이터(Proximal Data)'社를 인수했다. ※ 캐싱 소프트웨어 : 컴퓨팅 시스템에서 ...
    Date2014.11.04 CategoryENTERPRISE Views838
    Read More
  17. 3D마크가 국제 표준으로? UL, 핀란드 퓨처마크 인수 (Futuremark)

    미국 보험업자 연구소(UL=Underwriters Laboratories)는 3일(현지시간) 핀란드의 유명 퓨처마크(Futuremark)를 10월 31일에 인수했다고 발표했다. UL은 제품의 안전성이나 기능성에 대한 규격을 책정하고,...
    Date2014.11.04 CategoryENTERPRISE Views696
    Read More
  18. 슈퍼컴퓨터 계보> 고성능이지만 팔리지 않은 CRAY-3 (갈륨비소)

    이번에는 세이모어 크레이(Seymour Cray)가 마지막으로 만든 CRAY-3에 주목한다. CRAY-3의 정확한 개발 시작이 언제인가는 분명하지 않지만 CRAY-2 개발 방침의 윤곽이 결정된 무렵부터 이미 그의 ...
    Date2014.11.03 CategoryENTERPRISE Views1314
    Read More
  19. Twitter / IBM 제휴, 트위터 데이터에 의한 "의사결정" 애플리케이션 개발

    Twitter와 IBM은 Twitter 데이터 비즈니스 애플리케이션 분야에서 제휴를 한다고 발표 했습니다. 이 제휴에는 IBM의 애널리틱스 서비스와 Twitter 데이터 통합, 특정 업계·직종용 엔터프라이즈 애플리케이...
    Date2014.10.31 CategoryENTERPRISE Views696
    Read More
  20. 애플 아이튠즈 스토어 음악 판매 감소, 향후 비츠 뮤직이 관건

    美 애플은 27일, 미 증권 거래 위원회(SEC)에 제출한 연례 보고서에서 아이튠즈 스토어(iTunes Store)의 음악 다운로드 판매가 감소했다고 밝혔다. 아이튠즈의 2014년도(2013년 10월 ~ 2014년 9월...
    Date2014.10.29 CategoryENTERPRISE Views1375
    Read More
Board Pagination Prev 1 ... 19 20 21 22 23 24 25 26 27 28 ... 33 Next
/ 33