4월 30일 (화) 오전 4:54

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2024.06.05. / 장르 드람 / 국가 대한민국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
개봉 2024.05.22. / 장르 액션 / 국가 미국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...

이번에는 세이모어 크레이(Seymour Cray)가 마지막으로 만든 CRAY-3에 주목한다. CRAY-3의 정확한 개발 시작이 언제인가는 분명하지 않지만 CRAY-2 개발 방침의 윤곽이 결정된 무렵부터 이미 그의 관심은 CRAY-2를 떠나 CRAY-3로 향하던 것 같다.

 

CCC(Cray Computer Corporation)의 CRAY-3 카탈로그. 이는 4P 구성 CRAY-3

CRAY-3의 설계 목표는 CRAY-2의 12배 성능 

CRAY-3의 당초 설계 목표는 또 다시 CRAY-2의 12배라는 야심적인 것이었다. 원래 CRAY-2 자체가 2GFLOPS에 가까운 성능을 가진 머신이였으니 이것의 12배라면 24GFLOPS에 이른다.

실제로는 여기까지 성능은 도달하지 않고, 16프로세서의 하이엔드의 구성에서도 15GFLOPS 정도로 하이엔드 구성은 결국 제조되지 않고 끝났다. 이 이야기는 후술하고 이야기를 1985년 전후로 되돌린다.

CRAY-2에서는 ECL(※)설계를 적용했으나 크레이 자신은 갈륨 비소(GaAs)에 미래를 찾고 있었으며 이를 Rockwell Semiconductor(이 당시는 Rockwell International의 Semidonductor Division)과 공동으로 개발하고 있었다.

※ 연재 276회에서 CRAY-1/2의 내부 회로를 MOSFET 기반으로 썼는데 이는 ECL입니다. 정정합니다.

이후 Rockwell International 중 갈륨 비소를 담당하던 조직은 이 회사로부터 독립해 GigaBit Logic Inc.이라는 벤처 회사를 설립했다. 이 GigaBit Logic에는 크레이도 출자한 것 같고 최종적으로는 GigaBit Logic이 CRAY-3와 뒤이어 CRAY-4용 반도체를 제공하게 됐다.

그리고 당초에는 Rockwell/Gigabit Logic과 후지쯔에서 공급을 검토한 것 같고, 결과적으로 CRAY-3에서는 사이클 시간을 2.11나노초(474MHz)까지 끌어올렸다.

아키텍처 자체 CRAY-2 연장선에 있는 것이다. 하나의 foreground 프로세서 여러 백그라운드 프로세서 조합으로 동작해 CRAY-3 최대 16개의 백그라운드 프로세서를 이용할 수 있게되었다.

foreground 프로세서 구조 아래 그림과 같이 64KB 명령어 메모리 ( 명령 캐시) 갖고 이를 커뮤니케이션 채널 루프를 통해 백그라운드 프로세서 전달하는 구조다.


포어 그라운드 프로세서 구조. 1개의 커뮤니케이션 채널 루프에 최대 4개의 백그라운드 프로세서가 연결되며 이 커뮤니케이션 채널 루프를 4개 연결할 수 있기 때문에 최대 16P가 된다


백그라운드 프로세서의 구조가 아래 사진이다. 벡터 연산 유닛 자체는 크게 변하지 않은(하지만 Vector Shift가 부활)것으로 1개의 백그라운드 프로세서당 피크 성능은 1cycle에 2Flops이므로 948MFlops, 이것이 16개 동시에 동작하면 최대 15.17GFlops.


백그라운드 프로세서의 구조. CRAY-2와 비교하면 90도 뒤집혔지만 기본은 크게 다르지 않다


다만 CRAY-3는 CRAY-2보다 이후 등장한 점도 있고 CRAY-2의 문제점에 대한 개선이 몇 가지 이루어지고 있다. 원래 CRAY-2가 실효적 성능으로 CRAY X-MP와 다를 바 없었던 것은 메모리 성능이 뒤따르지 못했기 때문이다.

CRAY-2에서는 어드레스 세이브(B)와 스칼라 세이브(T)의 2종류의 레지스터를 생략하고 그 대신 로컬 메모리를 추가하고 있다. 현재의 데이터 캐시에 해당하는 것으로 16Kwords(128KB)가 각각의 백그라운드 프로세서에 내장되어 있었지만 요컨대 이것으로는 턱없이 부족했다는 것이다.

지난번 CRAY-2 내부 구조도(아래 그림 참조)와 비교하면 Vector Functrional Unit과 Address Functional Unit의 앞에 로컬 메모리가 배치되어 있는게 분명하다.


CRAY-2의 백그라운드 프로세서 구조


단지 원래 데이터 캐시 사용한다면 캐시 유닛 직접 Common Memory Storage Module 연결되어 직접 데이터 가져오자마자 내보내지 않으면 안되는 것이지만 실제로는 각각 레지스터 연결되어 있지 않다. 따라서 오퍼레이션은 다음과 같이 되어 거의 의미가 없었다.

  • 공통 메모리에서 레지스터데이터를 가져 온다
  • 등록기에서 로컬 메모리에 데이터를 카피

물론 레지스터의 반복 사용시 대피 영역으로 쓰기에는 충분했겠지만 거꾸로 말하면 그러한 사용법 밖에 안됐다.

CRAY-3에서는 이 점에 관한 반성이 있었을 것이다. 로컬 메모리는 단순히 레지스터 뿐 아니라 스칼라 유닛에서도 직접 접근할 수 있도록 변경되었다.

이에 따라 벡터 유닛이 연산 하는 것과 병행하여 스칼라 유닛이 로컬 메모리에 데이터를 저장하거나 대피시키는게 가능해 보다 효과적으로 로컬 메모리를 이용할 수 있게 됐다.

이 외에 공통 메모리가 약간 진화했다. 공통 메모리는 8개의 Octant라는 덩어리를 유지할 수 있다. 각각의 Octant의 내부는 64뱅크로 분할됐으며 이는 동시에 접속할 수 있기 때문에 최대 512way 인터리브 구성이 된다.


공통 메모리 구성. Octant를 몇 개 탑재할지는 유동적으로 1/2/4/8 Octant 중 하나를 선택


메모리 칩 자체는 CMOS의 SRAM을 이용해 최대 구성에서는 128GB/초의 대역이 된다고 알려져 있는데 여기서 생각하면 1개의 Octant당 16GB/초, 1개 뱅크당 256MB/초(2Gbps)라는 계산이 된다.

뱅크 자체는 64bit Word 구성이라 SRAM 자체의 속도는 32MHz가 된다. 당시의 CMOS 기술을 감안하면 타당한 속도라 할 수 있다.

그리고 1개의 메모리 뱅크는 4Mwords(32MBytes)이므로 Octant 1개 당 메모리 용량은 2GB. 8Octant의 최대 구성에서는 16GB의 메모리 탑재량이 됐다. 이 인터리브 대역을 버는 방식 STAR-100 그것을 연상시키지만 CRAY-3 쪽이 웅장한 규모다.


배선 지연의 해소는 CRAY-2-처럼 3차원 기판과 프로리나토 냉각

회로 규모가 커지는 한편 배선 지연 문제를 해결하려면 배선을 더 단축할 필요가 있다. 이를 실현하기 위해 CRAY-3는 여전히 3차원 기판이 채용됐다. 아래 사진은 CRAY-3에서 이용된 갈륨 비소 IC다.


갈륨 비소 IC. 이는 CG가 아닌 실물 사진. 세로로 돌출되어 있는 것이 Bonding Pad


갈륨 비소 IC 자체의 크기는 3.835mm2로 매우 작다. IC 위에 보이는 배선은 0.076mm의 금에 의해 주도로 거기서 52개의 Bonding Pad가 나온다. 이 갈륨 비소 IC을 장착한 기판 4장을 69장의 배선층에서 샌드위치로 만든 것이 CRAY-3의 모듈이다.


CRAY-3의 모듈. 오른쪽 사진에서 모듈 하단에 나온 것이 전원 공급 케이블 플러그, 상단 및 좌우에 나온 것이 모듈 간 상호 접속 커넥터. 모듈 치수는 121×107×7mm으로 알려졌다

CRAY-3의 경우 이 모듈이 4개로 1개의 CPU을 구성했다. CCC에 의하면 하나의 모듈에 최대 1024개의 갈륨 비소 IC가 탑재되고 있다고 한다. 시스템 전체로는 최대 336개의 모듈로 구성돼 16P 구성 CRAY-3가 14만 2000개 이상의 갈륨 비소 IC와 3만 6864개의 SRAM 칩으로 구성된다.

당연하지만 이런 고밀도로 구성하면 발열은 방대해진다. 실제 CRAY-3의 경우 1입방 인치당 발열은 640W에 이르는 것으로 알려져 있었다. 다만 이미 CRAY-2에서 프로리나토 냉각에 익숙했기에 CRAY-3에서도 고민없이 프로리나토 냉각이 채용됐다.

CRAY-3 완성, 1대밖에 안 팔려 도산

CRAY-3는 최종적으로 1993년에 최초의 제품이 완성됐지만 여기에 도달할때까지의 우여곡절을 소개한다.

당초 CRAY-3의 개발은 CRI(Cray Research Inc.)CRAY Labs에서 진행된 것인데 이 당시 CRI는 CRAY-3와 별도로 CRAY X-MP의 후계 CRAY Y-MP(Y-MP C90)의 개발도 진행해 CRI는 2개의 개발 프로젝트를 동시에 진행할 여력이 없었다.

이러한 점도 있고 1989년경 세이모어 크레이와 당시 CRI의 CEO, John Rollwagen은 CRAY Labs를 주체로 한 CRAY-3 팀을 별도 회사로 만들기로 했다.

이것이 CCC(Cray Computer Corporation)로 역시 크레이가 CEO 였다. 따라서 CRAY-2까지는 CRI, CRAY-3 이후는 CCC의 제품이라는 것인데 정작 CRAY-2의 제조는 CRAY Labs에서 이루어지던 만큼 이 근방을 어떻게 해결했는지는 불명이다.

그건 그렇고 CRAY-3의 첫(그리고 마지막) 고객은 NCAR(National Center for Atmospheric Research)였다. 1993년 5월, 4프로세서/128MWord 구성의 CRAY-3가 납품된다. 이것은 순수한 평가를 위한 것으로 NCAR는 CRAY-3를 이용해 기상 모델을 시뮬레이션 할 예정이었다.

그런데 적어도 4프로세서 중 1개에는 오류가 있어서 제대로 움직이지 않고 움직인 나머지 3 프로세서에도 제곱근 연산에 문제가 있었다.

1994년 8월 ComputerWorld의 기사에 따르면 6000만번에 1회 정도의 빈도로 제곱근의 연산 결과가 1bit이상해지는 현상이 일어났다고 한다. CCC는 이를 개수하겠다고 약속했지만 결국 무산돼 NCAR는 CRAY-3의 대금 지불을 거부했다.

NCAR 이외에 LLNL(Lawrence Livermore National Laboratory)에게도 판매하다가 LLNL이 요구하는 1992년 6월까지 16P 구성 시스템을 납품한다는 조건을 만족하지 못하고 결국 이를 충족한 CRI의 CRAY C90에 계약을 빼앗기게 된다. 또 NARC(NASA Ames Research Center)와의 계약도 CRAY-3의 개발이 뒤떨어졌기 때문에 무산됐다.

이상과 같이 CCC CRAY-3에서 매출이 사실상 제로이며 개발 비용 회수 전망이 서지 않았다. 이 당시 크레이는 월 스트리트 저널의 취재를 받아 "I know when I'm done, but it isn't yet."이라고 답했다.

그런 가운데도 과단성 있게 다음 CRAY-4의 개발을 추진해 1994년에는 CRAY-4의 개발이 시작된다. 기본적인 발상은 우선 사이클 타임을 1나노초(1GHz 구동)로 극복하기 위해 갈륨 비소 IC 탑재 밀도를 CRAY-3의 10배로 높이고 배선장을 10cm 이하로 막도록 했다.

CPU는 모듈 1개로 탑재 할 수 있도록 최대 64프로세서(64 백그라운드 프로세서)탑재가 가능하게 될 것으로 전망됬다. 또한 이를 고속화한 CRAY-5의 설계도 시작되었다.

게다가 NSA(National Security Agency)에 CRAY-3/SSS(Super Scalable System) 시스템을 납품하는 계약이 1994년 여름에 맺어졌다. 이는 2P CRAY-3에 51만 2천개의 1bit 프로세서로 구성된 대규모 병렬 컴퓨터를 조합하는 하이브리드 구성이였다는데 자세한 부분은 불명이다.

다만 크레이가 범인이 아니라고는 하지만 돈이 없어지는 것만은 극복할 수가 없어 CCC는 1995년 3월 파산했다. 당초 회생의 길을 모색했으나 어디에도 손을 내미는 곳은 없었으며 CCC의 시설은 폐쇄된다. 이에 맞춰 CRAY-4/5 나 CRAY-3/SSS의 개발도 모두 중단됐다.

그리고 한때는 CRI/CCC 용 매출이 전체의 7할에 이른 GigaBit Logic 이지만, CRAY-3 전용 제조가 일단락된 1991년에 미국 Tektronix의 100% 자회사인 TriQuint Semiconductor와 합병한다.

합병이라기보다 흡수라는게 실정에 가까운 것이겠지만 이 회사는 RF 반도체에 특화된 반도체 업체로 현재도 RF용에 갈륨 비소를 비롯한 특수한 반도체를 많이 제공하고 있다.

당초 GigaBit Logic은 CRAY 이외의 슈퍼 컴퓨터 업체에 갈륨 비소 기반의 IC를 판매하는 길을 찾고 있던 것 같지만 잘 발견되지 않은 모양이다. 그래도 CCC와 공멸하지 않았다는 것은 행운이라고 할까.

CCC 폐쇄 이후 크레이는 방침을 전환, 기존의 프로세서를 바탕으로 대규모 병렬 컴퓨터를 개발하는 SRC Computers를 설립하지만 교통 사고로 1996년에 서거한다. 다음은 CRI의 CRAY X-MP 이후의 이야기를 해설한다.

출처 - http://ascii.jp






  1. 인텔 기조 강연) 큐리, 리얼센스, 리젠스, 웨어러블, 사물인터넷 등 설명

    큐리를 발표하는 Intel CEO 브라이언 크르자니크 Intel의 CEO 브라이언 크르자니크는 1월 6일~9일(현지시간) 미국 라스 베이거스에서 진행되고 있는 International CES의 기조 강연에 등단...
    Date2015.01.08 CategoryENTERPRISE Views2272
    Read More
  2. 퀄컴 스냅드래곤 810은 실제품에 탑재 - IEEE 802.11ad/트라이밴드

    Qualcomm은 International CES의 프레스 데이 기자 회견을 개최하고 CES에서 전시하는 솔루션 등에 대한 설명을 진행했다. Qualcomm은 예년 International CES의 타이밍에 맞춰 신제품 발표를 했...
    Date2015.01.07 CategoryENTERPRISE Views965
    Read More
  3. 에어플레이 대항 Google Cast for Audio 발표, 클라우드에서 스피커로 직접 재생

    구글이 크롬캐스트의 오디오 버전이라 할 수 있는 Google Cast for Audio를 발표 했습니다. 대응 앱 및 브라우저에서 Cast 아이콘을 탭 하여 대응 음악 서비스의 소리를 스피커 사운드 바, 오디오...
    Date2015.01.06 CategoryENTERPRISE Views1066
    Read More
  4. 중국 스마트폰 업체 샤오미도 PC 사업 시작, 애플 맥북에어 카피

    중국의 인기 스마트폰 업체, 중국의 애플로 불리는 샤오미(Xiaomi)가 동사의 첫번째 노트북 PC를 발표할 예정이며 그 PC는 애플의 맥북에어를 카피하고 있는 것으로 확인 되었습니다. 이번에 유출된 샤...
    Date2014.12.30 CategoryENTERPRISE Views961
    Read More
  5. 애플의 팀쿡 CEO, CNN 선정 올해의 최고 CEO (CNNMoney)

    미국 CNN 머니가 The best CEOs of 2014(2014년 베스트 CEO 톱 10)을 발표 했습니다. 그 결과 CEO of the year(올해의 베스트 CEO)로 애플의 팀쿡 CEO가 선정 되었습니다. 팀쿡은 애플의 주가를 40% 상승...
    Date2014.12.24 CategoryENTERPRISE Views1045
    Read More
  6. 도시바, 낸드플래시 기밀 유출 소송건에 대해 SK 하이닉스와 화해

    도시바는 2014년 3월 13일에 제소한 SK 하이닉스에 대한 낸드플래시 소송에 대해 SK 하이닉스가 도시바에 2억 7800만 달러를 지불하는 것으로 합의했다고 밝혔다. 이 소송은 SK 하이닉스로 이적한...
    Date2014.12.20 CategoryENTERPRISE Views895
    Read More
  7. 미국 IBM + Apple 협업의 첫번째 성과 IBM MobileFirst for iOS Apps 발표

    IBM + Apple은 협업의 첫번째 성과인 은행, 소매, 보험, 금융 서비스, 통신, 행정, 항공 분야의 고객을 대상으로 한 IBM MobileFirst for iOS 솔루션을 발표했다. IBM MobileFirst for iOS 솔루션...
    Date2014.12.20 CategoryENTERPRISE Views1447
    Read More
  8. 슈퍼컴퓨터 계보> 연구자들이 동경했던 커넥션 머신 CM-1

    전회까지는 CRAY 시리즈, 정확히는 CRI(Cray Research Inc.)와 CCI(Cray Computer Inc.)의 계보를 설명했으나 이쪽은 기본적으로 벡터형 머신이다. 명령 포맷은 SIMD(Single Instruction Multi Data)...
    Date2014.12.16 CategoryENTERPRISE Views1109
    Read More
  9. 델과 인텔, 세계 사무실 종업원의 IT 이용 실태 조사 (Global Evolving Workforce Study)

    델(Dell)과 인텔(Intel)은 2일(현지시간) 전 세계 사무실 종업원의 IT 이용 실태 조사 Global Evolving Workforce Study 결과를 발표했다. 이 조사는 12개국의 중소 규모/대규모 조직 약 5,000명의 ...
    Date2014.12.08 CategoryENTERPRISE Views805
    Read More
  10. 마이크로소프트, 메일 앱 벤처기업 어컴플리(Acompli) 인수 발표

    마이크로소프트는 1일, 인수 금액 등의 자세한 부분은 미공개로 샌프란시스코의 메일 앱 개발 벤처 어컴플리(Acompli)를 인수했다고 밝혔습니다. Acompli의 메일 앱은 Microsoft Exchange, Office...
    Date2014.12.03 CategoryENTERPRISE Views984
    Read More
  11. 싸이프레스와 스팬션 합병, 세계 최대 SRAM/NOR Flash 기업으로

    미국 Cypress Semiconductor와 Spansion은 1일(현지시간) 약 40억달러의 전액 주식 교환으로 합병을 진행한다고 발표했다. 새로운 통합 회사명은 Cypress Semiconductor. 합병에 의해 탄생하는 새...
    Date2014.12.03 CategoryENTERPRISE Views711
    Read More
  12. IDC, 세계 스마트폰 시장 출하 전망 발표 - 큰 돈 벌기 힘들다

    iCharts IDC(International Data Corporation)가 2018년까지 세계 스마트폰 시장 출하 전망을 발표했다. 발표된 내용에 따르면 2014년 스마트폰 출하 대수는 12억 8800만대로 전년 대비 26.3% 증가한 성장...
    Date2014.12.03 CategoryENTERPRISE Views774
    Read More
  13. 슈퍼컴퓨터 계보> CRAY Y-MP 이후의 벡터형 머신

    이번에는 CRAY Y-MP 이후의 CRAY 벡터 프로세서 시리즈를 묶어 설명한다. CRAY X-MP 개발에 이어CRI는 CRAY Y-MP의 개발을 시작한다.  CRAY Y-MP 이는 CRAY X-MP EA 기준(즉 32bit주소)로 하면서 최...
    Date2014.11.27 CategoryENTERPRISE Views931
    Read More
  14. 슈퍼컴퓨터 계보> 멀티코어화로 대성공한 CRAY X-MP (레스 데이비스)

    이번에 해설하는 것은 CRAY-1에서 분가한 CRAY X-MP다. 연재 276회에서 설명한 대로 CRAY-1의 설계가 일단락 된 시점에서 세이모어 크레이(Seymour Cray)의 관심은 CRAY-2로 옮겨졌다. CRAY X-MP 다만 CRAY...
    Date2014.11.27 CategoryENTERPRISE Views665
    Read More
  15. 엔비디아 실적 발표, 지포스 GPU / 테그라 SOC 판매 호황

    NVIDIA가 2014년 8월~10월 결산 내용을 발표 했습니다. 엔비디아의 실적은 전년 동기 대비 16% 증가된 역대 최대의 12억 2500만 달러의 분기 매출과 45% 증가된 1억 7300만 달러의 순익, 1주당 이익은 55%...
    Date2014.11.10 CategoryENTERPRISE Views841
    Read More
  16. 삼성전자, 서버용 SSD 소프트웨어 업체 '프록시멀 데이터' 인수

    [ 보도 - 삼성전자 ] 삼성전자가 미국의 서버용 SSD(Solid State Drive) 캐싱(Caching) 소프트웨어 전문업체인 '프록시멀 데이터(Proximal Data)'社를 인수했다. ※ 캐싱 소프트웨어 : 컴퓨팅 시스템에서 ...
    Date2014.11.04 CategoryENTERPRISE Views838
    Read More
  17. 3D마크가 국제 표준으로? UL, 핀란드 퓨처마크 인수 (Futuremark)

    미국 보험업자 연구소(UL=Underwriters Laboratories)는 3일(현지시간) 핀란드의 유명 퓨처마크(Futuremark)를 10월 31일에 인수했다고 발표했다. UL은 제품의 안전성이나 기능성에 대한 규격을 책정하고,...
    Date2014.11.04 CategoryENTERPRISE Views696
    Read More
  18. 슈퍼컴퓨터 계보> 고성능이지만 팔리지 않은 CRAY-3 (갈륨비소)

    이번에는 세이모어 크레이(Seymour Cray)가 마지막으로 만든 CRAY-3에 주목한다. CRAY-3의 정확한 개발 시작이 언제인가는 분명하지 않지만 CRAY-2 개발 방침의 윤곽이 결정된 무렵부터 이미 그의 ...
    Date2014.11.03 CategoryENTERPRISE Views1314
    Read More
  19. Twitter / IBM 제휴, 트위터 데이터에 의한 "의사결정" 애플리케이션 개발

    Twitter와 IBM은 Twitter 데이터 비즈니스 애플리케이션 분야에서 제휴를 한다고 발표 했습니다. 이 제휴에는 IBM의 애널리틱스 서비스와 Twitter 데이터 통합, 특정 업계·직종용 엔터프라이즈 애플리케이...
    Date2014.10.31 CategoryENTERPRISE Views696
    Read More
  20. 애플 아이튠즈 스토어 음악 판매 감소, 향후 비츠 뮤직이 관건

    美 애플은 27일, 미 증권 거래 위원회(SEC)에 제출한 연례 보고서에서 아이튠즈 스토어(iTunes Store)의 음악 다운로드 판매가 감소했다고 밝혔다. 아이튠즈의 2014년도(2013년 10월 ~ 2014년 9월...
    Date2014.10.29 CategoryENTERPRISE Views1375
    Read More
Board Pagination Prev 1 ... 19 20 21 22 23 24 25 26 27 28 ... 33 Next
/ 33