4월 28일 (일) 오후 9:39

logo

  • home
  • head
  • itnews
  • product
  • mobile
  • game
  • benchmark
  • analysis
  • blog

개봉 2024.06.05. / 장르 드람 / 국가 대한민국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...
개봉 2024.05.22. / 장르 액션 / 국가 미국 감독 : 조지 밀러 출연 : 안야 테일러 조이, 크리스 헴스워스 등 ...

SSD에서 클라우드 : 스토리지 저장매체의 발전과 데이터 활용 특성



2014년도 IDC Report에 따르면 향후 생성될 디지털 정보는 매년 42.5%씩 늘어나고 2017년에는 125 Exabytes에 이른다고 하며 요새 Petabyte나 Exabyte 같은 단위가 그리 낯설게 들리지 않는 것을 보면 기업이 든 개인이든 폭발적으로 늘어나는 데이터를 어떻게 관리하느냐가 초미의 관심사임에는 틀림 없다. 이를 증 명하듯 비즈니스 SNS인 링크드인에서 조사한 바로는 2014년도 구인 기업에게 가장 각광받았던 기술에서 스토리지 관리 부분이 당당 3위를 차지하기도 하였다. 이렇게 생성되는 데이터가 늘어나는 만큼 스토리지 시 스템 기술도 발전을 이루어 왔고 그 중심에는 스토리지 시스템에서 실제 데이터가 저장되는 저장매체의 발 전이 매우 크게 기여 했음에 의심의 여지가 없다.

인류 최초의 기계적인 스토리지 저장 매체는 바로 1800년대 초반에 직물을 짜는 기계에서 사용한 천공카드 였다고 한다. 천공카드에 일정 패턴으로 천공을 뚫으면 베틀이 그 패턴 그대로 직물을 짤 수 있었다고 하며 여 기서 아이디어를 얻어 1800년대 후반 전기적으로 천공을 인식하여 몇 개의 카드에 저장된 숫자를 테이블로 만들어 내는 시스템이 만들어졌다는 것이다.

다음으로 나온 저장매체가 마그네틱 테이프이며 1951년도에 발표된 최초의 상업용 컴퓨터인 유니벡 (Univac)-1에 저장용 스토리지로 사용되었고 그 이후 현재까지 컴퓨팅 산업의 발전과 함께 저장 매체도 마 그네틱 테이프에서 마그네틱 디스크 그리고 최신의 Flash 반도체 기술에 기반을 둔 SSD(Solid State Drive) 에 이르기까지 눈부신 발전을 함께 이룩해 왔다.

그럼 여기서 우리는 폭발적으로 늘어나는 데이터를 어떤 저장 매체에 저장하여야 하는가를 고민하지 않을 수 없다. 아직도 SSD는 Disc 대비 수십 배 비싼 솔루션이며 그 SSD 내부에서도 가격과 성능 차이가 수배에 이르기 때문이고 결국 좋은 성능은 그만큼 높은 비용을 지급하게 만들기 때문에 스토리지 시스템에 저장될 데이터의 활용 특성에 대해서 이해하는 것이 매우 중요하다 하겠다.

이 부분의 설명을 돕기 위하여 스마트폰을 예로 들도록 하겠다. 일전에 어떤 연예인이 자신의 스마트폰에 3,500명의 연락처가 저장되어 있다고 얘기하는 걸 들은 적이 있는데 그럼 그분은 이 3,500명의 연락처라는 데이터를 어떤 식으로 활용하고 있을까? 이분이 3,500명 모두에게 같은 주기로 똑같이 연락하지는 않을 거 라 생각된다. 이를테면 하루에 10명씩 매일 통화하면 1년에 한 번은 3500명 모두와 연락을 취할 수 있다. 하지 만 이런 식으로 데이터(여기서는 연락처)를 활용하는 경우는 거의 없을 것이다. 연구에 따르면 데이터의 활 용은 반드시 특정 데이터군에 대해 집중되며 이러한 부분을 데이터 활용 특성 (Data skew 또는 Data access pattern)이라고 얘기한다

즉 100번 전화를 시도 한다고 할 때 Data skew가 88%이면 하면 90번은 3,500명 중 180명 이내의 사람들에 게 전화가 간다는 것이고 Data skew가 33%이면 100번의 전화통화중 80번은 3,500명 중 1,155명 중에 간다 는 것을 뜻한다. 이것은 같은 데이터라도 그 데이터를 사용하는 사람에 따라 달라지는데 이를 IT 솔루션으로 설명하면 어떤 애플리케이션이냐 따라 그 Data skew가 달라진다

밑의 [그림1]은 이러한 애플리케이션 별 데이터 활용 특성을 그래프로 설명하고 있다. 그림 아래쪽의 기타 App은 클라우드 솔루션으로 사진을 공유하는 Internet Service Provider의 1년간의 사진 활용 특성이며 이 는 사용자가 1년 동안 찍은 사진을 다시 볼 때 80%는 지난 3개월에 집중된다는 것을 의미한다. 이러한 특성 을 이 사업자가 이해하고 적절하게 사용할 수 있다면 엄청난 스토리지 비용을 절감할 수 있다. 예를 들어 자주 보는 지난 3개월간의 사진은 가장 성능이 좋은 - 이를테면 - SSD에 저장해서 빠른 응답 속도를 제공하고, 나 머지 9개월 사진은 더 느린 응답 시간에 계약조건을 단 후 원격 Cloud storage에 저장하는 것이다. 데이터 활 용 특성을 무시하고 모든 데이터를 SSD에 담는 것보다 수십 배의 비용 절감이 가능할 것으로 예상된다.

tech_img4426.jpg


그런데 이러한 데이터 사용 특성은 개인보다는 저장 데이터가 무척 큰 기업 규모의 Structured Data에서 훨 씬 더 직관적이고 명확하게 적용된다. 어떤 기업이 지난 10년간의 고객의 주문 정보를 저장하고 있고 주문에 서 매출인식까지의 한 주기를 6개월이라 한다면 해당 6개월 치의 데이터는 자주 읽고 변경하며 활용하겠지만, 나머지 9년 6개월의 이미 마감이 된 주문 정보 데이터는 활용이 매우 낮을 수밖에 없는 것입니다. [그림 1]에 서 OLTP성 업무의 Data skew 그래프가 이러한 데이터 활용 특성에 대해서 잘 설명하고 있다.

특히 OLTP성 Structured Data는 결국 Database에서 생성되는 것이고 Data의 생성과 저장은 향후 그 Data 의 효율적인 활용에 지대한 영향을 끼치게 되어 오라클에서는 12c부터 Heat map이라는 기능으로 기업이 가 지고 있는 DB Data의 Dataskew에 따라 block 단위로 Hot/Warm/Cold/Deep Archive로 구분하여 그 활 용 특성을 알도록 도와준다.

tech_img4427.jpg


만약 이러한 대량의 데이터를 세부 데이터 활용 패턴을 무시하고 한 종류의 저장 매체 - 이를테면 고성능의 SSD에 모두 저장하는 것은 효율적인 자원 활용을 매우 어렵게 만든다. 이를테면 가장 높은 성능을 위하여 데 이터 사용 패턴을 무시하고 모든 데이터를 SSD에 담는다고 했을 때 우선 성능 때문에 SSD를 선택했으나 비 용 때문에 중저가 SSD를 선택해야 하는 모순에 빠지게 된다 - 앞에서 얘기했듯이 같은 SSD라 하더라도 그 종류에 따라 가 격과 성능이 천차만별이기 때문이다. 그리고 성능 때문에 SSD 를 선택했으나 저장 용량을 줄이기 위하여 중복제거 같은 오 히려 스토리지 시스템의 IOPS 성능을 저하시키는 기능도 함 께 사용되어야 하는 아쉬움이 있는 것이다.

결국 특히 대량의 데이터를 가지고 있는 기업 입장에서 가장 이상적인 방법은 빠른 응답을 해야 하는 소량의 데이터를 최 고 성능의 반도체 기반의 저장 매체에 저장하고 활용이 떨어 지는 대량의 데이터는 저비용의 HDD나 테이프 시스템 및 Cloud에 분산하며 각 매체 간의 유연한 데이터 이동을 가능하 게 할 관리 시스템을 채택했을 경우 가장 뛰어난 투자 대비 성 능 개선 효과를 볼 수 있을 것이며 특히 이를 위하여는 애플리 케이션과 온프레미스 스토리지 시스템에서 Clould에 이르기 까지 서로 능동적으로 이러한 Data 활용 특성에 대한 정보를 공유하고 그에 맞는 스토리지 tier를 선택할 수 있도록 공동 개발되는 것이 가장 중요한 것이다. 왜냐하면, 설 사 DB에서 Heatmap으로 Data 특성에 대해 구분되었더라도 밑단의 스토리지 시스템이 이 패턴을 이해하지 못한다면 이러한 기능은 무용지물이기 때문이다.

따라서 기업 고객의 경우 이러한 Data의 생성과 저장 그리고 백업 및 Archiving에 이르기까지 Data의 한 생 애 주기에 대한 깊은 이해로 소프트웨어와 하드웨어를 Co-engineering 할 수 있는 솔루션 공급업체를 선택 하는 것이 매우 중요하다고 할 수 있겠다.



출처 : 오라클

제공 : 데이터 전문가 지식포털 DBguide.net






  1. 네트워크 성능 관련 용어 정의 - 대기시간 (Latency)

    Latency   지연 시간의 측정치를 말한다. 대기시간은 하나의 네트워크, 링크, 또는 장비에서 또 다른 네트워크, 링크, 장비까지의 지연을 말한다. 이 지연은 네트워크를 구성하는 회선, 장비, 서버의 부...
    Date2016.11.09
    Read More
  2. 네트워크 성능 관련 용어 정의 - 가용성(Availability)

    Availability (가용성) 1. 정의 서비스를 위해 사용되는 네트워크 활용도를 말한다. 가용성은 통상 자원이 활용될 수 있는 날, 주 또는 달의 백분율로 표시한다. 즉, 총 네트워크 운용(가동)시...
    Date2016.11.08
    Read More
  3. 네트워크 성능 관련 용어 정의 - 혼잡(Congestion)

    Congestion 혼잡은 매우 높은 부하상태에서 발생하게되며, 혼잡은 네트워크 또는 장비가 처리할 용량을 초과했음을 나타낸다. 이러한 혼잡 상태는 급속히 지연(latency)을 증가시키고 그 상태가 지속...
    Date2016.11.08
    Read More
  4. 더 얇고 가볍게, 다이어트 중인 반도체 패키지 기술

    더 얇고 가볍게, 다이어트 중인 반도체 패키지 기술 - 팬 아웃 웨이퍼 레벨 패키지 관련 기술 특허출원 증가 - 보다 얇고 가벼운 고사양 휴대용 전자기기 수요 증가에 발맞춰 팬-아웃 웨이퍼 레...
    Date2016.10.30
    Read More
  5. 애플 iOS 10.1, 13건의 취약성 수정

    애플이 24일 iOS 최신 버전 iOS 10.1 발표. 새로운 기능과 13건의 취약성 조정 포함. iOS 10.1은 아이폰5 이상 아이패드 4세대 이상 아이팟 터치 6세대 이상이 대상이 되는 새로운 버전. ...
    Date2016.10.30
    Read More
  6. ASUS, 카비레이크 지원 메인보드 BIOS 제공 시작

    ASUS가 인텔 Z170/Q170/H170/B150/H110/C232 칩셋 메인보드용으로 7세대 카비레이크 Core 프로세서 등 차세대 CPU에 대응한 BIOS 제공 시작. 바이오스 업데이트는 UBS 메모리를 사용하거나 ASUS E...
    Date2016.10.11
    Read More
  7. 즉석 리뷰 : 데이드림 뷰 “스마트폰 VR의 새로운 제왕”

    스마트폰 기반 가상 현실(VR) 시장의 절대 강자는 기어 VR이다. 삼성은 오큘러스와 손잡고 뛰어난 품질과 인상적인 VR 라이브러리 경험을 탄생시켰다. 구글 카드보드(Google Cardboard)는 저렴하다는 장점...
    Date2016.10.07
    Read More
  8. Cisco ASA 방화벽 신규 취약점 보안 업데이트 권고

    □ 개요 o Cisco社는 ASA 소프트웨어에 영향을 주는 취약점을 해결한 보안 업데이트를 발표[1] o 공격자는 취약점에 영향 받는 네트워크 장비에 원격코드 실행 및 서비스 거부 등의 피해를 발생시킬 수 있으...
    Date2016.09.07
    Read More
  9. SSD에서 클라우드 : 스토리지 저장매체의 발전과 데이터 활용 특성

    SSD에서 클라우드 : 스토리지 저장매체의 발전과 데이터 활용 특성 2014년도 IDC Report에 따르면 향후 생성될 디지털 정보는 매년 42.5%씩 늘어나고 2017년에는 125 Exabytes에 이른다고 하며 요새 Pet...
    Date2016.09.07
    Read More
  10. 눈(目)으로 로그인, 홍채인식 기술

    안구의 홍채를 이용해 사람을 인식하는 기술, 바로 ‘홍채인식(iris recognition)’이다. 홍채라는 부위가 워낙 생소하고 독특해서인지, 이를 통해 사람을 인식하는 기술은 예전부터 SF 영화의 단골 소재로...
    Date2016.09.07
    Read More
  11. 전세계 노트북PC 시장 점유율 (Trend Force)

    트렌드 포스의 2015년 종합 세계 노트북 시장 점유율 (2016년은 예상수치) HP와 레노버가 1위자리를 놓고 박빙의 경쟁중 애플과 에이수스가 중간 위치에서 박빙의 경쟁중 1위 HP 20.5% 2...
    Date2016.08.24
    Read More
  12. “100달러도 안 쓰고” PC를 업그레이드하는 10가지 방법

    Brad Chacos | PCWorld 물론 호화로운 신형 서피스 프로와 1,200달러 그래픽 카드가 미디어의 헤드라인을 장식할 수 있겠지만, 진짜 현실의 이야기는 PC의 가격이 결코 만만치 않다는 것이다. 두 명의 아...
    Date2016.08.21
    Read More
  13. 2016년 8월 마이크로소프트 보안 패치

    2016년 8월 Microsoft 보안 업데이트Microsoft의 정기적인 월례 보안 업데이트 계획에 따라 2016년 8월 10일 신규 보안 업데이트 9건이 발표되었습니다. 세부 정보 받기IT 전문가 및 시스템 관리자해당 업...
    Date2016.08.18
    Read More
  14. 컴퓨터그래픽만으로도 영화가 된다?!

    영화 ‘부산행’이 연일 흥행 신기록을 갈아치우며 올 여름 극장가를 뜨겁게 달구고 있다. 극중에서 부산으로 향하던 KTX 열차는 좀비들로 인해 대전역에서 정차하지만 여기저기에서 나타난 다른 좀비들의 ...
    Date2016.08.13
    Read More
  15. 윈도우10 레드스톤 업데이트 방법 (Windows 10 Redstone)

    Windows 10 1주년 업데이트 정보Windows는 꾸준히 업그레이드됩니다. Windows 10 1주년 업데이트는 Windows 10 출시 이후 두 번째로 큰 업데이트입니다. 고객의 의견을 반영한 멋진 새로운 기능이 가득합니...
    Date2016.08.06
    Read More
  16. 사기성 소프트웨어 설치를 방지하기 위한 연구조사

    원치 않는 소프트웨어로부터 사용자를 보호하는 차원에서 최근 구글에서는 사기성 소프트웨어 설치 유도 수법 및 원치 않는 소프트웨어 제공과 관련된 비즈니스를 규명하는 데 최선의 노력을 쏟고 있습니다...
    Date2016.08.05
    Read More
  17. 랜섬웨어와의 전쟁: IT 보안 회사와 사법 기관과의 국제 공조 프로젝트 출범

    16만 여개의 복호화 키로 만든 새 복호화 프로그램으로 관련 암호화된 데이터를 복구하는데 도움을 줍니다. 네덜란드 경찰과 유로폴, 인텔 시큐리티와 카스퍼스키랩이 참여한 'No More Ransom'이라는 프로...
    Date2016.07.29
    Read More
  18. 개발자의 의사소통 능력

    개발자의 의사소통 능력 개발자의 의사소통 능력은 코딩실력보다 중요하다. 이미 여러 번 했던 이야기다.'개발자의 생명은 커뮤니케이션'이라는 칼럼에서 개발자의 의사소통이 정확히 무엇을 의미하는...
    Date2016.07.21
    Read More
  19. 2016년 7월 마이크로소프트 보안 패치

    Microsoft의 정기적인 월례 보안 업데이트 계획에 따라 2016년 7월 14일 신규 보안 업데이트 16건이 발표되었습니다. IT 전문가 및 시스템 관리자해당 업데이트에 관한 자세한 정보는 Microso...
    Date2016.07.17
    Read More
  20. 랜섬웨어 공격 급증, 연간 71만 8천 명의 피해자 발생

    Kaspersky Security Network (KSN)의 통계 자료에 따르면 암호화 랜섬웨어 공격이 급증하면서 2015년 4월부터 2016년 3월 사이에 집계된 피해자 수가 71만 8,536명에 이르고 있습니다. 이는 2014년~2015년 ...
    Date2016.07.10
    Read More
  21. 2016년 상반기 구글 인기 검색어

    2016년도 벌써 반이 훌쩍 지나고 어느덧 장마가 시작되었습니다. 지난 6개월간 구글 검색에서는 어떤 검색어들이 인기를 끌었을까요? 지난 상반기를 뜨겁게 달궜던 인기 검색어 순위를 종합 순위와 함께 사...
    Date2016.07.08
    Read More
  22. VMware ESXI란 무엇인가

    1. ESXi 소개      ESXi는 VMware에서 만든 가상화 OS 입니다. ESXi는 vSphere Hypervisor 이라는 제품군에 속해있습니다. 따라서 ESXi는 vSphere Hypervisor에 있는 많은 프로그램들 중 하...
    Date2016.07.03
    Read More
  23. 아마존 웹서비스 글로벌 리전 (AWS Region)

    AWS 클라우드는 전 세계 13개의 지리적 리전 내에 35개의 가용 영역을 운영하고 있으며, 다음 해에는 4개의 리전과 9개의 가용 영역이 추가될 예정입니다. AWS 리전 및 가용 영역 AWS 클라우드 인프라는 ...
    Date2016.06.30
    Read More
  24. Xbox의 진화와 게이밍의 미래를 보여준 2016 E3 총정리

    지난 6월 14일부터 16일까지 미국 LA 컨벤션 센터에 엄청난 인파가 몰렸다. 바로 Electronic Entertainment Expo, 줄여서 E3라고 부르는 행사가 열렸기 때문. E3는 매년 9월에 열리는 동경게임쇼(TGS), 독...
    Date2016.06.27
    Read More
  25. 로보 어드바이저, 인간과 공생일까 경쟁일까?

    로보 어드바이저, 인간과 공생일까 경쟁일까? 소프트웨어 개발자로서 주식에 관심을 가진 사람들은 인간의 직관과 경험을 통한 주식투자를 능가하는 프로그램을 개발해 보고 싶다는 생각을 한 번씩은 ...
    Date2016.06.24
    Read More
  26. 윈도우서버 2008 장애조치 클러스터링 구성 방법

    1. 필수 요구사항 A. Active directory 가 필요합니다. B. Windows Server 2008 Enterprise Edition 이 설치된 2 대 이상의 domain member server 가 필요합니다. C. 클러스터 된 가상 서버에 ...
    Date2016.06.21
    Read More
  27. VMware 보안 업데이트 권고

    □ 개요 o VMware社는 원격코드실행 취약점 등을 해결한 보안 업데이트를 발표[1][2] o 영향 받는 버전의 사용자는 최신 버전으로 업데이트 권고 □ 설명 o 공격자가 인증 없이 원격으로 역직렬화...
    Date2016.06.21
    Read More
  28. 2016년 6월 마이크로소프트 보안 패치

    2016년 6월 Microsoft 보안 업데이트Microsoft의 정기적인 월례 보안 업데이트 계획에 따라 2016년 6월 15일 신규 보안 업데이트 16건이 발표되었습니다. 세부 정보 받기IT 전문가 및 시스템 관리자해당 ...
    Date2016.06.21
    Read More
Board Pagination Prev 1 ... 8 9 10 11 12 13 14 15 16 17 ... 47 Next
/ 47