검수요청.png검수요청.png

스토리지

위키원
jh8983 (토론 | 기여)님의 2020년 7월 30일 (목) 14:39 판
이동: 둘러보기, 검색

            가기.png (다른뜻) 스토리지코인에 대해 보기

스토리지(storage)는 대용량 자료 저장장치를 말한다. 스토리지는 영어 뜻으로는 원래 '저장 장소'를 의미하며 데이터 저장장치 그 자체를 스토리지 또는 스토리지 디바이스라고도 한다. 그 뜻이 확대되어 전문화, 네트워킹화, 대용량화된 저장기술을 총칭하게 되었고 조직(기업, 정부, 비영리기관 등)에서 생성 보유하는 데이터가 점차 대형화됨에 따라, 조직 내 스토리지 인프라 구축을 위해 저장, 백업, 재난복구, 보안 등을 모두 고려하는 전문화된 대용량 저장기술을 총칭한다. 크게 RAM과 같이 내부 장치로 쓰이는 1차 스토리지와 하드디스크, 테이프 등과 같은 외부 장치로 쓰이는 2차 스토리지, 클라우드 스토리지로 표현하는 3차 스토리지로 구분할 수 있다. [1][2]

개요

초창기 서버에는 RAM과 하드디스크, 즉 주 기억장치(primary storage)와 보조 기억장치(secondary storage)가 구분되어 있지 않았다. 하지만 늘어나는 용량에 맞추다 보니 공간적인 한계에 봉착했고, 그 결과 구분된 스토리지 시스템을 가진 보조 기억장치가 탄생했다. 이는 우리가 아는 직접 연결 스토리지(DAS) 개념의 첫 사례가 된다. 이와 같이 서버와 스토리지를 구분함으로써 업무 효율을 위해 보다 정교하고 복잡한 아키텍처를 구성할 수 있게 되었다.[3]

역사

  • 데이터 스토리지의 문을 열다
데이터 스토리지의 역사는 1956년 미국 캘리포니아 새너제이에 위치한 IBM 연구소에서 시작되었다. 레이놀드 존슨을 필두로 개설된 IBM 연구소의 주요 과제는 거대한 펀치 카드를 대신할 새로운 데이터 기록 매체를 개발하는 것이었는데 초기 IBM 메인 프레임은 드럼 메모리와 테이프 드라이브를 모두 사용했지만, 드럼 메모리는 속도는 빠르지만, 용량이 적고, 테이프 드라이브는 용량은 크지만 느렸다. 존슨은 연구원들에게 드럼 메모리와 테이프 드라이브의 장점을 합친 스토리지를 개발하되, 그 형태를 회전하는 접시(플래터)형으로 할 것을 지시했고 연구팀은 그렇게 세계 최초의 하드디스크 드라이브인 IBM 350 디스크 스토리지 유닛을 개발하게 되었다.
IBM 350은 높이 173cm, 너비 74cm로 무게가 약 1t이나 되어, 한번 옮길 때마다 지게차가 필요했지만, 과거의 어떤 시스템보다 더 큰 용량이어서 직경이 60cm인 50개의 디스크에 최대 5MB를 저장하는 것이 가능했고, IBM은 2년이 안 돼서 저장 용량을 두 배로 늘리는 데 성공했다.
  • IBM, 스토리지 시장을 제패하다
1960년대 스토리지 시장은 IBM이 거의 장악했다. 다른 기업들도 자체 스토리지와 IBM 메인 프레임 시스템용 호환 스토리지를 생산해 IBM보다 낮은 가격을 제시하며 스토리지 시장에 뛰어들었다. IBM은 이에 맞서 계속해서 더 저렴하고 성능이 뛰어난 제품을 개발하여 1973년에는 현대 하드디스크 드라이브의 아버지로 불리는 3340 디스크 드라이브를 출시하였다. 여전히 크기는 세탁기만 했지만, 30MB의 고정 용량과 30MB의 이동식 디스크 팩을 장착했다. 또한 IBM 3340 드라이브는 최초의 밀폐된 읽기/쓰기 헤드를 탑재해 오염을 방지했고, 평균 탐색 시간은 25밀리초로 대폭 줄였다. 게다가 한 달에 9천 원(7.81달러)이라는 저렴한 가격에 임대가 가능했고 이로서 IBM은 새로운 기술로 업계를 또다시 평정했다.
  • 의회 도서관이 내 손 안에
IBM 350을 시작으로, 데이터 스토리지 업계의 연구원들은 수십 년 동안 더 많은 데이터를 더 빠르게 이용할 수 있는 하드디스크 드라이브를 만드는 일에 열중했다. 그 결과 1990년대에는 세탁기 크기의 디스크 컨테이너에 최대 10TB까지 저장할 수 있는 3.5인치 플래터로까지 발전할 수 있었다. 10TB는 국회 도서관 전체를 저장할 수 있는 어마어마한 용량이었는데 책 2,900만 권, 기록물 270만 개, 사진 1,200만 장, 지도 480만 개, 필사본 5,800만 개를 포함한 1억 3,000만 개의 항목을 저장할 수 있는 정도였다. 1GB당 스토리지 가격도 훨씬 저렴했다. IBM이 최초의 디스크 드라이브를 개발했던 1956년을 기점으로 평균 하드디스크 드라이브 가격은 매년 41%씩 하락했고 초기 하드디스크 디스크의 가격이 1GB당 약 22억 5천만 원(200만 달러)이었던 것에 반해, 지금은 약 25원(2센트)까지 떨어졌다. IDC 보고서에 따르면 2020년에는 전 세계에 연간 생산·복제되는 데이터의 양이 44조 기가바이트에 달할 것이라고 한다.[4]

종류

스토리지 연결 방식에는 다스(DAS, Direct Attached Storage), 나스(NAS, Network Attached Storage), 샌(SAN, Storage Area Network) 방식이 있다.

스토리지 제조사에 따라 IBM 스토리지, EMC 스토리지(=Dell 스토리지), 히타치(Hitachi) 스토리지, HP 스토리지, 브로케이드(Brocade) 스토리지 등의 제품이 있다.

DAS

직접 연결 저장장치를 의미하며, 서버 또는 컴퓨터 네트워크를 거치지 않고 서버가 채널(SCSI 또는 Fiber Channel)을 통해 저장 장치에 직접 연결하여 사용하는 방식이다. 서버에 직접 외장 저장 장치를 추가하므로 속도는 빠르고 확장은 쉽지만, 연결 수에 한계가 있고, 각 서버는 사용자가 직접 파일 시스템을 관리해야 한다.[3]

특징

대표적인 DAS 미디어(전용 케이블)로는 스카시(SCSI, Small Computer Systems Interface), 파이버 채널(Fibre Channel), SSA(Serial Storage Architecture)가 있고, 모두 블록 I/O 프로토콜을 사용한다.

파일 시스템 (File System) : 컴퓨터에서 데이터를 기록하거나 수정, 삭제, 찾기 등을 하기 위해선 디스크에 준비 작업이 필요하다. 따라서 사전이 파일에 이름을 붙이고, 논리적으로 어디에 저장되어야 하며, 구조를 통해 파일까지 가는 경로를 설정해야 하는데 이를 수행하는 게 파일 시스템이다.

​블록 I/O 프로토콜 : I/O 커맨드가 디스크나 테이프 드라이브 같은 특정 스토리지 장치와 그 저장 위치를 정확히 지정해준다. 예를 들어 디스크의 경우 I/O 요청 시 디스크의 특정 블록 위치를 지정해서 데이터가 읽히거나 쓰인다. 따라서 DAS의 가장 중요한 특징은 스토리지에 발생하는 모든 I/O가 SCSI 프로토콜 블록 I/O로 해독. 즉 모든 I/O가 블록으로 포맷되며, 이 블록 I/O는 물리적 디스크 장치에 저장된 데이터 위치와 구조에 관한 정보를 가지고 있다.[5]

장점

  • 전용 케이블로 서버와 직접 연결하기 때문에 속도가 빠르다.
  • 설치가 간편/용이하다.
  • 연결된 서버마다 개별적인 파일 관리시스템이 가능하다.
  • 네트워크 결합 스토리지와 스토리지 영역 네트워크에 비해 비용이 적게 든다.[6]

단점

  • 스토리지 간 접속방법이 서로 달라 공유에 문제가 있다.
  • 시스템 간 파일 공유가 불가능하며 시스템마다 같은 데이터를 가져야 한다.
  • 확장성, 유연성이 떨어진다. 접속 가능 SCSI버시 수, 처리 가능 데이터 용량이 제한적이다.
  • 데이터 증가에 따른 스토리지의 계속적 추가는 서버 효율성을 저하한다.
  • 서버 다운 시 장착된 스토리지 사용이 불가능하다.[6]

NAS

사무실의 업무 환경이 종이에서 전자문서로 넘어가기 시작하면서 업무 문서나 자료들을 동시에 공유하고 수정하는 일이 많아져 이처럼 스토리지에 접속하는 사용자가 증가하고 공유가 필요한 자료가 많아지면서 더 쉽고 편리하게 데이터를 공유할 방법이 필요했다. 이러한 배경 속에서 스토리지 영역 네트워크와 함께 등장한 것이 바로 네트워크 결합 스토리지다.[7]

특징

네트워크 결합 스토리지도 마찬가지로 네트워크를 통해 서버나 클라이언트가 스토리지와 연결하지만, 스토리지 영역 네트워크와는 다르게 이더넷을 통해 연결하는 방식을 사용한다. 또한 스토리지를 SAN 스위치와 연결하지 않고 이더넷 케이블을 사용해 네트워크에 연결한다. 단적인 예로, 인터넷 공유기에 네트워크 결합 스토리지를 연결하면 같은 이더넷 네트워크에 연결된 PC로 네트워크 결합 스토리지에 접근할 수 있다. 이처럼 범용적인 네트워크를 사용하는 관계로 설치나 유지 관리가 쉽지만, 같은 이더넷에 연결된 장비들과 네트워크 자원을 공유하기 때문에 대역폭에 한계가 있을 수 있다.[7]

구성

네트워크 결합 스토리지는 자체적으로 파일 서비스를 제공하며, 대표적으로 NFS나 CIFS와 같은 스토리지 프로토콜을 사용한다. 네트워크 결합 스토리지의 주요 스토리지 프로토콜은 다음과 같다.

  • NFS (Network File System)
  • SMB/CIFS (Server Message Block/Common Internet File System)
  • FTP (File Transfer Protocol)
  • HTTP (Hypertext Transfer Protocol)
  • AFP (Apple Filing Protocol)

파일 시스템: 네트워크 결합 스토리지의 경우 블록보다 상위 개념인 파일을 저장 단위로 하고 있다. 파일은 폴더에 저장되며 하나의 폴더에 여러 하위 폴더가 겹겹이 존재하는 계층적 구조로 되어 있다. 각 파일은 이름과 파일에 대한 정보를 나타내는 메타데이터를 가지며, 이 메타데이터를 활용해 어느 폴더의 하위 디렉터리에 파일이 있는지 알 수 있다.

네트워크 결합 스토리지는 스토리지 시스템이 포함된 어플라이언스 형태와 스토리지 시스템이 포함 안 된 게이트웨이 형태 두 가지 방식으로 구성될 수 있다. 게이트웨이의 경우, 스토리지 부분을 스토리지 영역 네트워크와 연결해서 블록 서비스와 함께 CIFS나 NFS와 같은 파일 서비스를 제공할 수 있다.[7]

장점

  • 파일 서버를 통한 파일 시스템 공유가 가능하다. 이기종 시스템 간 파일 공유, 전송이 가능하다.
  • 데이터 서버와 스토리지 간 독립성을 유지한다.
  • LAN으로 클라이언트, 서버, 파일 서버를 연결한다.
  • 전용 파일서버 한곳에서 관리됨으로 파일을 여러 서버에서 공유할 수 있다.
  • 사용 중 다운 필요 없이 확장이 가능하다.
  • 스냅숏 등 데이터 보호 솔류션 및 데이터 백업이 간단하다.[6]

단점

  • 파일서버에 의해 스토리지 용량이 제한적이다.
  • 데이터 접근 요청으로 파일서버 병목현상이 발생한다.(LAN 대역폭 한계)
  • 파일서버 지원 스토리지만 연결할 수 있다.
  • 파일서버 다운 시 스토리지 사용이 불가능하다.[6]

SAN

하드디스크의 용량 증가와 소형화가 진행되면서 공간 효율적인 서버를 구성할 수 있게 되었지만, 서버의 용량 효율이 문제가 되어 서버의 스토리지 용량을 추가해야 할 경우, 부족분을 채우기 위해 새 디스크를 추가하거나 여유 공간이 있는 다른 서버에서 디스크를 물리적으로 빼서 추가해야 했다. 이러한 불편함을 해소하기 위해 사용된 것이 스토리지 영역 네트워크이다.[7]

특징

스토리지 영역 네트워크 방식은 여러 스토리지를 하나의 네트워크에 연결하고, 이 네트워크에 서버를 연결해 스토리지에 접속한다는 개념이다. 네트워크에 묶인 스토리지들은 가상으로 중앙화된 논리 볼륨(logical volume)을 형성하고, 필요에 따라 각 서버에 공간을 논리적으로 할당할 수 있다. 사용자는 LUN(Logical Unit Number)이라는 고유 번호를 통해 가상으로 할당된 디스크 드라이브에 연결된다. 데이터베이스, 가상화 환경, 영상 편집 같은 빠른 속도와 대규모 환경이 필요한 곳에서 주로 사용된다.[7]

구성

스토리지 영역 네트워크 환경을 구성하기 위해서는 스토리지 영역 네트워크 스위치라는 기기를 필요로 하게 된다. 스토리지 영역 네트워크 스위치는 위에서 설명한 개념을 구현하기 위해 스토리지와 서버를 중계하는 역할을 한다. 스토리지 영역 네트워크 방식은 각 서버와 스토리지를 광 케이블로 SAN 스위치와 연결해 데이터를 주고 받는다.

스토리지 영역 네트워크의 주요 스토리지 프로토콜은 다음과 같다.

  • iSCSI (Internet Small Computer Systems Interface)
  • 파이버 채널 (Fibre Channel)
  • iSER (iSCSI Extensions for RDMA)

스토리지 영역 네트워크 환경에서는 파일을 저장하는 방식으로 블록 스토리지(block storage)라는 개념을 사용한다. 블록 스토리지는 데이터를 블록이라는 일정한 크기의 조각으로 나누어 저장하는 것을 말한다. 각 블록은 저장된 위치(특정 스토리지 시스템의 특정 디스크)에 대한 주소를 가지고 있어 서버의 요청에 따라 블록들을 재구성해 하나의 데이터로 서버에 전달된다.[7]

장점

  • 광케이블을 사용하기 때문에 데이터 접근이 빠르다
  • 필요에 따라서 성능과 용량을 확장하기가 쉽다
  • LAN을 사용하지 않아 네트워크 부하를 최소화할 수 있다.
  • 가상화 환경을 구축하기 적합하다.[7]

단점

  • 상대적으로 비싸다
  • 이더넷 네트워크와 광케이블 네트워크를 동시에 운영하기에 관리에 손이 많이 간다.
  • 관리하는데 전문적인 인력이 필요하다.
  • 블록 백업에 스토리지 공간이 더 요구된다.[7]

비교

  • DAS, NAS, SAN 비교
항목 DAS NAS SAN
구성요소 서버

저장장치

서버

전용 파일 서버 저장장치

서버

FC 스위치 저장장치

접속장치 없음 이더넷 스위치 광채널 스위치
파일 시스템 공유 불가능 가능 불가능
적용 규모 소규모 중규모 대규모
속도 채널 속도 LAN + 채널 속도 채널 속도
[3]

IP-SAN

기존 스토리지 영역 네트워크와 기가비트 이더넷을 이용하는 IP 네트워크 기술을 접목시킨 IP 기반의 스토리지 네트워크다. 이더넷 기반의 TCP/IP를 스토리지 네트워크로 사용해 기존 스토리지 영역 네트워크 기술보다 운영과 성능의 효율성을 증가시킨다. FC기반을 유지하면서 IP접속을 하는 IFCP, FCIP와 IP를 중심으로 스토리지 영역 네트워크를 구축하는 ISCSI가 있다.[8]

클라우드 스토리지

클라우드 스토리지(cloud storage)는 디지털 데이터를 논리 풀에 저장하는 시스템이다. 논리 풀이라는 것은 물리적인 스토리지가 일반적으로 호스팅 업체에 의해 소유, 관리되는 복수의 서버들에 걸쳐 있는(복수의 지역에 걸쳐 있을 수도 있다.) 데이터 스토리지 모델이다. 이러한 클라우드 스토리지 제공자들은 사용자들이 데이터를 늘 사용 및 접근할 수 있도록, 또한 물리 환경이 보호된 상태로 실행되도록 서비스를 제공한다. 개인 또는 단체는 클라우드 스토리지 용량을 제공자로부터 구매 또는 임대하여 사용자, 단체의 데이터나 애플리케이션의 데이터를 저장한다. 클라우드 스토리지는 여러 지역에서 함께 연동되는 클라우드 컴퓨팅을 통해서 작동하기 때문에 외부에서 쉽게 접속할 수 있고, 웹 서비스를 통해서 접속할 수도 있으며, API를 이용하여 애플리케이션으로 접속할 수 있다. 이런 프로그램들을 통해서 클라우드 데스크톱 스토리지나 클라우드 스토리지 게이트웨이 혹은 웹 기반 콘텐츠 관리 시스템 등을 운영할 수 있는 특징이 있다.[9]

구조

클라우드 스토리지는 고수준의 가상화에 기반을 두고 있다. 보통 파일은 한 개의 스토리지에 저장이 되는데, 클라우드 스토리지는 한 개의 파일을 여러 대의 가상화된 물리 서버에 공통으로 저장하는 개념이다. 그리고, 쉽게 접근하기 위해서 웹이나 애플리케이션 기반의 파일 조회, 업로드, 삭제 등의 서비스를 포함하고 있다. 내부에 거의 무한대에 가까운 용량을 가지고 있기 때문에, 지금 현재 내가 1G의 용량을 가지고 있다가, 10G의 파일을 넣어야 할 때 서비스 비용만 지불 하면 바로 10G를 쓸 수 있는 놀라운 확장성을 가지고 있다. 멀티테넌시를 통해서 여러 명이 동시에 파일을 관리하거나 조회하는 것이 가능하고, 현재 내가 가지고 있는 파일과 사용할 수 있는 용량을 실시간으로 측정할 수 있다. 클라우드 스토리지 서비스들은 외부에 있는 서비스(아마존 S3)를 통해서 사용할 수 있고, 극도의 보안이 요구되는 경우, 내부에 설치한 ViON 캐퍼시티 서비스를 통해 활용할 수 있다.[9]

장점

  • 회사들은 일반적으로 한 달 평균 사용량에 해당하는 비용만 내는 구조이다. 그렇다고 해서 클라우드 스토리지가 저렴하다는 것은 아니다.
  • 클라우드 스토리지를 사용하는 업체는 전기 사용량의 70%를 절약할 수 있다.
  • 회사 내부 혹은 해당 업체에 만들거나, 두 개를 동시에 조합할 수 있으며, 비용이나 업무 지속성, 재해 복구 기능, 보안, 정부 정책 등의 조건에 따라서 선택할 수 있다.
  • 스토리지 가용성과 데이터 보호는 스토리지의 고유한 구조, 어플리 케이션, 추가적인 기술과 노력, 비용 등에 달렸다.
  • 추가 용량 구매나 유지 보수 작업 등의 스토리지 유지 작업은 서비스 공급자가 책임진다.
  • 클라우드 스토리지 업체는 웹 서비스 등을 통해서 다른 업체에 있는 자원을 다양하게 사용하는 방법을 제공한다.
  • 클라우드 스토리지에 필요한 가상 머신 이미지를 저장하고, 필요한 순간에만 다운로드 받아서 현지에서 사용할 수 있는 시스템을 제공한다.
  • 전 세계 센터에 백업을 나누어 저장하기 때문에 장애 발생을 하지 않는다. 증분 백업을 진행하므로, 데이터 백업 용량이 적어진다.
  • Webdav를 이용해서 내부 드라이브로 인식될 수 있다. 사무실이 여러 군데에 있는 경우 유용하다.[9]

단점

  • 네트워크가 연결되지 않은 장소에서는 사용할 수 없다.
  • 관리자가 마음대로 접근해서 볼 수도 있다.
  • 네트워크가 불안정하면 업로드가 끊기거나 실패할 수 있다.
  • 다른 언어를 사용하는 사이트의 이용에 어려움이 있다.

현황

현재 가장 주목받고 있는 것은 클라우드 스토리지를 이용한 서비스이다. 2019년 기준 전 세계 동영상 스트리밍 시장에서 30%의 점유율을 차지하고 있는 것으로 보이는 넷플릭스 비디오 서비스는 세계 각지의 아마존 웹 서비스(AWS) 데이터센터를 통해 끊김 없이 스트리밍되며, 시청자들의 취향 정보를 빅데이터로 수집해 비디오 추천 서비스를 제공한다. 넷플릭스에 클라우드 스토리지 서비스를 제공하는 아마존은 인터넷 서점으로 시작했지만, 지금은 전 세계적인 IT 기업 중 하나로 꼽힌다. 정부도 클라우드 시장 활성화에 본격적으로 나서기 시작했고 네이버와 KT 등 국내 기업들도 클라우드 시장에 끼어드는 추세다. [7][10]

각주

  1. 차재복, 〈스토리지〉, 《정보통신기술용어해설》, 2020-01-25
  2. stevenjlee, 〈(이해하기)스토리지 (Storage)의 종류 (DAS, NAS, SAN)와 개념〉, 《개인 블로그》, 2020-05-24
  3. 3.0 3.1 3.2 꿈꾸는 사람., 〈(스토리지 구성) DAS, NAS, SAN, IP-SAN〉, 《티스토리》, 2017-04-20
  4. IBM KORAE, 〈스토리지 70년 역사의 시작은 IBM〉, 《네이버 블로그》, 2018-11-12
  5. 촌, 〈스토리지 종류(storage) : DAS / NAS / SAN 비교〉, 《네이버 블로그》, 2020-04-27
  6. 6.0 6.1 6.2 6.3 상일, 〈6. 네트워크 스토리지 - DAS, NAS, SAN〉, 《네이버 블로그》, 2016-09-07
  7. 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 박주형, 〈스토리지 기초 지식 1편:DAS, SAN, 그리고 NAS〉, 《글루시스 기술 블로그》, 2019-12-02
  8. 낭만온달, 〈(기술사/토픽-IS플랫폼) IP-SAN 스토리지 구성기술〉, 《티스토리》, 2019-02-19
  9. 9.0 9.1 9.2 클라우드 스토리지 위키백과 - https://ko.wikipedia.org/wiki/%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C_%EC%8A%A4%ED%86%A0%EB%A6%AC%EC%A7%80
  10. 이후섭 기자, 〈클라우드 전쟁 불 붙었다…보안업계도 클라우드 시장 주목〉, 《이데일리》, 2020-07-25

참고자료

같이 보기


  검수요청.png검수요청.png 이 스토리지 문서는 하드웨어에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.