"지속적 데이터 보호"의 두 판 사이의 차이
7번째 줄: | 7번째 줄: | ||
컴퓨터의 백업은 IT 사회에서 매우 흥미로운 혁신중 하나였다. 복제기술은 자료를 보호하는데 훌륭한 기술이 되어왔따.기존의 백업 방식은 일정한 시간이나 날짜를 주기로 데이터가 백업이 된다다. 기존의 방식은 디스크 기반 라이브러리 (VTL), 그리고 소프트웨어가 자동으로 백업하는 방식 이였다, 예를들어 1주일단위로 데이터를 백업하는 회사가 있다고 가정을한다. 디스크 손상이나 해커의 공격으로 컴퓨터의 데이터가 손실되면 1주일 단위로 지정되있는 데이터를 서버에서 백업을 할 수있다. 하지만 중요한 데이터를 하루나 이틀전에 수정했다고 가정한다. | 컴퓨터의 백업은 IT 사회에서 매우 흥미로운 혁신중 하나였다. 복제기술은 자료를 보호하는데 훌륭한 기술이 되어왔따.기존의 백업 방식은 일정한 시간이나 날짜를 주기로 데이터가 백업이 된다다. 기존의 방식은 디스크 기반 라이브러리 (VTL), 그리고 소프트웨어가 자동으로 백업하는 방식 이였다, 예를들어 1주일단위로 데이터를 백업하는 회사가 있다고 가정을한다. 디스크 손상이나 해커의 공격으로 컴퓨터의 데이터가 손실되면 1주일 단위로 지정되있는 데이터를 서버에서 백업을 할 수있다. 하지만 중요한 데이터를 하루나 이틀전에 수정했다고 가정한다. | ||
서버에 백업이 되지않음으로 작업한 데이터는 전혀 복구를 할 수 없고 특정한 복구시점이나 시간으로 복구가 불가능하다. 이렇든 중요한 데이터나 혹은 공공기관,은행등의 데이터들은 바로바로 백업이 되어야한는데 너무 오랜시간 텀을 두게되면 문제가 발생한다. | 서버에 백업이 되지않음으로 작업한 데이터는 전혀 복구를 할 수 없고 특정한 복구시점이나 시간으로 복구가 불가능하다. 이렇든 중요한 데이터나 혹은 공공기관,은행등의 데이터들은 바로바로 백업이 되어야한는데 너무 오랜시간 텀을 두게되면 문제가 발생한다. | ||
− | 이는 컴퓨터도 마찬가지이다. 보통 백업은 주말이나 저녁에 많이 이루어진다. 그래야만 네트워크나 서버에 걸리는 과부화와 자원낭비를 막을 수 있다. 하지만 실제로 에러발생시 데이터를 복구하는데는 꽤 오랜시간이 소요되고 만만치 않다. | + | 이는 컴퓨터도 마찬가지이다. 수많은 고객들의 정보를 담고있기때문에 백업을 하는데도 오래걸리고 변경사항이 자주 발생한다. 보통 백업은 주말이나 저녁에 많이 이루어진다. 그래야만 네트워크나 서버에 걸리는 과부화와 자원낭비를 막을 수 있다. 하지만 실제로 에러발생시 데이터를 복구하는데는 꽤 오랜시간이 소요되고 만만치 않다. |
이렇듯 기존의 백업방식은 상당히 긴 시간이 필요하고 비용 또한 높으며 데이터 보호에대한 관심이 높아지면서 [[클라우드]](Cloud), [[스토리지]](Storage)등 여러 저장서버들이 시중에 나오게 되었고 백업 데이터의 효율을 위해 중복 데이터는 제거(remove)하고 보다 효율적인 자원을 사용하기에 지속적으로 데이터를 백업하는 지속적 데이터 보호 가 탄생하게 되었다.(기존의 특정 시간으로 돌아가는 스냅샷 방법보다 더 우수하다.) | 이렇듯 기존의 백업방식은 상당히 긴 시간이 필요하고 비용 또한 높으며 데이터 보호에대한 관심이 높아지면서 [[클라우드]](Cloud), [[스토리지]](Storage)등 여러 저장서버들이 시중에 나오게 되었고 백업 데이터의 효율을 위해 중복 데이터는 제거(remove)하고 보다 효율적인 자원을 사용하기에 지속적으로 데이터를 백업하는 지속적 데이터 보호 가 탄생하게 되었다.(기존의 특정 시간으로 돌아가는 스냅샷 방법보다 더 우수하다.) | ||
38번째 줄: | 38번째 줄: | ||
*디렉토리의 모든변화를 잡아내는 동시에 저장하는 형태이다. | *디렉토리의 모든변화를 잡아내는 동시에 저장하는 형태이다. | ||
*강력한 스토리지 기술인 Cloudian을 필요로 한다. | *강력한 스토리지 기술인 Cloudian을 필요로 한다. | ||
+ | * 서버의 성능에 영향을 미치치 않으며 디스크 용량을 절약한다. | ||
== 활용 == | == 활용 == | ||
− | 파일 유형 CDP는 최종 사용자와 파일 서버에 가장 적합하다. 그 이유는 보호 받을 자산(즉 파일)이 더 나은 조밀도와 복구 용이성을 제공하는 CDP 유형과 딱 맞아떨어지기 때문이다. 파일 해법 기반의 매력은 다음과 같다. 경량이며, 파일 기반 정책, 조밀도, 좀 더 자연스러운 복구 시나리오를 제공하며 응용 프로그램/사용자 가 올바른 CDP 유형을 선택한다. 매일매일 데이터 정보를 저장하고 보호하는 웹사이트나 은행, 고객의 정보를 가지고 있는 게임회사 등에서 많이 사용된다. 일반적인 사무실 직원이 사용하거나(문서 생성과 편집) 자동화된 비즈니스 응용 프로그램(XML 패키지)이 사용한다면 파일 기반 해법이 제격이다. (워크스테이션과 랩톱 같은 최종 사용자용 시스템을 보호하는 데 관심이 많다면 딱 맞는 해법이다.) 컴퓨터가 대부분 여러 응용 프로그램 서비스를 제공한다면(DB2나 오라클이나 전자편지 서버), 블록 기반 해법이 수용 될 것이다. 응용 프로그램이 독자적인 응용 프로그램 기반 CDP 기능을 내장하고 있다면, 이런 기능을 사용 할 때에는 발생하는 부하가 견딜만한지 고려해야 한다. | + | 파일 유형 CDP는 최종 사용자와 파일 서버에 가장 적합하다. 그 이유는 보호 받을 자산(즉 파일)이 더 나은 조밀도와 복구 용이성을 제공하는 CDP 유형과 딱 맞아떨어지기 때문이다. 파일 해법 기반의 매력은 다음과 같다. 경량이며, 파일 기반 정책, 조밀도, 좀 더 자연스러운 복구 시나리오를 제공하며 응용 프로그램/사용자 가 올바른 CDP 유형을 선택한다. 매일매일 데이터 정보를 저장하고 보호하는 웹사이트나 은행, 고객의 정보를 가지고 있는 게임회사 등에서 많이 사용된다. 백업기능 외에도 사실 복구기반에 많은 중점을 두기도 한다. 과거에는 백업만 보았다면 오류 발생후 데이터를 다시 복구하는 것이 중요함으로 데이터 복구시에 강력한 효과를 발휘한다. 일반적인 사무실 직원이 사용하거나(문서 생성과 편집) 자동화된 비즈니스 응용 프로그램(XML 패키지)이 사용한다면 파일 기반 해법이 제격이다. (워크스테이션과 랩톱 같은 최종 사용자용 시스템을 보호하는 데 관심이 많다면 딱 맞는 해법이다.) 컴퓨터가 대부분 여러 응용 프로그램 서비스를 제공한다면(DB2나 오라클이나 전자편지 서버), 블록 기반 해법이 수용 될 것이다. 응용 프로그램이 독자적인 응용 프로그램 기반 CDP 기능을 내장하고 있다면, 이런 기능을 사용 할 때에는 발생하는 부하가 견딜만한지 고려해야 한다. |
== 디스크의 크기 == | == 디스크의 크기 == | ||
46번째 줄: | 47번째 줄: | ||
== 문제점 == | == 문제점 == | ||
+ | * 서버에 데이터를 업로드하는 유일한 방법으로 외부공격애 취약 할 수 있다. | ||
* 연속적인 데이터 보호를 위해 뛰어난 디스크 드라이브가 필요하다. | * 연속적인 데이터 보호를 위해 뛰어난 디스크 드라이브가 필요하다. | ||
* 데이터 자원에 대한 처리량이 증가함으로 중요하게 보호할 자원에 문제가 발생 할 수 있다. | * 데이터 자원에 대한 처리량이 증가함으로 중요하게 보호할 자원에 문제가 발생 할 수 있다. |
2020년 7월 31일 (금) 15:17 판
지속적 데이터 보호(CDP)란 Continuous Data Protection의 약자로서 데이터(사진, 문서파일 등) 변화 시 즉각적으로 서버에 백업을 하는것을 의미한다. 연속백업이라고도 한다. 영어 약자로 CDP(씨디피)라고 한다.
개요
지속적 데이터 보호는 데이터의 모든 변경 사항을 스토리지(Storage) 또는 서버(Server)에 저장(save)한다. 블록단위로 데이터를 저장하기때문에 외부의 버퍼 오버플로우 공격이나 자연재해로 인한 데이터 손실시 원하는 날짜 시간 심지어는 분 단위까지 파악하여 백업(Back-up)을 할 수 있다.
등장배경
컴퓨터의 백업은 IT 사회에서 매우 흥미로운 혁신중 하나였다. 복제기술은 자료를 보호하는데 훌륭한 기술이 되어왔따.기존의 백업 방식은 일정한 시간이나 날짜를 주기로 데이터가 백업이 된다다. 기존의 방식은 디스크 기반 라이브러리 (VTL), 그리고 소프트웨어가 자동으로 백업하는 방식 이였다, 예를들어 1주일단위로 데이터를 백업하는 회사가 있다고 가정을한다. 디스크 손상이나 해커의 공격으로 컴퓨터의 데이터가 손실되면 1주일 단위로 지정되있는 데이터를 서버에서 백업을 할 수있다. 하지만 중요한 데이터를 하루나 이틀전에 수정했다고 가정한다. 서버에 백업이 되지않음으로 작업한 데이터는 전혀 복구를 할 수 없고 특정한 복구시점이나 시간으로 복구가 불가능하다. 이렇든 중요한 데이터나 혹은 공공기관,은행등의 데이터들은 바로바로 백업이 되어야한는데 너무 오랜시간 텀을 두게되면 문제가 발생한다. 이는 컴퓨터도 마찬가지이다. 수많은 고객들의 정보를 담고있기때문에 백업을 하는데도 오래걸리고 변경사항이 자주 발생한다. 보통 백업은 주말이나 저녁에 많이 이루어진다. 그래야만 네트워크나 서버에 걸리는 과부화와 자원낭비를 막을 수 있다. 하지만 실제로 에러발생시 데이터를 복구하는데는 꽤 오랜시간이 소요되고 만만치 않다. 이렇듯 기존의 백업방식은 상당히 긴 시간이 필요하고 비용 또한 높으며 데이터 보호에대한 관심이 높아지면서 클라우드(Cloud), 스토리지(Storage)등 여러 저장서버들이 시중에 나오게 되었고 백업 데이터의 효율을 위해 중복 데이터는 제거(remove)하고 보다 효율적인 자원을 사용하기에 지속적으로 데이터를 백업하는 지속적 데이터 보호 가 탄생하게 되었다.(기존의 특정 시간으로 돌아가는 스냅샷 방법보다 더 우수하다.)
기능
지속적 데이터 보호는 어느 기업이나 개인사용자로 부터 발생하는 모든 데이터의 편집기록을 백업하기 때문에 시스템이 악성코드에 의해 해킹을 당하여도 원하는 시간대가장 최신의 파일 데이터를 복구 할 수 있다. 디렉터리 파일을 복제하고 후속파일은 복제 원본파일에 블록 단위로 데이터를 저장하기 때문에 오베헤더가 없고 폴더와 파일을 마지막으로 수정한 내역까지 복구가 가능하다. 기존의 백업방식인 테이브 방식이나 아카이브 보다 훨씬 더 빠르게 데이터 복구를 제동하며 기존의 있던 데이터와 충돌하지않는다. 기존의 백업의 프로세스 낭비까지 보안하였다. 백업을 할려면 먼저 데이터를 확인해야되고 실행중이 프로세스를 확인해야한다. 주로 밤이나 주말에 함으로 백업되는 데이터의 양이 제한적이고 프로세스가 실행 되는동안 해당 프로그램은 사용하지 못한다. 지속적 데이터 보호는 프로세스를 따로 컨트롤 하지 않고 백업이 가능하다. CDP 작동 방식현재 지속적 데이터 보호기능은 윈도우7이상, 윈도우서버2008 R2 이상에서 제공이된다.[1] 데이터가 실제 변경될시 즉작적으로 백업을 하는 경우도 있고 정기적인 백업이지만 예약시간을 매우 자주 실행하여 지속적인 데이터 보호 효과를 수행 할 수 있다. 옆의 그림을 예시로 든다면 1시간을 주기로 데이터 백업을 진행 하고 있다. 예상치 못한 오류나 악성해커의 공격으로 데이터가 손실되면 해킹받기전 이전 시간으로 되돌릴 수 있다. 기존백업보다 훨씬 시간이 짧은것을 알 수 있다. 그림에서는 1시간이지만 실제로는 분 단위로 백업을 올릴 수 있기때문에 해커의 공격에도 안전하게 데이터를 복구 할 수 있다.작동원리
- CDP 백업을 위해 지속적으로 생성한 백업파일을 호출한다. (예를 들어 CDP의 백업이 생성 될 전체 백업 또는 증분 백업 예비 만들 수 있다.)
- 백업 모듈 및 연속 데이터 보호가 활성화 된 상태 에서 보호 계획을 처음 실행하면 전체 백업이 먼저 생성된다. 그 후 에는 컨택되거나 변경된 파일 / 폴더에 대한 CDP 백업이 생성된다. (CDP의 백업은 항상 최신 상태로 사용자에 의해 선택된 데이터를 포함한다.)
- 선택한 파일 / 폴더를 변경하면 새 CDP 백업이 생성 되지 않으며 모든 변경 사항이 동일한 CDP 백업에 기록된다.
- 예약 된 증분 백업 시간이되면 CDP 백업이 삭제 되고 증분 백업이 완료된 후 새 CDP 백업이 생성된다.
- CDP 백업은 항상 보호 된 파일 / 폴더의 최신 실제 상태를 갖는 백업 체인에서 최신 백업으로 유지된다.백업 모듈을 활성화하고 활성화하기로 결정으로 이미 보호 계획이있는 경우 지속적인 데이터 보호를 다음 CDP의 백업은 이미 전체 백업을 가지고 바로 백업 체인으로 옵션을 사용하도록 설정 한 후에 작성된다.[1]
옆의 그림에서도 자세히 볼 수 있다. CDP는 블록기반으로 구성된 파일을 복제하고 저장하기때문에 블록하나하나에 수정사항이 구분되어 있으며 파일변경시에만 새로운 블록을 추가하면 된다. 원래의 정보를 가지고있는 파일을 새로 업로드 하므로 기존의 파일은 삭제해도 무방하며 PC는 자신이 가지고 있는 파일을 올리면 블록이 추가되어 저장이되는 형태이다.
유형
- 블록 기반 CDP
- 응용 프로그램은 CDP가 돌고 있는지도 모른다. 대다수 블록 기반 CDP 해법은 (SAN 구조에) "내장된 형태"를 따르므로 서버나 스토리지 유형에 무관하게 동작한다. 아주 단순하게, 블록 기반 CDP는 스토리지 네트워크를 건너 일어나는 모든 블록 쓰기를 감시해서, 논리적으로 시간 순서에 따른 쓰기 캐시를 유지하는 방법을 사용한다. 몇몇 해법은 이런 캐시 관리에 있어 아주 복잡한 방법을 따른다. 이렇게 하는 이유는 (아주 값비싼 방법으로 트랜잭션을 재조합하는 방법과 비교해서) 캐시에 들어있는 disk/LUN의 "뷰"를 즉각 보여주는 기능을 제공하기 위해서다.블록 기반 해법은 투명하게 자료를 수집하는 과정에서 뛰어난 장점을 발휘하며, 과거 특정 시점의 뷰 를 반영한다. 하지만 종종 역사적인 "뷰"를 활용하기 위해 추가 작업이 필요한 경우도 있다. 예를 들어, 지속적으로 I/O를 스토리지에 스트리밍하는 데이터베이스 응용 프로그램을 상상해보자. 데이터베이스 동기화나 정지 시점과 일치하지 않는 특정 시점으로 "뷰"를 되돌리려면, 아마도 데이터베이스는 이 뷰를 기준으로 독자적인 비정상 종료 복구를 수행해야 할 것이다. 종종 블록 기반 CDP 해법은 CDP 디바이스가 복원점을 구분하기 위해 응용 프로그램 쪽에서 정지 시점과 일치하는 특정 "시각"을 태그로 기록해 놓는 태깅 연산을 지원한다. 이런 불연속점 사이에서도 CDP 해법이 유용한 뷰를 제공해주긴 하지만 몇몇 응용 프로그램 재동기화라는 비용을 치뤄야 한다(정말로 임의 시점으로 가고 싶다면 재동기화 비용은 엄청나게 높아진다).그러므로 블록 기반 해법의 매력은 다음과 같다. 응용 프로그램 투명성이 아주 높고, 응용 프로그램 성능에 영향을 미치지 않으며, 일반적으로 하드웨어와 플랫폼 특성을 타지 않는다.[2]
- 응용 프로그램 기반 CDP
- 스펙트럼의 반대쪽 끝에는 응용 프로그램 기반 CDP가 놓여있다. 즉, 특정 응용 프로그램(예: DB2나 기타 몇몇 데이터베이스 또는 비슷한 응용 프로그램)이 특정 시점으로 돌리기 위해 필요한 모든 저널링 정보를 처리할 책임을 전적으로 진다. 응용 프로그램에 밀접하게 통합되어 있다는 사실은 복구 능력에 훨씬 더 풍부한 기능을 제공하는 해법임을 의미한다. 예를 들어, 데이터베이스는 세 시간 전에 나타났던 테이블의 열이나 행을 복구하고, 동작 중인 응용 프로그램을 방해하지 않은 채로 살아있는 시스템에서 이런 복구 작업을 진행할 수 있을지도 모른다. 반면 블록 기반 해법은 테이블 열과 행을 보지 못하며, 가공되지 않은 블록만 볼 뿐이다. 블록 기반 해법은 전체 디스크(또는 디스크 집합)에 대한 "뷰"만 제공하며, (데이터베이스와 같은) 응용 프로그램은 실제 사용을 위해서는 이런 "뷰"를 물리적으로 "마운트"해야만 한다.응용 프로그램 기반 해법의 매력은 다음과 같다. 강력한 복구 능력을 위해 응용 프로그램과 밀접하게 통합되어야 한다. 단점은 다음과 같다. 응용 프로그램과 협력해야만 제대로 동작하며, 응용 프로그램 서버에 부하를 주고 자원을 소비한다.[2]
- 파일 기반 CDP
- 파일 기반 CDP 해법은 (파일 서버나 워크스테이션과 같은) 응용 프로그램 호스트에서 동작하며 응용 프로그램 기반 CDP와 상당히 비슷하다. 하지만 좀 더 범위가 넓은 이유는 여러 응용 프로그램과 사용자가 자연스럽게 파일 기반으로 구성된 자료를 사용하기 때문이다. 블록 기반 해법에서는 LUN/disk 단위로만 정책 설정이 가능했지만, 파일 기반 기술은 파일이나 파일 그룹 단위로 다양한 규약을 설정 할 수 있다. 특정 기계에 들어있는 파일 집합은 단순히 CDP 형식으로 보호를 받을 필요가 없을지도 모르며, 어떤 파일 집합은 저장 시점을 오랫동안 유지할 필요가 있을지도 모른다. 또한 파일 기반 CDP 해법은 부하가 중간 정도로 그치는데, 파일이 디스크에 자연스럽게 저장될 때, 이미 여러 캐시에 저장되어 있는 자료로 아주 쉽게 복사본을 만들 수 있기 때문이다. 복구 역시 파일 기반 CDP 해법에서 좀 더 부드럽게 진행된다. 과거 특정 시각에서 전체 볼륨 뷰를 마운트하거나 제공할 필요가 없다. 그 대신 각 파일에 대한 개별 저장 인스턴스를 찾아서 필요한 버전을 찾아 볼 수 있다(아니면 파일이나 디렉터리 집합 복구를 원하는 특정 시각을 요청할 수도 있다).[2]
특징
- 네트워크의 부하가 기존의 백업보다 낮으며 서버에 중복파일이 있다면 이를 제외하여 용량을 줄인다.(시스템 서버의 성능을 유지)
- 로컬,네트워크 폴더 외에도 클라우드,소프트웨어(OS)까지도 저장 할 수 있다.
- 어느시간(Any-Time) 이라도 복구 할 수 있다.
- 디렉토리의 모든변화를 잡아내는 동시에 저장하는 형태이다.
- 강력한 스토리지 기술인 Cloudian을 필요로 한다.
- 서버의 성능에 영향을 미치치 않으며 디스크 용량을 절약한다.
활용
파일 유형 CDP는 최종 사용자와 파일 서버에 가장 적합하다. 그 이유는 보호 받을 자산(즉 파일)이 더 나은 조밀도와 복구 용이성을 제공하는 CDP 유형과 딱 맞아떨어지기 때문이다. 파일 해법 기반의 매력은 다음과 같다. 경량이며, 파일 기반 정책, 조밀도, 좀 더 자연스러운 복구 시나리오를 제공하며 응용 프로그램/사용자 가 올바른 CDP 유형을 선택한다. 매일매일 데이터 정보를 저장하고 보호하는 웹사이트나 은행, 고객의 정보를 가지고 있는 게임회사 등에서 많이 사용된다. 백업기능 외에도 사실 복구기반에 많은 중점을 두기도 한다. 과거에는 백업만 보았다면 오류 발생후 데이터를 다시 복구하는 것이 중요함으로 데이터 복구시에 강력한 효과를 발휘한다. 일반적인 사무실 직원이 사용하거나(문서 생성과 편집) 자동화된 비즈니스 응용 프로그램(XML 패키지)이 사용한다면 파일 기반 해법이 제격이다. (워크스테이션과 랩톱 같은 최종 사용자용 시스템을 보호하는 데 관심이 많다면 딱 맞는 해법이다.) 컴퓨터가 대부분 여러 응용 프로그램 서비스를 제공한다면(DB2나 오라클이나 전자편지 서버), 블록 기반 해법이 수용 될 것이다. 응용 프로그램이 독자적인 응용 프로그램 기반 CDP 기능을 내장하고 있다면, 이런 기능을 사용 할 때에는 발생하는 부하가 견딜만한지 고려해야 한다.
디스크의 크기
CDP는 기존 백업 기술에 비해 더 적은 디스크 용량을 차지한다. 그 이유는 기존 백업 기술은 Incremental 백업이라 하더라도 일반적으로 파일 단위의 복제인 데 비해, CDP는 바이트 혹은 블럭 단위로 저장하기 때문이다. 예를 들어 한 개의 100 GB 파일에서 1바이트가 변경되었다면, CDP는 1바이트만 저장하는 반면, 기존 백업 기술은 100GB를 저장한다.[3]
문제점
- 서버에 데이터를 업로드하는 유일한 방법으로 외부공격애 취약 할 수 있다.
- 연속적인 데이터 보호를 위해 뛰어난 디스크 드라이브가 필요하다.
- 데이터 자원에 대한 처리량이 증가함으로 중요하게 보호할 자원에 문제가 발생 할 수 있다.
현황과 전망
각주
- ↑ 1.0 1.1 N3NCLOUDE,〈지속적인 데이터 보호(CDP)란 무엇인가요?〉, 《아크로니스》, 2020-07-06
- ↑ 2.0 2.1 2.2 Chris Stakutis,〈CDP란 무엇이며, 어디에 가장 적합한 기술인가〉, 《한국데이터산업진흥원》, 2008-09-24
- ↑ Continuous Data Protection 위키피디아, -https://en.wikipedia.org/wiki/Continuous_Data_Protection
참고자료
- Alexa Drake,〈Why Continuous Data Protection Is the Best Security Guard〉, 《Leaning Hub》, 2020-02-19
- N3NCLOUDE, 〈지속적인 데이터 보호(CDP)란 무엇인가요?, 《아크로니스》, 2020-07-06
- Chris Stakutis,〈CDP란 무엇이며, 어디에 가장 적합한 기술인가〉, 《한국데이터산업진흥원》, 2008-09-24
- Continuous Data Protection 위키피디아, -https://en.wikipedia.org/wiki/Continuous_Data_Protection
같이 보기