본문 바로가기

경영, 비즈니스/기업보안

기업이라면 반드시 알아야 할 데이터 백업 방법

728x90

 

보호해야 하는 데이터의 양부터 데이터에 대한 위협에 이르기까지, 비즈니스를 위한 핵심 데이터를 보호하는 일에는 큰 어려움이 따른다. 그러나 적절한 데이터 백업 방법을 사용하면 재해 복구와 IT 회복탄력성을 보장할 수 있다.

데이터 백업이란

데이터 백업은 간단히 말해 디지털화된 데이터 및 기타 비즈니스 정보의 복사본을 만드는 것이다. 백업은 우발적인 변경, 악의적 공격, 사람의 실수나 자연재해에 대비한 일종의 보험이다. 비즈니스 연속성과 재해 복구를 위해 백업 사본을 사용해서 데이터를 복구 또는 복원할 수 있다.

 

많은 기업이 여러 개의 데이터 백업을 만든다. 빠른 복구를 위해 복사본 중 하나를 온프레미스에 두고 다른 하나를 오프사이트 또는 클라우드에 둔다. 이렇게 하면 홍수나 화재 또는 기타 이벤트로 인해 온프레미스의 복사본이 손상되더라도 두 번째 복사본을 사용할 수 있다.

데이터 백업 방법을 이해하는 것이 중요한 이유

사고에 적절히 대비하지 않으면 되돌릴 수 없는 피해를 유발하고 회사의 성장과 안정이 영구적으로 저해될 수 있다. 백업은 최후의 방어선이며, 예상하지 못한 이벤트나 악의적 공격으로 인해 데이터가 변경, 손실 또는 손상됐을 때 데이터를 복구할 수 있는 사실상 유일한 방법이다. 이상 기후, 사이버 범죄를 비롯한 여러 위협이 부상하고 있는 상황에서 데이터는 어느 때보다 많은 위험에 직면해 있다. 따라서 사용 가능한 다양한 데이터 백업 방법을 이해하는 것이 무엇보다 중요하다.

기업에서 반드시 알아야 할 데이터 백업 방법

1. 전체 백업

전체 백업(full backup)은 기업이 한 번의 백업 작업에서 보호하고자 하는 모든 데이터의 복사본을 하나 이상 만드는 프로세스다. 이 방법은 모든 데이터의 완전한 복사본을 제공하므로 항상 사용 가능하고, 따라서 버전 제어가 간소화되고 복구 속도가 빨라진다.

 

이 방법의 한 가지 단점은 시간이다. 모든 데이터가 백업된다는 것을 보장하므로 일반적으로 가장 안전한 방법으로 간주되지만, 복사해야 할 데이터의 양으로 인해 가장 느린 데이터 백업 방법이기도 하다. 또한 전체 백업에는 필요한 스토리지 공간과 네트워크 대역폭이 가장 많다. 데이터 중복 제거 및 압축과 같은 기술은 공간 소비를 줄이고, 경우에 따라 전체 백업 프로세스의 속도를 높이는 데도 도움이 될 수 있다. 간편하고 빠른 복구 모델이 필요하고 공간과 백업 속도는 문제가 되지 않는다면 전체 백업에서 복구하는 것은 매우 효과적인 방법이다.

 

기억해야 할 중요한 점은 전체 백업을 암호화하는 것이다. 암호화하지 않으면 전체 데이터 환경이 취약해진다.

 

2. 차등 백업

마지막 전체 백업 이후 변경된 모든 파일을 복사하는 데이터 백업을 차등 백업(differential backup)이라고 한다. 차등 백업 대상에는 어떤 식으로든 추가되거나 변경된 모든 데이터가 포함된다. 차등 백업은 모든 데이터를 매번 복사하는 것이 아니라 전체 백업과 다른 데이터만 복사한다.

 

차등 백업은 전체 백업보다 스토리지 공간을 덜 차지하며, 이는 비용 관점에서 이점이다. 그러나 전체 백업 복원보다 속도가 더 느리다는 점에 유의해야 한다. 또한 차등 백업에서는 두 개의 파일이 필요하므로 관리하기 더 까다롭다. 어느 데이터 저장 매체를 사용하는가에 따라 달라지긴 하지만, 증분 백업보다 복구 시간이 더 빠를 수 있다. 차등 백업은 백업 시간 윈도우를 줄이면서 복구를 간소화하는 좋은 방법이다. 그러나 다음 전체 백업 실행 시간이 다가올수록 각 차등 백업의 크기는 증가한다.

 

차등 백업에는 이전 백업과 비슷한 데이터가 포함되므로 여기서도 마찬가지로 중복 제거와 같은 스토리지 저감 기술이 도움이 될 수 있다.

 

3. 증분 백업

증분 백업(incremental backup)은 항상 전체 백업으로 시작한다. 차등 백업과 마찬가지로 증분 백업도 이전 백업이 수행된 이후 변경되거나 추가된 데이터만 복사한다. 그러나 차등 백업이 마지막 전체 백업에 대한 변경을 기반으로 하는 것과 달리, 첫 번째 백업 이후의 모든 증분 백업은 마지막 증분 백업의 변경 사항을 기반으로 한다.

 

일반적으로 증분 백업에는 차등 및 전체 백업보다 필요한 공간이 적다. 최소한의 스토리지 공간만 사용하려면 블록 수준 증분 백업 대신 바이트 수준 증분 백업을 수행하면 된다. 하지만 증분 백업은 지금까지 살펴본 3가지 데이터 백업 방법 중 복원 속도가 가장 느리다. 또 복원을 위해서는 백업 체인 전반의 모든 파일이 필요하므로 관리하기도 더 복잡하다.

 

이 방법은 백업 윈도우가 촉박한 경우에 효과적이다. 인프라에서 비교적 적은 양의 데이터만 캡처해서 타겟으로 옮기면 되기 때문이다.

 

4. 합성 전체 백업

합성 전체 백업(synthetic full backup)은 전체 백업과 같이 모든 데이터를 다시 가져오는 부담 없이 긴 증분 체인의 영향을 낮추는 데 효과적인 방법이다. 합성 전체 백업에서는 이전 전체 백업과 증분 백업을 사용해서 모든 증분 변경 사항을 반영한 새 전체 백업을 생성한다. 이는 증분 백업 전략의 리셋 지점이다. ‘증분 영구(incremental forever)’ 백업이라고도 한다. 제대로 된 솔루션이라면 백업 스토리지 레이어에서 합성 전체 백업을 생성한다. 합성 전체 백업의 경우 매우 긴 증분 데이터 체인에 따르는 복구 시간 측면의 희생 없이 인프라에서 증분 데이터만 옮기면 된다.

 

5. 파일 수준 백업

전통적인 파일 수준 백업(file-level backup) 방법은 이제 낡은 방법이라는 인식도 있지만, 그렇지 않다. 이 데이터 백업 방법은 더 큰 범위의 데이터 보호 및 재해 복구 전략의 중요한 구성요소가 될 수 있다.

 

파일 수준 백업에서는 백업할 항목을 직접 선택한다. 파일 시스템 스캔이 수행되고, 각 데이터 집합의 복사본이 서로 다른 대상에 만들어진다. 이 백업은 일반적으로 하루 단위나 대략 그와 비슷한 일정으로 수행된다.

 

지금까지 설명한 데이터 백업 방법 중에서 꼭 한 가지만 사용해야 하는 것은 아니다. 대부분의 기업은 여러 방법을 조합한다. 데이터 손실 위험을 줄이는 데 도움이 되고, 더 나은 복구 지점 목표를 달성할 수 있다는 장점이 있기 때문이다.

 

파일 수준 백업은 물리적 시스템 또는 매우 큰 가상머신에 저장된, 블록 수준에서 백업할 수 없는 대량의 비구조적 데이터 집합을 처리하기에 좋은 방법이다. 파일 시스템 백업은 그동안 발전해서, 휴리스틱 및 멀티 스트리밍과 같은 기술을 사용해 더 강력한 인프라에서 더 큰 데이터 집합에 대해 더 빠른 데이터 이동을 제공한다.

 

6. 이미지 수준 백업

복구 지점 목표(Recovery Point Objective, RPO)를 개선하고 거의 지속적인 데이터 보호를 달성하는 것이 주된 목표라면 이미지 수준 백업이 좋은 방법이다. 무한 증분 백업으로도 불리는 이미지 수준 백업은 짧은 윈도우 내에 여러 백업을 수행한다. 재해가 발생한 이후 OS가 정상 작동하는지 여부와 무관하게 신속하게 시스템을 가동할 수 있으므로 데이터 복구에 효과적이다. 이미지 수준 백업에는 물리적 시스템의 볼륨부터 전체 가상머신 이미지에 이르기까지 많은 변형이 있다. 가장 많이 사용되는 방법은 관리 오버헤드를 줄여주는 가상머신의 이미지 수준 백업이다.

 

재해 발생 후 빠른 복원 방법을 원하면서 물리적 시스템이 있다면 이미지 수준 백업의 한 형태인 베어 메탈 복원을 고려할 수 있다. 이 방법을 사용하면 데이터뿐 아니라 OS와 애플리케이션, 구성 설정도 백업해서 이벤트 이후 더 빠르게 리빌드하고 복구할 수 있게 된다. 대부분 경우 베어 메탈 복구는 가상머신에 할 수 있으므로 물리적인 시스템 액세스가 극히 제한될 수 있는 재해 복구 상황에 도움이 된다.

 

7. 지속적 데이터 보호

지속적 데이터 보호(Continuous Data Protection, CDP)는 최근 인기를 얻으면서 많이 알려졌다. 복구 속도를 높이고 더욱 세분화된 복구 지점 목표를 달성할 수 있는 방법이다.

 

CDP는 서브 파일 수준에서 새롭거나 변경된 모든 데이터 블록을 매우 빈번한 간격으로 캡처한다. 일부 최신 CDP 접근 방법의 경우 장애가 발생한 가상머신 또는 서버를 몇 분, 빠르면 몇 초 만에 복원할 수 있다. 디스크 변경을 추적하기 위한 스냅샷 또는 볼륨 필터 디바이스를 사용해서 복원 지점이 생성되는 경우가 여기에 해당한다.

 

데이터 무결성을 보장하고 복원 수행 시 문제를 방지하기 위해 CDP 백업은 애플리케이션 일관성을 유지한다. 무결성 검사를 통한 최신 백업 검증으로 복구 가능성을 보장한다. CDP와 ‘즉각 복원’ 기술은 비즈니스 크리티컬 시스템에 적합하다. 이 접근 방법은 잠재적인 데이터 손실의 양을 줄이고, 복구 속도를 높여 다운타임으로 인해 비즈니스가 받는 비용 측면의 영향을 경감시켜 준다.

 

8. 어레이 기반 스냅샷

어레이 기반 스냅샷(array-based snapshot)은 다른 데이터 백업 방법보다 시스템에 미치는 영향이 낮고 스토리지 공간도 덜 필요하다. 이 방법을 사용하면 세부적인 수준에서 신속하게 데이터 볼륨을 복구할 수 있다. 볼륨에 작성된 데이터의 기본 스냅샷이 생성되면 그 이후의 스냅샷에서는 증분 변경 사항만 캡처된다. 따라서 디스크 공간이 절약되고 로컬 복구 속도가 빨라진다. 부가적인 디스크 공간을 확보하지 않고도 많은 스냅샷을 생성할 수 있다. 스냅샷을 짧은 간격으로 예약해서 복구 지점 목표를 달성할 수 있다.

 

스냅샷의 동작은 일반적인 백업 작업을 벗어나 수행되므로 복잡성이 가중될 수 있다. 어레이 기반 스냅샷을 보완하는 백업 애플리케이션을 사용하면 일반적인 문제를 극복하는 데 도움이 된다. 하나의 UI를 통해 복구 스냅샷을 생성, 예약, 복구할 수 있으므로 관리하기도 더 쉽다.

 

스토리지 스냅샷은 전체적인 복구 전략에서 효과적인 구성요소지만, 여전히 주 스토리지에 위치하므로 재해 발생 시 손실될 수 있다. 따라서 다른 위치에 스냅샷 복사본을 만들거나 데이터를 백업하는 것이 최선의 방법이다.

 

9. 데이터 중복 제거

데이터 증가가 백업 스토리지 예산에 부담이 된다면 데이터 중복 제거가 도움이 될 수 있다. 데이터 중복 제거는 중복된 데이터 블록을 찾아 제거하고 이전 백업 이후 변경된 블록만 저장해서 백업 데이터 스토리지 요구사항과 비용을 비약적으로 낮춰준다. 또한 중복 제거 솔루션은 소스 측 중복 제거인 ‘오프로딩’ 옵션도 제공한다. 이 옵션을 통해 인프라를 이동하는 백업 데이터 트래픽을 더욱 줄이고 백업 시간을 단축할 수 있다.

 

데이터 중복 제거에 소프트웨어 정의 접근 방법을 추가하면 기존 백업 시스템을 보완할 수 있다. 이를 통해 리소스 관리, 프로비저닝 자동화를 위한 더 높은 유연성을 얻고 온프레미스 또는 클라우드 기반 스토리지 용량을 신속하게 할당할 수 있다. 소프트웨어 정의 접근 방법은 하드웨어 어플라이언스에 비해 새로운 수요를 더 잘 충족할 수 있고 더 폭넓은 클라우드 제공업체, 스토리지 디바이스 및 가상화 플랫폼을 지원한다.

 

데이터 증가가 수그러들 기미 없이 계속되는 상황에서 데이터 중복 제거는 백업 스토리지 비용을 통제하는 데 도움이 될 수 있다.

 

결론

사이버 공격, 자연 재해는 물론 사람의 실수와 같은 일상적인 위험까지 데이터는 매일 위험에 직면한다. 이제는 사고 발생 여부가 아닌, 언제 발생할지의 문제다. 적절한 백업 및 복구 방법을 적시에 구현하면 돌이킬 수 없는 피해를 유발하는 위협에서 기업을 보호하는 데 도움이 된다. 변경 불가 백업은 랜섬웨어와 같은 위협에서 데이터를 한층 더 보호해 준다. 궁극적으로 백업은 최후의 방어선이다.

 

반응형

출처

기업이라면 반드시 알아야 할 9가지 데이터 백업 방법

백업(ITWorld Korea)

 

728x90
반응형
LIST