AWS DataSync와 Storage Gateway 비교

AWS DataSync와 Storage Gateway 비교

AWS의 DataSync, Storage Gateway를 이해하고 비교해보자.


AWS Storage Gateway와 AWS DataSync 개요

앞에서 AWS Storage Gateway을 간단히 말하면

백업 툴이며 AWS에서 기존의 온프레미스 환경의 데이터센터를 운영하고 있는 고객을 대상으로 백업 전용 게이트웨이를 사용할 수 있도록 만든 서비스

AWS에서 소개하는 DataSync 설명을 보면

AWS DataSync온프레미스와 AWS 스토리지 서비스 사이에서 데이터 이동을 자동화 및 가속화하는 안전한 온라인 서비스입니다. DataSync는 NFS(Network File System) 공유, SMB(Server Message Block) 공유, Hadoop 분산 파일 시스템(HDFS), 자체 관리형 객체 스토리지AWS Snowcone, Amazon S3 버킷, Amazon EFS 파일 시스템 및 Amazon FSx for Windows File Server 파일 시스템 간데이터를 복사할 수 있습니다.


AWS DataSync 개념

  • AWS안에서 혹은 온프레미스에서 데이터를 이동하기 위한 서비스
    • AWS 스토리지/온프레미스 -> AWS 스토리지
  • Agent를 사용
    • 데이터센터에 설치되어 가상머신(VM)으로 데이터의 소스를 읽어 AWS의 데이터 저장 서비스로 데이터를 전송
    • 동일한 AWS 계정에서 데이터를 전송할 땐 사용하지 않음 = 다른 계정으로 옮길때는 필요(주로 EC2에 설치)
  • 지원 프로토콜
    • NFS, SMB, HDFS, S3 API
  • 다양한 AWS 스토리지를 지원
    • S3, EFS, FSx, SnowCone

AWS DataSync 아키텍쳐

1. 온프레미스 -> AWS 스토리지

archi

온프레미스에서 AWS 스토리지로 데이터를 옮기고 싶을 때의 상황입니다.
온프레미스 서버에 Agent를 설치하고, DataSync로 데이터를 전송하면 DataSync에서 각 서비스로 데이터를 전송하게 됩니다.

2. AWS 스토리지 -> AWS 스토리지

archi2

AWS 스토리지에서 AWS 스토리지로 데이터를 옮기고 싶을 때의 상황입니다.
해당 그림은 다른 리전에서의 데이터 전송이지만, 같은 리전에서도 가능합니다.
동일한 AWS 계정 내에서의 데이터 전송이므로 Agent는 필요하지 않으며 DataSync 서비스끼리 서로 싱크를 맞춰서 자동으로 해당 리전으로 데이터를 전송합니다.


AWS DataSync 기능

  • 데이터의 전송 전 필터 적용 가능
    • 어떤 데이터를 제외하거나 포함할지 설정 가능
      • 예 : JPG 확장자인 데이터만 전송
  • 스케줄 설정 가능
    • 일정 스케줄마다 데이터를 전송 및 동기화
  • 데이터 무결성 검사
    • 데이터의 손상이나 누락을 검사할 수 있음
  • 동시에 여러 소스에서 하나의 대상으로 전송 가능
    • 예 : 여러 Agent에서 하나의 S3 버킷으로 전송
  • 전송 실패시 재전송

즉 DataSync는 주로 데이터의 전송 및 이동을 목적으로 하는 서비스이다.


DataSync와 Storage Gateway 비교

compare

DataSync의 경우 AWS안에서 혹은 온프레미스에서 데이터를 이동하기 위한 서비스이고
Storage Gateway의 경우 하이브리드환경으로 온프레미스에서 클라우드의 저장 서비스를 연동하기 위한 서비스입니다.

DataSyncGlacier/DA로의 전송이 직접적으로 지원된고
Storage Gateway일단 S3에 저장하고, 이후 LifeCycleGlacier/DA로의 전송이 간접적으로 가능합니다.


정리

  • DataSync : 데이터의 전송을 위한 서비스
    • 데이터를 잘 전달하기 위한 기능으로 구성
      • 데이터 필터, 무결성 검사, 스케줄링, 재시도 등
    • 다양한 서비스/주체간 데이터 전송 지원
  • Storage Gateway : 온프레미스 환경에서 AWS의 스토리지를 이용(주로 백업)하기 위한 서비스
    • 데이터를 클라우드에 저장하고 사용하거나 백업하기 위한 기능
      • 온프레미스에서 클라우드 환경의 데이터를 액세스 가능
    • 테이프 기반(혹은 레거시 환경) 백업 애플리케이션 지원

DataSync와 Storage Gateway는 상호 배타적인 서비스가 아니며
둘 다 사용하는 아키텍쳐 또한 많습니다.



© 2022. All rights reserved. 신동민의 블로그