AWS DataSync와 Storage Gateway 비교
AWS의 DataSync, Storage Gateway를 이해하고 비교해보자.
- AWS Storage Gateway와 AWS DataSync 개요
- AWS DataSync 개념
- AWS DataSync 아키텍쳐
- AWS DataSync 기능
- DataSync와 Storage Gateway 비교
- 정리
AWS Storage Gateway와 AWS DataSync 개요
앞에서 AWS Storage Gateway
을 간단히 말하면
백업 툴이며 AWS에서
기존의 온프레미스 환경의 데이터센터
를 운영하고 있는 고객을 대상으로백업 전용 게이트웨이를 사용
할 수 있도록 만든 서비스
AWS에서 소개하는 DataSync 설명
을 보면
AWS DataSync는
온프레미스와 AWS 스토리지 서비스 사이
에서데이터 이동을 자동화 및 가속화
하는 안전한 온라인 서비스입니다. DataSync는NFS(Network File System) 공유, SMB(Server Message Block) 공유, Hadoop 분산 파일 시스템(HDFS), 자체 관리형 객체 스토리지
와AWS Snowcone, Amazon S3 버킷, Amazon EFS 파일 시스템 및 Amazon FSx for Windows File Server 파일 시스템 간
에데이터를 복사
할 수 있습니다.
AWS DataSync 개념
- AWS안에서 혹은 온프레미스에서 데이터를 이동하기 위한 서비스
AWS 스토리지/온프레미스 -> AWS 스토리지
- Agent를 사용
데이터센터에 설치되어 가상머신(VM)
으로 데이터의 소스를 읽어 AWS의 데이터 저장 서비스로데이터를 전송
동일한 AWS 계정
에서 데이터를 전송할 땐사용하지 않음
= 다른 계정으로 옮길때는 필요(주로 EC2에 설치)
- 지원 프로토콜
NFS, SMB, HDFS, S3 API
- 다양한 AWS 스토리지를 지원
S3, EFS, FSx, SnowCone
AWS DataSync 아키텍쳐
1. 온프레미스 -> AWS 스토리지
온프레미스에서 AWS 스토리지로 데이터를 옮기고 싶을 때의 상황입니다.
온프레미스 서버에 Agent를 설치
하고, DataSync로 데이터를 전송
하면 DataSync에서 각 서비스로 데이터를 전송
하게 됩니다.
2. AWS 스토리지 -> AWS 스토리지
AWS 스토리지에서 AWS 스토리지로 데이터를 옮기고 싶을 때의 상황입니다.
해당 그림은 다른 리전에서의 데이터 전송
이지만, 같은 리전에서도 가능
합니다.
동일한 AWS 계정 내에서
의 데이터 전송이므로 Agent는 필요하지 않으며
DataSync 서비스끼리 서로 싱크를 맞춰서 자동
으로 해당 리전으로 데이터를 전송
합니다.
AWS DataSync 기능
- 데이터의 전송 전 필터 적용 가능
어떤 데이터를 제외하거나 포함할지 설정
가능- 예 : JPG 확장자인 데이터만 전송
- 스케줄 설정 가능
일정 스케줄마다 데이터를 전송 및 동기화
- 데이터 무결성 검사
데이터의 손상이나 누락을 검사
할 수 있음
- 동시에 여러 소스에서 하나의 대상으로 전송 가능
- 예 :
여러 Agent에서 하나의 S3 버킷
으로 전송
- 예 :
- 전송 실패시 재전송
즉 DataSync는 주로 데이터의 전송 및 이동을 목적
으로 하는 서비스이다.
DataSync와 Storage Gateway 비교
DataSync의 경우 AWS안에서 혹은 온프레미스
에서 데이터를 이동
하기 위한 서비스이고
Storage Gateway의 경우 하이브리드환경으로 온프레미스에서 클라우드
의 저장 서비스를 연동
하기 위한 서비스입니다.
DataSync는 Glacier/DA
로의 전송이 직접적
으로 지원된고
Storage Gateway는 일단 S3에 저장
하고, 이후 LifeCycle
로 Glacier/DA
로의 전송이 간접적
으로 가능합니다.
정리
- DataSync : 데이터의 전송을 위한 서비스
데이터를 잘 전달하기 위한 기능
으로 구성- 데이터 필터, 무결성 검사, 스케줄링, 재시도 등
다양한 서비스/주체간 데이터 전송 지원
- Storage Gateway : 온프레미스 환경에서 AWS의 스토리지를 이용(주로 백업)하기 위한 서비스
데이터를 클라우드에 저장하고 사용하거나 백업
하기 위한 기능- 온프레미스에서 클라우드 환경의 데이터를 액세스 가능
테이프 기반(혹은 레거시 환경) 백업 애플리케이션 지원
DataSync와 Storage Gateway는 상호 배타적인 서비스가 아니며
둘 다 사용하는 아키텍쳐
또한 많습니다.
- Ref