AWS는 여러 데이터 관련 제품군을 지원하고 있어요.

1) NoSQL 계열

  • DynamoDB : SSD 사용, 3개 거점에 데이터 분산 저장
  • ElastiCache : 메모리 저장, 빠른 응답

2) 일반 SQL 계열

  • RDS : 트랜잭션 처리, 범용적 DB
  • RedShift : 대량 데이터, 집계 및 분석

 

RedShift 성능 향상의 비결은.

1) 열 형식 데이터 스토리지

  • 행 단위가 아닌 열 단위 데이터 저장
  • 물론 행 기반 시스템은 트랜잭션 처리에 좋지만.. 집계를 처리하는 쿼리가 많은 DW에서는 열 기반이 좋음

2) 고급 압축

  • 유사한 데이터가 순차적으로 디스크에 저장되므로 열 기반 스토리지는 훨씬 더 압축률이 좋다. 
  • 게다가 여러가지 압축 기술을 사용
  • 인덱스, 구체화된 보기를 요구하기 않으므로 기존 RDS보다 적은 공간 사용

3) 대규모 병렬 처리

  • 데이터 및 쿼리에 대한 부하를 여러 노드에 자동 분산

 

Amazon Redshift 시작하기

https://aws.amazon.com/ko/redshift/getting-started/

 

AWS에서 쉽게 데이터웨어하우스를 구축할 수 있어요!

 

요금제도는 무조건 시간당 용량제입니다. 약정은 없네요.