AWS는 여러 데이터 관련 제품군을 지원하고 있어요.
1) NoSQL 계열
- DynamoDB : SSD 사용, 3개 거점에 데이터 분산 저장
- ElastiCache : 메모리 저장, 빠른 응답
2) 일반 SQL 계열
- RDS : 트랜잭션 처리, 범용적 DB
- RedShift : 대량 데이터, 집계 및 분석
RedShift 성능 향상의 비결은.
1) 열 형식 데이터 스토리지
- 행 단위가 아닌 열 단위 데이터 저장
- 물론 행 기반 시스템은 트랜잭션 처리에 좋지만.. 집계를 처리하는 쿼리가 많은 DW에서는 열 기반이 좋음
2) 고급 압축
- 유사한 데이터가 순차적으로 디스크에 저장되므로 열 기반 스토리지는 훨씬 더 압축률이 좋다.
- 게다가 여러가지 압축 기술을 사용
- 인덱스, 구체화된 보기를 요구하기 않으므로 기존 RDS보다 적은 공간 사용
3) 대규모 병렬 처리
- 데이터 및 쿼리에 대한 부하를 여러 노드에 자동 분산
Amazon Redshift 시작하기
https://aws.amazon.com/ko/redshift/getting-started/
AWS에서 쉽게 데이터웨어하우스를 구축할 수 있어요!
요금제도는 무조건 시간당 용량제입니다. 약정은 없네요.