"빅데이타의 특성 3V
빅데이타에서 얘기하는 3V 란
크기(Volume),
Velocity(속도) 그리고
Variety(다양성) 을 의미하는데,
폭발적으로 증가하는 데이타의 크기를 감당하며, 실시간 속도로 분석이 용이하며 그리고 정형.비정형의 유투브, 파일, 소셜미디어등의 다양한 데이타를 다룰 수 있음을 의미한다. 페이스북은 매일 10 terrabyte 의 정보를 생성하며 (terrabyte 는 1000 gigabyte 를 뜻함) 분석보고에 의하면 2009년 80만 Petabyte 의 정보 ( Petabyte 는 백만 gibabyte 이다) 가 2020 년에는 35 Zettabyte (Zettabyte 는 1조 gigabyte 이다) 에 이른다고 한다. 10년 안에 44배의 정보의 증가가 예상되는데 반해, 3명중 1명의 비즈니스 리더는 정보가 없는 상태거나 신뢰할 수 없는 정보기반에서 의사결정을 한다고 한다. "
빅데이타를 찾다보니 위와 같은 정보가 있다.
Volume, Velocity, Variety 에 빠진 가장 중요한 요소인 "싼값으로" 는 어디에.
JBoss에서는 다음과 같이 빅데이타에 대처하고 있는듯 한데
M/W 입장에서 빅데이타를 흐름을 어떻게 흘러가고 있는가에 대한 좋은 정보가 아닌가 한다.
"레드햇 제이보스 데이터 가상화 6는 아파치 하둡, RDB, 몽고DB 같은 NoSQL 등 다양한 저장소에 흩어져 있는 데이터를 통합 및 변환해준다. 또한 호튼웍스와 협업으로 ‘호튼웍스 데이터 플랫폼(HDP)’을 접목해 하둡과 기존의 데이터 소스를 통합하고 외부 애플리케이션의 데이터 접근성을 개선하기 위한 비즈니스 친화적인 가상 데이터모델을 생성한다.
다양한 접근 방법과 스토리지 모델을 통해 다양한 데이터에 신속하게 접속할 수 있는 기능을 제공해 개발자들이 각 데이터의 기술 차이나 호환성 여부를 신경 쓰지 않고 애플리케이션 개발과 전달에만 주력할 수 있도록 데이터가 추출된다.
▲하둡, NoSQL, 레드햇 제이보스 데이터 그리드 등의 데이터 소스 지원
▲리포트 생성과 데이터 시각화를 신속히 수행하기 위한 비즈니스 대시보드
▲레드햇 제이보스 개발자 스튜디오와 통합한 그래픽 가상 데이터 모델 디자인 툴, SQL-DDL 기반 가상 데이터베이스 정의, 임포트/재사용 기능, 네이티브 쿼리 지원
▲레드햇 제이보스 엔터프라이즈 애플리케이션 플랫폼(EAP)과 구축 및 패키징 간소화 등이 특징이다. "
결국, 빅데이타에 대처해나가는 MW의 자세는
하둡이나 NoSQL같은 빅데이타의 모델격인 이런애들에 대한 연결 지원을 어떻게 해줄것인가.
JAVA가 플랫폼에 독립을 가져와었더라면,
MW는 하둡과 NoSQL같은 "다양한" 데이타 저장소에 대한 연결을 원할히 해주고, 각 데이터를 다루는 방법을 통합하여 제공하려는쪽으로 발전을 하고 있는듯 하다.
다시 말하면, WAS 자체적으로는 다양한 저장소를 연결해주는 Adapter를 원할하게 지원하면서, 그 각각의 다양한 저장소끼리에 대한 트랜잭션 보장 기능을 강화되는 방향으로 발전하려고 하는것이 아닌가 생각된다.