PNPC

  • home
  • Business
  • Big Data

Big Data혁신을 선도하는 고객의 동반자 PNPC

Big Data

개요
Big Data란 기존의 기업 환경에서 사용되는 ‘정형화된 데이터’는 물론 메타데이터나 스키마 등을 포함하는 데이터, XML이나 HTML 텍스트 등 미처 활용하지 못하고 있는 ‘반정형화된 데이터’, 여기에 사진, 이미지, 동영상처럼 지금까지 기업에서 활용하기 어려웠던 멀티미디어 데이터인 ‘비정형 데이터’를 모두 포함하는 대용량의 데이터 및 관련도구, 분석기법 등을 포함합니다.
빅데이터 시대의 DW/BI 전략
비교적 선형적으로 증가하던 정형 데이터 조차 연간 40~60%에 이르는 폭발적인 증가세를 보이며, 비정형 데이터의 증가속도는 누구도 예측할 수 없는 정도입니다. 이에 따라, 기업들의 빅데이터를 활용한 BI/DW 전략은 정형데이터와 비정형 데이터들에 대한 상호보완적인 접근전략이 필요하며, 궁극적으로는 통합연계분석이 장기 목표입니다. 빅 데이터 시대에서 보다 실질적으로 조명되는 비정형 대용량 데이터의 처리와 분석을 지원하기 위한 대표적인 기술이 하둡(Hadoop) 이며, 하둡은 저가형 x86 서버들에 기반한 분산처리기술을 통해, 비정형 데이터에 대한 빅데이터 분석에서 가장 선호되고 있는 솔루션으로, 빠른 속도로 성장을 거듭해 왔습니다. 최근에는 상용 하둡 배포판을 통해 프로젝트 시간 단축 및 리스크를 줄이고, 상용 BI/ETL/마이닝/분석툴과의 연계 및 호환성을 제공합니다.
BigData시스템 아키텍처 및 인프라 구성 – 논리적 구성
TO-BE 목표시스템은 확장성 및 효율성을 고려한 Hadoop 기반 BigData 인프라와 RDBMS가 포함된 Hybrid DW 형태로 구성합니다.
BigData시스템 아키텍처 및 인프라 구성 – 논리적 구성(상세)
다양한 소스 데이터를 고객 기준으로 통합하여 하나의 일관된 프로세스로 동작할 수 있도록 구성하며, 고객 통합 분석에 따른 공통 처리는 Ingest/Processing 영역에서 통합 처리합니다.