검수요청.png검수요청.png

"데이터 웨어하우스"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
5번째 줄: 5번째 줄:
 
== 목적 ==
 
== 목적 ==
 
데이터 웨어하우스는 기존 정보를 활용해 더 나은 정보를 제공하고, 데이터의 품질을 향상시키며, 조직의 변화를 지원하고 비용과 자원관리의 효율성을 향상시키는 것을 주목적으로 하고 있다. 데이터웨어하우스는 사용자의 의사결정을 지원하기 위해 기업이 축적한 많은 데이터를 사용자 관점에서 주제별로 통합하여 운영시스템과 사용자 사이의 별도의 장소에 저장해 놓은 데이터베이스로 이해할 수 있다.
 
데이터 웨어하우스는 기존 정보를 활용해 더 나은 정보를 제공하고, 데이터의 품질을 향상시키며, 조직의 변화를 지원하고 비용과 자원관리의 효율성을 향상시키는 것을 주목적으로 하고 있다. 데이터웨어하우스는 사용자의 의사결정을 지원하기 위해 기업이 축적한 많은 데이터를 사용자 관점에서 주제별로 통합하여 운영시스템과 사용자 사이의 별도의 장소에 저장해 놓은 데이터베이스로 이해할 수 있다.
 +
== 특징 ==
 +
=== 주제지향성 ===
 +
- 데이터웨어하우스 내의 데이터는 일상적인 트랜잭션을 처리하는 어플리케이션과 기능성들을 중심으로 하는 운영시스템의 데이터와는 달리 정보 이용자 관점에서 접근이 가능한 일정한 주제별 데이터로 분류 가능한 특징을 지닌다. 예를 들어 금융기관에서의 운영시스템은 대출, 예금, 은행, 카드 신탁 처리 등과 같은 어플리케이션과 기능들을 중심으로 디자인 되어 있지만, 데이터웨어하우스 방식에서는 고객 거래처, 상품, 활동 등과 같은 주제 영역을 중심으로 조직화된다. 따라서 데이터웨어하우스의 데이터는 의사결정시스템에 사용되지 않은 데이터는 저장하지 않는 반면, 운영시스템의 데이터는 의사결정 분석자의 의도와는 관계없는 즉시적인 요구를 만족시킬 수 있는 상세 데이터를 포함하게 된다.
 +
=== 통합성 ===
 +
- 데이터하우스에 보관되는 데이터는 애플리케이션 환경에서 발생되는 다양한 운영 데이터를 표준적이고 일관된 웨어하우스용 데이터베이스로 변환되어야 하며, 이를 위해서는 데이터웨어하우스 내의 데이터는 고도의 통합과 데이터에 대한 품질 보증과 과정이 필요하다. 이러한 통합성은 데이터의 이름 작성 방법, 일관된 변수 측정, 일관된 코드와 구조, 일관된 물리적 특성 등 여러 가지 면에서 나타난다. 예를 들어, 기존의 애플리케이션 중심의 운영 환경에서는 남자와 여자를 남/여, Male/Female, 1/0 등으로 다양하게 적용할 수 있으나, 데이터 웨어하우스에서는 이들을 통합할 필요가 있다(예: 남자와 여자는 ‘남’과 ‘여’로 통합). 이러한 데이터의 통합을 위한 운영시스템의 데이터베이스 내에서 데이터 변환 작업은 데이터 웨어하우스 구축의 중요한 작업 중 하나를 차지하게 된다.
 +
=== 시계열성 ===
 +
=== 비휘발성 ===
 
== 필요성 ==
 
== 필요성 ==
 
* 데이터 웨어하우스 시스템의 필요성
 
* 데이터 웨어하우스 시스템의 필요성

2020년 8월 13일 (목) 14:24 판

데이터 웨어하우스(Data Warehouse, DW)는 비즈니스 인텔리전스(BI) 활동, 특히 분석 작업을 지원하도록 설계된 일종의 데이터 관리 시스템이다. 데이터 웨어하우스는 오로지 쿼리와 분석을 수행하기 위해 개발된 것으로, 주로 대량의 과거 데이터를 포함한다. 데이터 웨어하우스에 있는 데이터는 일반적으로 애플리케이션 로그 파일이나 트랜잭션 애플리케이션과 같은 다양한 출처에서 수집된다.[1]

개요

 데이터 웨어하우스(Data Warehouse)는 1980년대 중반 IBM이 자사의 하드웨어를 판매하기 위해 처음으로 도입했던 개념으로, IBM은 ‘정보창고’의 의미로 인포메이션 웨어하우스(Information Warehouse)라는 용어를 사용하였다. 이후 이 개념은 많은 하드웨어, 소프트웨어 및 툴(tool) 공급 업체들에 의해 이론적, 현실적으로 성장하였으며, 1980년대 후반 W.H Inmon에 의해 최초로 데이터 접근 전략으로 데이터웨어하우스 개념을 사용함으로써 많은 관심과 집중을 받게 되었다. 데이터웨어하우스의 일반적인 정의는 의사결정에 필요한 정보처리 기능을 효율적으로 지원하기 위한 통합된 데이터를 가진 양질의 데이터베이스이다.[2]

목적

데이터 웨어하우스는 기존 정보를 활용해 더 나은 정보를 제공하고, 데이터의 품질을 향상시키며, 조직의 변화를 지원하고 비용과 자원관리의 효율성을 향상시키는 것을 주목적으로 하고 있다. 데이터웨어하우스는 사용자의 의사결정을 지원하기 위해 기업이 축적한 많은 데이터를 사용자 관점에서 주제별로 통합하여 운영시스템과 사용자 사이의 별도의 장소에 저장해 놓은 데이터베이스로 이해할 수 있다.

특징

주제지향성

- 데이터웨어하우스 내의 데이터는 일상적인 트랜잭션을 처리하는 어플리케이션과 기능성들을 중심으로 하는 운영시스템의 데이터와는 달리 정보 이용자 관점에서 접근이 가능한 일정한 주제별 데이터로 분류 가능한 특징을 지닌다. 예를 들어 금융기관에서의 운영시스템은 대출, 예금, 은행, 카드 신탁 처리 등과 같은 어플리케이션과 기능들을 중심으로 디자인 되어 있지만, 데이터웨어하우스 방식에서는 고객 거래처, 상품, 활동 등과 같은 주제 영역을 중심으로 조직화된다. 따라서 데이터웨어하우스의 데이터는 의사결정시스템에 사용되지 않은 데이터는 저장하지 않는 반면, 운영시스템의 데이터는 의사결정 분석자의 의도와는 관계없는 즉시적인 요구를 만족시킬 수 있는 상세 데이터를 포함하게 된다.

통합성

- 데이터하우스에 보관되는 데이터는 애플리케이션 환경에서 발생되는 다양한 운영 데이터를 표준적이고 일관된 웨어하우스용 데이터베이스로 변환되어야 하며, 이를 위해서는 데이터웨어하우스 내의 데이터는 고도의 통합과 데이터에 대한 품질 보증과 과정이 필요하다. 이러한 통합성은 데이터의 이름 작성 방법, 일관된 변수 측정, 일관된 코드와 구조, 일관된 물리적 특성 등 여러 가지 면에서 나타난다. 예를 들어, 기존의 애플리케이션 중심의 운영 환경에서는 남자와 여자를 남/여, Male/Female, 1/0 등으로 다양하게 적용할 수 있으나, 데이터 웨어하우스에서는 이들을 통합할 필요가 있다(예: 남자와 여자는 ‘남’과 ‘여’로 통합). 이러한 데이터의 통합을 위한 운영시스템의 데이터베이스 내에서 데이터 변환 작업은 데이터 웨어하우스 구축의 중요한 작업 중 하나를 차지하게 된다.

시계열성

비휘발성

필요성

  • 데이터 웨어하우스 시스템의 필요성

이러한 기존 시스템의 문제점을 보완하기 위하여 통합데이터베이스 방식의 시스템이 제안되기도 하였으나, 이러한 비정형화된 결과 생성을 위한 프로그래밍, 개발기간의 장기화 등의 단점으로 새로운 시스템을 요구하게 되었다.

구분 기존 데이터베이스 데이터 웨어하우스
기능 업무 프로세스 의사결정
데이터 형태 기능별 상세 데이터 주제별 요약 데이터
데이터 조작 read/write/update/delete read only
지향방향 신속한 처리 다차원 분석 제공

각주

참고자료

같이 보기

  검수요청.png검수요청.png 이 데이터 웨어하우스 문서는 프로그래밍에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.