OLAP
OLAP(Online Analytical Processing)은 대용량 업무 데이터베이스를 구성하고 BI(Business Intelligence)를 지원하기 위해 사용되는 기술이다. 데이터 웨어하우스나 데이터 마트와 같은 대규모 데이터에 대해 최종 사용자가 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용할 수 있는 실시간 분석 처리를 말한다.[1]
목차
개요[편집]
OLAP는 사용자가 다양한 차원(각도/관점/구성)의 정보에 직접 접근하여 대화식으로 분석하고 의사결정에 활용하는 과정으로 [2] 최종 사용자가 기업의 전반적인 상황을 이해 할 수 있게 하고 의사결정을 지원하는 것을 목표로 한다. [3] OLAP 데이터베이스는 하나 이상의 큐브로 분할 되며, 필요한 피벗 테이블 보고서와 피벗 차트 보고서를 쉽게 만들고 사용할 수 있도록 큐브 관리자가 데이터를 검색하고 분석하는 방법에 맞게 각 큐브를 구성하고 디자인한다. [4]
등장배경/역사[편집]
OLAP는 On-Line Analytical Processing의 약자로 RDB를 창조한 E.F.Codd 박사로부터 1993년도에 시작된 용어이다. Codd 박사는 대용량 데이터의 다양한 쿼리 결과에서 RDB의 한계점을 느끼고 그 바탕으로 OLAP를 만들었다. [5] [6]
- 1962년: 다차원 프로세싱의 개념 탄생
- 1972년: Express-다차원 데이타베이스
- 1982년: Metaphore-관계형 OLAP제품
- 1980년 중/후반: DSS 및 ELS 연계/다차원 스프레드시트
- 1993년: E.F.Codd에 의해 'OLAP'용어 사용
- 1995년: '관계형 OLAP'용어 사용, OLAP벤더 흡수, 합병 및 협력
- 1997년: Hybrid OLAP 탄생
- 1999년: Microsoft의 OLAP 시장 참여, OLAP 표준 정립 및 대중화
특징[편집]
특징 주요 개념 OLAP 특징[1] 다차원성 사용자들이 실제적인 차원에서 정보를 분석한다.(Multidimensional View of Data) 직접 접근 최종 사용자들이 전산부서와 같은 정보 매개자를 거치지 않고 자신이 원하는 정보에 직접 접근한다. 대화식 분석 시스템과 상호작용을 통해 정보를 분석하고 원하는 정보를 얻을 때까지 계속해서 분석을 수행한다.(Drilling) 의사 결정용 기업의 전략적 방향설정 및 의사결정에 활용된다.
장점[3][편집]
OLAP는 다차원 데이터의 저장과 프로세싱에 동일한 엔진용으로 네트워크 상의 데이터 이동을 최소화할 수 있으며 사용자의 질의에 신속하게 대응할 수 있는 장점이 있다.
단점[3][편집]
OLAP는 원시 데이터를 볼 수 없으며 대용량 데이터를 취급하는데 역부족하다. 데이터 로딩 시간이 길며 RDB에 비해 에러 회복 능력과 하드웨어 활용이 뒤처진다는 단점이 있다.
분석방법[1][3][편집]
- Drill Down
특정한 주제 영역에서 요약된 범위에서 상세 범위로 단계적 접근하는 분석 방법으로 분석할 항목에 대해 한 차원의 계층 구조를 따라 단계적으로 요약된 형태의 데이터 수준을 보다 구체적인 내용의 상세 데이터로 접근하는 기능이다. (광역→시도→구→동→번지)
- Roll Up
Drill Down 과는 반대로 상세 범위에서 요약된 범위로 단계적 접근하는 분석 방법으로 분석할 항복에 대해 한 차원의 계층 구조를 따라 단계적으로 구체적인 내용의 상세 데이터로 요약된 형태의 데이터로 접근하는 기능이다. (번지→동→구→시도→광역)
- Pivot/Rotating
보고서의 행, 열, 페이지 차원을 무작위로 바꾸어 볼 수 있는 기능으로 분석 데이터의 축을 바꾸는 것이다. T-SQL 문에서 Pivot/Unpivot과 동일한 의미를 가진다.
- Slicing/Dicing
주요 비즈니스 항목들을 다양한 각도에서 조회하고 자유롭게 비교하는 기능으로 Slice과 Dice으로 나뉜다. - Slice: 한 차원의 멤버나 그 이상의 멤버를 가지고 한 값을 선택했을 때 나타나는 그 부분 집합으로 제품 담당자가 특정 제품에 대해서 선택할 때 나타나는 지역과 기간에 대한 집합이다. - Dice: 특정 항목에 대해 Rotation이나 Drill down, Roll up 등을 이용해 대화식으로 화면을 디스플레이 해가며 분석하는 프로세스를 말한다.
- Data Surfing
실행 중에 간단히 리포트의 형태와 조건을 바꾸는 것으로 마우스를 이용해 새로운 장표나 조건을 리포트 위로 끌어서 놓으면 그 새로운 장표나 조건에 의해 리포트가 다시 실행된다. 이 기능을 사용하면 현재 리포트에 보이고 있는 정보를 간단한 대화식 조작을 통해 어떠한 형태의 리포트도 나타낼 수 있게 해준다.
고려사항[7][편집]
구분 고려사항 OLAP 고려사항 최종 사용자 편의성 비전문적인 사용자가 손쉽게 데이터 웨어하우스, 데이터 마이닝의 데이터에 접근하여 원하는 데이터를 조회할 수 있어야 한다. 업무모델링 다차원 업무 모델의 설계가 가능해야 하며, 현업 요구 사항에 맞는 유연한 모델 구축을 지원해야 한다. 고급 분석 능력 고급 사용자를 위해 통계, 회계, 예측 기능 등을 지원해야 한다. Web 지원 Internet 연계, Web을 통한 보고서 출력, 데이터 분석 기능을 고려해야 한다. 보안성 다양한 수준의 보안 기능을 고려해야 한다. 호환성 Client OS, Server OS, DBMS 등을 고려해야 한다. 다양한 형태 정보 표현 다양한 그래픽 멀티미디어 및 Exception 기능을 지원해야 한다.
종류[7][편집]
ROLAP[편집]
ROLAP(Relational Online Analytical Processing)는 최종 사용자의 분석 및 질의 요구를 SQL 문으로 변환하여 데이터 웨어하우스에 전달하는 것으로 데이터 웨어하우스로부터의 처리 결과를 가공하여 최종 사용자에게 전달한다. 사용자의 처리 요구에 대한 변환 및 스케쥴링, 처리 결과에 대한 가공, Turning, Caching 등의 기능을 담당하며 별도로 데이터를 저장하거나 관리하지 않는다. 관계형 데이터베이스와 SQL과 같은 관계형 질의어를 사용하여 다차원 데이터를 저장하고 분석하는 형태로 정현적인 3 Tier 구조를 가진다.
- 장점 :대용량으로서 전사적으로 구축하는데 적합하며 확장성이 뛰어나다. 요약 정보가 추출된 원시 데이터를 검색해 볼 수 있다.
- 단점 : 정규화를 통해 저장되어 응답시간이 느리고 기존의 SQL을 사용하는데 한계가 있다.
- 대표제품 : 인포믹스의 메타큐브, 인포메이션 어드벤티지의 디시전 쉬이트, 마이크로스트래티지의 DSS에이전트 등
MOLAP[편집]
MOLAP(Multidimensional Online Analytical Processing)는 다차원 데이터베이스에 대하여 직접 색인된 OLAP로 가능한 모든 조합의 데이터가 반영되어 이미 다차원 배열에 저장되어 있는 데이터를 처리하며, 셀 내의 각 데이터를 직접 액세스 하는게 가능하다. 데이터 웨어하우스와는 별도로 다차원 데이터베이스를 구축하고 일반적으로, 특정 업무 영역 단위의 요약 데이터를 저장하는 데이터 마트로 운영된다. 다차원 데이터베이스는 주기적으로 데이터 웨어하우스에서 관련 데이터들을 가져와서 새로 생성하며, 최종 사용자로부터의 분석 및 질의 요구는 모두 MOLAP 서버에서 처리된다. 다차원 데이터를 저장하기 위한 특수한 구조의 다차원 DB를 사용하고 Transaction DB에서 추출된 데이터를 데이터셀에 보관하고, 속도 개선을 위해 주기억장치의 큐브 캐시 속에 데이터 큐브를 보관한다.
- 장점 : 데이터를 배열 구조에 저장하므로 ROLAP 대비 사용이 쉽고, 검색 속도가 빠르며 중소형 DW에 적합핟.
- 단점 : 차원을 미리 정의 내리고, 데이터 큐브를 먼저 생성한 후 데이터를 적재해야 한다.
- 대표 제품 : 하이페리언 솔루션의 에스베이스, 오라클의 익스프레스, 파일롯 소프트웨어의 디시젼 서포트 등
DOLAP[편집]
DOLAP(Desktop OLAP)는 서버 개념없이 직접 데이터 웨어하우스와 연결되어 최종 사용자의 분ㄴ석 및 질의 요구를 처리하는 것으로 DW 추출 후 사용자의 PC에 저장하는 형태로 다차원 데이터의 저장 및 프로세싱이 모두 Client에서 발생한다.
- 장점 : 싸고 빠르면 설치와 관리가 용이하다.
- 단점 : 대용량의 데이터를 처리하는데 한계가 있으며 데이터 정합성을 유지하기가 힘들다.
- 대표제품 : 코그노스의 파워플레이, 브리오테크놀러지의 브리오쿼리 등
HOLAP[편집]
HOLAP(Hybrid OLAP) 는 ROLAP와 MOLAP을 결합한 형태로 DB 저장은 관계형 데이터베이스, 다차원 프로레싱은 MOLAP을 사용한다.
- 장점 : ROLAP의 대용량 데이터 저장 능력과 다차원 프로세싱은 MOLAP의 정밀한 분석이 가능하다.
- 단점 : 정밀하지만 구현이 어렵다.
- 대표제품 : 오라클 익스프레스, 마이크로 소프트 SQL 서버 OLAP 등
기능[1][편집]
다차원 데이터 분석 다양한 데이터에 접근 OLAP 기능 다차원으로 구성된 데이터를 분석(기간/제품/매장의 연계분석) 트랜잭션 상세 데이터 + DW요약데이터 관련 Drill down and up 다양한 계산/통계, Privot table, 3차원 큐브 등의 기능 필요 신속한 질의와 응답, 대규모 DB 지원
전망[7][편집]
구분 고려사항 OLAP 향후 발전 전망 기술적인 측면 - 기존의 OLAP Tool들이 웹 환경으로 이전되어 활성화 될 것으로 예상
- 플랫폼에 독립적인 OLAP Tool의 개발이 필요
- OLAP 제품들이 공유할 수 있는 논리적 다차원 모델의 표준이 필요하며, ERP의 데이터 DW또는 특정 DB와 연계하여 다차원적으로 분석 능력 필요
- EC의 확산에 따라 Web 상에서 기능하는 Web OLAP등장비즈니스적 측면 - 적용된 Logic에 대한 개선이 필요하며, 웹 환경에 적합한 제품의 상용화가 필요
- OLAP의 검증형 접근법과 Data Mining의 발견형 접근법을 통합해 사용자 의사 결정을 지원
각주[편집]
- ↑ 1.0 1.1 1.2 1.3 〈OLAP란〉, 《Github - BE Developer》, 2018-09-06
- ↑ 〈OLAP개요〉, 《Tistory》, 2009-05-05
- ↑ 3.0 3.1 3.2 3.3 〈OLAP〉, 《Naver Blog - Best day of My Life》, 2005-12-13
- ↑ 〈OLAP 개요〉, 《Microsoft》
- ↑ 〈OLAP 등장배경〉, 《Naver Blog - obzen》, 2019-09-22
- ↑ 〈OLAP 역사〉, 《Tistory》, 2009-03-24
- ↑ 7.0 7.1 7.2 〈OLAP 종류〉, 《Tistory - 인생극장》, 2014-04-21
참고자료[편집]
- OLAP란 무엇인가?〈OLAP란〉, 2018-09-06《Github - BE Developer》
- OLAP에 대한 개념 정리〈OLAP〉, 2005-12-13《Naver Blog - Best day of My Life》</ref>
- OLAP란〈OLAP 등장배경〉, 2019-09-22《Naver Blog - obzen》</ref>
- 온라인 분석 처리 개요(OLAP)〈OLAP 개요〉, 《Microsoft》</ref>
- OLAP과 DW 개요〈OLAP 역사〉, 2009-03-24《Tistory》</ref>
- OLAP〈OLAP 종류〉, 2014-04-21《Tistory - 인생극장》</ref>
- (dBNuri)OLAP 개요〈OLAP개요〉, 2009-05-05《Tistory》</ref>
같이 보기[편집]