데이터 통합(DI; data integration)이란 유사항 성격의 데이터, 동질성을 가진 데이터를 더 큰 주제로 합치는 것을 의미한다. 확상성이 좋은 유연한 모델 작성으로 요구사항을 추가/변경에 따른 모델 변경을 최소화하는 것을 목적으로 가지고 있다.[1] 즉, 자료의 중복을 배제한 데이터의 모임이다.[2] 영어 약자로 DI(디아이)라고도 한다.
개요
데이터 통합은 한마디로 하나의 소스 시스템에서 관리하는 데이터를 목표 시스템의 데이터와 실시간이나 배치 형태로 변형의 단계를 거쳐 합산이나 여러 함수등을 통해 같은 의미를 가진 정보로 일치시키는 역할이라고 볼 수 있다.
[3]
특징
데이터 통합 프로세스
테이터를 통합하는데에는 기준이 있다. 먼저, 데이터의 성격(주제)이 유사(동질성)해야 한다. 식별자가 동일하면서 유사한 속성이 존재(유사성)해야 하며, 식별자는 다르지만 기초 속성이 유사(유사성)해야한다. 현행 데이터가 존재하면 마이그레이션하는데 문제가 없다. 별개의 요건으로 사용되지 않고 주로 같이 조회되며 통합해서 성능문제를 일으키지 않는다.
- 속성: 여러 엔티티에서 동일한 성질로 관리되는 속성을 도출하여 새로운 엔티티로 통합한다.
- 관계: 엔티티간 존재하는 많은 개별 관계를 상위 개념의 관계로 통합한다.
- 엔티티: 공통된 속성이 존재하는 엔티티를 통합해 슈퍼타입을 도출한다. 조인의 불편함, 성능에 영향을 미치는 배타적 관계의 엔티티를 통합한다.
데이터를 통합하는 과정에서는 고려해야할 몇가지 사항들이 있다. 첫째, 동질성이 빈약한 엔티티간 통합. 둘째, 지나친 유연성, 확장성만을 고려한 통합. 셋째, 엔티티 통합에 따른 인스턴스 증가로 인한 성능 문제. 넷째, 실체 엔티티는 최대한 통합하고, 행위 엔티티는 가능한 통합을 고려해야 한다.
- 확장성: 비슷한 유형의 업무가 발생했을 때 스키마 변경을 최소화하면서 코드 값 등의 인스턴스를 추가로 업무를 수용한다.
- 유지보수 효율성: 엔티티 개수가 감소해 데이터베이스 유지보수가 쉬워졌다.
- 분석, 설계에 대한 시간이 단축되고, 비용이 절감되었다.
- 개발의 용이성: 엔티티 통합에 따른 배타 곤계의 해소로 엑세스 경로의 효율성이 향상되었으며, 단순한 SQL 작성이 가능해졌다.
- 모델의 단순성
- 모델의 가독성: 슈퍼타입, 서브타입에서 발생하는 비즈니스 요건(관계)를 명확히 표현할 수 있다.
- 데이터 집합의 변질(희석): 무분별한 엔티티 통합은 데이터 집합을 모호하게 만들어 집합을 변질시킬 수 있다.
- 데이터베이스 성능과 관리 측면
- 가독성이 떨어진다.
- Null값의 사용이 증가되었다.
- 마이그레이션의 어려움이 있다.
분류
ETL
RTDI
데이터 동기화
데이터 이주
메타 데이터 관리
데이타 정보 허브/데이터 통합 허브
각주
참고자료
- DB모델링 - 4. 데이터통합〈데이터 통합〉, 2015-11-20《Tistory - 데카의 Daily Review》
- [DB기초] 데이터베이스의 정의와 특징〈데이터 통합〉, 2018-08-08《Tistory - 코딩팩토리》
- [데이터 통합(1)] 데이터 통합의 범위와 역할〈데이터 통합 개요〉, 2007-09-28《Bikorea》
- [데이터 통합(1)] 데이터 통합의 범위와 역할〈데이터 통합 장단점〉, 2015-11-20《Tistory - 데카의 Daily Review》
같이 보기
이 데이터 통합 문서는 프로그래밍에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
개발 : 프로그래밍 □■⊕, 소프트웨어, 데이터, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
프로그래밍 언어
|
ASP • C 언어 • C++ • C# • CSS • D 언어 • HTML • HTML5 • JSP • PHP • R • XHTML • XML • XSLT • 고(Go) • 고급언어 • 기계어 • 델파이 • 러스트 • 루비 • 루아 • 리액트 • 리퀴디티 • 무브 • 미켈슨 • 베이직 • 브이비스크립트 • 비주얼 C++ • 비주얼베이직(VB) • 비주얼베이직닷넷(VB.NET) • 솔리디티 • 스몰토크 • 스위프트 언어 • 스칼라 • 스크립트 언어 • 알골 • 어셈블리 • 언리얼스크립트 • 얼랭 • 에이잭스(Ajax) • 엠에프씨(MFC) • 오브젝티브-C • 오브젝트 파스칼 • 오카멜 • 웹어셈블리(WASM) • 이와즘(eWASM) • 자바 • 자바스크립트 • 저급언어 • 제이슨(JSON) • 제이쿼리(jQuery) • 카멜 • 코볼 • 코틀린 • 콜드퓨전 • 타입스크립트 • 파스칼 • 파워스크립트 • 파이썬 • 펄(Perl) • 포트란 • 프로씨(Pro-C) • 피엘에스큐엘(PL/SQL) • 피엘원(PL/I) • 하스켈
|
|
개발방법론
|
CBD 개발방법론 • EA • 구조적 개발방법론 • 객체지향 개발방법론 • 라이브러리 • 람다 아키텍처 • 모듈 • 모듈화 • 벤치마킹 • 소프트웨어 개발방법론 • 스크럼 • 스프린트 • 아키텍처 • 아키텍트 • 애자일 • 웹개발방법론 • 정보공학 개발방법론 • 컴포넌트 • 테일러링 • 템플릿 • 폭포수 모델 • 프로젝트 • 프로토타입 • 피드백
|
|
코딩
|
EUC-KR • UTF-8 • 값 • 글루웨어 • 노팔로우 링크 • 두팔로우 링크 • 디버깅 • 디코딩 • 마크업 • 버그 • 부트스트랩 • 세이브포인트 • 소스코드 • 시큐어코딩 • 아스키 • 액티브엑스 • 오픈소스 • 유니코드 • 인코딩 • 재컴파일 • 주석 • 컴파일 • 컴퓨터 프로그램 • 코드 • 코딩 • 태그 • 테스트 • 테이블 • 텍스트 • 파싱 • 퍼블리싱 • 퓨니코드 • 하드코딩 • 하이퍼링크 • 하이퍼텍스트
|
|
프로그래밍
|
C 명령어 • 객체 • 객체지향 • 객체지향 프로그래밍 • 거짓 • 관계연산자 • 기본형 변수 • 널 • 논리 • 논리연산 • 논리연산자 • 다중상속 • 다형성 • 대입 • 대입문 • 대입연산자 • 더블 • 도스 명령어 • 디폴트 • 레지스터변수 • 루프 • 리눅스 명령어 • 리턴 • 메모리 주소 • 메소드 • 멤버 • 명령문 • 명령어 • 무한루프 • 문자 • 문자열 • 바이트 • 반복문 • 배열 • 변수 • 분기 • 분기문 • 불린 • 브레이크 • 비교연산자 • 비트연산자 • 산술연산자 • 상속 • 상수 • 생성자 • 선언 • 선언문 • 설정자 • 속성 • 스위치 • 스태틱 • 시프트연산자 • 실행 • 실행문 • 어노테이션 • 에코 • 역참조 • 연산 • 연산문 • 연산자 • 오버로딩 • 오버라이딩 • 외부변수 • 윈도우 명령어 • 유닉스 명령어 • 인스턴스 • 인스트럭션 • 인클루드 • 인터페이스 • 임포트 • 입력 • 입력문 • 입출력 • 입출력문 • 자료형(데이터 타입) • 자바 명령어 • 자바 예약어 • 자바 컬렉션 • 전역변수 • 접근자 • 접근제어자 • 정보은닉 • 정수형 • 정적변수 • 제어 • 제어문 • 제어자 • 조건 • 조건문 • 조건연산자 • 주소 • 증감연산자 • 지역변수 • 참 • 참조 • 참조변수 • 초기화 • 추상메소드 • 추상클래스 • 추상화 • 출력 • 출력문 • 캡슐화 • 케이스 • 클래스 • 파라미터(매개변수) • 파이널 • 패키지 • 퍼블릭 • 포인터 • 프라이빗 • 프로텍티드 • 필드(멤버변수) • 함수 • 환경변수
|
|
명령어
|
abstract • array • boolean • break • byte • case • char • continue • default • double • do while • echo • elif • else • else if • false • final • float • for • gosub • goto • if • if else • import • include • int • join • long • long long • null • print • printf • println • private • protected • public • return • scanf • short • stdio.h • static • string • switch • temp • then • true • unsigned • void • while
|
|
디자인패턴
|
구조패턴 • 동시성패턴 • 동시실행패턴 • 모델-뷰-컨트롤러 패턴 • 상태패턴 • 생성패턴 • 싱글톤패턴 • 아키텍처패턴 • 전략패턴 • 커맨드패턴 • 행동패턴
|
|
프로그래밍 인물
|
귀도 반 로썸 • 그레이스 머레이 호퍼 • 니클라우스 비르트 • 댄 브릭클린 • 더그 커팅 • 데니스 리치 • 리누스 토르발스 • 리처드 그린블라트 • 마거릿 해밀턴 • 마크 앤드리슨 • 빈트 서프 • 빌 게이츠 • 빌 조이 • 스티브 잡스 • 에이다 러브레이스 • 제임스 고슬링 • 척 벤턴 • 켄 톰슨 • 팀 패터슨
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|