"인덱스"의 두 판 사이의 차이
(새 문서: '''인덱스'''(index)는 키 값으로 행 데이터의 위치를 식별하는데 사용하는 기능이다. 그러기 위해서는 원본 테이블을 기준으로 잘 정렬된 별...) |
잔글 (→같이 보기) |
||
(사용자 2명의 중간 판 5개는 보이지 않습니다) | |||
1번째 줄: | 1번째 줄: | ||
− | '''인덱스'''(index)는 키 값으로 행 데이터의 위치를 식별하는데 사용하는 기능이다. 그러기 위해서는 원본 테이블을 기준으로 잘 정렬된 별도의 테이블, 즉 인덱스 테이블을 생성해야 하고, 이로 인해 데이터 엑세스 성능을 높일 수 있다. 인덱스의 존재 유무에 따라 쿼리의 결과는 달라지지 않는다. 정규화가 되어 있지 않은 테이블은 컬럼이 많으며, 이에 따라 조합할 수 있는 인덱스가 많아지게 된다. 인덱스가 많으면 갱신 성능이 나빠지고 디스크 공간도 많아지므로 인덱스를 효과적으로 사용하려면 정규화가 잘 되어 있어야 한다.<ref name='index_info'>victolee, 〈[https://victorydntmd.tistory.com/319 인덱스(Index)]〉, 2019-05-18</ref> | + | '''인덱스'''(index)는 데이터베이스 분야에 있어서 테이블에 대한 동작의 속도를 높여주는 자료 구조를 일컫는다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> 키 값으로 행 데이터의 위치를 식별하는데 사용하는 기능이다. 그러기 위해서는 원본 테이블을 기준으로 잘 정렬된 별도의 테이블, 즉 인덱스 테이블을 생성해야 하고, 이로 인해 데이터 엑세스 성능을 높일 수 있다. 인덱스를 저장하는 데 필요한 디스크 공간은 보통 테이블을 저장하는 데 필요한 디스크 공간보다 작다. (왜냐하면 보통 인덱스는 키-필드만 갖고 있고, 테이블의 다른 세부 항목들은 갖고 있지 않기 때문이다.)<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> 인덱스의 존재 유무에 따라 쿼리의 결과는 달라지지 않는다. 정규화가 되어 있지 않은 테이블은 컬럼이 많으며, 이에 따라 조합할 수 있는 인덱스가 많아지게 된다. 인덱스가 많으면 갱신 성능이 나빠지고 디스크 공간도 많아지므로 인덱스를 효과적으로 사용하려면 정규화가 잘 되어 있어야 한다.<ref name='index_info'>victolee, 〈[https://victorydntmd.tistory.com/319 인덱스(Index)]〉, 2019-05-18</ref> |
− | 인덱스 테이블은데이터베이스를 검색하기 위해 사용할 수 있는 특별한 테이블로서, 데이터베이스 검색의 속도를 빠르게 도와주는 역할을 한다. 즉, 데이터베이스를 사용하는데 있어 성능에 대한 문제 또는 개선을 위해 가장 먼저 확인하는 부분이다. 이는 저절로 생성되지 않으며 관리자 또는 사용자에 의해 별도로 생성하거나 삭제할 수 있다. | + | == 개요 == |
+ | 인덱스 테이블은데이터베이스를 검색하기 위해 사용할 수 있는 특별한 테이블로서, 데이터베이스 검색의 속도를 빠르게 도와주는 역할을 한다. 즉, 데이터베이스를 사용하는데 있어 성능에 대한 문제 또는 개선을 위해 가장 먼저 확인하는 부분이다. 이는 저절로 생성되지 않으며 관리자 또는 사용자에 의해 별도로 생성하거나 삭제할 수 있다.<ref name='index_info'>victolee, 〈[https://victorydntmd.tistory.com/319 인덱스(Index)]〉, 2019-05-18</ref>인덱스는 고유 제약 조건을 실현하기 위해서도 사용된다. 고유 인덱스는 중복된 항목이 등록되는 것을 금지하기 때문에 인덱스의 대상인 테이블에서 고유성이 보장된다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | |||
+ | == 아키텍처 == | ||
+ | === 클러스터 === | ||
+ | [[클러스터]] 다중 데이터베이스와 다중 테이블이 조인될 때, 그것을 클러스터라고 한다. 클러스터 키 값을 공유하는 테이블들의 레코드는 동시에 또는 근처의 데이터베이스 블록에 함께 저장될 것이다. 이것은 클러스터 키 상의 이러한 테이블의 조인을 향상시킬 것이다. 왜냐하면 레코드들을 매칭시키는 것은 함께 저장되고, I/O 부하가 덜 그것들에 요구되기 때문이다. 클러스터의 부분들인 테이블에서의 데이터 레이아웃은 클러스터 환경에 의해 정의된다. 클러스터는 B-Tree 인덱스 또는 해쉬 테이블로 키화된다. 테이블 레코드가 저장될 데이터 블록은 클러스터 키 값에 의해 정의된다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | |||
+ | === 비클러스터화된 인덱스 === | ||
+ | 데이터는 임의의 순서로 존재하지만, 논리적 순서는 인덱스에 의해 지정된다. 데이터 열은 인덱스화된 컬럼 또는 표현의 값과는 상관없이 테이블 전체에 퍼져있다. 비 클리스터화된 인덱스 트리는 정렬된 순서로 레코드에 포인터를 포함하고 있는 인덱스의 리프 수순으로 인덱스 키 값을 포함하고 있다. 비 클러스터화된 인덱스에서는 열의 물리적 순서는 인덱스 순서와 동일하지 않고, 전형적으로 JOIN, WHERE 그리고 ORDER BY 절에서 사용된 비 기본키 컬럼 위에 만들어진다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | |||
+ | === 클러스터화된 인덱스 === | ||
+ | 클러스터링은 인덱스를 매칭시키기 위해서 데이터 블록을 어떤 분명한 순서로 바꾼다. 이것은 열 데이터가 순서대로 저장되는 것으로 이어진다. 그러므로 단 하나의 클러스터화된 인덱스는 임의의 데이터베이스 테이블 위에 만들어질 수 있다. 클러스터화된 인덱스는 전반적인 불러오기 속도를 엄청나게 향상시킨다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | |||
+ | == 저장 방식 == | ||
+ | === B-Tree Index === | ||
+ | *가장 일반적으로 사용되는 인덱스 알고리즘이다. | ||
+ | *컬럼 값을 변형하지 않고, 원래 값을 기준으로 이용해서 인덱싱을 한다. | ||
+ | *루트노드, 브렌치 노드, 리프 노드로 나누어진다. | ||
+ | *리프 노드는 데이터가 저장된 레코드의 주소를 가지게 된다.<ref name='litien.log'>〈[https://velog.io/@litien/Index Index에 대하여]〉, 2019-12-03</ref> | ||
+ | |||
+ | === Hash Index === | ||
+ | *컬럼 값으로 해시 값을 계산해서 인덱싱을 한다. | ||
+ | *값을 변형해서 인덱싱함으로 전방일치와 같이 값의 일부만 검색하고자 할 때 사용할 수 없다. | ||
+ | *주로 메모리 기반의 DB에서 많이 사용된다.<ref name='litien.log'>〈[https://velog.io/@litien/Index Index에 대하여]〉, 2019-12-03</ref> | ||
+ | |||
+ | == 종류 == | ||
+ | *비트맵 인덱스 | ||
+ | 비트맵 인덱스는 데이터 뭉치를 비트 열(bit array)로 저장하여 이러한 비트맵에 비트 연산을 수행함으로써, 대부분의 질의어에 응답하는 특별한 종류의 인덱스다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | *조밀 인덱스 | ||
+ | 데이터베이스에서 조밀 인덱스는 데이터 파일 내의 모든 레코드에 대한 키와 포인터의 쌍을 가진 파일이다. 중복 키를 가진 클러스터드 인덱스에서, 조밀 인덱스는 그러한 키를 가진 첫 번째 레코드를 가리키고 있다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | *희소 인덱스 | ||
+ | 희소 인덱스는 데이터 파일 내의 모든 블록에 대한 키와 포인터의 쌍을 가진 파일이다. 이 파일 내의 모든 키는 정렬된 데이터 파일 내의 블록에 연결된 특정 포인터들과 연계되어 있다. 중복된 키를 가진 클러스터드 인덱스에서 희소 인덱스는 각 블록 내의 가장 빈도가 낮은 검색 키를 지시한다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
+ | *역방향 인덱스 | ||
+ | 인덱스 내에 들어가기 전에 인덱스는 키 값을 뒤집는다. 키 값을 뒤집는 것은 특히 단일 값으로 새롭게 증가되는 번호순으로 된 인덱스 데이터에 유용하다.<ref name='위키백과'>〈[https://ko.wikipedia.org/wiki/%EC%9D%B8%EB%8D%B1%EC%8A%A4_(%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4) 인덱스(데이터베이스)]〉, 2020-08-08</ref> | ||
{{각주}} | {{각주}} | ||
7번째 줄: | 40번째 줄: | ||
== 같이 보기 == | == 같이 보기 == | ||
* [[검색]] | * [[검색]] | ||
+ | * [[인덱싱]] | ||
− | {{ | + | {{데이터|검토 필요}} |
2021년 8월 7일 (토) 03:15 기준 최신판
인덱스(index)는 데이터베이스 분야에 있어서 테이블에 대한 동작의 속도를 높여주는 자료 구조를 일컫는다.[1] 키 값으로 행 데이터의 위치를 식별하는데 사용하는 기능이다. 그러기 위해서는 원본 테이블을 기준으로 잘 정렬된 별도의 테이블, 즉 인덱스 테이블을 생성해야 하고, 이로 인해 데이터 엑세스 성능을 높일 수 있다. 인덱스를 저장하는 데 필요한 디스크 공간은 보통 테이블을 저장하는 데 필요한 디스크 공간보다 작다. (왜냐하면 보통 인덱스는 키-필드만 갖고 있고, 테이블의 다른 세부 항목들은 갖고 있지 않기 때문이다.)[1] 인덱스의 존재 유무에 따라 쿼리의 결과는 달라지지 않는다. 정규화가 되어 있지 않은 테이블은 컬럼이 많으며, 이에 따라 조합할 수 있는 인덱스가 많아지게 된다. 인덱스가 많으면 갱신 성능이 나빠지고 디스크 공간도 많아지므로 인덱스를 효과적으로 사용하려면 정규화가 잘 되어 있어야 한다.[2]
목차
개요[편집]
인덱스 테이블은데이터베이스를 검색하기 위해 사용할 수 있는 특별한 테이블로서, 데이터베이스 검색의 속도를 빠르게 도와주는 역할을 한다. 즉, 데이터베이스를 사용하는데 있어 성능에 대한 문제 또는 개선을 위해 가장 먼저 확인하는 부분이다. 이는 저절로 생성되지 않으며 관리자 또는 사용자에 의해 별도로 생성하거나 삭제할 수 있다.[2]인덱스는 고유 제약 조건을 실현하기 위해서도 사용된다. 고유 인덱스는 중복된 항목이 등록되는 것을 금지하기 때문에 인덱스의 대상인 테이블에서 고유성이 보장된다.[1]
아키텍처[편집]
클러스터[편집]
클러스터 다중 데이터베이스와 다중 테이블이 조인될 때, 그것을 클러스터라고 한다. 클러스터 키 값을 공유하는 테이블들의 레코드는 동시에 또는 근처의 데이터베이스 블록에 함께 저장될 것이다. 이것은 클러스터 키 상의 이러한 테이블의 조인을 향상시킬 것이다. 왜냐하면 레코드들을 매칭시키는 것은 함께 저장되고, I/O 부하가 덜 그것들에 요구되기 때문이다. 클러스터의 부분들인 테이블에서의 데이터 레이아웃은 클러스터 환경에 의해 정의된다. 클러스터는 B-Tree 인덱스 또는 해쉬 테이블로 키화된다. 테이블 레코드가 저장될 데이터 블록은 클러스터 키 값에 의해 정의된다.[1]
비클러스터화된 인덱스[편집]
데이터는 임의의 순서로 존재하지만, 논리적 순서는 인덱스에 의해 지정된다. 데이터 열은 인덱스화된 컬럼 또는 표현의 값과는 상관없이 테이블 전체에 퍼져있다. 비 클리스터화된 인덱스 트리는 정렬된 순서로 레코드에 포인터를 포함하고 있는 인덱스의 리프 수순으로 인덱스 키 값을 포함하고 있다. 비 클러스터화된 인덱스에서는 열의 물리적 순서는 인덱스 순서와 동일하지 않고, 전형적으로 JOIN, WHERE 그리고 ORDER BY 절에서 사용된 비 기본키 컬럼 위에 만들어진다.[1]
클러스터화된 인덱스[편집]
클러스터링은 인덱스를 매칭시키기 위해서 데이터 블록을 어떤 분명한 순서로 바꾼다. 이것은 열 데이터가 순서대로 저장되는 것으로 이어진다. 그러므로 단 하나의 클러스터화된 인덱스는 임의의 데이터베이스 테이블 위에 만들어질 수 있다. 클러스터화된 인덱스는 전반적인 불러오기 속도를 엄청나게 향상시킨다.[1]
저장 방식[편집]
B-Tree Index[편집]
- 가장 일반적으로 사용되는 인덱스 알고리즘이다.
- 컬럼 값을 변형하지 않고, 원래 값을 기준으로 이용해서 인덱싱을 한다.
- 루트노드, 브렌치 노드, 리프 노드로 나누어진다.
- 리프 노드는 데이터가 저장된 레코드의 주소를 가지게 된다.[3]
Hash Index[편집]
- 컬럼 값으로 해시 값을 계산해서 인덱싱을 한다.
- 값을 변형해서 인덱싱함으로 전방일치와 같이 값의 일부만 검색하고자 할 때 사용할 수 없다.
- 주로 메모리 기반의 DB에서 많이 사용된다.[3]
종류[편집]
- 비트맵 인덱스
비트맵 인덱스는 데이터 뭉치를 비트 열(bit array)로 저장하여 이러한 비트맵에 비트 연산을 수행함으로써, 대부분의 질의어에 응답하는 특별한 종류의 인덱스다.[1]
- 조밀 인덱스
데이터베이스에서 조밀 인덱스는 데이터 파일 내의 모든 레코드에 대한 키와 포인터의 쌍을 가진 파일이다. 중복 키를 가진 클러스터드 인덱스에서, 조밀 인덱스는 그러한 키를 가진 첫 번째 레코드를 가리키고 있다.[1]
- 희소 인덱스
희소 인덱스는 데이터 파일 내의 모든 블록에 대한 키와 포인터의 쌍을 가진 파일이다. 이 파일 내의 모든 키는 정렬된 데이터 파일 내의 블록에 연결된 특정 포인터들과 연계되어 있다. 중복된 키를 가진 클러스터드 인덱스에서 희소 인덱스는 각 블록 내의 가장 빈도가 낮은 검색 키를 지시한다.[1]
- 역방향 인덱스
인덱스 내에 들어가기 전에 인덱스는 키 값을 뒤집는다. 키 값을 뒤집는 것은 특히 단일 값으로 새롭게 증가되는 번호순으로 된 인덱스 데이터에 유용하다.[1]
각주[편집]
같이 보기[편집]