차트
차트(chart)는 어떤 자료의 분석 결과를 알아보기 쉽게 일정한 양식의 그림으로 나타낸 표이다. 차트는 의료, 항공, 통계자료 등에서 공공기관뿐만 아니라 평소에도 흔히 쓰이게 된다. 하나의 그림이나 표 나타내기 때문에 알고 싶은 결과를 한눈에 볼 수 있다. 도표에는 막대그래프, 꺾은선 그래프, 원그래프 등 다양한 방법으로 표현할 수 있다. 다른 말로는 도표라고도 부른다[1]
목차
개요
차트는 매우 다양한 형태를 취할 수 있지만 차트에 데이터에서 의미를 추출하는 기능을 제공하는 공통 기능이 있다. 일반적으로 사람은 텍스트보다 그림에서 의미를 더 빨리 추론할 수 있음으로 일반적으로 차트의 데이터는 그래프의 데이터가 참조하는 내용에 대한 간결한 설명을 제공한다. 수평 및 수직축이 사용되는 경우 일반적으로 각각 x 축 및 y 축이라고 한다. 각 축에는 규모, 주기적인 눈금으로 표시되며 일반적으로 숫자 또는 범주 표시와 함께 표시된다. 각 축에는 일반적으로 표시되는 차원을 간략하게 설명하는 레이블이 외부 또는 옆에 표시된다. 척도가 숫자인 경우 레이블은 종종 괄호 안에 해당 척도의 단위가 붙는다. 예를 들어, "이동 거리 (m)"는 일반적인 x 축 레이블이며 미터 단위로 표시된 이동 거리가 차트 내 데이터의 수평 위치와 관련되어 있음을 의미한다. 그래프 내에서 그리드 데이터를 시각적으로 정렬하는 데 도움이 되는 줄 수가 나타날 수 있다. 그리드는 규칙적이거나 중요한 눈금에서 시각적으로 강조하여 향상할 수 있다. 강조된 선을 주 그리드 선이라고 하고 나머지는 보조 그리드 선이라고 한다. 차트의 데이터는 모든 형식으로 표시될 수 있으며 개별 텍스트를 포함 할 수 있다. 라벨 차트에서 표시된 위치와 관련된 데이터를 설명한다. 데이터는 연결되거나 연결되지 않은 점 또는 모양, 색상 및 패턴의 조합으로 나타날 수 있다. 추론 또는 관심 지점을 그래프에 직접 오버레이 하여 정보 추출을 더욱 지원할 수 있다. 차트에 나타나는 데이터에 여러 변수가 포함된 경우 차트에는 범례 (키). 범례에는 차트에 나타나는 변수 목록과 그 모양의 예가 포함된다. 이 정보를 통해 각 변수의 데이터를 차트에서 확인 할 수 있다.[2]
종류
막대그래프
막대그래프는 범주 데이터를 요약하는 방법이다. 막대그래프에서는 동일한 너비의 여러 막대를 사용하여 데이터를 표시하며, 각 막대는 특정 범주를 나타낸다. 각 막대의 높이는 특정 집계(예: 나타내는 범주에 있는 값의 합계)에 비례한다. 분석을 만들 때 적용된 경우 막대그래프에서는 추가 정보를 참조선이나 여러 곡선 유형에 표시할 수 있다. 예를 들어 이러한 선 또는 곡선은 데이터 포인트가 특정 다항식 곡선에 따라 얼마나 잘 조정되는지를 보여주거나, 데이터를 설명하고 시각화 위에 곡선 또는 직선을 표시하는 모델에 샘플 데이터 포인트 모음을 맞추어 해당 모음을 요약한다. 일반적으로 분석에서 필터링 된 값에 따라 곡선의 모양이 변경된다.[3]
- 장점
- 독자에게 익숙하다.
- 시각화 중 가장 정확한 전달이 가능한 길이를 이용하였기 때문에, 값의 정확한 전달이 가능하고 읽기 쉽다.
- 대부분의 데이터셋을 커버할 수 있다.
- 음수도 나타낼 수 있다.
- 단점
- 누적 막대그래프의 경우, 각 비율을 정확히 파악하기 어렵다.[4]
히스토그램
히스토그램은 분포표를 그래프로 나타낸 것이다. 보통 히스토그램에서는 가로축이 계급, 세로축이 도수를 뜻하는데, 때때로 반대로 그리기도 한다. 계급은 보통 변수의 구간이고, 서로 겹치지 않는다. 그림에서 계급(막대기)끼리는 서로 붙어 있어야 한다. 히스토그램은 일반 막대그래프와는 다르다. 막대그래프는 계급 즉 가로를 생각하지 않고 세로의 높이로만 나타내지만, 히스토그램은 가로와 세로를 함께 생각해야 한다[5]
- 장점
- 쉽고 유용하다.
- 대부분의 데이터셋에 적용할 수 있다.
- 용량이 큰 데이터도 한눈에 요약해준다.
- 분포의 모양, 중심, 치우침 정도, 퍼짐 정도를 파악할 수 있다.
- 데이터의 범위를 파악할 수 있다.
- 단점
- 데이터가 항상 재가공(구간별 빈도수 요약)되어 표현된다.
- 도표에서 정확한 데이터를 재현할 수 없다.
- 여러 카테고리를 비교하기에 한계가 있다.[6]
라인 차트
선 도표, 라인 차트(line chart)는 직선 세그먼트로 연결된 '마커'(marker)라는 이름의 일련의 데이터 지점으로 정보를 표시하는 차트의 일종이다. 수많은 분야에서 일반화된 기본적인 유형의 차트이다. 측정 지점이 정렬되고(일반적으로 x축 값으로 정렬) 직선 세그먼트와 함께 병합된 것을 제외하고는 산 점도와 비슷하다. 선 도표는 시간 간격에 따라 데이터의 경향(트렌드)을 시각화하기 위해 종종 사용되는 데 이를 시계열이라고 하며, 이에 따라 선은 시간 순서에 따라 표현되기도 한다. 이러한 경우에는 실행 도표(런 차트, run chart)라고 부른다.[7]
- 장점
- 시간에 따른 숫자 형 변수의 변화를 잘 보여준다.
- 데이터 바깥으로 외삽(Exrapolation)이 가능하다.
- 내삽(Interpolation)을 통해 결측치 예측이 가능하다.
- 두 개(이상)의 카테고리의 관계를 비교해볼 수 있다.
- 단점
- 선분이 여러 개 있을 때, 쉽게 어수선해져 가독성이 낮아진다.
- 특정 시점의 데이터 포인트의 정확한 값을 알기 어렵다.[8]
원그래프
원그래프(영어: Pie chart)는 전체에 대한 각 부분의 비율을 부채꼴 모양으로 백분율로 나타낸 그래프이다. 각 부채꼴의 중심각이 전체에서 차지하는 비율을 나타내며, 비율을 한눈에 볼 수 있다는 장점이 있다. 전체적인 비율을 쉽게 파악할 수 있어서 언론사에서 통계 수치를 공개할 때 자주 활용된다. 원그래프는 수치 데이터를 표현한다. 먼저 전체에 대한 각 항목의 백분율을 계산한다. 그다음 항목이 차지하는 백분율만큼 원을 나눈다. 마지막으로 각 항목의 명칭, 백분율을 적는다. 원그래프를 나누어 나온 백분율의 합이 100%가 되는지 확인해야 한다.[9]
- 장점
- 독자에게 익숙하다.
- 시각적으로 단순하다.
- 비율 데이터의 완결성을 테스트하기에 좋다.
- 단점
- 각도를 이용하기 때문에 정확한 값을 전달하기 어렵다.
- 5개 이상의 카테고리를 전달하기 힘들다.
- 만드는 사람의 의도에 따라 메시지가 많이 달라질 수 있다.[10]
꺾은 선 그래프
선 그래프 또는 꺾은 선 그래프는 수량을 점으로 표시하고 그 점들을 선분으로 이어 그린 그래프를 말한다. 불필요한 부분을 생략하고 자세히 그래프를 그릴 때는 물결선을 긋는다. 선 그래프는 연속적 자료를 다루거나 통시적 자료를 다룰 경우, 동일하거나 일련의 관찰대상의 추이를 비교할 경우, 추세(trend)를 관찰할 경우에 쓰이는 그래프이다. 시간에 따라 뭔가가 지속해서 변화하는 것을 기록할 때 굉장히 유용하다. 숫자로만 적으면 지속해서 변화하는 것의 흐름을 정확히 파악하기가 어려우므로 이런 상황에서 꺾은선그래프가 유용하다.[11]
- 장점
- 조사하지 않은 중간의 값도 대략 예측할 수 있다.
- 단점
- 세로 눈금 한 칸의 크기를 너무 작게 하면 눈금 그리기가 어렵고 그래프가 너무 커지며, 너무 크게 할 경우 수량을 표시하기 힘든 단점이 있다.[12]
산점도
산점도는 가로축(X축)과 세로축(Y축)을 설정한 좌표평면상에서 각각의 관찰 값들을 점이나 X 문자로 표시하는 방식을 말한다. 물론 두 축이 의미하는 바가 무엇인지부터 확실하게 정의되어야 한다. 산점도는 나중에 회귀 분석(regression)을 할 때 굉장히 중요해진다. 수치를 표시하고 비교하는 데 사용되어 추세 외에도 데이터 클러스터의 모양을 보여드리고 데이터 클라우드에서 각 데이터 지점의 관계를 나타낼 수 있다.[13]
- 장점
- 그리기가 쉽다.
- 자료를 읽어내기가 쉽다.
- 도표에서 데이터를 정확하게 재현할 수 있다.
- 비선형(non-linear) 관계를 보여주기에 최적이다.
- 값의 범위, 최저, 최솟값을 탐색할 수 있다.
- 단점
- (한계점) 두 변수가 수치로 얼마나 상관있는지 말해주지 못한다.
- 2개 이상의 변수 관계를 탐색할 수 없다.
- 겹쳐 그려지는 문제가 발생할 수 있다.[14]
버블 차트
버블 차트는 데이터의 흐름을 평가하는 시스템 분석에 사용하는 차트/ 엑셀 지도 차트의 하나이다. 선이나 화살표로 이어지는 주석이 붙은 원(풍선 모양)으로 프로그램이나 시스템 내에서 동작 대상이 되거나 이동하는 데이터에 적용되는 조작, 절차를 나타내는 것을 말한다. 계통도나 플로차트 대신 버블 차트를 사용하는 것은 각 부분 간의 구조적, 순차적 또는 절차상의 관계를 주안점으로 하지 않고 주로 전체의 각 개념이나 부분 간의 연관을 기술하기 위해서이다. 가장 간단한 형태로, 버블 차트는 2차원의 데이터를 표현한다. 한 데이터는 동그란 버블의 크기로 시각화되는 수치 데이터이고, 다른 데이터는 버블 차트가 나타내고자 하는 대상이다. 간단하게 말해서, 큰 버블은 큰 값을 의미한다.[15]
- 장점
- 카테고리별로 색상을 다르게 하면 4개의 변수를 시각화 할 수 있다.
- 복잡한 데이터셋을 시각화할 수 있다.
- 핵심 변수를 한눈에 추론할 수 있다.
- 표를 읽는 것보다 트랜드 파악에 수월하다.
- 단점
- 원들이 겹쳐져 정보가 소실되기 쉽다.
- 0 혹은 음수의 자료들 전달이 어려울 수 있다.[16]
레이더 차트
레이더 차트(Radar Chart)는 어떤 측정 목표에 대한 평가항목이 여러 개일 때 항목 수에 따라 원을 같은 간격으로 나누고, 중심으로부터 일정 간격으로 동심으로 척도를 재는 칸을 나누어 각 평가항목의 정량화된 점수에 따라 그 위치에 점을 찍고 평가항목 간 점을 이어 선으로 만들어 항목 간 균형을 한눈에 볼 수 있도록 해주는 차트이다. 여러 측정 목표를 함께 겹쳐 놓아 비교하기에도 편리하다. 각 항목 간 비율뿐만 아니라 균형과 경향을 직관적으로 알 수 있어 편리하다. 특히 신문, 잡지 등에서 많이 쓰이는데 예를 들어 여러 제품의 품질을 평가하기 위해 견고성, 사용 편의성, 가격, 디자인, 고객서비스 등의 항목을 두고 이를 10단계로 점수를 매기고 이를 레이더 차트로 만들어서 보면 각 제품의 장단점과 균형을 쉽게 알 수 있어서 편리하다. 레이더의 표시장치와 닮아서 레이더 차트라고 한다.[17]
- 장점
- 계절, 시간 등 순환하는 카테고리에 강점이 있다.
- 방위 표현에 강점이 있다.
- 단점
- 정렬 순서에 민감하여 모양이 많이 달라질 수 있다.[18]
깔때기 차트
깔때기 차트는 단계별 이탈률 혹은 전환율을 보여주는 차트이다. 쉽게 말해서 단계별로 얼마나 남는지 살펴볼 때 유용하게 사용할 수 있다. 주로 마케팅과 영업 분야에서 단계별로 가망고객 전환율 분석을 통해 프로세스별 효과 및 효율성 검증, 개선에 활용된다. 따라서 태블로를 이용해서 시각화할 때 단계별로 수량이나 금액을 폭이나 크기로 표현한다면 더욱 효과적인 분석이 가능해진다.[19]
- 장점
- 각 세션의 크기를 대비함으로써 직관적으로 문제점을 파악 할 수 있다.
- 단점
- 무질서한 카테고리 또는 프로세스 관계가 없는 것은 표현이 힘들다.[20]
워드 클라우드 차트
워드 클라우드 차트는 각 단어의 중요도(인기도)를 한눈에 알아볼 수 있도록 높은 시각적 효과를 제공하는 차트이다. 단어의 중요도는 데이터에 나타난 단어의 빈도수가 얼마나 높은지 혹은 단어에 주어진 수치(가중치)가 얼마나 큰지에 따라서 결정되며 차트상에는 단어의 크기와 색상을 달리하여 표현된다. 워드 클라우드 차트는 노드의 series 속성값에 노드를 설정하여 생성할 수 있다. 차트에 표현되는 단어의 크기는 노드에 정의되는 다음 두 속성에 의해서 결정된다.[21]
- 장점
- 대량 텍스트에서 키워드를 추출 할 수 있다.
- 단점
- 데이터 너무 적거나 데이터 구분이 뚜렷하지 않은 텍스트에 적용되지 않는다.[20]
간트 차트
간트 차트란 미국의 헨리 간트(H. L. Gant)가 1919년 창안한 관리 도표로 작업계획과 작업 실적을 비교해 작업 진도를 관리·통제하는 진척관리에 이용된다. 간트 차트는 한 축에 시간의 흐름을 표시하고 다른 한 축에 생산 사이클에서 요구되는 과업들을 표시, 전체 생산 공정의 일정계획을 수립할 수 있고 핵심과업이나 지체 작업을 손쉽게 파악할 수 있다. 간트는 과업의 성과뿐 아니라 생산 일정계획의 작업순위를 결정할 수 있는 기준이 확립되어야 한다고 주장했는데, 생산과업의 작업순위가 효과적으로 계획·조정·수행되려면 최적 타이밍 결정이 우선되어야 한다고 보았다. 일정 계획이 수립되어 있지 못하면 병목현상이 발생하고 비효율이 내재돼 전체 시스템의 기능을 저하한다는 것이다.[22]
- 장점
- 전체 일정을 한눈에 볼 수 있다.
- 각 업무 사이의 관계를 보여줄 수도 있다.
- 단점
- 변화 또는 변경에 약하다.
- 일정계획에 있어서 정밀성을 기대하기 어렵다.
- 작업 상호 간의 유기적인 관계가 명확하지 못하다.[23]
각주
- ↑ 〈도표(diagram / graph / chart )〉, 《사이언스올》, 2015-09-09
- ↑ 〈차트〉, 《HiSoUR》
- ↑ 〈막대 그래프란?〉, 《TIBC》
- ↑ 〈막대 차트 (Bar Chart)〉, 《위키독스》
- ↑ 〈히스토그램〉, 《위키백과》
- ↑ 〈히스토그램 (Histogram)〉, 《위키독스》
- ↑ 〈선도표〉, 《위키백과》
- ↑ 〈라인 차트 (Line Chart)〉, 《위키독스》
- ↑ 〈원그래프〉, 《위키백과》
- ↑ 〈파이/도넛 차트 (Pie/Donut Chart)〉, 《위키독스》
- ↑ 〈선그래프〉, 《readonly》
- ↑ 제3교실플러스, 〈꺽은선그래프 배우기 〉, 《네이버 블로그》, 2012-08-27
- ↑ 〈산점도〉, 《나무위키》
- ↑ 〈산점도 (Scatter Plot)〉, 《위키독스》
- ↑ 〈버블 차트〉, 《네이버 지식백과》
- ↑ 〈버블 차트 (Bubble Chart)〉, 《위키독스》
- ↑ 〈레이다 차트〉, 《위키백과》
- ↑ 〈레이더 차트 (Radar Chart)〉, 《위키독스》
- ↑ 송재환, 〈분석 상황에 맞는 차트 작성 – ⑤ 깔때기 차트〉, 《플랜잇》, 2017-01-02
- ↑ 20.0 20.1 〈시각화 차트 종류 14 종: 한 눈에 들어오는 가치를 잡아주기〉, 《파인리포트》
- ↑ 〈알메이트-차트 6.0 사용 설명서〉, 《리아모어》
- ↑ 〈간트차트〉, 《네이버 지식백과》
- ↑ 〈간트 차트〉, 《위키백과》
참고자료
- 〈도표(diagram / graph / chart )〉, 《사이언스올》, 2015-09-09
- 〈차트〉, 《HiSoUR》
- 〈막대 그래프란?〉, 《TIBC》
- 〈히스토그램〉, 《위키백과》
- 〈원그래프〉, 《위키백과》
- 〈레이다 차트〉, 《위키백과》
- 〈간트 차트〉, 《위키백과》
- 〈선도표〉, 《위키백과》
- 〈히스토그램 (Histogram)〉, 《위키독스》
- 〈막대 차트 (Bar Chart)〉, 《위키독스》
- 〈라인 차트 (Line Chart)〉, 《위키독스》
- 〈파이/도넛 차트 (Pie/Donut Chart)〉, 《위키독스》
- 〈산점도 (Scatter Plot)〉, 《위키독스》
- 〈버블 차트 (Bubble Chart)〉, 《위키독스》
- 〈레이더 차트 (Radar Chart)〉, 《위키독스》
- 〈선그래프〉, 《readonly》
- 제3교실플러스, 〈꺽은선그래프 배우기 〉, 《네이버 블로그》, 2012-08-27
- 〈산점도〉, 《나무위키》
- 〈버블 차트〉, 《네이버 지식백과》
- 송재환, 〈분석 상황에 맞는 차트 작성 – ⑤ 깔때기 차트〉, 《플랜잇》, 2017-01-02
- 〈시각화 차트 종류 14 종: 한 눈에 들어오는 가치를 잡아주기〉, 《파인리포트》
- 〈알메이트-차트 6.0 사용 설명서〉, 《리아모어》
- 〈간트차트〉, 《네이버 지식백과》
같이 보기
|
|