검수요청.png검수요청.png

정밀도

위키원
이동: 둘러보기, 검색

정밀도(Precision)는 여러 번 측정하거나 계산했을 때 그 결과가 서로 얼마큼 가까운지를 나타내는 기준이다.

개요[편집]

정밀도(precision)는 동일한 조건에서 여러 번 반복 측정을 하는 경우 그 측정한 값이 서로 얼마나 가깝게 나오는지에 대한 척도로서 측정의 재현성(reproducibility)을 나타낸다. 즉 측정한 값의 편차가 적으면 적을수록 정밀하다고 할 수 있다. 정밀도는 우연 오차(random error) 혹은 불가측 오차(indeterminate error)의 존재에 의해 발생한다. 이에 반해 정확도(accuracy)는 측정한 값이 참값과 얼마나 일치하는지 정확성에 관한 척도이다. 측정된 값이 정확도는 높아도 정밀도가 낮은 경우도 있고, 거꾸로 정밀도가 높지만, 정확도가 낮은 경우도 있다.

정밀도의 표현[편집]

정밀도는 절대 표준편차와 상대 표준편차와 같은 성능 계수(figures of merit)로 표현된다.

절대 표준편차

정밀도를 표현하는 성능계수로 절대 표준편차(absolute standard deviation)가 쓰이며 그 식은 아래와 같다.

표준편차 공식, N은 측정횟수, xi는 i번째 측정을 ẋ는 측정의 평균을 나타낸다.

절대 표준편차가 크면 클수록 정밀도는 떨어지며 작으면 작을수록 정밀도는 높다.

상대 표준오차

정밀도를 표현하는 성능 계수로 절대 표준편차보다는 상대 표준편차(relative standard deviation, RSD)를 더 많이 사용한다. 상대 표준편차는 표준 편차를 측정한 값의 평균으로 나눈 값이다. 상대 표준편차는 이 비율에 100을 곱하여 종종 퍼센트로 나타낸다. 이를 또한 변동계수(coefficient of variation, CV)라고도 한다. 상대 표준편차는 절대 표준편차보다 정밀도의 질을 더욱 더 명확히 표현한다. 예를 들어 물속에 녹아있는 페놀의 양을 측정하는 경우 반복된 측정값의 절대 표준편차가 1.0ppm인 경우라고 할 때 만약 측정된 페놀 농도의 평균값이 100ppm인 경우는 상대 표준편차 RSD가 1.0%이지만 측정된 페놀 농도의 평균값이 10ppm인 경우는 RSD가 10%가 되어 상대적으로 재현성이 떨어진다.

정확도와 정밀도[편집]

정확도(正確度, accuracy)는 과학, 산업, 공업, 통계학 분야에서 측정하거나 계산된 양이 실제값과 얼만큼 가까운지를 나타내는 기준이며, 관측의 정교성이나 균질성과는 무관하다. 그러나 착오와 정오차가 제거된 경우, 정밀도를 정확도의 척도로 사용할 수 있다. 왜냐하면 현실적으로는 실제값을 정확하게 알 수 없기 때문이다.

정확도와 밀접한 관계가 있는 정밀도(精密度, precision)는 여러 번 측정하거나 계산하여 그 결과가 서로 얼만큼 가까운지를 나타내는 기준이다. 관측의 균질성을 나타내며, 관측된 값의 편차가 적을수록 정밀하다. 정밀도는 관측 과정과 우연 오차와 밀접한 관계를 가지며, 관측장비와 관측방법에 크게 영향을 받는다. 여기서 우연 오차는 까닭이 뚜렷하지 않은 오차이며 최소 제곱법에 따른 확률 법칙에 따라 추정할 수 있다.

계산, 측정된 값이 정확도는 높아도 정밀도가 낮은 경우도 있고, 거꾸로 정밀도가 높지만 정확도가 낮은 경우도 있다. 물론, 둘 다 낮거나 둘 다 높을 수도 있다.

정밀도와 재현율[편집]

정밀도와 재현율

이진 분류 기법(binary classification)을 사용하는 패턴 인식정보 검색 분야에서, 정밀도는 검색된 결과들 중 관련 있는 것으로 분류된 결과물의 비율이고, 재현율은 관련 있는 것으로 분류된 항목들 중 실제 검색된 항목들의 비율이다. 따라서 정밀도와 재현율 모두 관련도(Relevance)의 측정 기준 및 지식을 토대로 하고 있다.

정의[편집]

정보 검색 분야에서, 정밀도와 재현율은 검색된 문서(retrieved documents; 웹 검색 엔진에 의해 생성된 문서들) 및 관련 있는 문서(relevant documents; 웹 문서들 중 찾고자 하는 주제와 실제로 관련 있는 것들)에 의해 정의된다.

정밀도[편집]

정보 검색 분야에서 정밀도(precision)는 검색된 문서들 중 관련 있는 문서들의 비율이다.

재현율[편집]

정보 검색 분야에서 재현율(recall)은 관련 있는 문서들 중 실제로 검색된 문서들의 비율이다.

정의[편집]

실제 정답
Positive Negative
실험 결과 Positive True Positive False Positive

(Type 1 Error)

Negative False Negative

(Type 2 Error)

True Negative

통계적 분류 분야에서 정밀도(precision)와 재현율(recall)은 다음과 같이 정의된다.

여기서 재현율은 sensitivity로도 불리며, 정밀도는 positive predictive value(PPV)로 불리기도 한다; 통계적 분류 분야에서 사용되는 다른 기준으로 True Negative Rate(Specificity)와 정확도(Accuracy) 등이 있다.

정밀도와 반도체[편집]

반도체 제조 공정에서는 정밀도가 특히 중요하다. 반도체 공정에서 미세한 공정 변동이나 결함도 제품 성능에 큰 영향을 미칠 수 있기 때문에, 공정의 정밀도는 생산 수율과 제품 신뢰성에 직접적인 영향을 미친다. 예를 들어, 미세한 공정에서의 오류를 줄이고 잉킹(잉크를 사용한 불량품 식별)을 통해 결함을 제거하는 것은 반도체 제조의 중요한 목표이다.

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 정밀도 문서는 반도체에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.