결정이론
결정이론(Decision Theory)이란 수학적 또는 통계학적으로 불확실한 상황에서 어떤 가치 및 이에 관련된 문제들을 찾아내어 최적의 결정을 내리는 방법에 관한 이론이다. 이 과정에서 위험 함수의 값에 따라 행동의 효율을 측정하고 행동의 결정을 나타내는 결정 함수를 구하게 되는데, 따라서 결정이론은 확률이론(Probability theory)과 효용이론(Utility Theory)이 결합된 것이라고 볼 수 있다.
목차
개요
결정이론은 불확실성에 직면하여 결정을 내리지 않으면 안 될 경우, 어떤 결정을 할 것이며 어떤 정보를 어떻게 이용할지에 대한 문제에 답하려는 이론이다. 통계적 결정이론이라고도 한다. 결정이론은 의사 결정에서 문제의 설명, 그 방법의 선택 유도를 위한 모든 방법과 이론으로, 가장 적절한 행동을 선택하는 과정을 연구한다.[1] 결정이론은 결정자의 선택에 대한 연구이다. 예를 들어, 어떤 산의 지하에 구리가 매장되어 있을 때, 만약 매장량이 100만 톤 이상이면 채굴 사업에 착수하고 싶고, 그 이하라면 사업을 보류하고 싶다고 한다. 그러면 결정자는 지하에 100만 톤 이상의 구리가 있는지 알 수 없어도 오랜 경험으로 미루어 구리 매장량의 확실성에 관한 어떤 평가를 가지고 있을 것이다. 결정이론에서는 그것을 결정자의 판단확률로써 양화하고, 그와 동시에 어떤 결정에 따라 초래되는 결과의 가치를 평가하기 위한 효용이론을 구성한다. 양화란 양한정이라고도 하며, 양기호를 명제 앞에 붙여 명제를 나타내는 것을 말한다.[2] 그 후 결정자는 판단확률에 의한 효용의 기대치, 즉, 기대효용이 최대가 되도록 결정하는 것을 논리의 귀결로써 연역한다.[3] 여기서 연역이란 이미 알고 있는 하나 또는 둘 이상의 명제를 전제로 하여 명확히 규정된 논리적 형식들에 근거하여 새로운 명제를 결론으로 이끌어내는 추리의 방법이다.[4] 결정이론은 이러한 결정을 하는 것이 결정자에게 있어 불확실성 하에서의 합리적이고 가장 적절한 결정이라고 주장한다. 결정이론은 결정의 결과를 분석하거나 제약 조건과 가정에 따라 최적의 결정을 정하는 규범적 결정이론과 결정자가 실제로 결정을 내리는 방법을 분석하는 기술적 결정이론의 두 부분으로 나눌 수 있다. 현실적인 결정 문제에서는 최종 결정을 내리기 전 조사를 하고, 정보를 수집한다. 그러나 정보를 얻기 위해 비용이 발생하고, 그 비용을 고려했을 때 정보를 이용할 가치가 있는지를 결정이론에서는 정보 가치의 문제로서 해결한다. 정보화시대에 있어 정보 가치가 높은 정보는 무엇이고, 이것을 이용해 구체적 결정을 어떻게 내려야 하는가를 제시하는 것이 최근의 결정이론이다.[5] 결정이론은 게임 이론 분야와 밀접한 관련이 있고, 경제학, 통계학, 심리학, 생물학, 정치, 사회과학, 철학, 컴퓨터과학 등 여러 분야에 의해 연구되는 통합 주제이다. 이 이론의 경험적 적용은 대부분 통계적이고 계량적인 방법으로 이루어진다.
특성
결정 단계
- 문제 인식 : 문제의 원인을 분석, 정리하고 문제의 내용과 성격을 인지한 뒤 문제해결의 필요성을 자각하는 단계이다. 이 과정에서 관계자와 전문가들로 결정팀을 구성하고, 결정자의 성장 배경, 가치관, 역량에 따라 문제의 인지 여부와 속도가 다르다.
- 자료의 수집과 분석 : 문제해결과 평가에 필요한 자료를 최대한 수집하여 분석해 자료의 타당성과 신뢰성을 고려한다. 또, 문제해결의 기준과 해결책에 따른 기대수준 설정한다.
- 대안의 작성 및 평가 : 분석된 자료에 근거하여 여러 대안을 개발하여 작성하고, 변수를 고려하여 각 대안에 따른 결과 예측한다. 해당 문제의 관계자 및 관련 분야의 전문가를 통해 재정 상황, 사회적 영향, 조직구성원들에게 미칠 영향 등 예측하는 단계로, 델파이, 시나리오 기법, 회귀분석 기법 등 활용한다. 그렇게 예측한 결과를 바탕으로 각 대안을 조직구성원의 역량과 결과의 영향 등을 평가한다. 이때 현상 유지도 하나의 대안으로 고려해야 하며 대안의 수는 유한하다고 가정한다. 예를 들어 새로운 소매점의 입지는 지도상 모든 지점이 될 수 있으나 현실적으로는 몇 군데로 제한된다.
- 대안의 선택 : 대안들을 검토하여 최적의 대안 선택한다. 이때 조직목표와의 연계성, 문제해결 가능성, 실천 가능성, 이행 시 부작용 등을 종합적으로 검토해야 한다. 대개 대안을 선택할 때 보상을 계산하게 되는데, 이는 총이익이나 총비용이 된다. 각 대안마다 각 사건이 벌어질 경우의 보상을 정리한 것을 보상행렬(payroll table)이라고 한다. 대안이 세 가지고 사건이 네 가지면 이 행렬은 12개의 원소를 갖는다. 만약 시간적 가치를 고려하자면 보상은 현재가치나 내부수익률로 표시하고, 질적 요소를 반영하려면 선호도 행렬 접근법의 가중평균 점수를 보상으로 이용한다. 각 사건의 확률은 전체의 합이 1이 되어야 하는데, 과거가 미래에 대한 좋은 지표라면 과거 자료를 사용하여 확률을 추정하면 된다.[6]
- 대안의 실행 : 결정에 영향을 받을 사람들의 수용 또는 인정 확보해야 한다. 부정적 태도에 대한 원인 분석 후 결정을 포기하거나, 수정하거나, 이행을 추진해야 한다. 이때 이행은 계획, 조직, 인사, 지시, 조정, 보고, 예산, 평가로 이루어진다. 계획은 개괄적인 추진 개요를 설정하고, 조직은 세부계획 설정 및 실행기구 설치 단계이다. 인사는 실행인력 선택 및 역할 할당, 동기부여가 포함된다. 지시는 업무순서를 결정하고 업무지시를 시작하는 단계이며, 조정은 서로 다른 팀 간의 업무 조율, 보고는 서면, 모니터링 등을 통해 경과를 보고하는 단계다. 예산은 재정 계획, 회계, 관리, 평가는 형성평가, 총괄평가 등을 실시하고 피드백을 하는 단계이다.
불확실성
불확실한 상황에서의 결정은 결정 이론의 핵심이다. 각각의 행동이 다른 확률로 둘 이상의 가능한 결과를 낳을 수 있는 상황에 직면했을 때, 합리적인 절차는 가능한 모든 가능성을 확인하고 기대 가치를 계산하는 것이다. 그 과정에서 어떤 행동에 따라 기댓값이 발생할 확률과 그 값을 결정하고, 두 값을 곱해 기댓값 또는 평균 기댓값을 얻을 수 있다. 그러면 총 기댓값이 가장 높은 행동을 선택하게 된다. 만약 모든 결과에 위험이 존재할 때 실제 사람의 의사 결정에서 이득보다 손실이 크게 발생하고, 사람들은 절대 효용이 아닌 유틸리티 상태 변화에 초점을 맞추며, 고정을 통해 주관적인 확률의 추정을 편향시킨다는 특징이 있다. 불확실성 하에서의 의사결정이 이루어지는 이유는 미래에 일어날 사건들을 나열할 수는 있지만 각각의 확률을 추정할 수는 없기 때문이다. 예를 들면 과거의 경험이 전무하여 미래의 확률은 추정하기가 어려운 경우다.
- 최대최소(maxmini) : 최악의 경우가 가장 좋은 대안을 선정하는 비관주의적 규칙이다.
- 최대최대(maxmax) : 최선의 경우가 가장 좋은 대안을 선택하는 낙관주의적 규칙이다.
- 라플라스(laplace) : 모든 확률이 동일한 확률로 일어난다고 보고, 보상의 산술 평균이 가장 좋은 대안을 선택하는 현실주의적 규칙이다.
- 최소최대후회(minimax regret) : 최악의 후회가 가장 양호한 대안을 선택한다. 기회상실 또는 후회 행렬을 먼저 작성해야 한다. 후회란 동일한 열에 있는 보상 중 가장 좋은 값과의 차이로, 주어진 사건에서 최선의 대안에 비해 얼마나 손해(이익의 상실 또는 비용의 증가)를 보는가를 나타내는 것이다.
각 사건을 나열하고 그 확률을 추정할 수 있다고 하면, 불확실성 하에서의 의사결정보다는 정보가 더 많다. 이런 경우는 기대값 의사결정 규칙이 널리 이용된다. 기대값은 각각의 보상을 확률과 곱한 다음 이를 합하여 구하며, 기대값이 최선인 대안을 선택하게 된다. 기대값이란 같은 의사결정을 반복할 때 평균보상이므로, 나쁜 사건이 발생하여 나쁜 결과를 얻을 수 있다. 따라서 위험을 회피하고자 하는 경우라면 이 규칙을 적용하면 안 된다.[6]
시점 간 선택
시점 간 선택은 행동이 시간이 지남에 따라 다른 단계에서 실현되는 결과로 이루어지는 것과 관련이 있다. 이것은 도착 규모와 도착 시간에 따라 달라지는 보상 사이의 선택을 포함하기 때문에 비용 편익 결정이라고도 한다. 만약 누군가 돈이 생긴다면 휴가를 가거나 기부할 수 있듯, 답은 부분적으로 예상되는 이자율, 물가 상승, 사람의 기대 수명 등과 같은 요소에 달려 있다. 그러나 이런 요소를 고려하더라도 인간의 행동은 다시 규범적 결정이론의 예측에서 크게 벗어나기도 한다.
일상생활에서 결정하는 선택들 중 그 결과가 당장 나타나지 않고 시간이 지나서야 드러나는 경우가 많다. 다이어트의 경우만 하더라도 체중이 감소하기까지는 적어도 2~3주가 걸리고, 영어 공부를 하더라도 유창한 말하기 실력을 위해서는 수년이 걸릴 수 있다. 이와 같이 선택을 하는 시점과 그로 인해 결과가 나타나는 시점 사이에 시간적인 간격이 떨어져 있는 의사결정을 시점간 선택이라고 한다. 대부분의 사람들은 큰 보상에는 마음이 끌리지만 그 보상이 주어지는데 시간이 오래 걸릴수록 그 선택을 꺼린다. 왜냐하면 보상이 주어지는데 시간이 지체될수록 그 보상의 가치가 할인되기 때문이다. 예를 들면 오늘 만 원을 받을 것인지 아니면 내일 이만 원을 받을 것인지 둘 중 하나를 선택하라고 하면, 대부분 사람들은 후자를 선택할 것이다. 하지만 오늘 만 원과 일년 뒤 이만 원 중 선택하라고 하면, 대부분은 전자를 선택할 것이다. 왜냐하면 일년 뒤의 이만 원은 현재 시점에서 그 가치가 할인되어서 이만 원이 되지 않기 때문이다. 사람들이 미래의 이익을 할인하는 이유는 현재의 만 원은 당장 사용할 수 있지만 일년 뒤의 이만 원은 현재 사용할 수 없기 때문이다. 그리고 미래의 불확실성으로 인해 일년 뒤의 이만원이 실제로 손에 들어올지 확신할 수 없기 때문일 것이다.
이런 시점간 선택을 객관적으로 연구하기 위해 지연할인과제(Delay Discounting Task)가 개발되었다. 이 과제에서 피검자는 즉각적인 보상과 지연된 더 큰 보상 사이에서 어떤 것을 선호하는지 반복해서 질문을 받는다. 지연되는 시점은 내일, 일주일 후, 이주 후, 한달 후, … 일년 후 등인데, 각 시점에서의 가치 할인이 얼마나 되는지 알아보는 것이 이 과제의 핵심이다. 예를 들면 피검자는 “오늘 1만 원 또는 일주일 후 2만 원 중 어느 것을 선호하는가?” 질문을 받는다. 만약 피검자가 오늘 만 원을 선택하면, “오늘 1만 원 또는 일주일후 3만 원 중 어느 것을 선호하는가?”라는 질문을 다시 받는다. 만약 피검자가 오늘 1만 원을 선택하면, “오늘 1만 원 또는 일주일 후 4만 원 중 어느 것을 선호하는가?”라는 질문을 다시 받는다. 여기서 피검자가 일주일 후 4만 원을 선택한다면, 일주일 지연되는 동안 1만 원의 가치는 1/4로 할인된다는 것을 의미한다. 다시 말해, 이 피검자에서 일주일 후 1만 원은 현재 시점에서는 그 가치가 1/4로 할인되어 2천 5백 원에 해당된다고 볼 수 있다. 지연된 보상에 대한 할인율은 보편적이지만, 그 할인율은 사람마다 차이가 있고 여기에는 충동성이 관여한다. 왜냐하면 충동성이 높은 사람일수록 시간이 지연되는 것에 대한 참을성이 부족하기 때문이다. 따라서 충동적인 사람일수록 지연된 더 보상에 대해 할인율이 높으므로 지연된 더 큰 보상보다 즉각적인 보상을 선택할 가능성이 높다. 지연된 큰 보상에 대한 할인율은 개인간에도 차이가 있지만, 한 개인이 어떤 상황에 있는지 또는 어떤 상태인지에 따라서도 달라진다.
- 시점간 선택에 영향을 미치는 요인
- 시점간 선택은 의사결정을 할 당시의 상황이 어떤 맥락이었는지 그리고 의사결정자의 상태가 어떠하였는지에 따라 변경될 수 있다. 첫째, 시점간 선택에 영향을 줄 수 있는 맥락으로는 지연된 시간과 보상의 크기 중 어느 것에 집중을 하느냐, 미래의 시간과 사건을 어떻게 조망하느냐 등이 포함된다. 둘째, 의사결정자의 감정상태, 생리주기, 혈당의 변화 등이 시점간 선택에 영향을 줄 수 있다.
- 먼저 시점간 선택을 할 상황에서 지연된 시간에 주의집중을 하면 즉각적인 보상에 더 끌리게 되는 반면에, 보상의 크기에 주의집중을 하면 지연된 더 큰 보상에 더 끌리게 된다. 따라서 보상의 크기에 민감하고 지연된 시간에 둔감할수록 충동성은 감소한다. 흥미롭게도 보상의 크기를 천 원 단위의 십 원 단위까지 제시할 때 충동성은 더 감소하였다. 예를 들면, “오늘 9천 원 또는 일주일 후 1만 1천 원 중 어느 것을 선호 하는가?” 대신 “오늘 8천 4백 4십 원 또는 일주일 후 1만 3백 2십 원 중 어느 것을 선호하는가?”로 질문을 할 경우에 지연된 더 큰 보상을 선택하였다. 그 이유는 보상의 크기를 십원 단위 이하로 제시할 경우에 보상의 크기에 더 집중하게 되므로 시간의 지연에 대해 둔감해졌기 때문이다. 그리고 “오늘 1만 원 또는 한 달 후 2만 2천 원 중 어느 것을 선호하는가?” 대신에 “오늘 1만 원과 한 달 후 0원 또는 오늘 0원과 한 달 후 2만 2천 원 중 어느 것을 선호하는가?”로 질문을 할 경우에도 충동성이 감소하였다. 전자와 달리 후자처럼 질문을 받게 되면, 즉각적인 보상을 선택할 경우 기회비용으로 지연된 더 큰 보상을 잃는다고 느껴져서 지연된 더 큰 보상을 선택할 인내심이 커졌기 때문이다.
- 다음으로 지연되는 시간보다 미래에 일어날 사건에 집중할수록 충동성은 감소하고 인내심은 더 향상될 수 있다. 예를 들면, “180일 후 해외여행을 갈 것이다”라고 생각하는 것보다“180일 후 파리 에펠탑에서 야경을 볼 것이다”라고 상상하면 더 참을성 있게 기다릴 수 있다. 그 이유는 미래의 사건에 대해 구체적으로 상세하게 상상할수록 지연된 시간이 길게 느껴지지 않기 때문이다. 그리고 지연되는 시간을 좀 더 구체적으로 표시할 경우에도 인내심이 더 높아질 수 있다. 다시 말해, 여행갈 때까지 남은 날을 표기하기 보다, 여행을 하는 구체적인 날짜를 표기하는 것이 참을성 있게 기다리는 방법이다. 즉 “180일 후 해외여행 간다” 보다 “5월 1일부터 해외여행 간다”라고 표기하면 구체적으로 상상할 수 있어서 지연된 시간이 좀 더 짧게 느껴질 수 있기 때문이다.
- 마지막으로 의사결정자가 어떤 상태인지에 따라서도 시점간 선택은 달라질 수 있다. 첫째, 성적욕망이 시점간 선택에 영향을 줄 수 있다. 매력적인 여성의 얼굴을 본 후 남성이 시점간 선택을 하였을 경우, 즉각적인 보상을 선택하는 경향이 증가하였다. 반면, 여성에서는 오직 배란일 전후에만 이런 비슷한 현상이 나타났다. 이는 배란일 전후에 평상시보다 충동성이 강해지므로 지연된 더 큰 보상을 기다릴 인내심이 감소하였기 때문으로 추정된다. 둘째, 감정상태에 따라 시점간 선택이 변할수 있는데, 시점간 선택을 하기 전에 슬픈 감정을 유도하였을 경우, 충동성이 증가하여 즉각적인 보상을 선택하였다. 이에 반해 만족과 같은 긍정적인 감정상태는 지연된 시간에 대한 인내심이 증가하여 지연된 더 큰 보상을 선택하게 만들었다. 셋째, 혈당의 변화도 시점간 선택에 영향을 주었는데 공복시보다 설탕이 든 음료수를 마신 후에는 즉각적인 보상보다 지연된 더 큰 보상을 선택하는 경향이 높았다.[7]
상호작용
결정은 다른 사람들의 결정에 어떻게 대응할 것인지 고려해야 하기 때문에 더 어려워진다. 이러한 사회적 결정에 대한 분석은 결정이론보다 게임이론에서 더 자주 다뤄지지만, 동일한 수학적 방법이 관련돼 있다. 게임이론의 관점에서 결정이론에서 다루는 대부분의 문제는 1인용 게임이다. 신흥 사회 인지공학 분야에서, 연구는 정상, 비정상, 비상, 위기 상황에서 인간 조직의 다양한 유형 분산 결정에 중점을 두고 있다.
복잡성
결정이론의 다른 분야들은 그것들의 복잡성 때문에, 혹은 조직의 복잡성 때문에 결정이 어려워진다. 결정을 내리는 개인은 자원에 제한되어 있기 때문에 합리적이어야 한다. 문제는 실제 행동과 최적 행동 사이의 차이 전에, 최적의 행동을 결정하기가 더 어렵다는 것이다.
관련 이론
규범적 결정이론
규범적 결정이론은 완벽한 정확도로 계산할 수 있거나 완전히 합리적이고 이상적인 결정자를 고려해 최적성이 결정되는 최적의 결정 확인과 관련이 있다. 즉, 특정한 목적 달성을 위한 실천적 제언을 한다. 규범적 접근법을 실용적으로 적용하는 것을 결정 분석이라고 하며, 사람들이 더 나은 결정을 내릴 수 있도록 도구, 방법론, 소프트웨어를 찾는 것이 목표이다. 규범적 결정이론은 경영과학이나 오퍼레이션 리서치(operation research)의 이름으로 연구되어 왔으며, 여기서 규범이란 윤리적, 선형적인 규범을 뜻하는 것은 아니며, 일정한 목적을 가장 적합하게 달성하기 위해 어떠한 선택원리에 의해 의사결정을 해야 하는지 같은 실천적 규범을 제공한다는 의미이다. 이 이론은 결과 지향적이고 최적해를 도출하기 위한 일정한 계산 절차를 가지고 있으며, 수학적 수법을 적용하는 등의 방법론상의 특징을 가지고 있다. 따라서 규범적 결정이론은 경영수학의 중요한 내용을 이루고 있다.[8][9]
기술적 결정이론
기술적 결정이론은 결정자들이 어떤 일관된 규칙에 행동한다는 가정하에 관찰된 행동을 설명하는 것과 관계가 있다. 기업의 조직 내에서 인간이 의사결정을 어떻게 하는가 하는 사실을 기술하고 분석하는 것을 임무로 하는 기술론이다. 기업의 생산량이나 가격정책의 결정, 제품개발의 결정 등은 기업 그 자체가 행하는 것이 아니라 그 조직 내의 사람이 결정하는 것이므로, 의사결정에 영향을 주는 조직구조, 정보시스템, 모티베이션 등도 그 연구대상이 된다. 조직의 의사결정 과정을 분석하고 기술한다는 점에서 과정 지향적인 연구이다. 의사결정 과정은 문제발견과정, 문제해결을 위한 새로운 대체안의 탐구과정, 발견된 각 대체안을 평가하여 선택하는 과정 등으로 나누어 이루어진다. 의사결정을 분석한다는 것은 결구 인간행동을 연구하는 행동과학을 응용하게 된다. 규범적 의사결정론에서 최적화 원리 대신 만족화 원리, 문제 지향적 탐구의 원리, 정보의 피드백 원리 및 불확실성 회피의 원리 등의 의사 결정원리가 전개된다.[10] 기술적 결정이론은 추상적인 법칙의 정립이 아니라 논리실증주의에 따라 검증 가능한 가설을 세우고, 그 가설을 실험이나 관찰에 의하여 검증함으로써 이론을 세우는 식으로 의사결정 문제에 접근한다.[9]
인과적 결정이론
기존의 결정이론에서 고려되지 않았던 인과적 구조에 대해 주목한 이론으로, 결정자가 가지고 있는 인과적 믿음이 합리적 결정에 영향을 미친다고 본다. 결정자의 믿음은 결정 과정에서 큰 역할을 하고, 이 믿음에 대해 논하고 명확히 해야 한다는 입장이다. 인과적 결정이론은 윌리엄 뉴컴(William Newcomb)이 제기한 뉴컴의 문제에서 발생하는 문제를 해결하기 위해 인과 구조에 대한 지식의 고려를 결정이론에 도입한 것이다. 형이상학, 귀납추리, 효용 및 확률 등과 밀접한 관련이 있다.[11]
통계적 결정이론
불확실한 상황에서 최적의 결정을 하기 위해 위험 함수의 값에 따라 행동의 효율을 측정하고, 행동의 결정을 나타내는 결정 함수를 구하는 이론이다. 이 식을 구하기 위해 잘못 추정함으로써 발생되는 손실 정도를 뜻하는 손실 함수와 특정한 표본추출법에 의해 야기될 수 있는 표본 오차의 정도를 나타내는 위험 함수, 행동에 따른 비용 함수, 손실 및 비용의 기댓값에 따라 행동의 효율을 측정하고, 행동의 결정을 나타내는 결정 함수가 있다.[12][13]
휴리스틱
휴리스틱은 어떤 사안 또는 상황에 대해 엄밀한 분석을 하지 않고 제한된 정보만으로 즉흥적, 직관적으로 판단, 선택하는 의사결정 방식을 의미한다.[14] 결정 과정에서 휴리스틱(heuristics)은 정당하지 않거나 일상적인 생각에 근거해 결정하는 것을 말하는데, 이는 간단한 결정을 할 때 평가적 사고의 양을 줄이고 무의식적인 규칙에 근거하여 결정의 일부 측면에 초점을 맞추기 때문에 단계별 처리보다 빠르지만, 동시에 다른 것들을 무시하기 때문에 오류 가능성이 크다. 경험적 사고방식 때문에 발생하는 오류 중 하나는 무작위 사건이 이전의 무작위 사건의 영향을 받는다고 믿는 도박사의 오류(the gambler’s fallacy)가 있고, 또 다른 하나는 결정자들이 극단적인 대안보다 온건한 대안을 선호하는 쪽으로 편향될 수 있는 타협 효과이다. 타협 효과는 온건한 선택이 가장 많은 이익을 가져다준다는 사고하에서 작용한다. 휴리스틱은 가용성 휴리스틱, 대표성 휴리스틱, 기준점과 조정, 감정 휴리스틱 등이 있다. 가용성 휴리스틱은 어떤 사건이 발생한 빈도를 판단할 때 그 사건에 대한 객관적인 정보보다는 사건에 관한 구체적인 예를 얼마나 떠올리기 쉬운지에 따라 발생 빈도를 판단하는 것이다. 대표성 휴리스틱은 우리가 어떤 대상이나 사람이 특정 범주의 전형적인 특성을 얼마나 많이 나타내는지, 대표성이 있는지에 근거하여 특정 범주에 속할 확률을 파악하는 인지적 책략이다. 기준점과 조정 휴리스틱은 사람들이 흔히 어떤 판단을 내릴 때 초기 기준을 정하고 다음에 그 기준을 조정하는 방법으로 판단을 내리는 것을 말한다. 이 경우 조정하는 과정에서 기준점에 얽매여 충분히 조정하지 못해 오류가 발생한다. 감정 휴리스틱은 합리적이고 이성적으로 판단하는 것이 아니라 감정에 따라 판단하는 것을 말한다.[15]
베이즈주의 결정이론
일반적으로 베이즈주의(Bayesian) 의사결정 이론을 표준적 의사결정 이론이라고 부른다. 의사결정 이론은 의사결정자의 상태에 대한 믿음, 욕구, 행위의 관계를 효용의 기댓값에 대한 형식화로 제시한 것인데, 이때 가능한 상태는 확률로 표현된다. 이 확률은, 행위자가 상태들에 대해 갖는 주관적 믿음의 정도를 나타내는 것으로 해석된다. 그리고 그 상태에서 얻을 이익이나 손해는 효용 함수로 표현된다. 가능한 상태에 대한 확률과 효용 함수를 곱하여 이들을 평균화 즉, 모두 합하면 그것이 기대되는 효용이다. 합리적인 의사결정자는 그 기대되는 효용이 극대화되는 선택을 할 것이다. 이런 의미에서 의사결정 이론의 핵심은 기대 효용을 극대화하는 원리에 있다. 예를 들어 A는 친구의 집에 저녁 초대를 받았고 레드 와인이나 화이트 와인을 가지고 갈 계획이다. 친구의 집에서 준비할 음식이 스테이크가 될지, 치킨 요리가 될지 확실하지 않지만 둘 중 하나인 것은 분명하다. A가 어떤 와인을 가져갈 지는 A의 행위이다. 친구가 어떤 음식을 준비할지는 가능한 상태이다. 그리고 선택한 와인의 종류와 준비된 음식의 상태가 조합된 바에 따라 A가 얻게 되는 만족도는 효용에 해당한다. 따라서 다음과 같은 표를 얻을 수 있다.[16]
상태의 확률과 선택에 따른 상태의 효용 스테이크 (상태 1) 치킨 (상태 2) 레드와인 선택(R) Pr (상태 1)× U (R, 상태 1) Pr (상태 2) × U (R, 상태 2) 화이트와인 선택 (W) Pr (상태 1) × U (W, 상태 1) Pr (상태 2) × U (W, 상태 2) ‘Pr’은 확률, ‘U’는 효용 함수이다.
각 선택에 따른 기대 효용은 아래와 같으며 합리적 의사결정자는 기대 효용이 더 큰 선택을 할 것이다.
레드 와인 선택의 기대 효용 = Pr (상태 1) × U (R, 상태 1) + Pr (상태 2) × U (R, 상태 2) 화이트 와인 선택의 기대 효용 = Pr (상태 1) × U (R, 상태 1) + Pr (상태 2) × U (W, 상태 2)
세비지 결정이론
의사결정 이론은 상태에 대한 확률과 효용 함수에 대한 해석 즉, 행위와 상태 그리고 이들의 관계에 대한 해석에 따라 세 가지로 구분할 수 있다. 이때 가장 먼저 논의되는 것은 세비지(Savage)의 이론이다. 세비지의 이론에 따르면, 효용 함수는 한 상태에서 이루어진 행위의 결과를 가리킨다. 그리고 그 상태에 대한 믿음이 확률로 표현된다. 그리고 그 상태는 행위로부터 독립적인 것이다. 다시 말해 행위는 상태에 대한 증거도 아니고 그 상태의 원인도 아니다. 이는 세비지 이론에 문제로 제기된다. 예를 들어 B는 B의 차를 공용 주차장에 주차하고 있다. 어떤 섬뜩하게 생긴 사람이 다가와 주차된 차를 봐 주겠다고 하면서 1만 원을 요구하였다. B는 두 가지 상태를 추론할 수 있다. 이 사람이 차의 유리를 깰 것이다. 그렇지 않을 것이다. 따라서 B가 그에게 1만 원을 지불한 경우에 가능한 결과는 다음과 같이 두 가지가 된다. 차의 유리는 깨지지 않았고 1만 원이 지출되었다. 차의 유리는 깨지고 1만 원이 지출되었다. 이번에는 B가 그에게 1만 원을 지불하지 않은 경우를 보자. 이 경우에 차의 유리는 깨지거나 깨지는 두 가지 상태가 가능하다. 결과로서 상태가 무엇이든지 1만 원을 지불하지 않는 것이 더 높은 기대 효용을 주게 된다. 그러나 이는 잘못된 선택이다. B가 1만 원을 지불하지 않았다면 유리는 깨질 것이고 1만 원을 지불한다면 그렇지 않을 수도 있다. 1만 원으로 극단적인 결과를 피할 수 있다면 1만 원을 주는 게 낫다.[16]
제프리 결정이론
제프리(Jeffrey)의 이론은 상태는 행위와 어떤 방식으로 관련될 수 있다고 본다. 세비지의 이론에서 상태는 확률 함수에 대한 것으로 이론을 구성하는 핵심 요소이다. 결과는 효용 함수에 대한 것으로 이론의 또 다른 핵심 요소이다. 행위는 이들 둘을 연결하는 결정론적 함수이다. 그러나 제프리의 이론에서는 행위, 상태, 결과가 구분되지 않는다. 제프리의 이론에서는 행위, 상태, 결과 모두가 명제로 고려된다. 명제가 된다는 의미는 확률 함수와 효용 함수의 변수에 들어갈 항이 될 수 있다는 것이다. 다시 말해 이들 함수가 적용될 대상이 된다는 것이다. 어떤 행위를 택하는 것, 어떤 상태를 얻는 것, 어떤 결과가 나오게 되는 것 각각에 대해 확률을 말할 수 있다. 마찬가지로 효용함수도 그렇게 말할 수 있다. 제프리의 이론에서 의사결정의 문제는 명제로 구성되며 각 명제에 대한 확률 함수와 효용 함수로 이루어진다. 제프리의 이론에서는 상태는 행위와 어떤 방식으로든 관련될 수 있다. 따라서 행위를 조건으로 상태의 확률에, 행위와 그 행위의 결과에 대한 효용을 곱하여 이들의 총합이 기대 효용이 된다. 이를 증거적 기대 효용이라 한다.[16]
죄수의 딜레마
브라이언 스컴스(Brian Skyrms)는 세비지와 제프리의 이론을 다소 변형된 죄수의 딜레마 상황에 적용했다. 용의자 A는 용의자 B의 생각이 거의 같다고 믿는다. 따라서 용의자 B도 자신과 같은 선택을 할 것으로 생각한다. 그렇다면 용의자 A가 협조할 때 B가 협조할 확률, 용의자 A가 배신할 때 B가 배신할 확률 모두 각각의 경우에 1이 된다. 용의자 A의 생각과 선택이 용의자 B의 생각과 선택에 인과적으로 영향을 주지 못하여도 용의자 A의 생각은 용의자 B의 선택에 확률적으로 독립적이지는 않다. 다시 말해 인과적으로 독립적이지만 증거적인 관계로 관련을 맺는다. 용의자 A가 세비지의 이론을 따른다면 자신의 선택을 평가할 때 용의자 B의 선택에 대해 용의자 A 자신의 선택에 부여한 확률을 그대로, 어떤 조건화도 없이 부여할 것이다. 이미 보았듯이 이는 자백에 더 높은 세비지 방식의 효용을 부여하는, 늘 우세한 전략을 따른 것이다. 그러나 용의자 A가 제프리의 이론을 따른다면 행위를 조건화하는, 다시 말해 행위가 조건으로 주어지는 경우에 상태의 확률을 고려하여 그것을 가중치로 이용할 것이다. 용의자 A는 용의자 B의 협조가 거의 확실하다는 것에 상대하여 자신도 협조했을 때 대가를 계산할 것이다.
용의자 A, B 모두 의사결정 이론자이고 제프리 방식의 행동에 조건화한 상태의 확률을 고려한다면 그들 모두 협조할 것이다. 그러나 그들이 인과적으로 영향을 주지 못하는 상황에서 그들의 협조는 여전히 매우 놀랍다. 이런 문제에 대한 제프리의 해결 방안은, 의사결정자가 숙고하는 과정에서 행위에 조건화한 확률들이 그대로 유지되지 않을 수도 있으며 허위 상관이 제거되는 방식으로 진화할 것이라 본다. 다시 말해 숙고의 끝 무렵에서, 상태는 행위로부터 확률적으로 독립적으로 될 것을 전제한다. 여기서 확률적 독립성은, 상태의 확률을 행위에 조건화하여도 조건화하지 않은 경우와 비교하여 변화가 없다는 것이다. 숙고의 과정이란 조건 하에서 제프리의 이론은 용의자 A에게 세비지의 이론과 같은 의사결정을 하게 하는 것이다. 기대 효용을 극대화하는 늘 우세한 전략으로 배신을 선택하는 것이다. 이처럼 어떤 선택 X가 거의 임박한 순간에 행위자가 가질 제프리 방식의 조건부 확률을 고려하자. 행위 X에 대한 그 확률을 고려한 기대 효용이 최소한 다른 어떤 행위의 기대 효용만큼 크다면 그 행위는 비준 가능한 것이다. 그런 행위에 선택의 가치가 있는 것이다. 여기서 선택이 거의 임박한 순간이란 행위의 확률이 1이 될 때이므로 다른 행위에 조건화한 확률은 의미가 없게 된다. 거의 임박한 순간이란 확률이 변화하는 궤적에서 그 확률이 1의 극한값을 갖는 것으로 이해할 수 있다. 그러나 문제가 있다. 확률의 어떤 궤적에서는 사실상 무관한데 상관으로 보이는 허위 상관이 제거되지 않고 여전히 남아있을 수 있다.[16]
각주
- ↑ 결정이론 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=1600023&cid=50305&categoryId=50305
- ↑ 양화 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=388280&cid=41978&categoryId=41985
- ↑ 결정이론 위키백과 - https://ko.wikipedia.org/wiki/%EA%B2%B0%EC%A0%95_%EC%9D%B4%EB%A1%A0
- ↑ 연역법 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=1126605&cid=40942&categoryId=31530
- ↑ 결정이론 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=1059547&cid=40942&categoryId=31819
- ↑ 6.0 6.1 유니코드, 〈의사결정론(decision theory); Uncertainty & Risk〉, 《네이버 블로그》, 2019-07-15
- ↑ 김양태, 〈시점간 선택과 중독 - Intertemporal Choice and Addiction〉, 《한국중독정신의학회》, 2016
- ↑ 규범적 의사결정론 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=1068566&cid=40942&categoryId=31909
- ↑ 9.0 9.1 기술과학 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=1071165&cid=40942&categoryId=31500
- ↑ 기술적 의사결정론 두산백과 - https://terms.naver.com/entry.nhn?docId=1071189&cid=40942&categoryId=31910
- ↑ 인과적 의사결정 이론 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=4357369&cid=40942&categoryId=31528
- ↑ 통계적 결정 이론 정보통신기술용어해설 - http://www.ktword.co.kr/abbr_view.php?m_temp1=5225
- ↑ 통계적 결정 이론 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=857546&cid=42346&categoryId=42346
- ↑ 휴리스틱 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=3548243&cid=58393&categoryId=58393
- ↑ 휴리스틱 네이버 지식백과 - https://terms.naver.com/entry.nhn?docId=2070217&cid=41991&categoryId=41991
- ↑ 16.0 16.1 16.2 16.3 김준성, 〈의사결정 이론의 문제와 진화게임 이론에서의 인과의 역할 - Casuality on Decision Theory and Evolutionary Game Theory〉, 《예술인문사회 융합 멀티미디어 논문지》, 2018-04
참고자료
- 결정이론 위키백과 - https://ko.wikipedia.org/wiki/%EA%B2%B0%EC%A0%95_%EC%9D%B4%EB%A1%A0
- Decision theory Wikipedia - https://en.wikipedia.org/wiki/Decision_theory
- 휴리스틱 이론 위키백과 - https://ko.wikipedia.org/wiki/%ED%9C%B4%EB%A6%AC%EC%8A%A4%ED%8B%B1_%EC%9D%B4%EB%A1%A0
- 기대효용이론 두산백과 - https://terms.naver.com/entry.nhn?docId=1068566&cid=40942&categoryId=31909
- 규범적 의사결정론 두산백과 - https://terms.naver.com/entry.nhn?docId=1068566&cid=40942&categoryId=31909
- 기술적 의사결정론 두산백과 - https://terms.naver.com/entry.nhn?docId=1071189&cid=40942&categoryId=31910
- 오현석, 〈Decision Theory〉, 《개인 블로그》
같이 보기