작성자: admin 작성일시: 2016-05-03 00:37:21 조회수: 1831 다운로드: 139
카테고리: 기초 수학 태그목록:

확률의 의미

지금까지 우리는 표본 집합의 부분 집합인 사건에 대해 확률이라는 숫자를 할당했다. 이 확률이라는 숫자는 도대체 어떤 의미를 가지는 걸까? 확률이라는 숫자가 가지는 의미에 대해서는 여러가지 해석이 있을 수 있다. 그중 가장 대표적인 것이 빈도주의적(frequentist) 의미와 베이지안 (Bayesian) 의미이다

확률의 빈도주의 의미

100개의 과일이 들어있는 상자가 있다고 하자. 과일은 표본이라고 보고 상자 안의 모든 과일의 집합은 표본 집합이라고 볼 수 있다. 이 상자 안의 100개 과일 중 일부는 사과이고 나머지는 오렌지다. 그러면 사과라는 과일의 집합은 하나의 사건이 된다. 이 사건의 이름을 $A$ 라고 하자.

이 상자안의 과일 집합(표본 공간)에서 하나의 과일(표본)을 선택하는 문제를 생각하자. 표본 집합에서 하나의 표본을 선택하는 것을 표본 추출, 또는 샘플링(sampling)이라고 한다.

$A$ 라는 사건이 가지는 확률이란 선택된 표본이 이 사건(부분 집합) $A$ 의 원소가 될 경향(propensity) 또는 가능성을 말한다. 즉 100개의 과일 중에서 사과를 선택할 가능성이다.

그렇다면 가능성이라는 것은 어떻게 정의될까? 빈도주의자(frequentist)는 "반복된 샘플링"이라는 개념을 사용하여 가능성을 정의한다. 즉 100번 반복하여 표본을 선택하였을 때 해당 표본이 사과인 경우가 10번, 오렌지인 경우가 90번이라면 사과라는 사건의 확률은 10/100 = 0.1 로 정의할 수 있다는 것이 빈도주의적 관점에서 보는 "가능성" 즉, "확률"의 정의이다.

확률의 베이지안 의미

베이지안 관점에서 확률은 이미 발생한 사건의 진실에 대해 알고자 하는 노력이다.

위의 과일 선택 문제에서 하나의 과일을 선택한 사람이 이 과일이 무엇인지 보여주지 않은채 "내가 선택한 과일은 사과이다"라고 주장한다고 해보자.

이 때는 사건의 확률이 "미래에 특정한 사건에 속하는 일이 발생할 가능성"이 아니라 "이미 발생한 일이 특정한 사건에 속할 가능성"이 된다. 다른 관점에서 보면 "이미 발생한 일이 특정한 사건에 속한다는 가설(hypothesis) 혹은 주장의 신뢰도"라고도 볼 수 있다.

또 다른 예로 우리는 4개의 보기에서 하나의 정답을 고르는 4지선다형 객관식 문제를 풀때도 베이지안 확률을 사용한다.
1번부터 4번까지의 보기를 읽어보고 마음속으로 각각의 보기마다 확률을 할당하기 때문이다.

'1번은 절대로 답이 될 수 없어. 그러니까 1번이 정답일 확률은 0이다. 2번과 3번이 그럴 듯한데. 4번은 가능성이 2번이나 3번의 가능성의 반도 안되어 보이고. 그러니까 2번과 3번이 정답일 확률은 각각 0.4이고 4번이 정답일 확률은 0.2이군.'

이러한 생각을 했다면 $\{1,2,3,4\}$ 라는 표본 집합이 있을 때 다음과 같이 확률을 할당한 것이다.

$$ P(\{1\}) = 0 $$$$ P(\{2\}) = 0.4 $$$$ P(\{3\}) = 0.4 $$$$ P(\{4\}) = 0.2 $$

여기에서는 확률의 정의는 무언가 반복되는 것, 또는 빈도과는 전혀 관계가 없다. 확률 $ P(\{1\}) $ 은 "정답이 1이다"라는 주장에 대한 신뢰도일 뿐이다.

이번에는 시계 바늘 문제를 예로 들어 보자. 시계의 바늘이 다음 그림과 같은 위치에 있다고 하자.

"시계 바늘의 각도는 0도 이상 30도 이하이다"라는 말은 진실임을 알 수 있다. 따라서 사건(부분 집합) $\{ 0^{\circ} \leq \theta < 30^{\circ} \} $의 확률, 즉 시계 바늘의 진짜 각도가 이 사건(부분 집합)안에 속해 있을 확률은 1이다.

$$ P(\{ 0^{\circ} \leq \theta < 30^{\circ} \}) = 1$$

이와 달리 "시계 바늘의 각도는 30도 이상 36도 이하이다"라는 말은 거짓이다. 따라서 사건(부분 집합) $ \{ 30^{\circ} \leq \theta < 60^{\circ} \} $ 의 확률, 즉, 시계 바늘의 진짜 각도가 이 사건(부분 집합)안에 속해 있을 확률은 0이다.

$$ P(\{ 30^{\circ} \leq \theta < 60^{\circ} \}) = 0 $$

따라서 베이지안 확률론의 관점에서 사건(event)이란 "진짜 표본이 포함되어 있을 가능성이 있는 후보의 집합", 다시 말해 "진실에 대한 어떤 가설"로 볼 수 있고 사건의 확률이란 "진짜 표본이 그 후보 집합에 있을 가능성" 또는 "어떤 가설이 진실일 가능성"이라고 볼 수 있다.

베이지안 확률의 추정

베이지안 확률 값은 어떻게 추정할 수 있을까?

앞서의 4지선다형 객관식 문제에서 우리가 문제에 대해 아무런 사전 지식이 없다면 4개의 사건(보기)은 우리에게 있어 모두 같은 신뢰도를 가진다.

$$ P(\{1\}) = P(\{2\}) = P(\{3\}) = P(\{4\}) = x $$

그리고 4개의 사건은 서로 공통원소가 없고 4개의 사건 합집합은 전체 집합이므로 확률의 성질을 이용하여 다음과 같이 각 사건의 확률이 모두 동일한 0.25 값을 가진다는 것을 보일 수 있다.

$$ P(\{1\}) + P(\{2\}) + P(\{3\}) + P(\{4\}) = 4x = P(\{1\} \cup (\{2\} \cup \{3\} \cup \{4\}) = P(\Omega) = 1 $$$$ x = 1/4 = 0.25 $$

즉 모든 경우가 같은 확률이라고 보는 것은 결국 "정답에 대해 아무런 지식이 없다" 다른 말로 "아무것도 아는게 없다"는 말을 수학적으로 표현한 것이 지나지 않는 것이다.

그렇다면 문제에 대한 사전 지식이 있다면 이 확률은 어떻게 달라질까? 베이즈 정리(Bayesian Rule)은 이러한 사전 지식이 최종 확률에 어떤 영향을 끼치는지를 계산할 수 있게 해준다. 베이즈 정리에 대해서는 나중에 자세히 설명한다.

연습 문제 1

  1. 과일 문제에서 전체 과일 중 사과의 수가 10개라고 하자. 사건 $A$의 확률은 얼마인가? 과일을 선택하는 사람이 눈을 감고 손만으로 과일을 선택하는데 손의 감각으로는 과일을 구별할 수 없다고 가정하자.

  2. 위 문제에서 만약 과일을 선택하는 사람이 손으로 사과와 오렌지를 구별할 수 있다면 사건 $A$의 확률은 달라질까?

  3. 위의 시계 바늘 그림에서 다음 확률은 어떻게 서술할 수 있을까?

$$ P(\{ 2^{\circ} \leq \theta < 8^{\circ} \}) = ?$$

질문/덧글

확률의 베이지안 의미 moon*** 2016년 10월 11일 2:35 오후

너무 개념적인 질문일수도 있지만,,

확률이 베이지안의 의미를 갖는다면 이미 발생한 사건에 대해 예측한다고 이해됩니다.

모든 표본공간에 대한 확률이 1로 정의되면 베이지안의 의미는 문제가 될 것이 없어보이지만

주식의 경우를 예로들면 A라는 항목의 주식이 급등 혹은 급락하는 경우는 A가 이전에 그런 경우가 없다면 사건에 포함될 수 없기 때문에 베이지안의 의미는 무의미 해지는 것 아닌가요?

아니면 급등 혹은 급락한 경우가 있는 다른 항목의 주식 데이터를 활용하기 때문에 의미가 있다고 볼 수 있는건가요?

답변: 확률의 베이지안 의미 관리자 2016년 10월 12일 7:11 오후

표본 공간은 "이전에 일어나지 않은 일은 포함하지 않는 것"이 아니고 "물리적으로 일어날 수 있는 일은 모두 포함"합니다.