작성자: admin 작성일시: 2016-05-03 00:37:21 조회수: 2638 다운로드: 213
카테고리: 기초 수학 태그목록:

확률의 의미

지금까지 우리는 표본 집합의 부분 집합인 사건에 대해 확률값이라는 숫자를 할당했다. 이 확률값이라는 숫자는 도대체 어떤 의미를 가지는 걸까? 확률값이라는 숫자가 가지는 의미에 대해서는 여러가지 해석이 있을 수 있다. 그중 가장 대표적인 것이 빈도주의(Frequentist) 관점과 베이지안(Bayesian) 관점이다

빈도주의 관점에서 확률의 의미

빈도주의에서는 반본적으로 선택된 표본이 사건(부분 집합) $A$ 의 원소가 될 경향(propensity)을 그 사건의 확률이라고 한다.

예를 들어 동전을 던져 앞면이 나오는 사건의 확률값이 0.5라는 것은 실제로 동전을 반복하여 던졌을 경우 동전을 던진 전체 횟수에 확률값을 곱한 숫자만큼 해당 사건이 발생한다고 본다. 예를 들어 10,000번을 던지면 $ 10,000 \times 5 = 5,000$번 앞면이 나오는 경향을 가진다는 의미이다.

베이지안 관점에서 확률의 의미

베이지안 관점은 이미 발생한 사건의 진실에 대해 알고자 하는 노력이다. 위의 동전 문제에서 동전을 던진 사람이 동전을 손에 숨긴채 "앞면이 나왔다"고 주장한다고 가정하자. 이 때는 사건의 확률이 "미래에 특정한 사건에 속하는 일이 발생할 가능성"이 아니라 "이미 발생한 일이 특정한 사건에 속할 가능성"이 된다. 다른 관점에서 보면 "이미 발생한 일이 특정한 사건에 속한다는 가설(hypothesis) 혹은 주장(assertion)의 신뢰도"라고도 볼 수 있다.

또 다른 예로 4개의 보기중 하나의 정답을 고르는 4지선다형 객관식 문제를 풀때도 우리는 베이지안 확률을 사용한다. 1번부터 4번까지의 보기를 읽어보고 마음속으로 다음처럼 각각의 보기에 대한 확률을 할당하기 때문이다.

'1번은 절대로 답이 될 수 없어. 그러니까 1번이 정답일 확률은 0이다. 2번과 3번이 그럴 듯한데. 4번은 가능성이 2번이나 3번의 가능성의 반도 안되어 보이고. 그러니까 2번과 3번이 정답일 확률은 각각 0.4이고 4번이 정답일 확률은 0.2이군.'

이러한 생각을 했다면 $\{1,2,3,4\}$ 라는 표본 집합이 있을 때 다음과 같이 확률을 할당한 것이다.

$$ P(\{1\}) = 0 $$$$ P(\{2\}) = 0.4 $$$$ P(\{3\}) = 0.4 $$$$ P(\{4\}) = 0.2 $$

여기에서는 확률의 정의는 무언가 반복되는 것, 또는 빈도과는 전혀 관계가 없다. 확률 $ P(\{1\}) $ 은 "정답이 1이다"라는 주장에 대한 신뢰도일 뿐이다.

베이지안 관점에서 사건의 의미

따라서 베이지안 확률론의 관점에서 사건(부분 집합)이란 "발생한 표본(답)이 포함되어 있을 가능성이 있는 후보의 집합"이며 다른 의미로는 "이 사건에 속한 후보 집합안에 발생한 표본(답)이 있다"는 주장이라 할 수 있다.

또 사건의 확률은 "발생한 표본(답)이 그 후보 집합에 있을 가능성", "어떤 가설이 진실일 가능성", 또는 "이 사건에 속한 후보 집합안에 발생한 표본(답)이 있다"는 주장의 신뢰도라고 볼 수 있다.

사건의 발생

확률론에서 사건이 일어났다 혹은 발생했다(occur)하는 말은 그 사건(부분 집합) 즉 후보군 안에 정말로 선택된 표본이 있음을 알게 되었다는 것을 말한다. 다른 말로는 해당 사건이 말하고 있는 주장이 사실임을 알게되었다는 뜻으로 추가적인 정보가 들어왔음을 뜻한다.

질문/덧글

확률의 베이지안 의미 moon*** 2016년 10월 11일 2:35 오후

너무 개념적인 질문일수도 있지만,,

확률이 베이지안의 의미를 갖는다면 이미 발생한 사건에 대해 예측한다고 이해됩니다.

모든 표본공간에 대한 확률이 1로 정의되면 베이지안의 의미는 문제가 될 것이 없어보이지만

주식의 경우를 예로들면 A라는 항목의 주식이 급등 혹은 급락하는 경우는 A가 이전에 그런 경우가 없다면 사건에 포함될 수 없기 때문에 베이지안의 의미는 무의미 해지는 것 아닌가요?

아니면 급등 혹은 급락한 경우가 있는 다른 항목의 주식 데이터를 활용하기 때문에 의미가 있다고 볼 수 있는건가요?

답변: 확률의 베이지안 의미 관리자 2016년 10월 12일 7:11 오후

표본 공간은 "이전에 일어나지 않은 일은 포함하지 않는 것"이 아니고 "물리적으로 일어날 수 있는 일은 모두 포함"합니다.