작성자: admin 작성일시: 2016-05-02 11:31:45 조회수: 2605 다운로드: 146
카테고리: 기초 수학 태그목록:

확률의 수학적 정의

우리는 초등학교부터 고등학교, 그리고 대학교에 이르기까지 확률에 대한 여러가지 지식을 배운다. 그러나 그 교육과정 어디에도 확률의 수학적 정의를 정확히 서술한 내용은 보기 힘들다. 확률의 수학적 정의를 아는 것은 확률과 관련된 복잡한 문제를 푸는 것 뿐 아니라 지금까지 생각해오던 확률에 대한 관점을 새롭게 환기시키는데도 큰 도움이 된다.

확률을 정확히 정의하려면 우선 다음 3가지 개념을 알아야 한다.

  • 확률 표본
  • 표본 공간
  • 확률 사건

확률 표본

"무언가"의 집합으로부터 하나를 선택하는 문제를 생각하자. 이때 "무언가"는 하나의 "물건"일 수도 있고 하나의 "사실" 혹은 현실에서 일어날 수 있는 어떤 "현상"일 수도 있다. 다만 구체적으로 무엇이 선택되었는지는 알 수 없을 수 있다.

이렇게 선택된 하나의 사실확률 표본 또는 간단히 표본(sample)이라고 한다. 보통 $\omega$(그리스 알파벳 소문자 오메가)라는 기호로 표기한다.

예를 들어 주사위를 던져서 2라는 숫자를 표시하는 면이 위로 나온 "사실"은 표본이 될 수 있다. 이때 주의할 점은 2라는 숫자뿐 아니라 2라는 숫자가 나온 "사실"도 표본이 될 수 있다는 점이다. 이 점을 확실하게 하기 위해 앞으로는 주사위에서 발생할 수 있는 표본에 대해 다음과 같이 숫자가 아닌 기호를 정해서 이야기 하도록 한다.

: 1이라는 숫자를 표시하는 면이 위로 나온 표본

: 2라는 숫자를 표시하는 면이 위로 나온 표본

: 3이라는 숫자를 표시하는 면이 위로 나온 표본

: 4라는 숫자를 표시하는 면이 위로 나온 표본

: 5라는 숫자를 표시하는 면이 위로 나온 표본

: 6이라는 숫자를 표시하는 면이 위로 나온 표본

확률표본을 숫자로 국한시키지 않고 어떤 현상, 혹은 사실로 지정하였기 때문에 하나의 표본은 숫자 하나에 해당하는 정보만 가지고 있는 것이 아니라 복수의 숫자 정보를 가질 수 있다. 예를 들어 지구상의 살아있는 사람 중 어떤 선택된 "한 명"도 확률표본이다. 이 확률표본은 키, 몸무게, 허리둘레, 혈액형, 등 수많은 숫자 정보를 가질 수 있다. 주식가격과 같은 시계열 정보도 확률표본이라고 볼 수 있다. 이 주식가격은 어제의 가격이라는 정보 이외에도 오늘의 가격, 내일의 가격 등 다양한 숫자 정보를 내포하고 있다. 이러한 특징은 연속시간 확률과정(continuous time stochastic process) 연구에서 중요한 역할을 한다.

표본 공간

표본 공간(sample space)선택될 수 있는 모든 표본의 집합을 말한다. 보통 $\Omega$(그리스 알파벳 대문자 오메가)로 표기한다.

위에서 예로 든 주사위의 경우에는 다음과 같은 표본 공간을 가진다.

$$\Omega = \{⚀,⚁,⚂,⚃,⚄,⚅\}$$

다음과 같은 것도 표본 공간과 표본의 예라고 할 수 있다.

(1) 고등학교의 어떤 반(표본 공간)과 그 반의 한 학생(표본)은 표본공간과 표본의 예가 될 수 있다. 한 반에 있는 학생의 수는 유한하므로 표본 공간내의 표본의 수는 유한하다.

(2) 넓은 평원에서 화살을 쏘았을 때 화살이 떨어진 위치(표본)와 전체 평원(표본 공간)도 표본공간과 표본의 예가 될 수 있다. 그런데 이 때는 화살이 떨어질 수 있는 위치의 수가 무한하다. 왜냐하면 어떤 두 위치가 있어도 이 사이에 또다른 위치가 존재할 수 있기 때문이다. 이 때는 표본 공간내의 표본의 수가 무한하다.

(3) 시계 바늘을 돌려서 바늘이 멈춘 위치와 12시 사이의 각도도 표본공간과 표본의 예가 될 수 있다. 이 경우에도 임의의 두 시각 사이에는 또다른 시각이 존재할 수 있으므로 표본 공간내의 표본의 수가 무한하다.

연습 문제 1

표본 공간과 표본의 예를 생각한다. 표본의 수가 유한한 경우(표본 공간 $\Omega_1$)와 무한한 경우(표본 공간 $\Omega_2$) 2가지를 생각해 보자.

사건

확률 사건, 또는 간단히 사건(event)이라는 것은 표본 공간의 부분집합, 즉, 전체 표본 공간 중에서 우리가 관심을 가지고 있는 일부 표본의 집합을 뜻한다. 보통 $A,B, C, \cdots$와 같이 알파벳 대문자로 표기한다.

어떤 집합 $A$가 전체 집합 $\Omega$의 부분집합이라는 것은 수식으로 다음과 같이 표기한다.

$$ A \subset \Omega $$

위에서 예로 든 주사위 표본 공간에서는 가능한 사건으로 다음과 같은 것이 있을 수 있다. 물론 이 사건들이 가능한 사건의 전부 즉, 모든 부분집합을 나열하고 있는 것은 아니다.

$$ A = \{⚃,⚄,⚅\} $$$$ B = \{⚀,⚁\} $$$$ C = \{⚁\} $$$$ D = \{⚀,⚁,⚂,⚃,⚄,⚅\} $$

예로 든 $A$라는 사건은 "주사위의 윗면으로 나오는 숫자가 4 또는 5 또는 6인 표본의 집합"이다. 이를 다른 말로 하면 "3보다 큰 숫자가 주사위의 윗면이 되는 경우"를 뜻한다. 따라서 보통 "~가 나오는 경우"라고 말할 때 이 "경우"라는 개념이 바로 사건에 해당한다.

중요한 점은 확률에서의 사건(event)이라는 용어는 일상 생활에서 사용하는 사건(accident)이라는 말과 의미가 전혀 다르다는 점이다. 확률에서의 사건은 단순히 부분 집합을 의미한다.

연습 문제 2

위에서 생각한 두가지 표본 공간 $\Omega_1 $, $\Omega_1 $ 에 대해 각각 3가지의 사건을 예로 들어본다. 이 사건들을 각각 $A_1$, $B_1$, $C_1$, $A_2$, $B_2$, $C_2$ 라고 이름 붙인다.

$$ A_1, B_1, C_1 \subset \Omega_1$$$$ A_2, B_2, C_2 \subset \Omega_2 $$

확률

확률(probability)이란 각각의 사건에 대해 할당된, 다음과 같은 3가지 조건을 만족하는 숫자를 말한다. 보통 대문자 알파벳 $P$ 로 나타낸다. $P(A)$ 라고 쓰면 $A$라는 사건에 할당된 숫자이다.

(1) 모든 사건에 대해 확률은 실수이고 양수이다.

$$P(A)\in\mathbb{R}, P(A)\geq 0 $$

(2) 표본공간이라는 사건에 대한 확률은 1이다.

$$P(\Omega) = 1$$

(3) 공통 원소가 없는 두 사건의 합집합의 확률은 각각의 사건의 확률의 합이다.

$$ A \cap B = \emptyset \;\;\; \rightarrow \;\;\; P(A \cup B) = P(A) + P(B) $$

이 세가지를 콜모고로프의 공리(Kolmogorov's axioms)라고 한다.

확률은 사건이라고 하는 입력을 받아서 숫자라는 출력을 내보내는 함수(function)로 볼 수 있다.

$$ 사건 \rightarrow \text{숫자} $$

그런데 확률은 "표본 하나 하나에 대해 정의되어 있는 숫자"가 아니다, 즉, 표본을 입력으로 가지는 함수가 아니다. 예를 들어 주사위의 ⚀ 면은 $\dfrac{1}{6}$ 이라는 확률을 지니고 있다고 생각한다면 다음과 같이 수식으로 쓸 수 있는데

$$ P(⚀) = \dfrac{1}{6} $$

이러한 개념과 수식은 올바른 것이 아니다.

확률의 정의에 따라 확률은 표본이 아닌 사건에 대해 정의되는 사건을 입력으로 가지는 함수이다. 그러므로 정확한 수식은 다음과 같다.

$$ P(\{⚀\}) = \dfrac{1}{6} $$

확률의 의미

어떤 사건에 할당된 확률이라는 숫자는 그 사건(부분집합)에 해당하는 표본이 선택될 혹은 선택되었을 가능성을 뜻한다. 예들 들어 $ A = \{⚃,⚄,⚅\} $ 일 때는 주사위를 던져 나온 숫자가 3보다 클 가능성을 말한다. 혹은 뒤에서 이야기할 베이지안 확률론의 관점에서는 이러한 주장 즉, "주사위를 던져 나온 숫자가 3보다 크다"는 주장의 신뢰도를 뜻할 수도 있다.

위에서 예로 든 몇가지 사건에 대해 확률을 정의한 예(example)는 다음과 같다.

$$ P(A) = P(\{⚃,⚄,⚅\}) = \dfrac{1}{2} $$$$ P(B) = P(\{⚀,⚁\}) = \dfrac{1}{3} $$$$ P(C) = P(\{⚁\}) = \dfrac{1}{6} $$$$ P(D) = P(\{⚀,⚁,⚂,⚃,⚄,⚅\}) = 1 $$

주사위 한 면의 확률은 정말 $\dfrac{1}{6}$ ?

위에서 주사위의 확률을 이야기 할 때, 확률을 정의한 "예(example)" 라는 말을 썼다는 점에 주의하자. 그렇다면 $ P(C) = P(\{⚁\}) = \dfrac{1}{6} $ 이 아닌 경우도 있단 말인가? 답은 "그렇다"이다. 왜일까? 주사위의 면은 6개이니까 당연히 나올 수 있는 경우의 수는 6개, 따라서 1을 6으로 나누어 6분의 일이 아니란 말인가?

확률은 그 경우가 현실에서 나타날 가능성을 뜻한다고 말했다. 여러분 손에 현실의 주사위가 있다고 하자. 그 주사위를 던지면 정말로 특정한 하나의 면이 나올 가능성이 "정확하게" 6분의 1일까? 이렇게 묻는다면 대부분은 "정확하게는 그렇지 않다"고 대답한다.

주사위를 정밀하게 만들지 않으면 어떤 면이 더 잘나오게 되는 불량 주사위도 있을 수 있다고 한다. 그렇다면 더 극단적인 경우를 생각해 보자. 누군가가 주사위 도박에서 사기를 치기 위해 특수한 주사위를 만들었다고 하자. 이 주사위는 절대로 6이 나오지 않으며 10번을 던지면 5번은 반드시 눈금 ⚀ 이 나오게 만들었다면?

그림: 영화 타짜의 한 장면. 이 이미지에 대한 저작권은 해당 영화의 제작자에 있습니다. 출처는 네이버 무비 http://movie.naver.com/movie/bi/mi/photoView.nhn?code=57723

이 때는 확률이 다음과 같다고 할 수 있을 것이다.

$$ P(\{⚀\}) = 0.5 $$$$ P(\{⚅\}) = 0 $$

이 경우에도 이 숫자가 확률이라고 할 수 있을까? 확률이라고 할 수 있다. 확률의 정의에서 주의할 점은 확률에 대한 위의 정의만 만족하면 모두 확률이라고 할 수 있다는 점이다.

예를 들어 다음과 같은 사실은 확률의 정의와 무관하다.

  • 표본의 갯수가 같은 사건(event)은 확률 값이 같다.

이 방법에 따르면 특정한 주사위 하나의 면이 나올 확률값은 모두 같아야 한다면, 즉, 주사위가 공정(fair)해야 한다면, 다음과 같은 수식에 의해 하나의 면이 나올 확률은 $\dfrac{1}{6}$이 된다.

$$ P + P + P + P + P + P = 1 $$$$ P = \dfrac{1}{6} $$

이는 우리가 현상에 대해 아무것도 모른채 확률 값을 추정해야 할 때 흔히 사용되는 방법이다. 즉, 상황이 모두 공정하다고 가정하는 경우에 쓸 수 있다. 하지만 이 방법은 확률 값을 만드는 방법의 하나일 뿐이고 현실에서 꼭 이대로 확률 값 즉, 숫자를 배정되어야할 이유는 없다.

연습 문제 3

위의 연습 문제에서 생각한 표본 공간과 사건의 예 중에서 표본의 수가 유한한 표본 공간 $\Omega_1$과 이 표본 공간의 부분집합 $A_1$, $B_1$, $C_1$ 에 대해 마음대로 확률값을 할당해 보자. 공정하지 않는 경우도 상관없다. 단 콜모고로프의 공리는 만족해야 한다.

표본의 수가 무한한 경우

다시 확률의 정의로 돌아가서 왜 확률을 표본에 대해 할당하지 않고 사건에 대해 할당하였을까?

그 이유는 표본의 수가 무한한 경우를 다루기 위해서이다. 앞서 주사위의 경우는 표본의 수가 6개 밖에 되지 않는 경우였다. 그럼 표본의 수가 무한한 경우는 어떨까.

다음 그림과 같은 하나의 바늘만 가진 시계가 있다고 하자. 시계라고 해도 되고 하나의 바늘을 가진 원형 회전판이라고 생각해도 된다. 이 시계의 바늘이 가리킬 수 있는 각도의 종류는 몇 가지가 있을까?

정각 12시를 가리킨다면 0도이고 정각 1시를 가리키면 30도이다. 만약 12시 30분이라면 15도를 가리킬 것이다. 그런데 0도와 15도 사이에는 1도도 있을 수 있고 0도와 1도 사이에는 0.5도가 있을 수 있다. 0도와 0.5도 사이에는 0.25도, 그리고 그 사이에는 0.1436....도 등으로 무한한 경우가 존재할 수 있다.

그렇다면 이 시계 바늘 문제에서 바늘이 정각 12시를 가르킬 확률 즉, 각도가 정확하게 0이 될 확률은 얼마일까?

만약 모든 각도에 대해 가능성이 똑같다면, 바늘이 정각 12시를 가르킬 확률 즉, 각도가 정확하게 0이 될 확률은 0이다.

수식으로 나타내면 다음과 같다.

$$ P(\{ \theta = 0^{\circ} \}) = 0$$

각도가 0이 아닌 어떤 경우도 마찬가지이다. 예를 들어 시계 바늘이 1시를 가리키는 경우, 즉 각도가 30도가 되는 경우도 마찬가지이다.

$$ P(\{ \theta = 30^{\circ} \}) = 0$$

왜 그럴까. 모든 각도에 대해 가능성이 똑같으므로 그 확률을 $x$라는 값이라고 하자. 그런데 각도가 나올 수 있는 경우는 무한대의 경우가 있으므로 만약 $x$가 0이 아니라면 $x \times \infty = \infty$로 전체 표본 집합의 확률이 무한대가 된다. 즉, 1이 아니다.

따라서 표본의 수가 무한하고 모든 표본에 대해 표본 하나만을 가진 사건의 확률이 동일하다면, 표본 하나에 대한 사건의 확률은 언제나 0이다.

확률이 표본이 아닌 사건에 대해 정의된 이유가 바로 이때문이다.

이번에는 표본의 집합이자 표본 집합의 부분집합인 사건(event)을 생각해보자. 다음과 같은 사건에 대한 확률은 얼마라고 말할 수 있을까?

  • 시계 바늘이 12시와 1시 사이에 있는 경우, 즉 각도가 0도보다 같거나 크고 30도보다 작은 경우

이 경우에는 동일한 가능성을 지닌 경우가 12개 있다고 볼 수 있다. (1시와 2시 사이, 2시와 3시 사이 등) 따라서 다음과 같이 말해도 무방하다.

$$ P(\{ 0^{\circ} \leq \theta < 30^{\circ} \}) = \frac{1}{12}$$

여러가지 구간(사건)에 대해서도 다음과 같이 확률을 정할 수 있다.

$$ P(\{ 30^{\circ} \leq \theta < 60^{\circ} \}) = \frac{1}{12}$$$$ P(\{ 0^{\circ} \leq \theta < 60^{\circ} \}) = \frac{1}{6}$$$$ P(\{ 0^{\circ} \leq \theta < 1^{\circ} \}) = \frac{1}{360}$$

위의 확률 값도 이 시계가 공정(fair)하다는 가정하에 만든 숫자들이다. 만약 시계에 어떤 조작이 되어 있어 특정한 각도 근처에 머무르는 가능성이 다른 각도보다 크다면 위와 같은 숫자는 나올 수 없을 것이다.

연습 문제 4

위의 연습 문제에서 생각한 표본 공간과 사건의 예 중에서 표본의 수가 무한한 표본 공간 $\Omega_2$과 이 표본 공간의 부분집합 $A_2$, $B_2$, $C_2$ 에 대해 마음대로 확률값을 할당해 보자. 공정하지 않는 경우도 상관없다. 단 콜모고로프의 공리는 만족해야 한다.

질문/덧글

확률 사건이 pjw9*** 2017년 7월 4일 10:15 오전

표본공간내의 부분 집합이라고 하셨는데 위의 주사위예에서 {1,2,3}은 1 또는 2또는 3이 나올 사건이라고 이해했습니다. 그렇다면 1,2,3 이 동시에 나올 사건은 위 예에서는 표본 공간내의 부분집합이 아닌건가요? 아니라면 어떻게 위 예에서 표본을 정의하여야 1,2,3이 동시에 나올 사건을 부분집합으로 표현할수 있을까요?