다운로드
작성자: admin 작성일시: 2016-05-16 20:57:46 조회수: 5045 다운로드: 351
카테고리: 기초 수학 태그목록:

확률 변수

확률 변수

확률적 데이터를 수학기호로 표시할 때는 변수를 표시할 때처럼 문자로 표시한다. 하지만 일반적인 변수가 특정한 하나의 숫자를 대표하는 변수인 것과 달리 확률적 데이터를 대표하는 변수는 나올 수 있는 값이 확률적 분포를 가진다. 즉 특정한 값은 자주 나오고 다른 어떤 값은 드물게 나올 수 있다. 이러한 변수를 확률 변수(random variable)라고 한다.

확률 변수는 숫자 혹은 벡터를 생성하는 기계에 비유할 수 있다.

확률 변수의 수학적 정의

수학적으로 확률 변수는 표본 공간을 정의역(domain)으로 가지고 실수를 공역(range)으로 가지는 함수로 정의한다. 즉 확률 변수는 표본 공간의 모든 표본에 대해 어떤 실수 값을 붙인(할당한) 것이다.

$X$, $Y$ 등의 대문자 알파벳을 사용하여 확률 변수를 표기하고 확률 변수에 의해 할당된 실수는 $x$, $y$와 같이 소문자 알파벳으로 표시하는 것이 보통이다. 경우에 따라서는 소문자 알파벳으로 확률 변수를 표기할 수도 있다.

$$ \omega \in \Omega \;\;\; \xrightarrow{X} \;\; x \in \mathbf{R} $$$$ X(\omega) = x \;\; (x \in \mathbf{R}) $$

확률과 확률 변수의 차이점은 다음과 같다.

  • 확률은 표본으로 이루어진 집합 즉, 사건에 대해 할당된 숫자이지만 확률 변수는 표본 하나 하나에 대해 할당된 숫자이다.
  • 확률은 0부터 1사이의 숫자만 할당할 수 있지만 확률 변수는 모든 실수 범위의 숫자를 할당할 수 있다.

확률 변수를 사용하면 모든 표본은 하나의 실수 숫자로 변하기 때문에 표본 공간을 실수의 집합 즉 수직선(number line)으로 표시할 수 있다. 표본의 집합인 사건(event)은 이 수직선 상의 숫자의 집합인 구간(interval)으로 표시된다.

이산 확률 변수

예를 들어 주사위의 확률 문제에서 주사위에서 나올 수 있는 모든 면의 집합인 표본집합 $\{⚀,⚁,⚂,⚃,⚄,⚅\}$ 내의 모든 표본에 대해 다음과 같이 숫자를 할당하면 1부터 6까지 값을 가지는 확률변수가 된다. 이렇게 확률 변수값이 연속적(continuous)이지 않고 떨어져(discrete) 있는 경우를 이산 확률 변수(discrete random variable)라고 한다.

$$X(⚀) = 1$$$$X(⚁) = 2$$$$X(⚂) = 3$$$$X(⚃) = 4$$$$X(⚄) = 5$$$$X(⚅) = 6$$

주의 할 점은 이산 확률 변수의 정의는 값의 이산성이지 가능한 경우가 유한하다는 점이 아니라는 점이다. 이산 확률 변수도 연속 확률 변수와 같이 가능한 값 자체는 무한대의 경우의 수가 있을 수 있다. 예를 들어 기하 분포(geometric distribution)는 양의 정수값을 가지는 이산 분포이지만 무한대의 양의 정수도 0이 아닌 확률을 가질 수 있다.

확률 변수를 정의한다는 것은 표본(sample)이라는 추상적이고 일반적인 개념 대신 숫자라는 명확한 개념을 대신 사용하겠다는 의미이다. 현실적으로도 계산이 가능한 것은 숫자 뿐이므로 데이터 분석을 수행하기 위해서는 결국 표본의 특성(feature)을 숫자로 변환하는 단계가 필요하다.

연속 확률 변수

이번에는 주사위가 아닌 시계 바늘을 예로 들어보자. 시계 바늘이 특정한 위치를 가르키는 현상을 표본(sample)으로 생각하고 12시를 기준으로 해당 위치까지의 각도를 확률 변수로 하면 이 연속 확률 변수의 값은 실수(real number) 집합처럼 연속적이고 무한개의 경우의 수를 가진다. 이러한 확률 변수를 연속 확률 변수 (continuous random variable)라고 한다.

연속 확률 변수에서는 수직선 상의 실수 구간(interval)으로 정의되는 사건을 사건의 기본 단위로 사용할 수 있다.

예를 들어 $\{ a \leq X < b \}$ 라는 사건 $A$는 표본 $\omega$의 집합인데 이 집합의 원소인 표본($\omega \in A$)에 할당된 확률 변수의 값 $X(\omega)$가 $a$ 보다 같거나 크고 $b$ 보다 작은 모든 표본 $\omega$만을 모아 놓은 집합이다.

$$ A = \{ \omega ; a \leq X(\omega) < b \} = \{ a \leq X < b \} $$

이러한 사건을 단일 구간 사건이라고 한다. 단일 구간은 시작점과 끝점이라는 두 개의 숫자로 묘사하는 것이 가능하므로 단일 구간 사건은 두 개의 실수 숫자로 정의할 수 있다.

따라서 확률도 다음처럼 두 개의 실수로 정의할 수 있다.

$$ P(A) = P(\{ \omega ; a \leq X(\omega) < b \}) = P(\{ a \leq X < b \}) = P(a,b) $$

하나의 구간이 아니라 복수 구간으로 이루어진 복잡한 사건의 확률은 콜모고로프의 공리에 의해 각 단일 구간 사건의 확률의 합으로 구할 수 있다.

$$ P(\{ x_1 \leq x \leq x_2 \} \text{ 또는 } \{ x_3 \leq x \leq x_4\}) = P(\{ x_1 \leq x \leq x_2 \}) + P(\{ x_3 \leq x \leq x_4\}) $$$$ x_1 < x_2 < x_3 < x_4 $$

질문/덧글

아직 질문이나 덧글이 없습니다. 첫번째 글을 남겨주세요!