다운로드
작성자: admin 작성일시: 2016-05-29 14:53:24 조회수: 4557 다운로드: 329
카테고리: 기초 수학 태그목록:

검정과 모수 추정의 의미

데이터 분석의 첫번째 가정은 "분석하고자 하는 데이터가 어떤 확률변수로부터 실현(realized)된 표본이다"라는 가정이다. 이 말은 우리가 정말 관심이 있는 것이 지금 손에 가지고 있는 데이터 즉, 하나의 실현체(reailization)에 불과한 표본이 아니라 그 뒤에서 이 데이터를 만들어 내고 있는 확률변수의 분포라는 뜻이다. 확률론적인 관점에서 볼 때 데이터는 이 확률변수의 분포를 알아내기 위한 일련의 참고 자료일 뿐이다.

확률변수의 분포를 알면 다음과 같은 질문에 답을 할 수 있다.

  1. 해당 데이터가 특정한 분포 모형, 예를 들면 가우시안 정규 분포로부터 생성된 것인가?
  2. 만약 그렇다면 그 정규 분포의 기댓값 $\mu$ 와 분산 $\sigma^2$이 특정한 값을 가지고 있는가? 예를 들면 $\mu = 0$ 인가 아닌가?
  3. 정규 분포의 기댓값 모수 $\mu$가 0이 아니라면 구체적으로 어떤 값을 가질 것인가?

첫번째 질문은 확률변수의 분포에 대한 가설(hypothesis)이 맞는지 틀리는지를 확인하는 것을 확률변수의 분포 검정(distribution test)이라고 한다. 분포 검정 중에서 정규 분포(normal distribution)인지 아닌지를 검정하는 것을 특별히 정규성 검정(normality test)이라고 부른다.

두번째 질문은 확률변수의 분포가 어떤 모형을 따르는지는 이미 정해져 있는 상태에서 확률 밀도 함수(pdf)의 계수(coefficient) 즉, 모수(parameter)가 특정한 값인지 혹은 특정한 값과 비교하여 큰지 작은지를 확인하는 과정이다. 이러한 것을 모수 검정(parameter test)이라고 한다.

마지막 질문은 모수가 실제로 어떤 숫자를 가질 확률이 가장 높은지를 알아내는 작업으로 모수 추정(parameter estimation) 또는 추정(estimation)이라고 한다.

질문/덧글

아직 질문이나 덧글이 없습니다. 첫번째 글을 남겨주세요!