지식/확률 및 통계

[확률 및 통계] Binomial Distribution and Multinomial Distribution (이항 분포와 다항 분포)

narao 2021. 11. 14. 17:23
반응형

The Bernoulli Process (베르누이 과정)

Binomial distribution(이항 분포)와 multinomial distribution(다항 분포)를 알아보기 전에 베르누이 과정을 먼저 알아야 한다. 베르누이 과정은 쉽게 말해서 결과가 오직 두가지인 확률 변수의 과정이다. 대표적인 예시로 동전 던지기가 있다. 결과가 앞, 뒤로 오직 두 가지이다.

그리고 베르누이 과정은 시행을 하면 할수록 확률이 상수에 가까워진다. 당연히 동전을 6번 던질 때보다 1000번 던질 때 앞면이 나올 확률이 더 0.5에 가까울 것이다.

 

그 외에도 엄밀하게 말하자면 다음과 같은 특성을 지녀야 하지만, 문제를 푸는데 별로 중요하지 않다.

1. 실험이 반복된 시도로 구성되어야 한다.

2. 각각의 시도의 결과가 성공 또는 실패로 분류되어야 한다.

3. \(p\)로 표기하는 성공할 확률이 여러 번 시도를 통해 상수가 되어야 한다.

4. 반복된 시도는 서로 독립이다.

 

Binomial Distribution (이항 분포)

Binomial Distribution(이항 분포)는 베르누이 과정을 따르는 확률 분포라고 할 수 있다. 즉, 결과가 오직 두 개인 시행을 여러번 시도할 때 사용한다고 생각하면 된다.

Random variable (확률 변수) \(X\)가 binomial distribution(이항 분포)를 따른다면, 확률 변수 \(X\)의 확률 질량 함수는 다음과 같다.

이항 분포

\(x\): 성공 횟수

\(n\): 전체 시행(반복) 횟수

\(p\): 성공할 확률

\(q\): 실패할 확률 =\((1-p)\)

 

또한, \(x\)에 0부터 \(n\)까지 넣어서 모두 더하면 1이 된다. (전체 확률은 항상 1이어야 하기 때문)

Mean and Variance of Binomial Distribution (이항 분포의 평균과 분산)

이항 분포의 평균과 분산은 다음과 같이 구할 수 있다.

평균
분산

Multinomial Distribution (다항 분포)

다항 분포는 이항분포에서 도출 가능한 결과가 3개 이상인 분포이다.

이항 분포가 각각의 시행에서 도출 가능한 결과가 오직 2개라면 다항 분포에서는 도출 가능한 결과가 \(k\)개 이다.

이때, 다항 분포의 확률 질량 함수는 다음과 같다.

다항 분포

여러 번의 시행에서 결과가 몇 번 나왔는지를 나타내는 \(x\)를 모두 더한 값은 n을 만족해야 한다.

또한, 여러 개의 결과의 확률을 모두 더하면 1을 만족해야 한다.

반응형