베르누이 분포란?
베르누이 분포는 가장 단순한 이산 확률 분포 중 하나로, 결과가 딱 두 가지로 나뉘는 실험의 결과를 모델링하는 데 사용한다. 이 두 가지 결과는 일반적으로 '성공'과 '실패' 또는 '참'과 '거짓' 등으로 정의한다. 대표적인 예로 '동전 던지기'가 있다.
베르누이 분포는 다음과 같은 특징을 가진다.
- 두 가지 결과: '성공'(1) 또는 '실패'(0)
- 성공 확률: 성공할 확률을 '$p$'라고 하며, 이때 실패할 확률은 '$1-p$'이다.
베르누이 분포의 확률질량함수
베르누이 분포의 확률질량함수는 다음과 같의 정의된다.
$$P(X=x)=\left\{\begin{matrix} p& \textrm{if}\; x=1\\ 1-p& \textrm{if}\; x=0 \\\end{matrix}\right.$$
여기서 $x$는 베르누이 시행의 결과를 나타내는 변수이다. 즉, $x$는 1(성공) 또는 0(실패)의 값을 가진다.
베르누이 분포의 예제
베르누이 분포를 설명할 때 주로 사용되는 간단한 예제이다.
예제1: 동전 던지기
동전을 던져서 앞면이 나오는 것을 성공이라고 가정해보자. 동전이 공정하다면, 앞면이 나올 확률은 '$p=0.5$'이다. 따라서 실패할 확률도 '$1-p=0.5$'이다. 이 경우의 $x$는 1(앞면) 또는 0(뒷면)이다.
예제2: 제품 불량률
제조 공정에서 무작위로 선택한 제품이 불량일 확률을 '$p=0.02$'라고 가정하면 '$x=1$'이면 불량품, '$x=0$'이면 정상품을 의미한다.
베르누이 분포의 기대값과 분산
베르누이 분포의 기대값(평균)과 분산은 각각 다음과 같이 구할 수 있다.
- 기대값 $E(X)$
$$ \begin{align*}
E(X) &= \sum_{x}x\cdot P(X=x)\\
&= (1\times P(x=1)) + (0 \times P(X=0))\\
&= 1 \times p + 0 \times (1-p)\\
&= p
\end{align*}$$
- 분산 $Var(X)$
$$\begin{align*}
Var(X) &= E[(X-E(X))^2]\\
&= E[(X-p)^2]\\
&= E[X^2-2Xp+p^2]\\
&= E[X^2]-2pE[X]+p^2\\
&= p-2p^2+p^2\\
&= p(1-p)
\end{align*}$$
베르누이 분포 시각화 (python)
성공 확률이 '$p=0.7$'인 베르누이 분포의 확률 질량함수를 막대그래프로 그려보았다.
import matplotlib.pyplot as plt
# 성공 확률 p 설정
p = 0.7
# 확률 값
success_prob = [p, 1 - p]
outcomes = ['Success (1)', 'Failure (0)']
# 막대 그래프 생성
plt.bar(outcomes, success_prob, color=['blue', 'orange'])
# 그래프 제목과 축 레이블 설정
plt.title('Bernoulli Distribution (p=0.7)')
plt.xlabel('Outcome')
plt.ylabel('Probability')
plt.ylim(0,1)
# 막대 위에 확률값 텍스트 추가
for i in range(len(outcomes)):
plt.text(i, success_prob[i] + 0.02, f'{success_prob[i]:.2f}', ha='center')
# 그래프 출력
plt.show()
베르누이 분포의 응용
베르누이 분포를 응용할 수 있는 간단한 예시들이다.
- 마케팅: 광고를 클릭할 확률을 분석할 때, 사용자가 광고를 클릭하는지 여부(1 또는 0)로 모델링할 수 있다.
- 제조: 품질 관리에서 제품이 불량인지 아닌지의 이진 상태를 베르누이 분포로 표현할 수 있다.
- 의학: 특정 치료가 효과가 있는지 없는지를 평가할 때, 성공 또는 실패로 나타낼 수 있다.
결론
베르누이 분포는 이산 확률 분포의 기본 중 하나로, 성공과 실패라는 이진 결과를 모델링하는 데 매우 유용하다. 이 분포를 이해하면 이항 분포 등 더 복잡한 분포의 개념을 배우는 데도 도움이 된다. 다양한 분야에서 베르누이 분포를 활용해 데이터를 분석하고 예측할 수 있으며, 이로 인해 실질적인 비즈니스 인사이트를 도출할 수 있다.
다음 포스트에서는 이항 분포에 대해 다루며, 베르누이 분포가 어떻게 확장될 수 있는지 정리할 예정이다.