ベルヌーイ分布の基本を徹底解説!期待値・分散の計算方法とは?
ベルヌーイ分布とは?
ベルヌーイ分布は、確率論と統計学の基礎を成す確率分布で、成功と失敗の2つの結果しか持たないベルヌーイ試行における結果をモデル化するために用いられます。
この分布は、コイン投げや製品の検査における合格・不合格の判定といった、さまざまな現実のシナリオを表現するのに適しています。
具体的には、確率変数 ${X}$ が成功(1)または失敗(0)のいずれかの値をとる離散確率分布であり、成功する確率を ${p}$ (${0 ≤ p ≤ 1}$) とすると、失敗する確率は ${1 – p}$ となります。この確率変数の確率質量関数は以下のように表されます。
$${P(X=k) = p^k (1-p)^{1-k}, \quad k \in \{0, 1\}}$$
$k=1$ は成功、$k=0$ は失敗を表します。
ベルヌーイ分布のパラメータ
ベルヌーイ分布のパラメータは成功確率 ${p}$ のみで、これによって分布の形が決まります。
たとえば、$p = 0.5$ の場合は成功と失敗の確率が等しく、公平なコイン投げの状況を表現します。
期待値の計算
先ほども述べた通り、ベルヌーイ試行は成功または失敗の2つの結果しか持たない試行であり、成功確率を${p}$とすると、失敗確率は${1-p}$となります。
このベルヌーイ試行の結果を確率変数${X}$で表すと、${X}$はベルヌーイ分布に従います。
${X}$が成功(1)をとる確率は${p}$、失敗(0)をとる確率は${1-p}$でしたね!
このベルヌーイ分布の期待値$E[X]$は、以下の式で計算されます。
$${E[X] = \sum_{x=0}^{1} x \cdot P(X=x) = 0 \cdot (1-p) + 1 \cdot p = p}$$
つまり、ベルヌーイ分布の期待値は成功確率$p$に等しくなります。
これは直感的に理解しやすい結果です。例えば、コイン投げにおいて表が出る確率が${p=0.5}$であれば、期待値は0.5となり、平均的には2回に1回表が出ると予想されます。
期待値と分散の理解が怪しい方は、こちらのコンテンツがオススメです。
分散の計算
分散は、期待値からの二乗偏差の期待値として定義されます。
$${Var(X) = E[(X – E[X])^2] = E[(X – p)^2]}$$
これは以下のように展開できます。
$${Var(X) = E[X^2 – 2pX + p^2] = E[X^2] – 2pE[X] + p^2}$$
$E[X^2]$ は以下のように計算できます。
${E[X^2] = \sum_{k=0}^{1} k^2 P(X=k) = 0^2 \times (1-p) + 1^2 \times p = p}$
したがって、分散は次のようになります。
$${Var(X) = p – 2p^2 + p^2 = p(1-p)}$$
この式から、成功確率 ${p}$ が 0.5 の時に分散が最大値 0.25 を取ることがわかります。
${p}$ が 0 または 1 に近づくにつれて、分散は 0 に近づきます。これは直感的に理解できます。成功確率が非常に高いまたは低い場合、結果はほぼ確定的なため、ばらつきは小さくなるからですね
ベルヌーイ分布と二項分布の関係
ベルヌーイ分布を学習するときは、必ず二項分布との関連を整理してほしいです。
というのも、ベルヌーイ分布は、二項分布の特殊な場合(${n=1}$)と見なされます。
ベルヌーイ分布→二項分布
ベルヌーイ試行の期待値がpの時、二項分布について
期待値:np
分散:np(1-p)
二項分布は、独立したベルヌーイ試行を複数回繰り返した際の成功回数をモデル化します。
$${P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}}$$
ここで、$\binom{n}{k}$は二項係数です。
二項分布の期待値は、$n$回のベルヌーイ試行の期待値の和として計算でき、${np}$となります。
これは、各ベルヌーイ試行の期待値が${p}$であることから導かれます。
そして、分散は ${np(1-p)}$ となります。
これは、各ベルヌーイ試行の分散が $p(1-p)$ であり、独立な試行の分散の和が全体の分散となることから導き出せますね。