信頼区間と信用区間の違いをわかりやすく解説

信頼区間と信用区間

母集団のパラメータを推定する際に用いられる「信頼区間」と「信用区間」は、どちらもある範囲内に真の値が含まれる確率を示す概念ですが、その解釈や計算方法に大きな違いがあります。

詳しく見ていきましょう。

HPD区間やベイズ統計学の復習がしたい方はこちらの記事がオススメです。

信頼区間

まず、信頼区間について説明します。

母集団の未知のパラメータ $\theta$ を推定するために、$n$ 個のランダムサンプル $X_1, X_2, \ldots, X_n$ から点推定量 $\hat{\theta}$ が計算されます。

点推定量は母集団パラメータの単一の値の推定値ですが、サンプリング誤差のため、当然真の値と一致するとは限りませんね。

そこで、信頼区間は $\hat{\theta}$ の周りの範囲を提供し、この範囲内に真の母集団パラメータ $\theta$ が含まれる確率を指定します。

信頼区間は、以下の形で表されます。

$$\hat{\theta} \pm z_{\alpha/2} \cdot \text{SE}(\hat{\theta})$$

$z_{\alpha/2}$ は標準正規分布の上側 $\alpha/2$ 分位点、$\text{SE}(\hat{\theta})$ は $\hat{\theta}$ の標準誤差です。

この式は、点推定値 $\hat{\theta}$ の周りの範囲を定義し、その範囲内に真の母集団パラメータ $\theta$ が含まれる確率が $(1 – \alpha)$ になることを意味します。

通常、$\alpha$ は 0.05 または 0.01 に設定され、対応する信頼水準は 95% または 99% となります。

この辺りは統計検定2級では頻出の部分ですね。

具体例を挙げてみましょう。

$n$ 個のランダムサンプル $X_1, X_2, \ldots, X_n\sim N(\mu,\sigma^2)$ から母集団平均 $\mu$ の点推定量 $\bar{X}$ を計算したとします。

このとき、$\bar{X}$ の標準誤差は $\text{SE}(\bar{X}) = \sigma / \sqrt{n}$ です (ここで $\sigma$ は母集団の標準偏差)。

有意水準 $\alpha = 0.05$ のとき、$z_{0.025} = 1.96$ なので、95% 信頼区間は次のように計算されます。

$$\begin{equation*}
\bar{X} \pm 1.96 \cdot \frac{\sigma}{\sqrt{n}}
\end{equation*}$$

信頼区間の解釈

信頼区間95%：「もし同じ実験を何度も繰り返した場合、95%の信頼区間が真の値を含む確率は95%である」と解釈されます。

あくまで、確率の対象は「信頼区間」であり、「母集団平均${\mu}$」ではありません。
母集団平均${\mu}$は、ある一定の値であり、確率的に変動するものではありません。

上でもランダムサンプリングや標準誤差の話をしました通り、信頼区間は、実験を何度も繰り返すという仮想的状況に基づいて解釈されるものであり、当然ですが毎回の繰り返しで、異なる標本が得られ、異なる信頼区間が計算されます。

なので、この範囲内に真の母集団平均 $\mu$ が含まれる確率は 95% となります、というのは誤解を招く表現ですね。

具体例

例えば、ある商品の重量の平均を調べたいとします。100個の商品を抽出して重量を測定し、95%信頼区間を計算したとします。このとき、計算された信頼区間に真の平均重量が含まれているかどうかは、この1回の調査では分かりません。しかし、同じ実験を100回繰り返せば、約95回の信頼区間に真の平均重量が含まれることが期待されます。