信頼区間と信用区間の違いをわかりやすく解説
信頼区間と信用区間
母集団のパラメータを推定する際に用いられる「信頼区間」と「信用区間」は、どちらもある範囲内に真の値が含まれる確率を示す概念ですが、その解釈や計算方法に大きな違いがあります。
詳しく見ていきましょう。
HPD区間やベイズ統計学の復習がしたい方はこちらの記事がオススメです。
信頼区間
まず、信頼区間について説明します。
母集団の未知のパラメータ

点推定量は母集団パラメータの単一の値の推定値ですが、サンプリング誤差のため、当然真の値と一致するとは限りませんね。
そこで、信頼区間は
信頼区間は、以下の形で表されます。
この式は、点推定値
通常、
この辺りは統計検定2級では頻出の部分ですね。
具体例を挙げてみましょう。
このとき、
有意水準
信頼区間の解釈
信頼区間の解釈
信頼区間95%:「もし同じ実験を何度も繰り返した場合、95%の信頼区間が真の値を含む確率は95%である」と解釈されます。
あくまで、確率の対象は「信頼区間」であり、「母集団平均
母集団平均
上でもランダムサンプリングや標準誤差の話をしました通り、信頼区間は、実験を何度も繰り返すという仮想的状況に基づいて解釈されるものであり、当然ですが毎回の繰り返しで、異なる標本が得られ、異なる信頼区間が計算されます。
なので、この範囲内に真の母集団平均
具体例
例えば、ある商品の重量の平均を調べたいとします。100個の商品を抽出して重量を測定し、95%信頼区間を計算したとします。このとき、計算された信頼区間に真の平均重量が含まれているかどうかは、この1回の調査では分かりません。しかし、同じ実験を100回繰り返せば、約95回の信頼区間に真の平均重量が含まれることが期待されます。
信用区間
一方、信用区間は、ベイズ統計学における概念です。
事前分布と尤度関数から得られる事後分布を使用して、母集団パラメータの credible interval (信用区間)を構築します。
信用区間は、母集団パラメータが特定の範囲内に含まれる事後確率を提供します。
事後分布
つまり、母集団パラメータ
数学的には、信用区間は次のように表すことができます
たとえば、正規分布の平均

- 青い曲線: 事後分布
- 赤い影: 95%信用区間
- 緑の点線: 事後分布の平均
- 赤の点線: 信用区間の境界
作図をしてみました。
目的は、母集団の平均(母平均)を推定するための典型的なベイズ推論です
事前分布に正規分布を仮定(平均10、標準偏差3)して、十回くらいサンプリングしてみました。
密度が高い部分にフォーカスしている結果、事前分布の平均を信用区間が包含していることがわかりますね。
信用区間の解釈
信用区間の解釈
真の母集団平均μが含まれる確率は〜%と解釈できる。
まず信頼区間の前提と違うのは、母集団平均
事前分布と尤度関数から事後分布を求めます。
この事後分布は、データを観測した後の
95%信用区間は、この事後分布において確率が95%を占める区間として定義されます。
つまり、「このデータを観測した今、μが95%の確率でこの区間にある」と解釈できるのです。
まとめ
さて、ここまでで差は理解できましたでしょうか。

両者の主な違いは、信頼区間が頻度論的アプローチに基づいているのに対し、信用区間がベイズ的アプローチに基づいている点です。
信頼区間は長期的な確率的振る舞いに基づいており、実験や調査を無限に繰り返した場合の範囲を示唆しています。
一方、信用区間はベイズ理論に基づき、具体的なデータに対する事後分布から直接計算されるパラメータの範囲を表しています。
信用区間は事前情報を反映できるため、信頼区間よりも狭い区間を得られる可能性がありますが、事前分布の選択が重要になります。