【等分散の仮定編】2標本問題をわかりやすく解説|推定と検定
こんにちは、青の統計学です。
今回は、2標本問題について扱います。
確率変数が2つ登場するため難しいですが、応用上用いられることが多いのが「2標本問題」です。
中でも今回は、二つの確率変数が同一の分散であると仮定した「等分散の仮定」に基づいて解説していきます。
等分散の仮定が認められないときには、Welchのt検定を使います。
2標本問題
2標本問題とは、以下のような状況です。
ーー
\(X_1,…,X_m \sim N(\mu_1,\sigma^2)\) でiid
\(Y_1,…,Y_n \sim N(\mu_2,\sigma^2)\) でiid
\(X_1,…,X_m\)と \(Y_1,…,Y_n\)は互いに独立
確率変数\(X\)と確率変数\(Y\)はそれぞれ正規分布に従っている。
この時の、2標本間の母平均に差があるかどうかを知りたい。
ーー
まず覚えていただきたいのが、2標本問題では、標本間の平均値に差があるかを知りたい、ということです。
ここまで聞いて、帰無仮説と対立仮説が浮かんだ方はかなり鋭いです。
よく使われるのが、以下のような治験の例です。
血圧を下げる新しい薬の効果を調べたいです。 m人の試験者に血圧を下げるとされる新薬を投与し、n人には偽薬を与えました。 処置群の血圧の平均値をμ1、コントロール群の血圧の平均値をμ2とします。 その平均の差が有意か調べたいです。
帰無仮説:\(\mu_1 = \mu_2\)
対立仮説:\(\mu_1≠ \mu_2\)
以上のように、帰無仮説と対立仮説を設定できたと思います。
棄却したい条件、今回なら新薬を投与してもしなくても血圧の平均は変わらない、を帰無仮説とします。
両側検定の対立仮説は、「新薬は、血圧を下げることもあれば、上げることもある」ですので、\(\mu_1<\mu_2\)のように、片側検定の対立仮説を置いても良いでしょう。
では、検定の手順に移っていきます。
1:標本平均の差を出す
$$|\overline{X}- \overline{Y}|,\mu_{1}=\mu_{2}$$
そのまま帰無仮説の右辺を移行した形になります。
差の絶対値が、どんな分布に従うかを知る必要がありました。
2:標本平均の差の絶対値がある値Cを超えるとき、帰無仮説を棄却する
$$|\overline{X}- \overline{Y}|>C→H_{0}は棄却される$$
3:差の絶対値が従う分布を調べる
まず、それぞれの標本平均が従う分布は、各確率変数が従う正規分布の「平均をサンプル数で割り」、「分散をサンプル数の2乗で割った」正規分布です。
$$\overline{X}〜N(\mu_{1},\frac{\sigma^2}{m}), \overline{Y}〜N(\mu_{2},\frac{\sigma^2}{n})$$
上のような形になります。こちらの差を取り、絶対値を取るので、以下のようになります。
$$\overline{X}-\overline{Y}〜N(|\mu_{1}-\mu_{2},\frac{\sigma^2}{m}+\frac{\sigma^2}{n})$$
差をとっているので、平均は差を取り、分散は和を取ります。
そもそも標本平均や差の絶対値が従う分布がわかるのでしょうか?
ここで、正規分布の再生性が活躍します。
何気なくやる計算も、再生性という性質がなければ線形変換した値の分布がわからなくなってしまいます。
正規分布の再生性に関しては、こちらをご覧ください。
4:標準化する。
そのままでは使いづらいので、標準化しようと思います。
差の絶対値に対する処置は、「平均分引き、標準偏差だけ割る」です。
$$Z=\frac{|\overline{X}-\overline{Y}|-|μ_1-μ_2|}{σ\sqrt{m-{-1}+n^{-1}}}〜N(0,1)$$
ややこしくなってきたので、\(Z\)に置き換えます。
また、帰無仮説の元では2標本間の平均は等しいので、|μ1 – μ2|=0になります。分子が軽くなりました。
このように、標準正規分布に従うようになりました。
5:誤棄却の確率\(\alpha\)を求める
こちらは、「帰無仮説が正しいのに、帰無仮説を棄却してしまう」確率であり、いわゆる第一種の過誤です。
有意水準とp値について復習したい方はこちらをご覧ください。
$$\alpha=P(|Z|>C|H_0)=2P(Z>C|H_0)$$
$$\frac{|\overline{X}-\overline{Y}|-|μ_1-μ_2|}{σ\sqrt{m^{-1}+n^{-1}}}=z_{\frac{\alpha}{2}}$$
$$|\overline{X}-\overline{Y}|=σ\sqrt{\frac{m+n}{mn}}z_{\frac{\alpha}{2}}$$
また、\(C\)は\(2\)分の\(\alpha\)分位点に一致することになります。
よって、\(Z\)が2分の\(\alpha\)分位点よりも大きい時に、帰無仮説を棄却できます(嬉しい)。
さて、ここで一つ不明のものがあります。「標準偏差\(\sigma\)」です。
6:母分散\(\sigma^2\)を不偏分散に置き換える
不偏分散を使えば、置き換えた結果の検定統計量もt分布に従い、かつ不偏分散は自由度\((m+n-2)\)のカイ2乗分布に従います。
不偏分散については、こちらをご覧ください。
今回は、等分散の仮定があるので、2標本を使った不偏分散を作ります。
$$V^2=\frac{1}{m+n-2}(\sum_{i=0}^m(X_i-\overline{X})^2\sum_{i=0}^m(Y_i-\overline{Y})^2)$$
Xの不偏分散とYの不偏分散の加重平均をとっているだけです。簡単ですね。
よって、新しい検定統計量Tは自由度\(m+n-2\)のt分布に従うことがわかりました。
$$T = \frac{|\overline{X}-\overline{Y}|}{V\sqrt{m^{-1}+n^{-1}}}〜t_{m+n-2,\frac{\alpha}{2}}$$
補足|不偏分散がカイ二乗分布に従うことについて
ここまでで、なぜ統計量が従う分布が色々変わるのか謎だと感じた方も多いと思います。
少し補足をします。
2つの独立した標本(サイズ${m}$と${n}$)が同じ母分散${\sigma^2}$を持つ正規分布から得られたと仮定します。
不偏分散の定義上、 2標本の不偏分散${s^2}$は以下のように定義されます
${s^2 = \frac{(m-1)s_1^2 + (n-1)s_2^2}{m+n-2}}$
ここで、${s_1^2}$と${s_2^2}$はそれぞれの標本の不偏分散です。
また、正規分布からの標本の不偏分散${s^2}$と母分散${\sigma^2}$の関係は、以下のようにカイ二乗分布に従います:
${\frac{(m+n-2)s^2}{\sigma^2} \sim \chi^2_{m+n-2}}$
自由度の解釈ですが、これは比較的簡単で、
第1標本の自由度:${m-1}$
第2標本の自由度:${n-1}$
合計自由度:${(m-1) + (n-1) = m+n-2}$
というだけですね。
また、2つの標本が独立であるため、それぞれのカイ二乗統計量も独立です。
そしてカイ二乗分布の加法性により、独立なカイ二乗分布の和は、自由度を足し合わせたカイ二乗分布に従います。
これらの理由により、2標本の不偏分散を合わせて計算した結果が自由度${m+n-2}$のカイ二乗分布に従います。
この性質は、等分散の仮定の下で2標本のt検定や分散分析などの統計的手法の基礎となっています。
カイ二乗分布をはじめとした、標本についての分布はこちらが役立ちそうです。
等分散の仮定
冒頭でも説明したように、等分散の仮定とは「二つの確率変数の母分散が等しい」という仮定です。
この仮定は強いものですが、必ずしも現実と合致するわけではありません。
特に、社会科学においては、変数が複雑な外部要因の影響を受けるため、等分散の仮定はしばしば妥当性を欠くと考えられます。
一方、自然科学の分野では、実験環境が厳密に管理されている場合、この仮定はより適用しやすいです。
たとえば、実験室での精密な計測では、計測器の精度が一定であるため、変数間の分散が均等であると仮定することに一定の合理性があるとされています。等分散の仮定は、そのため自然科学の分野で有効に機能するケースが多いです。
実際の問題を解く
血圧を下げる新しい薬の効果を調べたいです。 10人の試験者に血圧を下げるとされる新薬を投与し、10人には偽薬を与えました。 処置群の血圧の平均値が94、コントロール群の血圧の平均値が100でした。 有意水準95%その平均の差が有意か調べたいです。 ただし、不偏分散は6.4であるとします。
では、以上のような問題を解いてみましょう。
先ほどの式に当てはめると、検定統計量は自由度18のt分布に従うことがわかります。
$$T = \frac{|100-94|}{6.4\sqrt{10^{-1}+10^{-1}}}〜t_{18,\frac{\alpha}{2}}$$
計算すると、検定統計量は\(2.096‥\)でした!
t分布表を見ると、値は\(2.101\)です。\(T < 2.101\)なので、帰無仮説を棄却することはできません。
つまり、「新薬に血圧に明確な効果があるとは言えない」です。
φ(自由度) | 95%(片側) | 95%(両側) |
1 | 6.3137 | 12.7062 |
2 | 2.9200 | 4.3027 |
3 | 2.3534 | 3.1824 |
4 | 2.1318 | 2.7765 |
‥ | ‥ | ‥ |
17 | 1.7396 | 2.1098 |
18 | 1.7341 | 2.1009 |
19 | 1.7291 | 2.0930 |
20 | 1.7247 | 2.0860 |
21 | 1.7207 | 2.0796 |
CODE|python
ここでは、pythonで等分散の検定を行うコードを紹介いたします。
import scipy.stats as stats
data1 = [34, 23, 44, 29, 26]
data2 = [44, 39, 29, 23, 33]
stat, p = stats.levene(data1, data2)
print("Statistic: ", stat)
print("p-value: ", p)
if p < 0.05:
print("The variances are not equal.")
else:
print("The variances are equal.")
statsライブラリのleveneというメソッドを使えば簡単に検定を行うことができます。
Statistic: 0.015414258188824687 p-value: 0.9042560437250893 The variances are equal.
このように評価されたと思います。
有意水準\(0.05\)では、「分散は異なる」と判断されなかったようです。
今回の2標本検定をさらに極めたい方は、こちらの記事がおすすめです。