推定・検定

HOME
統計学
推定・検定
【等分散の仮定編】2標本問題をわかりやすく解説|推定と検定

06/28/2022 / 最終更新日時 : 10/26/2025 Blue 推定・検定

【等分散の仮定編】2標本問題をわかりやすく解説|推定と検定

こんにちは、青の統計学です。

今回は、2標本問題について扱います。

確率変数が2つ登場するため難しいですが、応用上用いられることが多いのが「2標本問題」です。

中でも今回は、二つの確率変数が同一の分散であると仮定した「等分散の仮定」に基づいて解説していきます。

等分散の仮定が認められないときには、Welchのt検定を使います。

【非等分散編】pythonでWelch(ウェルチ)のt検定をやってみた

2標本問題

2標本問題とは、以下のような状況です。

ーー

$X_1,…,X_m \sim N(\mu_1,\sigma^2)$ でiid

$Y_1,…,Y_n \sim N(\mu_2,\sigma^2)$ でiid

$X_1,…,X_m$と $Y_1,…,Y_n$は互いに独立

確率変数$X$と確率変数$Y$はそれぞれ正規分布に従っている。

この時の、2標本間の母平均に差があるかどうかを知りたい。

ーー

まず覚えていただきたいのが、2標本問題では、標本間の平均値に差があるかを知りたい、ということです。

ここまで聞いて、帰無仮説と対立仮説が浮かんだ方はかなり鋭いです。

よく使われるのが、以下のような治験の例です。

血圧を下げる新しい薬の効果を調べたいです。

m人の試験者に血圧を下げるとされる新薬を投与し、n人には偽薬を与えました。

処置群の血圧の平均値をμ1、コントロール群の血圧の平均値をμ2とします。
その平均の差が有意か調べたいです。

帰無仮説：$\mu_1 = \mu_2$

対立仮説：$\mu_1≠ \mu_2$

以上のように、帰無仮説と対立仮説を設定できたと思います。

棄却したい条件、今回なら新薬を投与してもしなくても血圧の平均は変わらない、を帰無仮説とします。

両側検定の対立仮説は、「新薬は、血圧を下げることもあれば、上げることもある」ですので、$\mu_1<\mu_2$のように、片側検定の対立仮説を置いても良いでしょう。

では、検定の手順に移っていきます。

1：標本平均の差を出す

$$|\overline{X}- \overline{Y}|,\mu_{1}=\mu_{2}$$

そのまま帰無仮説の右辺を移行した形になります。

差の絶対値が、どんな分布に従うかを知る必要がありました。

2：標本平均の差の絶対値がある値Cを超えるとき、帰無仮説を棄却する

$$|\overline{X}- \overline{Y}|>C→H_{0}は棄却される$$

3：差の絶対値が従う分布を調べる

まず、それぞれの標本平均が従う分布は、各確率変数が従う正規分布の「平均をサンプル数で割り」、「分散をサンプル数の2乗で割った」正規分布です。

$$\overline{X}〜N(\mu_{1},\frac{\sigma^2}{m}), \overline{Y}〜N(\mu_{2},\frac{\sigma^2}{n})$$

上のような形になります。こちらの差を取り、絶対値を取るので、以下のようになります。

$$\overline{X}-\overline{Y}〜N(|\mu_{1}-\mu_{2},\frac{\sigma^2}{m}+\frac{\sigma^2}{n})$$

差をとっているので、平均は差を取り、分散は和を取ります。

そもそも標本平均や差の絶対値が従う分布がわかるのでしょうか？

ここで、正規分布の再生性が活躍します。

何気なくやる計算も、再生性という性質がなければ線形変換した値の分布がわからなくなってしまいます。

正規分布の再生性に関しては、こちらをご覧ください。

【例題つき】正規分布(ガウス分布)の確率密度について|R

4：標準化する。

そのままでは使いづらいので、標準化しようと思います。

差の絶対値に対する処置は、「平均分引き、標準偏差だけ割る」です。

$$Z=\frac{|\overline{X}-\overline{Y}|-|μ_1-μ_2|}{σ\sqrt{m-{-1}+n^{-1}}}〜N(0,1)$$

ややこしくなってきたので、$Z$に置き換えます。

また、帰無仮説の元では２標本間の平均は等しいので、|μ1 – μ2|=0になります。分子が軽くなりました。

このように、標準正規分布に従うようになりました。

5：誤棄却の確率$\alpha$を求める

こちらは、「帰無仮説が正しいのに、帰無仮説を棄却してしまう」確率であり、いわゆる第一種の過誤です。

有意水準とp値について復習したい方はこちらをご覧ください。

【仮説検定】p値をゼロから解説(第一種の過誤,第二種の過誤,検出力)

【統計検定2級】第一種の過誤と第二種の過誤について

$$\alpha=P(|Z|>C|H_0)=2P(Z>C|H_0)$$

$$\frac{|\overline{X}-\overline{Y}|-|μ_1-μ_2|}{σ\sqrt{m^{-1}+n^{-1}}}=z_{\frac{\alpha}{2}}$$

$$|\overline{X}-\overline{Y}|=σ\sqrt{\frac{m+n}{mn}}z_{\frac{\alpha}{2}}$$

また、$C$は$２$分の$\alpha$分位点に一致することになります。

よって、$Z$が２分の$\alpha$分位点よりも大きい時に、帰無仮説を棄却できます(嬉しい)。

さて、ここで一つ不明のものがあります。「標準偏差$\sigma$」です。

6：母分散$\sigma^2$を不偏分散に置き換える

不偏分散を使えば、置き換えた結果の検定統計量もt分布に従い、かつ不偏分散は自由度$(m+n-2)$のカイ2乗分布に従います。

不偏分散については、こちらをご覧ください。

【n-1で割る理由】不偏分散と不偏性についてわかりやすく解説

今回は、等分散の仮定があるので、2標本を使った不偏分散を作ります。

$$V^2=\frac{1}{m+n-2}(\sum_{i=0}^m(X_i-\overline{X})^2\sum_{i=0}^m(Y_i-\overline{Y})^2)$$

Xの不偏分散とYの不偏分散の加重平均をとっているだけです。簡単ですね。

よって、新しい検定統計量Tは自由度$m+n-2$のt分布に従うことがわかりました。

$$T = \frac{|\overline{X}-\overline{Y}|}{V\sqrt{m^{-1}+n^{-1}}}〜t_{m+n-2,\frac{\alpha}{2}}$$

補足｜不偏分散がカイ二乗分布に従うことについて

ここまでで、なぜ統計量が従う分布が色々変わるのか謎だと感じた方も多いと思います。

少し補足をします。

2つの独立した標本（サイズ${m}$と${n}$）が同じ母分散${\sigma^2}$を持つ正規分布から得られたと仮定します。

不偏分散の定義上、 2標本の不偏分散${s^2}$は以下のように定義されます

${s^2 = \frac{(m-1)s_1^2 + (n-1)s_2^2}{m+n-2}}$

ここで、${s_1^2}$と${s_2^2}$はそれぞれの標本の不偏分散です。

また、正規分布からの標本の不偏分散${s^2}$と母分散${\sigma^2}$の関係は、以下のようにカイ二乗分布に従います：

${\frac{(m+n-2)s^2}{\sigma^2} \sim \chi^2_{m+n-2}}$

自由度の解釈ですが、これは比較的簡単で、

第1標本の自由度：${m-1}$

第2標本の自由度：${n-1}$

合計自由度：${(m-1) + (n-1) = m+n-2}$

というだけですね。

また、2つの標本が独立であるため、それぞれのカイ二乗統計量も独立です。

そしてカイ二乗分布の加法性により、独立なカイ二乗分布の和は、自由度を足し合わせたカイ二乗分布に従います。

これらの理由により、2標本の不偏分散を合わせて計算した結果が自由度${m+n-2}$のカイ二乗分布に従います。

この性質は、等分散の仮定の下で2標本のt検定や分散分析などの統計的手法の基礎となっています。

カイ二乗分布をはじめとした、標本についての分布はこちらが役立ちそうです。

カイ二乗分布の基礎と統計学における重要な役割

F検定の理論的背景と分散比の検定方法

等分散の仮定

冒頭でも説明したように、等分散の仮定とは「二つの確率変数の母分散が等しい」という仮定です。

この仮定は強いものですが、必ずしも現実と合致するわけではありません。

特に、社会科学においては、変数が複雑な外部要因の影響を受けるため、等分散の仮定はしばしば妥当性を欠くと考えられます。

一方、自然科学の分野では、実験環境が厳密に管理されている場合、この仮定はより適用しやすいです。

たとえば、実験室での精密な計測では、計測器の精度が一定であるため、変数間の分散が均等であると仮定することに一定の合理性があるとされています。等分散の仮定は、そのため自然科学の分野で有効に機能するケースが多いです。

実際の問題を解く

血圧を下げる新しい薬の効果を調べたいです。

10人の試験者に血圧を下げるとされる新薬を投与し、10人には偽薬を与えました。

処置群の血圧の平均値が94、コントロール群の血圧の平均値が100でした。
有意水準95%その平均の差が有意か調べたいです。


ただし、不偏分散は6.4であるとします。

では、以上のような問題を解いてみましょう。

先ほどの式に当てはめると、検定統計量は自由度18のt分布に従うことがわかります。

$$T = \frac{|100-94|}{6.4\sqrt{10^{-1}+10^{-1}}}〜t_{18,\frac{\alpha}{2}}$$

計算すると、検定統計量は$2.096‥$でした！

t分布表を見ると、値は$2.101$です。$T < 2.101$なので、帰無仮説を棄却することはできません。

つまり、「新薬に血圧に明確な効果があるとは言えない」です。

φ（自由度）	95%(片側)	95%(両側)
1	6.3137	12.7062
2	2.9200	4.3027
3	2.3534	3.1824
4	2.1318	2.7765
‥	‥	‥
17	1.7396	2.1098
18	1.7341	2.1009
19	1.7291	2.0930
20	1.7247	2.0860
21	1.7207	2.0796

CODE|python

ここでは、pythonで等分散の検定を行うコードを紹介いたします。

import scipy.stats as stats

data1 = [34, 23, 44, 29, 26]
data2 = [44, 39, 29, 23, 33]

stat, p = stats.levene(data1, data2)

print("Statistic: ", stat)
print("p-value: ", p)

if p < 0.05:
    print("The variances are not equal.")
else:
    print("The variances are equal.")

statsライブラリのleveneというメソッドを使えば簡単に検定を行うことができます。

Statistic:  0.015414258188824687
p-value:  0.9042560437250893
The variances are equal.

このように評価されたと思います。

有意水準$0.05$では、「分散は異なる」と判断されなかったようです。

今回の2標本検定をさらに極めたい方は、こちらの記事がおすすめです。

母平均の区間推定と検定 – 正規分布と標準誤差の概念

母分散の区間推定と検定 – 標本からの母集団の分散推定手法

青の統計学

@blue_statistics

Blue

青の統計学は、東京大学を卒業後、事業会社でデータサイエンティストとして勤務する筆者が運営する、AI・データサイエンスの総合学習メディアです。自身の大学時代の経験から、教科書だと分かりにくかった事項を克服でき、かつ実務で活かせる知識を楽しく学べるように、インタラクティブ学習ツール「DS Playground」を開発しており、大学での講義の材料としても利用されています。Xフォロワー1万人を突破！