F検定の理論的背景と分散比の検定方法

F検定

F検定は、2つの母集団の分散の比を検定する統計的手法で、実務上様々な場面で利用されています。

例えば製造業において、複数のラインからサンプルを抽出し、それぞれの工程の分散を比較する際に使われます。

もし分散に有意な差があれば、その原因を特定し是正する必要があります

また、臨床試験においても、新薬と既存薬の効果の分散を比較することで、新薬の有効性を評価するのに役立ちます。

統計検定2級以降必須の知識ですので、しっかり学習していきましょう。

仮定

まず、$n_1$個の標本$X_1, X_2, \ldots, X_{n_1}$と$n_2$個の標本$Y_1, Y_2, \ldots, Y_{n_2}$があり、$X_i$と$Y_j$はそれぞれ平均$\mu_1$と$\mu_2$、分散$\sigma_1^2$と$\sigma_2^2$の正規分布$\mathcal{N}(\mu_1, \sigma_1^2)$と$\mathcal{N}(\mu_2, \sigma_2^2)$から独立に抽出された標本であると仮定します。

$X_i$と$Y_j$から求めた不偏分散$S_1^2$と$S_2^2$は、自由度$n_1 – 1$と$n_2 – 1$の$\chi^2$分布に従うことが知られています。

さらに、$\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}$の比は自由度$(n_1 – 1, n_2 – 1)$のF分布に従うことが証明されています。

つまり、$F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} = \frac{S_1^2}{S_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2}$は自由度$(n_1 – 1, n_2 – 1)$のF分布$F(n_1 – 1, n_2 – 1)$に従います。

この性質を利用して、$\sigma_1^2 = \sigma_2^2$という帰無仮説を検定することができます。

具体的には、有意水準$\alpha$に対して、$F$がある臨界値$F_\alpha$より大きければ帰無仮説を棄却し、$\sigma_1^2 \neq \sigma_2^2$と判断します。

$F_\alpha$は、$\int_{F_\alpha}^\infty f(x; n_1 – 1, n_2 – 1) \,dx = \alpha$を満たす値です。

ここで、$f(x; n_1 – 1, n_2 – 1)$はF分布の確率密度関数です。

このようにF検定は、2つの標本の分散比がある臨界値を超えるか否かで、2つの母集団の分散が等しいかどうかを判断する手法となります。

実際の計算では、

$$F = \frac{S_1^2}{S_2^2}$$

を求め、これが$F_\alpha$より大きければ帰無仮説を棄却します。

次のセクションで確率密度関数まで扱いますが、t分布やカイ二乗分布と同じように標本に関する分布で、主に分布の形や密度関数を知っておくというよりも、どの検定でどう使われるのか、というところを優先的に理解しておくのが良いです。

他の分布に関しては、こちらをご覧ください。

F検定の前提について

F検定を適切に行うためには、いくつかの前提条件を満たす必要があります。

第一に、各標本が正規分布に従うことが望ましいです。

→カイ二乗分布に従う確率変数も、結局は独立な正規分布に従う確率変数の平方和なので、元を辿れば一緒ですね。

中心極限定理によれば、標本サイズが十分大きければ正規性の仮定を緩和できます。

中心極限定理については、こちらをどうぞ。

第二に、標本は独立であることが求められます。

つまり、ある標本の値が他の標本の値に影響を与えてはいけません。

第三に、標本分散は未知の母集団分散の不偏推定量であることが前提となります。

F分布の性質を利用することで、F検定の理論的根拠が得られます。

まず、2つの標本から求めた不偏分散$S_1^2$と$S_2^2$は、それぞれ$\chi^2$分布に従うことが知られています。

$$\begin{align*}
\frac{(n_1 – 1)S_1^2}{\sigma_1^2} &\sim \chi^2(n_1 – 1)\\
\frac{(n_2 – 1)S_2^2}{\sigma_2^2} &\sim \chi^2(n_2 – 1)
\end{align*}$$

さらに、$\chi^2$分布の性質から、$\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}$の比は自由度$(n_1 – 1, n_2 – 1)$のF分布に従うことが導かれます。

$$\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} = \frac{S_1^2}{S_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \sim F(n_1 – 1, n_2 – 1)$$

このF分布の性質を利用して、

$$\sigma_1^2 = \sigma_2^2$$

という帰無仮説を検定できます。

具体的には、有意水準$\alpha$に対応する臨界値$F_\alpha$を求め、$F = \frac{S_1^2}{S_2^2}$がこの値を超えれば帰無仮説を棄却します

$F_\alpha$は、$\int_{F_\alpha}^\infty f(x; n_1 – 1, n_2 – 1) \,dx = \alpha$を満たす値で、$f(x; n_1 – 1, n_2 – 1)$はF分布の確率密度関数です。

分散分析

分散分析の文脈で言うと、F統計量は水準間平均平方和を、残差平均平方和で割った値(=群間分散と群内分散の比率)です。

$${Fvalue=\frac{\frac{SSB}{df_{between}}}{\frac{SSW}{df_{within}}}\sim F(df_{between},df_{within})}$$

繰り返しになりますが、群間平方和 (SSB) は、群の平均が全体の平均からどれだけ離れているかを示し、これがカイ二乗分布に従います。

これは、各群の平均もまた正規分布に従うためです。

同様にして、群内平方和 (SSW) は、各データポイントがその群の平均からどれだけ離れているかを示し、この分布もカイ二乗分布に従います。これは、データポイントが各群内で正規分布に従うという仮定によります。

このように、ANOVAの論理構造は、結局は元データの正規分布仮定に強く依存しています。(前述の通り)

分散分析については、統計検定2級の鬼門となっております。
青の統計学でも複数の記事で扱っていますので、以下をご参照ください。

さて、ここまで見てきましたが、特に覚えて欲しい点は、F検定の嬉しさは、2つの母集団分散の比を直接検定できる点にであるということです。

一方で、母集団分散が未知の場合には推定値を用いる必要があり、推定の不確実性が結果に影響を及ぼします。

また、正規性の仮定が厳密に満たされない場合もあり、その際にはノンパラメトリック手法を検討する必要があります。

適切な手法の選択には、データの性質や目的を踏まえた上で、慎重な判断が求められます。

まとめ

– F検定は、2つの母集団の分散$\sigma_1^2$と$\sigma_2^2$の比を検定する統計的手法
– 2つの標本からの不偏分散$S_1^2$と$S_2^2$の比$F = \frac{S_1^2}{S_2^2}$は、自由度$(n_1 – 1, n_2 – 1)$のF分布$F(n_1 – 1, n_2 – 1)$に従う
$$F = \frac{S_1^2}{S_2^2} \sim F(n_1 – 1, n_2 – 1)$$
– $\sigma_1^2 = \sigma_2^2$という帰無仮説を検定する際、$F$が臨界値$F_\alpha$より大きければ帰無仮説を棄却する
$$\int_{F_\alpha}^\infty f(x; n_1 – 1, n_2 – 1) \,dx = \alpha$$
– 製造業や臨床試験など、2つの過程の分散を比較する場面で利用される
前提条件として、標本が正規分布に従うこと、独立であること、不偏分散を用いることなどが求められる

FOLLOW ME !