変動係数とは?|確率変数の相対的な散らばりを表す指標の解説

こんにちは、青の統計学です!

今回は、変動係数 について解説します。数学的背景も踏まえて、理解が深まる構成にしているのでぜひ最後までご覧ください。

青の統計学では、noteで統計検定やG検定に関するチートシートを掲載しております。
こちらをクリック!

【完全版】統計検定2級チートシート
【最短合格】統計検定2級の攻略本|4万字

変動係数

まず概要から言うと、変動係数は確率論や統計学において、確率変数の相対的な散らばり具合を表す尺度です。

確率変数の標準偏差を平均値で割ったものとして定義されます。

$$
変動係数 = \frac{標準偏差}{平均値}
$$

標準偏差は確率変数の絶対的な散らばり具合を測る一方で、変動係数は平均値に対する散らばり具合の相対的な大きさを表します。

統計検定2級で変動係数を求める問題が出ましたね〜

異なる単位や平均値を持つ確率変数の散らばりを比較する際に有用ですね。

変動係数の値は0以上をとり、0に近いほど相対的な散らばりが小さく、値が大きいほど相対的な散らばりが大きいことを意味します。

一般に、変動係数が\(1\)を超えると「ばらつきが大きい」と見なされます。

変動係数は、確率変数\(X\)の平均\(\mu\)と分散\(\sigma^2\)を用いて、以下のように表すこともできます。

$$
変動係数 = \frac{\sqrt{\sigma^2}}{\mu} = \frac{\sigma}{\mu}
$$

さらに、標本平均\(\bar{X}\)と標本分散\(S^2\)を用いた経験的な変動係数は次のように定義されます。

$$
経験的変動係数 = \frac{\sqrt{S^2}}{\bar{X}}
$$

このように、変動係数は確率変数や標本データの相対的な散らばりを簡潔に表す指標として有用です。

しかし、具体は後述しますが、確率分布の形状には依存しないため、ある種の確率分布では解釈が難しくなる場合があります。

変動係数の式の導出を見ていきましょう。

確率変数$X$の分散$\sigma^2$は、次のように定義されています。

$$
\sigma^2 = E[(X – \mu)^2]
$$

ここで、$E[\cdot]$は期待値を表し、$\mu$は$X$の平均値です。

分散の平方根をとると標準偏差$\sigma$が得られます。

$$
\sigma = \sqrt{\sigma^2} = \sqrt{E[(X – \mu)^2]}
$$

標準偏差を平均値で割れば、変動係数が得られます。

$$
\text{変動係数} = \frac{\sigma}{\mu} = \frac{\sqrt{E[(X – \mu)^2]}}{\mu}
$$

つまり、変動係数は標準偏差を平均値で規格化したものと解釈できます。

周辺の期待値や分散が怪しい人は、こちらをどうぞ

具体例

例えば、確率変数$X$が平均$\mu=100$、標準偏差$\sigma=20$の正規分布$\mathcal{N}(100, 20^2)$に従うとしましょう。

この場合、変動係数は$20/100=0.2$となります。

一般に、正規分布の変動係数は常に$\sigma/\mu$で与えられます。

一方、確率変数$Y$が平均$\lambda=5$のポアソン分布$\text{Pois}(5)$に従うとしましょう。

ポアソン分布の平均と分散は等しいので、$\sigma=\sqrt{\lambda}=\sqrt{5}$です。

よって、変動係数は$\sqrt{5}/5\approx0.447$となります。

このように、変動係数は確率分布の種類に依存しますが、一般に$0\leq\text{変動係数}\leq1$の範囲にあり、値が小さいほど相対的なばらつきが小さいことを意味します。

変動係数が$1$を超えると、ばらつきが平均より大きいことを示唆します。

例えば、確率変数$Z$が$Z=X-100$($X\sim\mathcal{N}(100, 20^2)$)で定義されるとすると、$\mu_Z=0$、$\sigma_Z=20$なので、変動係数は$20/0=\infty$となり、ばらつきが非常に大きいことがわかります。

変動係数の限界!?

確率変数の相対的な散らばりを表す変動係数は、標本分散と標本平均の比として定義されましたね。

より一般的には、確率変数$X$の分散関数$V(X)$と平均関数$E(X)$の比として定義できます。

すなわち、

$$
\text{変動係数} = \frac{\sqrt{V(X)}}{E(X)}
$$

となります。

この定義は、広範な確率分布に対して適用可能です。

例えば、正規分布や指数分布、ガンマ分布などでは、変動係数は既知の関数形で表されます。

変動係数は、確率分布の形状によらず、相対的な散らばりを表す指標として有用です。

しかし、先ほども申し上げた通り、確率分布の形状を無視する点が変動係数の限界でもあります。

例えば、平均が0に近づくと変動係数は発散する可能性があります。

また、確率分布が裾の重い場合、変動係数は平均的なばらつきを過小評価する傾向があります。

定義から考えてみると、弱点が分かりますね。

FOLLOW ME !