06/15/2022 / 最終更新日時 : 04/27/2024 bluest 大学数学 【線形代数】固有値や固有ベクトルは機械学習にどう使われているのか|主成分分析 こんにちは、青の統計学です。 今回は、前回大好評だった「線形代数がデータサイエンスにどう使われているのかシリーズ」の第二弾です。 大学数学で勉強した固有値や固有ベクトルが一体何の役に立っているのか…対角化で冪 […]
06/15/2022 / 最終更新日時 : 05/05/2024 bluest 統計学基礎 【F値とは】分散分析による検定の多重性について|統計検定準1級 統計検定準一級では、2級同様「分散分析」の内容が出てきます。 今回は、前回と視点を変えた「検定の多重性」について解説します。 例題を通して理解していきましょう。 *確実に理解するために、ある程度時間をかけてみましょう。 […]
06/13/2022 / 最終更新日時 : 10/14/2024 bluest ベイズ 【ベイズ因子】オッズ比の使われ方を紹介します こんにちは、青の統計学です。 今回はロジスティック回帰の解釈で定番の、オッズ比について考えていきます。 オッズ比は二つのカテゴリに分けられるデータに対して有用な指標であり、特に、疾患や事象が発生する確率について研究する際 […]
06/13/2022 / 最終更新日時 : 11/14/2024 bluest 大学数学 【完全攻略】多重共線性をわかりやすく解説 多重共線性(Multicollinearity)とは 重回帰分析を勉強していると、最小二乗法の仮定の一つに「多重共線性がないこと」と見たことがあると思います。 冪乗項や交互作用項などを説明変数に入れて必然的に生じる多重共 […]
06/12/2022 / 最終更新日時 : 01/06/2025 bluest 医薬生物学 シンプソンズのパラドクスとは?──「部分」と「全体」で逆転する統計の落とし穴 「相関関係はあるが、因果関係があるとは限らない」——統計を学ぶ方なら必ず耳にする言葉ですが、「因果はあるのに相関が消えてしまう」という、より厄介な現象も存在します。それがシンプソンズのパラドクス (Simpson’s P […]
06/08/2022 / 最終更新日時 : 01/12/2025 bluest マーケティング 【GLMM】一般化線形混合モデルについてわかりやすく解説 1. 一般化線形モデル (GLM) と固定効果モデル まずは、前提知識を確認しましょう。 2. 一般化線形混合モデル (GLMM) の位置づけと特長 「GLMM = 一般化線形モデル + 混合効果」GLMM は、一般化線 […]
06/06/2022 / 最終更新日時 : 01/04/2025 bluest ベイズ 【尤度って?】尤度関数と最尤推定量の解説と例題 確率分布のパラメータ\(θ\)を推定する方法の一つとして、最尤推定というものがあります。 最尤推定には、尤度関数を使うことが必須です。まずは尤度関数については見てみましょう。 尤度(likelihood)について 抑えて […]
06/04/2022 / 最終更新日時 : 09/08/2024 bluest 大学数学 【例題つき】正規分布(ガウス分布)ついてわかりやすく解説 こんにちは、青の統計学です。 二項分布やポアソン分布のようなカウントデータを扱う離散分布の他に、連続データを扱う連続分布があります。 今回は、連続分布の代表格である「正規分布」について扱います。 確率密度に関する例題とと […]
06/03/2022 / 最終更新日時 : 12/05/2024 bluest 医薬生物学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 AIC(赤池情報量基準) モデルを比較する時に、観測したデータとの当てはまりの良さで判断することがあります。 これは最大対数尤度で考えています。 「対数尤度が大きいモデルが良い」と言うのは、一つの軸ではありますが複雑なモ […]
05/31/2022 / 最終更新日時 : 11/26/2024 bluest Python ブートストラップ法についてわかりやすく解説|R ブートストラップ法(bootstrap method) ブートストラップ法とは、限られた標本データから母集団の特性を推定するための統計的リサンプリング手法です。 特徴は、データの復元抽出による多数のサンプルセットの生成に […]
05/30/2022 / 最終更新日時 : 11/17/2024 bluest 統計学基礎 【統計検定2級】第一種の過誤と第二種の過誤について 今回は、統計検定2級で頻出の「第一種の過誤(type I error)と第二種の過誤(type II error)」について解説します。 仮説検定では、比較するモデル同士を帰無仮説と対立仮説に分けます。パラメーター数が少 […]
05/30/2022 / 最終更新日時 : 09/08/2024 bluest Python 【統計検定】ポアソン過程をわかりやすく解説|待ち行列理論 こんにちは、青の統計学です。 今回は統計検定準一級から登場する確立過程の一つ「ポアソン過程」について解説いたします。 このコンテンツに全て詰まっているのでブックマーク推奨です! 関わりの深い生存時間解析は、こちらで学習で […]
05/27/2022 / 最終更新日時 : 11/16/2024 bluest Python 【汎用性抜群】尤度比検定をわかりやすく解説します 尤度比検定(likelihood ratio test) 尤度比検定とは、汎用性の高い統計モデルの検定です。 専門的な用語抜きに説明すると、尤度比検定とは二つのモデルのうち、観測データをよりよく説明するのはどちらだろうか […]
05/24/2022 / 最終更新日時 : 09/16/2024 bluest Python 【GLM】一般化線形モデルをわかりやすく解説|ポアソン回帰 一般化線形モデル(generalized liner model) 今回はGLMと呼ばれる「一般化線形モデル(generalized liner model)」を解説します。 よく似た名前として、分散分析や共分散分析など […]
05/23/2022 / 最終更新日時 : 01/09/2025 bluest Python 分散分析と共分散分析:基礎からPython実装までわかりやすく解説 こんにちは、青の統計学です。 「分散分析(ANOVA)」と、そこからさらに一歩進んだ「共分散分析(ANCOVA)」について解説します。ビジネスシーンや研究、データ分析の現場でも活用範囲が広い手法であり、知っておくと有用で […]
05/20/2022 / 最終更新日時 : 05/05/2024 bluest 統計学基礎 【統計検定2級】分散分析の信頼区間について|python 統計検定2級の中でも手強い分野の一つ、「分散分析」を扱います。 中でも、分散分析の信頼区間は盲点になることが多いです。例題を通して学んでいきましょう。 分散分析について基礎から学びたい方は、以下のコンテンツをご覧ください […]
05/19/2022 / 最終更新日時 : 09/14/2024 bluest 大学数学 トービットモデルとは?わかりやすく解説【潜在変数】|計量経済学 トービットモデル トービットモデルは、経済学や計量経済学で広く使用される回帰モデルの一種です。 このモデルは、従属変数が一定の値(通常は0)で切断されている状況を扱うためにつくられました。 モデルの基本構造と切断 トービ […]
05/17/2022 / 最終更新日時 : 09/16/2024 bluest 大学数学 【t検定】t統計量(t値)の求め方 t統計量(t value)について解説 t統計量とは、t検定で使う検定統計量のことです。 t統計量は、回帰分析や仮説検定において重要な役割を果たす検定統計量です。特に、回帰係数の統計的有意性を評価する際に用いられます。統 […]
05/13/2022 / 最終更新日時 : 01/10/2025 bluest Python 【統計】標準誤差を例題を通してわかりやすく解説|python 統計検定などで、信頼区間を求めることは多くあります。 そこで必要なのが標準誤差という概念です。 分布によって誤差の作り方が異なったりするため厄介です。 丁寧に学んでいきましょう。 標準誤差(standard error) […]
05/06/2022 / 最終更新日時 : 09/19/2024 bluest Python 【統計検定準一級】回帰診断法とは?|残差プロットとleverageをわかりやすく解説 回帰診断法 回帰診断法は、回帰分析において誤差項の仮定が成立しているかどうかを評価する手法です。 仮定について詳しく深掘りたい方は、こちらを先に見た方がいいかもしれないです …で、これらの仮定を確認するために […]
05/04/2022 / 最終更新日時 : 09/15/2024 bluest 大学数学 層化抽出法の比例配分とネイマン配分をわかりやすく解説【統計検定準一級】 層化抽出法 層化抽出法は、母集団を互いに排反な部分集合(層)に分割し、各層から独立に標本を抽出する方法です。 統計検定二級では、調査手法の一つとして他の方法と比較できているかを問われていましたが、準一級では具体例を通して […]
05/04/2022 / 最終更新日時 : 11/16/2024 bluest 確率過程 【例題つき】固定効果推定と固定効果モデルについてわかりやすく解説|ランダム効果 固定効果(fixed effect)とは まず、固定効果推定を行うのは「対象を複数時点で観察する」場合です。社会科学の分野では、パネルデータ分析とよく言われていますね。 まず固定効果推定を使うための、モチベーションから確 […]
05/03/2022 / 最終更新日時 : 11/30/2024 bluest Python 【時系列】ARモデルをわかりやすく解説|Yule-Walker法や最尤法も こんにちは、青の統計学です。 今回解説するのは、時系列モデルの基礎であるARモデルです。 まずは数式を見てみましょう。 ARモデル(autoregression model) $$y_{n} = \sum_{j=1}^{ […]
05/01/2022 / 最終更新日時 : 01/13/2025 bluest 大学数学 不偏性と不偏分散についてわかりやすく解説 不偏性(unbiasedness) 不偏分散とは、分散の中でも不偏性を持つ分散のことです。 まずは、不偏性から理解していきましょう。 「不偏性がある」とは、標本平均の期待値が母平均に一致することを指します。 数式で書くと […]
04/29/2022 / 最終更新日時 : 05/05/2024 bluest 統計学基礎 【統計検定2級で最も厄介(主観)】分散分析を解説します② さて、前回の記事に続いて分散分析を解説していきます。 統計検定2級に挑戦したい方は、こちらのnoteもぜひご覧ください。(リポストすると割引になります!) 画像をクリックすると記事に飛びます。 分散分析とは まずはおさら […]
04/25/2022 / 最終更新日時 : 05/02/2024 bluest 統計学基礎 【統計検定2級で最も手強い(主観)】分散分析について解説します① こんにちは、青の統計学です。 統計検定では、実験計画法の分野で「分散分析」というものがよく出ており、「自由度」や「残差平方和」などの知識が必要で厄介です。 今回は、分散分析について解説いたします。 統計検定2級に挑戦した […]
04/24/2022 / 最終更新日時 : 09/07/2024 bluest Python 【統計検定2級】歪度と尖度をわかりやすく解説|python こんにちは、青の統計学です。 今回は尖度と歪度という2つの統計量をみてみましょう。 モーメントを使った算出式を使っておりますが、尖度と歪度の計算の仕方は色々あります。 統計検定2級に挑戦したい方は、こちらのnoteもぜひ […]
04/23/2022 / 最終更新日時 : 12/06/2024 bluest Python 【統計学】ポアソン分布についてわかりやすく解説 ポアソン分布(poisson distribution) 統計学および確率論で用いられるポアソン分布とは、ある事象が一定の時間内に発生する回数を表す離散確率分布です。 定数\( \lambda > 0\ […]
04/22/2022 / 最終更新日時 : 11/04/2024 bluest Python 【R^2】決定係数をわかりやすく説明|python こんにちは、青の統計学です。 今回は、決定係数について解説します。 決定係数とは、作った回帰モデルはどの程度学習データと当てはまっているのか調べる方法の一つです。 統計検定2級に挑戦したい方は、こちらのnoteもぜひご覧 […]