01/28/2023 / 最終更新日時 : 11/17/2024 Blue 大学数学 【例題あり】一様分布についてわかりやすく解説 一様分布 一様分布は最もシンプルな連続確率分布の一つで、「同じ確率で起こる」という直感的な概念を数学的に表現したものです。 例えばこんな感じです。 では、早速みていきましょう。 連続型一様分布 一様分布の特徴の一つが、連 […]
01/21/2023 / 最終更新日時 : 04/27/2024 Blue Python 【python】Lasso(ラッソ)回帰で疎なデータに対応しよう|機械学習 こんにちは、青の統計学です。 今回は、スパース学習の代表例である、Lasso(回帰)について解説いたします。 正則化項にL2ノルムを使う、リッジ回帰については、以下のコンテンツをご覧ください。 【python】Ridge […]
01/19/2023 / 最終更新日時 : 08/30/2025 Blue 因果推論 【計量経済学】IPW推定量をわかりやすく解説|因果推論 こんにちは、青の統計学です。 今回は、計量経済学の授業などで傾向スコアとともに出てくるIPW推定量について解説いたします。 IPW推定量とは何か? IPW推定量は、その名の通り「逆確率重み付け(Inverse Proba […]
01/13/2023 / 最終更新日時 : 01/07/2024 Blue 因果推論 成田悠輔教授の論文でも使われた回帰不連続デザイン(RDD)を学ぶ|python 今回は、子供に対する教育機関の因果効果を分析した、成田悠輔教授の論文を通して、回帰不連続デザインを解説いたします。 参照文献:Regression Discontinuity in Serial Dictatorship […]
01/03/2023 / 最終更新日時 : 09/13/2024 Blue 社会科学 【論文解説】多重共線性は回帰分析にどのような影響を与えるのか こんにちは、青の統計学です。 今回は、多重共線性への理解を深め、対処などを考察するために論文を読んでみました。 多変量解析をするとなると、大抵はマルチコ(多重共線性)の壁にあたります。 そこで正確な理解をした方が良いと感 […]
12/30/2022 / 最終更新日時 : 08/12/2025 Blue マーケティング p値をわかりやすく解説|検出力を使った具体例 1. p値の定義と計算方法 1.1 p値の定義 p値 は、統計検定において次のように定義される数値です。 ここでいう「極端な値」とは、検定手法や両側検定・片側検定によって定義が変わります。 たとえば平均値に関する両側検定 […]
12/23/2022 / 最終更新日時 : 11/16/2024 Blue 大学数学 【例題付き】ラグランジュ未定乗数法の基本と応用をわかりやすく解説 ラグランジュの未定乗数法の基礎 ラグランジュの未定乗数法は、条件付き(制約付きともいう)最適化問題を解決するための数学的手法です。 条件付き最適化問題とは? ラグランジュ法を使うと、「ある制約条件を満たしながら、一番いい […]
11/27/2022 / 最終更新日時 : 01/29/2025 Blue 大学数学 ロジスティック分布とは?シグモイド関数との関わりも解説 1. ロジスティック分布の定義と基本性質 「ロジスティック回帰」「シグモイド関数」といったキーワードを聞くと、0 から 1 までの連続値を確率のように扱うイメージを持つ方が多いかもしれません。 たとえば「あるメールがスパ […]
08/04/2022 / 最終更新日時 : 01/13/2025 Blue Python 【共変量の調整】傾向スコア・マッチングによる因果推論 | python こんにちは、青の統計学です。今回は傾向スコアをご紹介します。 因果推論に必要な考え方ですので、しっかり習得しましょう。 傾向スコア (propensity score) 傾向スコアとは、群間比較研究において、介入を受けた […]
07/16/2022 / 最終更新日時 : 01/04/2025 Blue Python マルコフ連鎖をわかりやすく解説【MCMC法への応用】 1. マルコフ連鎖の基本原理 1.1 マルコフ連鎖 マルコフ連鎖 (Markov Chain) は、確率過程の一種です。離散時間マルコフ連鎖を例にとると、時刻 ${t = 0, 1, 2, \dots}$ に観測される状 […]
07/09/2022 / 最終更新日時 : 03/15/2025 Blue Python 【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較 クラスタリングのモチベーション クラスタリングは、似た特徴を持つデータをグループ分けすることで、顧客セグメンテーション、マーケティング戦略、異常検知などの幅広いビジネス課題に対応するための手法です。 データの集合をグルー […]
07/05/2022 / 最終更新日時 : 11/03/2024 Blue Python 【周期性を掴もう】pythonでコレログラムを書いてみましょう ヒストグラムや折れ線グラフなどはよく耳にしますが、「コレログラム」は聞いたことがないかたも多いと思います。 今回は統計検定2級や準一級でよく出る「コレログラム」についてまとめてみました。 統計検定のチートシートは以下をク […]
06/28/2022 / 最終更新日時 : 01/13/2025 Blue マーケティング 幾何分布とは?意外とビジネスに役立つ確率分布 1. 幾何分布(Geometric Distribution)の概要 幾何分布は、離散確率分布の一種で「ある試行を繰り返したときに、初めて成功が得られる試行回数に関する分布」を表します。 ビジネスの現場では「初回成功まで […]
06/28/2022 / 最終更新日時 : 01/17/2025 Blue マーケティング 多項分布とは?ビジネスの活用範囲の多い分布 多項分布って? 多項分布とは、複数のカテゴリにまたがって起こりうる事象を、一定回数の試行によって観測したときに、その観測結果がどのような確率で生じるかを表す分布です。 具体的には、サイコロを何度も振った場合に1の目が何回 […]
06/20/2022 / 最終更新日時 : 10/14/2024 Blue Python 【統計検定準一級】ランダムウォークとマルチンゲールの話。 こんにちは、青の統計学です。 統計検定準一級では、「この確立過程Sは、マルチンゲールかどうか?」という問題が出ることがあります。 マルコフ性と並んで登場する「マルチンゲール」に、とっつきにくさを感じた方も多いと思います。 […]
06/18/2022 / 最終更新日時 : 08/13/2025 Blue Python 共分散分析(ANCOVA)とは?回帰分析や分散分析との違いもわかりやすく解説 こんにちは、青の統計学です。 今回は、共分散分析について解説いたします。交絡因子等のバイアスを排除する上での便利な手法ですので、これを機にしっかり理解しましょう。 共分散分析の数学的背景 共分散分析を理解する上で、まずそ […]
06/13/2022 / 最終更新日時 : 02/20/2025 Blue 大学数学 【完全攻略】多重共線性をわかりやすく解説 多重共線性(Multicollinearity)とは 重回帰分析を勉強していると、最小二乗法の仮定の一つに「多重共線性がないこと」と見たことがあると思います。 冪乗項や交互作用項などを説明変数に入れて必然的に生じる多重共 […]
06/12/2022 / 最終更新日時 : 01/06/2025 Blue 医薬生物学 シンプソンズのパラドクスとは?──「部分」と「全体」で逆転する統計の落とし穴 「相関関係はあるが、因果関係があるとは限らない」——統計を学ぶ方なら必ず耳にする言葉ですが、「因果はあるのに相関が消えてしまう」という、より厄介な現象も存在します。それがシンプソンズのパラドクス (Simpson’s P […]
06/11/2022 / 最終更新日時 : 08/10/2025 Blue Python 差の差分析(DID)をわかりやすく解説:多期間DIDとサンプルサイズ計算まで こんにちは、青の統計学です 今回は、実務でもよく使われる「差の差分析」について解説いたします。社会科学系の授業でも紹介されますね。シンプルで理解しやすいかつ強力な分析手法ですが、並行トレンドの仮定など前提となるルールもあ […]
06/08/2022 / 最終更新日時 : 01/12/2025 Blue マーケティング 【GLMM】一般化線形混合モデルについてわかりやすく解説 1. 一般化線形モデル (GLM) と固定効果モデル まずは、前提知識を確認しましょう。 2. 一般化線形混合モデル (GLMM) の位置づけと特長 「GLMM = 一般化線形モデル + 混合効果」GLMM は、一般化線 […]
06/03/2022 / 最終更新日時 : 01/26/2025 Blue 医薬生物学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 1:AICとは何か AICは「複数の統計モデルのうち、どれがより予測に適しているか」を評価するために考案された指標です。 もし「当てはまりの良さ」だけを追求すると、パラメータを増やせば増やすほどモデルはデータにぴったり合 […]
06/03/2022 / 最終更新日時 : 09/16/2024 Blue Python ロジスティック回帰についてわかりやすく解説【二項分布】【統計検定】 ロジット関数とロジスティック関数 こんにちは、青の統計学です、 今回は、分類タスクの王道「ロジスティック回帰」について解説していきます。 しっかり復習したい方は、以下の記事をご覧ください。 基本は、線形回帰の拡張でしたね […]
05/31/2022 / 最終更新日時 : 11/26/2024 Blue Python ブートストラップ法についてわかりやすく解説|R ブートストラップ法(bootstrap method) ブートストラップ法とは、限られた標本データから母集団の特性を推定するための統計的リサンプリング手法です。 特徴は、データの復元抽出による多数のサンプルセットの生成に […]
05/27/2022 / 最終更新日時 : 08/14/2025 Blue Python 尤度比検定とは?わかりやすく解説|カイ2乗分布との関わり こんにちは、青の統計学です。 今回は様々な分野で活用されている尤度比検定について解説いたします。 バイオ系でもよく使われていますね。 概要をまずざっくりと理解したい方は、youtubeの聞き流しがおすすめです。 尤度比検 […]
05/19/2022 / 最終更新日時 : 09/14/2024 Blue 大学数学 トービットモデルとは?わかりやすく解説【潜在変数】|計量経済学 トービットモデル トービットモデルは、経済学や計量経済学で広く使用される回帰モデルの一種です。 このモデルは、従属変数が一定の値(通常は0)で切断されている状況を扱うためにつくられました。 モデルの基本構造と切断 トービ […]
05/17/2022 / 最終更新日時 : 08/13/2025 Blue マーケティング 【t検定】t統計量(t値)の求め方 t統計量(t value)について t統計量とは、t検定で使う検定統計量のことです。 t統計量は、回帰分析や仮説検定において重要な役割を果たす検定統計量です。特に、回帰係数の統計的有意性を評価する際に用いられます。 統計 […]
05/11/2022 / 最終更新日時 : 08/15/2025 Blue 大学数学 ベルマン方程式をわかりやすく解説|動的計画法 こんにちは、青の統計学です。 今回は、ベルマン方程式についてわかりやすく解説します。 ベルマン方程式とは ベルマン方程式は、「最適性の原理」を数学的に表現したものです。 最適性の原理とは、「ある時点での最適な意思決定は、 […]
05/06/2022 / 最終更新日時 : 09/19/2024 Blue Python 【統計検定準一級】回帰診断法とは?|残差プロットとleverageをわかりやすく解説 回帰診断法 回帰診断法は、回帰分析において誤差項の仮定が成立しているかどうかを評価する手法です。 仮定について詳しく深掘りたい方は、こちらを先に見た方がいいかもしれないです …で、これらの仮定を確認するために […]
05/04/2022 / 最終更新日時 : 09/15/2024 Blue 大学数学 層化抽出法の比例配分とネイマン配分をわかりやすく解説【統計検定準一級】 層化抽出法 層化抽出法は、母集団を互いに排反な部分集合(層)に分割し、各層から独立に標本を抽出する方法です。 統計検定二級では、調査手法の一つとして他の方法と比較できているかを問われていましたが、準一級では具体例を通して […]
05/04/2022 / 最終更新日時 : 08/22/2025 Blue 確率過程 【例題つき】固定効果推定と固定効果モデルについてわかりやすく解説|ランダム効果 よりお手軽に学習したい方は以下の聞き流し動画から聞いてみるのがおすすめです。 固定効果(fixed effect)とは まず、固定効果推定を行うのは「対象を複数時点で観察する」場合です。社会科学の分野では、パネルデータ分 […]
05/03/2022 / 最終更新日時 : 11/30/2024 Blue Python 【時系列】ARモデルをわかりやすく解説|Yule-Walker法や最尤法も こんにちは、青の統計学です。 今回解説するのは、時系列モデルの基礎であるARモデルです。 まずは数式を見てみましょう。 ARモデル(autoregression model) $$y_{n} = \sum_{j=1}^{ […]