12/30/2022 / 最終更新日時 : 01/11/2025 bluest マーケティング p値をわかりやすく解説|検出力を使った具体例 1. p値の定義と計算方法 1.1 p値の定義 p値 は、統計検定において次のように定義される数値です。 ここでいう「極端な値」とは、検定手法や両側検定・片側検定によって定義が変わります。 たとえば平均値に関する両側検定 […]
12/23/2022 / 最終更新日時 : 11/16/2024 bluest 大学数学 【例題付き】ラグランジュ未定乗数法の基本と応用をわかりやすく解説 ラグランジュの未定乗数法の基礎 ラグランジュの未定乗数法は、条件付き(制約付きともいう)最適化問題を解決するための数学的手法です。 条件付き最適化問題とは? ラグランジュ法を使うと、「ある制約条件を満たしながら、一番いい […]
11/27/2022 / 最終更新日時 : 01/29/2025 bluest 大学数学 ロジスティック分布とは?シグモイド関数との関わりも解説 1. ロジスティック分布の定義と基本性質 「ロジスティック回帰」「シグモイド関数」といったキーワードを聞くと、0 から 1 までの連続値を確率のように扱うイメージを持つ方が多いかもしれません。 たとえば「あるメールがスパ […]
08/04/2022 / 最終更新日時 : 01/13/2025 bluest Python 【共変量の調整】傾向スコア・マッチングによる因果推論 | python こんにちは、青の統計学です。今回は傾向スコアをご紹介します。 因果推論に必要な考え方ですので、しっかり習得しましょう。 傾向スコア (propensity score) 傾向スコアとは、群間比較研究において、介入を受けた […]
07/16/2022 / 最終更新日時 : 01/04/2025 bluest Python マルコフ連鎖をわかりやすく解説【MCMC法への応用】 1. マルコフ連鎖の基本原理 1.1 マルコフ連鎖 マルコフ連鎖 (Markov Chain) は、確率過程の一種です。離散時間マルコフ連鎖を例にとると、時刻 ${t = 0, 1, 2, \dots}$ に観測される状 […]
07/09/2022 / 最終更新日時 : 03/15/2025 bluest Python 【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較 クラスタリングのモチベーション クラスタリングは、似た特徴を持つデータをグループ分けすることで、顧客セグメンテーション、マーケティング戦略、異常検知などの幅広いビジネス課題に対応するための手法です。 データの集合をグルー […]
07/05/2022 / 最終更新日時 : 11/03/2024 bluest Python 【周期性を掴もう】pythonでコレログラムを書いてみましょう ヒストグラムや折れ線グラフなどはよく耳にしますが、「コレログラム」は聞いたことがないかたも多いと思います。 今回は統計検定2級や準一級でよく出る「コレログラム」についてまとめてみました。 統計検定のチートシートは以下をク […]
06/28/2022 / 最終更新日時 : 01/13/2025 bluest マーケティング 幾何分布とは?意外とビジネスに役立つ確率分布 1. 幾何分布(Geometric Distribution)の概要 幾何分布は、離散確率分布の一種で「ある試行を繰り返したときに、初めて成功が得られる試行回数に関する分布」を表します。 ビジネスの現場では「初回成功まで […]
06/28/2022 / 最終更新日時 : 01/17/2025 bluest マーケティング 多項分布とは?ビジネスの活用範囲の多い分布 多項分布って? 多項分布とは、複数のカテゴリにまたがって起こりうる事象を、一定回数の試行によって観測したときに、その観測結果がどのような確率で生じるかを表す分布です。 具体的には、サイコロを何度も振った場合に1の目が何回 […]
06/20/2022 / 最終更新日時 : 10/14/2024 bluest Python 【統計検定準一級】ランダムウォークとマルチンゲールの話。 こんにちは、青の統計学です。 統計検定準一級では、「この確立過程Sは、マルチンゲールかどうか?」という問題が出ることがあります。 マルコフ性と並んで登場する「マルチンゲール」に、とっつきにくさを感じた方も多いと思います。 […]
06/18/2022 / 最終更新日時 : 09/09/2024 bluest Python 【python】共分散分析(ANCOVA)の基礎から応用まで|因果推論 共分散分析 共分散分析は、調整平均を用いて、共変量(covariate)の影響を考慮した上で、群間の平均値の差を検定する方法です。 分散分析(ANOVA)と似ていますが、共分散分析は共変量を考慮する点で異なります。 →こ […]
06/13/2022 / 最終更新日時 : 02/20/2025 bluest 大学数学 【完全攻略】多重共線性をわかりやすく解説 多重共線性(Multicollinearity)とは 重回帰分析を勉強していると、最小二乗法の仮定の一つに「多重共線性がないこと」と見たことがあると思います。 冪乗項や交互作用項などを説明変数に入れて必然的に生じる多重共 […]
06/12/2022 / 最終更新日時 : 01/06/2025 bluest 医薬生物学 シンプソンズのパラドクスとは?──「部分」と「全体」で逆転する統計の落とし穴 「相関関係はあるが、因果関係があるとは限らない」——統計を学ぶ方なら必ず耳にする言葉ですが、「因果はあるのに相関が消えてしまう」という、より厄介な現象も存在します。それがシンプソンズのパラドクス (Simpson’s P […]
06/11/2022 / 最終更新日時 : 01/13/2024 bluest Python 【因果推論】差の差(DID)分析による平均処置効果の推定|計量経済学 こんにちは、青の統計学です 今回は、社会科学の分野でもよく使われる「差の差分析」について解説いたします。 シンプルで理解しやすいかつ強力な分析手法ですが、並行トレンドの仮定など前提となるルールもあります。 差の差分析(d […]
06/08/2022 / 最終更新日時 : 01/12/2025 bluest マーケティング 【GLMM】一般化線形混合モデルについてわかりやすく解説 1. 一般化線形モデル (GLM) と固定効果モデル まずは、前提知識を確認しましょう。 2. 一般化線形混合モデル (GLMM) の位置づけと特長 「GLMM = 一般化線形モデル + 混合効果」GLMM は、一般化線 […]
06/03/2022 / 最終更新日時 : 01/26/2025 bluest 医薬生物学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 1:AICとは何か AICは「複数の統計モデルのうち、どれがより予測に適しているか」を評価するために考案された指標です。 もし「当てはまりの良さ」だけを追求すると、パラメータを増やせば増やすほどモデルはデータにぴったり合 […]
06/03/2022 / 最終更新日時 : 09/16/2024 bluest Python ロジスティック回帰についてわかりやすく解説【二項分布】【統計検定】 ロジット関数とロジスティック関数 こんにちは、青の統計学です、 今回は、分類タスクの王道「ロジスティック回帰」について解説していきます。 しっかり復習したい方は、以下の記事をご覧ください。 基本は、線形回帰の拡張でしたね […]
05/31/2022 / 最終更新日時 : 11/26/2024 bluest Python ブートストラップ法についてわかりやすく解説|R ブートストラップ法(bootstrap method) ブートストラップ法とは、限られた標本データから母集団の特性を推定するための統計的リサンプリング手法です。 特徴は、データの復元抽出による多数のサンプルセットの生成に […]
05/27/2022 / 最終更新日時 : 11/16/2024 bluest Python 【汎用性抜群】尤度比検定をわかりやすく解説します 尤度比検定(likelihood ratio test) 尤度比検定とは、汎用性の高い統計モデルの検定です。 専門的な用語抜きに説明すると、尤度比検定とは二つのモデルのうち、観測データをよりよく説明するのはどちらだろうか […]
05/19/2022 / 最終更新日時 : 09/14/2024 bluest 大学数学 トービットモデルとは?わかりやすく解説【潜在変数】|計量経済学 トービットモデル トービットモデルは、経済学や計量経済学で広く使用される回帰モデルの一種です。 このモデルは、従属変数が一定の値(通常は0)で切断されている状況を扱うためにつくられました。 モデルの基本構造と切断 トービ […]
05/17/2022 / 最終更新日時 : 01/29/2025 bluest マーケティング 【t検定】t統計量(t値)の求め方 t統計量(t value)について t統計量とは、t検定で使う検定統計量のことです。 t統計量は、回帰分析や仮説検定において重要な役割を果たす検定統計量です。特に、回帰係数の統計的有意性を評価する際に用いられます。 統計 […]
05/11/2022 / 最終更新日時 : 09/16/2024 bluest 大学数学 ベルマン方程式をわかりやすく解説|強化学習や動的計画法 こんにちは、青の統計学です。 今回は、ベルマン方程式についてわかりやすく解説します。 管理人は経済学部出身だったので動的計画法の文脈で学びました。 情報数理であれば、強化学習のアルゴリズムで学びますね。 こちらでも簡単に […]
05/06/2022 / 最終更新日時 : 09/19/2024 bluest Python 【統計検定準一級】回帰診断法とは?|残差プロットとleverageをわかりやすく解説 回帰診断法 回帰診断法は、回帰分析において誤差項の仮定が成立しているかどうかを評価する手法です。 仮定について詳しく深掘りたい方は、こちらを先に見た方がいいかもしれないです …で、これらの仮定を確認するために […]
05/04/2022 / 最終更新日時 : 09/15/2024 bluest 大学数学 層化抽出法の比例配分とネイマン配分をわかりやすく解説【統計検定準一級】 層化抽出法 層化抽出法は、母集団を互いに排反な部分集合(層)に分割し、各層から独立に標本を抽出する方法です。 統計検定二級では、調査手法の一つとして他の方法と比較できているかを問われていましたが、準一級では具体例を通して […]
05/04/2022 / 最終更新日時 : 11/16/2024 bluest 確率過程 【例題つき】固定効果推定と固定効果モデルについてわかりやすく解説|ランダム効果 固定効果(fixed effect)とは まず、固定効果推定を行うのは「対象を複数時点で観察する」場合です。社会科学の分野では、パネルデータ分析とよく言われていますね。 まず固定効果推定を使うための、モチベーションから確 […]
05/03/2022 / 最終更新日時 : 11/30/2024 bluest Python 【時系列】ARモデルをわかりやすく解説|Yule-Walker法や最尤法も こんにちは、青の統計学です。 今回解説するのは、時系列モデルの基礎であるARモデルです。 まずは数式を見てみましょう。 ARモデル(autoregression model) $$y_{n} = \sum_{j=1}^{ […]