11/27/2022 / 最終更新日時 : 01/29/2025 Blue 大学数学 ロジスティック分布とは?シグモイド関数との関わりも解説 1. ロジスティック分布の定義と基本性質 「ロジスティック回帰」「シグモイド関数」といったキーワードを聞くと、0 から 1 までの連続値を確率のように扱うイメージを持つ方が多いかもしれません。 たとえば「あるメールがスパ […]
11/15/2022 / 最終更新日時 : 11/28/2024 Blue Python 【機械学習】単回帰分析をわかりやすく解説|python 単回帰分析 教師あり学習 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変 […]
08/21/2022 / 最終更新日時 : 01/13/2025 Blue ベイズ 超幾何分布をわかりやすく解説|非復元抽出 1. 超幾何分布 1.1 超幾何分布とは 超幾何分布は、有限個からなる母集団から非復元抽出を行うときに、「特定の属性を持つ要素がサンプル中に何個含まれるか」を表す確率分布です。 例示:品質検査への応用 このとき、確率変数 […]
08/04/2022 / 最終更新日時 : 01/13/2025 Blue Python 【共変量の調整】傾向スコア・マッチングによる因果推論 | python こんにちは、青の統計学です。今回は傾向スコアをご紹介します。 因果推論に必要な考え方ですので、しっかり習得しましょう。 傾向スコア (propensity score) 傾向スコアとは、群間比較研究において、介入を受けた […]
07/23/2022 / 最終更新日時 : 10/26/2024 Blue Python 【外れ値に対処】順位相関係数と相関係数の違いについて | python 相関係数は、外れ値があると大きく値が変わってしまうという特徴があり、正確な関係の把握が難しい場合があります。 そこで、外れ値に対処できる頑健(ロバスト)な相関係数が必要とされます。 それが、スピアマンの順位相関係数と呼ば […]
07/16/2022 / 最終更新日時 : 01/04/2025 Blue Python マルコフ連鎖をわかりやすく解説【MCMC法への応用】 1. マルコフ連鎖の基本原理 1.1 マルコフ連鎖 マルコフ連鎖 (Markov Chain) は、確率過程の一種です。離散時間マルコフ連鎖を例にとると、時刻 ${t = 0, 1, 2, \dots}$ に観測される状 […]
07/15/2022 / 最終更新日時 : 08/13/2025 Blue Python 【非等分散編】pythonでWelch(ウェルチ)のt検定をやってみた 2標本問題において、標本間の母分散が等しいという等分散の仮定は、限られた場でしか信憑性がありません。 今回は、標本間の母分散が異なるときに使えるWelchのt検定を学びましょう。 等分散の仮定を置いた2標本問題の方が簡単 […]
06/30/2022 / 最終更新日時 : 01/19/2025 Blue 統計学基礎 【期待値の応用】モーメント母関数(積率母関数)について 統計検定準一級には、積率母関数についての問題があります。 マクローリン展開や合成関数の微分の知識が必要なことから、避けられがちですが、使う分には便利なものです。 今回は、モーメント法と積率母関数について解説します。 統計 […]
06/29/2022 / 最終更新日時 : 06/07/2025 Blue 大学数学 コーシー分布とは?わかりやすく解説 1. コーシー分布とは?ざっくり解説 はじめに、コーシー分布は「重い裾(fat-tail)を持つ分布」として知られ、平均や分散が定義できないという面白い特徴を持っています。 確率論を学ぶと真っ先に登場する正規分布とは異な […]
06/29/2022 / 最終更新日時 : 01/19/2025 Blue マーケティング 対数正規分布とは?ビジネスで使える便利な確率分布 1. 対数正規分布とは? まず、抑えて欲しいのが 対数正規分布は、「ある変数 ${X}$ の対数 ${\ln(X)}$が正規分布に従う」ときに、変数${X}$そのものが従う分布のことです。より具体的には、確率変数${X} […]
06/28/2022 / 最終更新日時 : 02/08/2025 Blue ベイズ 混合ガウス分布とは?わかりやすく解説 はじめに 正規分布(ガウス分布)は、統計学や機械学習における基本的な確率分布であり、データが平均を中心に左右対称に分布する特徴を持ちます。この分布を拡張したもの混合ガウス分布(Gaussian Mixture Model […]
06/28/2022 / 最終更新日時 : 09/22/2024 Blue 統計学基礎 【等分散の仮定編】2標本問題をわかりやすく解説|推定と検定 こんにちは、青の統計学です。 今回は、2標本問題について扱います。 確率変数が2つ登場するため難しいですが、応用上用いられることが多いのが「2標本問題」です。 中でも今回は、二つの確率変数が同一の分散であると仮定した「等 […]
06/28/2022 / 最終更新日時 : 01/13/2025 Blue マーケティング 幾何分布とは?意外とビジネスに役立つ確率分布 1. 幾何分布(Geometric Distribution)の概要 幾何分布は、離散確率分布の一種で「ある試行を繰り返したときに、初めて成功が得られる試行回数に関する分布」を表します。 ビジネスの現場では「初回成功まで […]
06/28/2022 / 最終更新日時 : 01/17/2025 Blue マーケティング 多項分布とは?ビジネスの活用範囲の多い分布 多項分布って? 多項分布とは、複数のカテゴリにまたがって起こりうる事象を、一定回数の試行によって観測したときに、その観測結果がどのような確率で生じるかを表す分布です。 具体的には、サイコロを何度も振った場合に1の目が何回 […]
06/27/2022 / 最終更新日時 : 01/28/2025 Blue マーケティング ガンマ分布とは?リスク解析と保険数理に使える分布 ガンマ分布とは ガンマ分布とは、連続型の確率分布の一種で、主に「待ち時間」や「寿命」「損害額」などのモデリングに広く使われる分布です。その汎用性の高さが特徴的です。 ガンマ分布はふたつのパラメータ(しばしば形状パラメータ […]
06/24/2022 / 最終更新日時 : 11/07/2024 Blue 数理最適化 【MSEを最小化】ガウス・マルコフの定理と最良線形不偏推定量について 回帰分析等で算出した推定量を評価するとき、どのような指標があるでしょうか。 これまでは、一致性や不偏性を取り上げてきました。簡単に復習しましょう。 一致性(consistency):サンプル数を∞に近づけると、推定量はパ […]
06/22/2022 / 最終更新日時 : 09/11/2024 Blue Python 主成分分析(PCA)をわかりやすく解説【統計検定準一級】|python 主成分分析 青の統計学へようこそ。 今回は、教師なし学習の一つ「主成分分析」について解説いたします。 数学的背景まで掘り下げたコンテンツは以下になります。 【python】主成分分析(+回帰)の仕組みとコード例|教師なし […]
06/19/2022 / 最終更新日時 : 10/31/2023 Blue Python 【python】ガウス過程回帰の仕組みと実務での応用|ノンパラメトリック機械学習 こんにちは、青の統計学です。 今回はガウス過程回帰について解説いたします。 製造業の現場など、n=20やそこらぐらいのデータセットで予測を行う必要がある時によく使われます。 ガウス過程は少数データとの相性がよく、予測値の […]
06/18/2022 / 最終更新日時 : 08/13/2025 Blue Python 共分散分析(ANCOVA)とは?回帰分析や分散分析との違いもわかりやすく解説 こんにちは、青の統計学です。 今回は、共分散分析について解説いたします。交絡因子等のバイアスを排除する上での便利な手法ですので、これを機にしっかり理解しましょう。 共分散分析の数学的背景 共分散分析を理解する上で、まずそ […]
06/15/2022 / 最終更新日時 : 04/27/2024 Blue 大学数学 【線形代数】固有値や固有ベクトルは機械学習にどう使われているのか|主成分分析 こんにちは、青の統計学です。 今回は、前回大好評だった「線形代数がデータサイエンスにどう使われているのかシリーズ」の第二弾です。 大学数学で勉強した固有値や固有ベクトルが一体何の役に立っているのか…対角化で冪 […]
06/15/2022 / 最終更新日時 : 05/05/2024 Blue 統計学基礎 【F値とは】分散分析による検定の多重性について|統計検定準1級 統計検定準一級では、2級同様「分散分析」の内容が出てきます。 今回は、前回と視点を変えた「検定の多重性」について解説します。 例題を通して理解していきましょう。 *確実に理解するために、ある程度時間をかけてみましょう。 […]
06/13/2022 / 最終更新日時 : 02/20/2025 Blue 大学数学 【完全攻略】多重共線性をわかりやすく解説 多重共線性(Multicollinearity)とは 重回帰分析を勉強していると、最小二乗法の仮定の一つに「多重共線性がないこと」と見たことがあると思います。 冪乗項や交互作用項などを説明変数に入れて必然的に生じる多重共 […]
06/11/2022 / 最終更新日時 : 08/10/2025 Blue Python 差の差分析(DID)をわかりやすく解説:多期間DIDとサンプルサイズ計算まで こんにちは、青の統計学です 今回は、実務でもよく使われる「差の差分析」について解説いたします。社会科学系の授業でも紹介されますね。シンプルで理解しやすいかつ強力な分析手法ですが、並行トレンドの仮定など前提となるルールもあ […]
06/08/2022 / 最終更新日時 : 01/12/2025 Blue マーケティング 【GLMM】一般化線形混合モデルについてわかりやすく解説 1. 一般化線形モデル (GLM) と固定効果モデル まずは、前提知識を確認しましょう。 2. 一般化線形混合モデル (GLMM) の位置づけと特長 「GLMM = 一般化線形モデル + 混合効果」GLMM は、一般化線 […]
06/06/2022 / 最終更新日時 : 08/12/2025 Blue ベイズ 【尤度とは?】最尤法についてわかりやすく解説|最尤推定量 こんにちは、青の統計学です。 今回は、統計学の中で必須の知識「尤度」について解説いたします。 尤度とは? 確率と尤度の違い 確率は「あるモデルやパラメータが与えられたときに、特定のデータが得られる可能性」を表します。例え […]
06/04/2022 / 最終更新日時 : 02/08/2025 Blue 大学数学 正規分布とは?図解と合わせわかりやすく解説 こんにちは、青の統計学です。 二項分布やポアソン分布のようなカウントデータを扱う離散分布の他に、連続データを扱う連続分布があります。 今回は、連続分布の代表格である「正規分布」について扱います。 確率密度に関する例題とと […]
06/03/2022 / 最終更新日時 : 01/26/2025 Blue 医薬生物学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 1:AICとは何か AICは「複数の統計モデルのうち、どれがより予測に適しているか」を評価するために考案された指標です。 もし「当てはまりの良さ」だけを追求すると、パラメータを増やせば増やすほどモデルはデータにぴったり合 […]
06/03/2022 / 最終更新日時 : 09/16/2024 Blue Python ロジスティック回帰についてわかりやすく解説【二項分布】【統計検定】 ロジット関数とロジスティック関数 こんにちは、青の統計学です、 今回は、分類タスクの王道「ロジスティック回帰」について解説していきます。 しっかり復習したい方は、以下の記事をご覧ください。 基本は、線形回帰の拡張でしたね […]
05/31/2022 / 最終更新日時 : 11/26/2024 Blue Python ブートストラップ法についてわかりやすく解説|R ブートストラップ法(bootstrap method) ブートストラップ法とは、限られた標本データから母集団の特性を推定するための統計的リサンプリング手法です。 特徴は、データの復元抽出による多数のサンプルセットの生成に […]
05/30/2022 / 最終更新日時 : 08/14/2025 Blue 統計学基礎 【仮説検定】第1種の過誤と第2種の過誤とは? こんにちは、青の統計学です。 今回は、統計検定2級で頻出の「第一種の過誤(type I error)と第二種の過誤(type II error)」について解説します。 こちらの動画では、もっと簡単に解説しています。 前提 […]
05/27/2022 / 最終更新日時 : 08/14/2025 Blue Python 尤度比検定とは?わかりやすく解説|カイ2乗分布との関わり こんにちは、青の統計学です。 今回は様々な分野で活用されている尤度比検定について解説いたします。 バイオ系でもよく使われていますね。 概要をまずざっくりと理解したい方は、youtubeの聞き流しがおすすめです。 尤度比検 […]
05/24/2022 / 最終更新日時 : 09/16/2024 Blue Python 【GLM】一般化線形モデルをわかりやすく解説|ポアソン回帰 一般化線形モデル(generalized liner model) 今回はGLMと呼ばれる「一般化線形モデル(generalized liner model)」を解説します。 よく似た名前として、分散分析や共分散分析など […]
05/23/2022 / 最終更新日時 : 08/13/2025 Blue Python 分散分析と共分散分析:基礎からPython実装までわかりやすく解説 こんにちは、青の統計学です。 「分散分析(ANOVA)」と、そこからさらに一歩進んだ「共分散分析(ANCOVA)」について解説します。ビジネスシーンや研究、データ分析の現場でも活用範囲が広い手法であり、知っておくと有用で […]