06/30/2022 / 最終更新日時 : 01/25/2025 bluest Python コサイン類似度とは?高校数学で理解する 1. コサイン類似度とは? ベクトル同士の“方向の近さ”を測る指標 コサイン類似度(Cosine Similarity)とは、主に2つのベクトルがどのくらい同じ方向を向いているかを測定するための指標です。計算結果の値は- […]
06/29/2022 / 最終更新日時 : 01/19/2025 bluest 大学数学 コーシー分布とは?わかりやすく解説 1. コーシー分布とは?ざっくり解説 はじめに、コーシー分布は「重い裾(fat-tail)を持つ分布」として知られ、平均や分散が定義できないという面白い特徴を持っています。 確率論を学ぶと真っ先に登場する正規分布とは異な […]
06/29/2022 / 最終更新日時 : 01/19/2025 bluest マーケティング 対数正規分布とは?ビジネスで使える便利な確率分布 1. 対数正規分布とは? まず、抑えて欲しいのが 対数正規分布は、「ある変数 ${X}$ の対数 ${\ln(X)}$が正規分布に従う」ときに、変数${X}$そのものが従う分布のことです。より具体的には、確率変数${X} […]
06/28/2022 / 最終更新日時 : 02/08/2025 bluest ベイズ 混合ガウス分布とは?わかりやすく解説 はじめに 正規分布(ガウス分布)は、統計学や機械学習における基本的な確率分布であり、データが平均を中心に左右対称に分布する特徴を持ちます。この分布を拡張したもの混合ガウス分布(Gaussian Mixture Model […]
06/28/2022 / 最終更新日時 : 09/22/2024 bluest 統計学基礎 【等分散の仮定編】2標本問題をわかりやすく解説|推定と検定 こんにちは、青の統計学です。 今回は、2標本問題について扱います。 確率変数が2つ登場するため難しいですが、応用上用いられることが多いのが「2標本問題」です。 中でも今回は、二つの確率変数が同一の分散であると仮定した「等 […]
06/28/2022 / 最終更新日時 : 01/13/2025 bluest マーケティング 幾何分布とは?意外とビジネスに役立つ確率分布 1. 幾何分布(Geometric Distribution)の概要 幾何分布は、離散確率分布の一種で「ある試行を繰り返したときに、初めて成功が得られる試行回数に関する分布」を表します。 ビジネスの現場では「初回成功まで […]
06/28/2022 / 最終更新日時 : 01/17/2025 bluest マーケティング 多項分布とは?ビジネスの活用範囲の多い分布 多項分布って? 多項分布とは、複数のカテゴリにまたがって起こりうる事象を、一定回数の試行によって観測したときに、その観測結果がどのような確率で生じるかを表す分布です。 具体的には、サイコロを何度も振った場合に1の目が何回 […]
06/27/2022 / 最終更新日時 : 01/28/2025 bluest マーケティング ガンマ分布とは?リスク解析と保険数理に使える分布 ガンマ分布とは ガンマ分布とは、連続型の確率分布の一種で、主に「待ち時間」や「寿命」「損害額」などのモデリングに広く使われる分布です。その汎用性の高さが特徴的です。 ガンマ分布はふたつのパラメータ(しばしば形状パラメータ […]
06/25/2022 / 最終更新日時 : 11/29/2024 bluest ベイズ ベイズ推定をわかりやすく解説|事後分布から推定量を導く方法 ベイズ推定の目的 ベイズの定理からしっかり解説するので、これからベイズ推定について知見を深めたい人や、MCMC法を使ってベイズ推定をしたい方など、さまざまな人におすすめです。 ベイズの定理 まず第一にベイズ統計学は、経験 […]
06/24/2022 / 最終更新日時 : 11/07/2024 bluest 数理最適化 【MSEを最小化】ガウス・マルコフの定理と最良線形不偏推定量について 回帰分析等で算出した推定量を評価するとき、どのような指標があるでしょうか。 これまでは、一致性や不偏性を取り上げてきました。簡単に復習しましょう。 一致性(consistency):サンプル数を∞に近づけると、推定量はパ […]
06/22/2022 / 最終更新日時 : 09/11/2024 bluest Python 主成分分析(PCA)をわかりやすく解説【統計検定準一級】|python 主成分分析 青の統計学へようこそ。 今回は、教師なし学習の一つ「主成分分析」について解説いたします。 数学的背景まで掘り下げたコンテンツは以下になります。 【python】主成分分析(+回帰)の仕組みとコード例|教師なし […]
06/20/2022 / 最終更新日時 : 10/14/2024 bluest Python 【統計検定準一級】ランダムウォークとマルチンゲールの話。 こんにちは、青の統計学です。 統計検定準一級では、「この確立過程Sは、マルチンゲールかどうか?」という問題が出ることがあります。 マルコフ性と並んで登場する「マルチンゲール」に、とっつきにくさを感じた方も多いと思います。 […]
06/19/2022 / 最終更新日時 : 10/31/2023 bluest Python 【python】ガウス過程回帰の仕組みと実務での応用|ノンパラメトリック機械学習 こんにちは、青の統計学です。 今回はガウス過程回帰について解説いたします。 製造業の現場など、n=20やそこらぐらいのデータセットで予測を行う必要がある時によく使われます。 ガウス過程は少数データとの相性がよく、予測値の […]
06/18/2022 / 最終更新日時 : 09/09/2024 bluest Python 【python】共分散分析(ANCOVA)の基礎から応用まで|因果推論 共分散分析 共分散分析は、調整平均を用いて、共変量(covariate)の影響を考慮した上で、群間の平均値の差を検定する方法です。 分散分析(ANOVA)と似ていますが、共分散分析は共変量を考慮する点で異なります。 →こ […]
06/18/2022 / 最終更新日時 : 01/11/2025 bluest マーケティング UI/UX 改善における統計的アプローチ: ~サンプリング設計とベイズ推論の活用~ 1. UI/UX 改善と統計学の関係 ユーザーの操作感やインタラクションをより快適にするためのUI/UX改善は、データドリブンなアプローチができるようになってます。 たとえば「新しいボタン配置Aが既存配置Bよりもコンバー […]
06/15/2022 / 最終更新日時 : 04/27/2024 bluest 大学数学 【線形代数】固有値や固有ベクトルは機械学習にどう使われているのか|主成分分析 こんにちは、青の統計学です。 今回は、前回大好評だった「線形代数がデータサイエンスにどう使われているのかシリーズ」の第二弾です。 大学数学で勉強した固有値や固有ベクトルが一体何の役に立っているのか…対角化で冪 […]
06/15/2022 / 最終更新日時 : 05/05/2024 bluest 統計学基礎 【F値とは】分散分析による検定の多重性について|統計検定準1級 統計検定準一級では、2級同様「分散分析」の内容が出てきます。 今回は、前回と視点を変えた「検定の多重性」について解説します。 例題を通して理解していきましょう。 *確実に理解するために、ある程度時間をかけてみましょう。 […]
06/13/2022 / 最終更新日時 : 10/14/2024 bluest ベイズ 【ベイズ因子】オッズ比の使われ方を紹介します こんにちは、青の統計学です。 今回はロジスティック回帰の解釈で定番の、オッズ比について考えていきます。 オッズ比は二つのカテゴリに分けられるデータに対して有用な指標であり、特に、疾患や事象が発生する確率について研究する際 […]
06/13/2022 / 最終更新日時 : 11/14/2024 bluest 大学数学 【完全攻略】多重共線性をわかりやすく解説 多重共線性(Multicollinearity)とは 重回帰分析を勉強していると、最小二乗法の仮定の一つに「多重共線性がないこと」と見たことがあると思います。 冪乗項や交互作用項などを説明変数に入れて必然的に生じる多重共 […]
06/12/2022 / 最終更新日時 : 01/06/2025 bluest 医薬生物学 シンプソンズのパラドクスとは?──「部分」と「全体」で逆転する統計の落とし穴 「相関関係はあるが、因果関係があるとは限らない」——統計を学ぶ方なら必ず耳にする言葉ですが、「因果はあるのに相関が消えてしまう」という、より厄介な現象も存在します。それがシンプソンズのパラドクス (Simpson’s P […]
06/11/2022 / 最終更新日時 : 01/13/2024 bluest Python 【因果推論】差の差(DID)分析による平均処置効果の推定|計量経済学 こんにちは、青の統計学です 今回は、社会科学の分野でもよく使われる「差の差分析」について解説いたします。 シンプルで理解しやすいかつ強力な分析手法ですが、並行トレンドの仮定など前提となるルールもあります。 差の差分析(d […]
06/08/2022 / 最終更新日時 : 01/12/2025 bluest マーケティング 【GLMM】一般化線形混合モデルについてわかりやすく解説 1. 一般化線形モデル (GLM) と固定効果モデル まずは、前提知識を確認しましょう。 2. 一般化線形混合モデル (GLMM) の位置づけと特長 「GLMM = 一般化線形モデル + 混合効果」GLMM は、一般化線 […]
06/06/2022 / 最終更新日時 : 01/04/2025 bluest ベイズ 【尤度って?】尤度関数と最尤推定量の解説と例題 確率分布のパラメータ\(θ\)を推定する方法の一つとして、最尤推定というものがあります。 最尤推定には、尤度関数を使うことが必須です。まずは尤度関数については見てみましょう。 尤度(likelihood)について 抑えて […]
06/04/2022 / 最終更新日時 : 02/08/2025 bluest 大学数学 正規分布とは?図解と合わせわかりやすく解説 こんにちは、青の統計学です。 二項分布やポアソン分布のようなカウントデータを扱う離散分布の他に、連続データを扱う連続分布があります。 今回は、連続分布の代表格である「正規分布」について扱います。 確率密度に関する例題とと […]
06/03/2022 / 最終更新日時 : 01/26/2025 bluest 医薬生物学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 1:AICとは何か AICは「複数の統計モデルのうち、どれがより予測に適しているか」を評価するために考案された指標です。 もし「当てはまりの良さ」だけを追求すると、パラメータを増やせば増やすほどモデルはデータにぴったり合 […]
06/03/2022 / 最終更新日時 : 09/16/2024 bluest Python ロジスティック回帰についてわかりやすく解説【二項分布】【統計検定】 ロジット関数とロジスティック関数 こんにちは、青の統計学です、 今回は、分類タスクの王道「ロジスティック回帰」について解説していきます。 しっかり復習したい方は、以下の記事をご覧ください。 基本は、線形回帰の拡張でしたね […]
05/31/2022 / 最終更新日時 : 11/26/2024 bluest Python ブートストラップ法についてわかりやすく解説|R ブートストラップ法(bootstrap method) ブートストラップ法とは、限られた標本データから母集団の特性を推定するための統計的リサンプリング手法です。 特徴は、データの復元抽出による多数のサンプルセットの生成に […]
05/30/2022 / 最終更新日時 : 11/17/2024 bluest 統計学基礎 【統計検定2級】第一種の過誤と第二種の過誤について 今回は、統計検定2級で頻出の「第一種の過誤(type I error)と第二種の過誤(type II error)」について解説します。 仮説検定では、比較するモデル同士を帰無仮説と対立仮説に分けます。パラメーター数が少 […]
05/30/2022 / 最終更新日時 : 09/08/2024 bluest Python 【統計検定】ポアソン過程をわかりやすく解説|待ち行列理論 こんにちは、青の統計学です。 今回は統計検定準一級から登場する確立過程の一つ「ポアソン過程」について解説いたします。 このコンテンツに全て詰まっているのでブックマーク推奨です! 関わりの深い生存時間解析は、こちらで学習で […]
05/27/2022 / 最終更新日時 : 11/16/2024 bluest Python 【汎用性抜群】尤度比検定をわかりやすく解説します 尤度比検定(likelihood ratio test) 尤度比検定とは、汎用性の高い統計モデルの検定です。 専門的な用語抜きに説明すると、尤度比検定とは二つのモデルのうち、観測データをよりよく説明するのはどちらだろうか […]
05/24/2022 / 最終更新日時 : 09/16/2024 bluest Python 【GLM】一般化線形モデルをわかりやすく解説|ポアソン回帰 一般化線形モデル(generalized liner model) 今回はGLMと呼ばれる「一般化線形モデル(generalized liner model)」を解説します。 よく似た名前として、分散分析や共分散分析など […]
05/23/2022 / 最終更新日時 : 01/09/2025 bluest Python 分散分析と共分散分析:基礎からPython実装までわかりやすく解説 こんにちは、青の統計学です。 「分散分析(ANOVA)」と、そこからさらに一歩進んだ「共分散分析(ANCOVA)」について解説します。ビジネスシーンや研究、データ分析の現場でも活用範囲が広い手法であり、知っておくと有用で […]
05/20/2022 / 最終更新日時 : 05/05/2024 bluest 統計学基礎 【統計検定2級】分散分析の信頼区間について|python 統計検定2級の中でも手強い分野の一つ、「分散分析」を扱います。 中でも、分散分析の信頼区間は盲点になることが多いです。例題を通して学んでいきましょう。 分散分析について基礎から学びたい方は、以下のコンテンツをご覧ください […]