01/29/2023 / 最終更新日時 : 10/26/2025 Blue データ分析 【SHAP】特徴量重要度や寄与度、限界効果を意思決定者にうまく伝えたい話|python これは直近仕事で抱えている問題を整理するために書き上げたコンテンツです。 今回は、prediction(予測)ではなくidentification(識別)に関する議論です。 kaggle等のコンペでは、予測に重きが置かれ […]
01/28/2023 / 最終更新日時 : 10/26/2025 Blue 確率分布 【例題あり】一様分布についてわかりやすく解説 一様分布 一様分布は最もシンプルな連続確率分布の一つで、「同じ確率で起こる」という直感的な概念を数学的に表現したものです。 例えばこんな感じです。 では、早速みていきましょう。 連続型一様分布 一様分布の特徴の一つが、連 […]
01/21/2023 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【python】Lasso(ラッソ)回帰で疎なデータに対応しよう|機械学習 こんにちは、青の統計学です。 今回は、スパース学習の代表例である、Lasso(回帰)について解説いたします。 正則化項にL2ノルムを使う、リッジ回帰については、以下のコンテンツをご覧ください。 【python】Ridge […]
01/19/2023 / 最終更新日時 : 11/02/2025 Blue マーケティング 【計量経済学】IPW推定量をわかりやすく解説|因果推論 因果推論の手法「IPW推定量」をわかりやすく解説。IPW(逆確率重み付け)がなぜバイアスを補正できるのか、前提となる傾向スコアの役割から、潜在的アウトカムを用いた数学的背景、Horvitz-Thompson推定量まで、計量経済学の観点で紹介します。
01/13/2023 / 最終更新日時 : 11/08/2025 Blue マーケティング 回帰不連続デザイン(RDD)をわかりやすく解説【因果推論】 回帰不連続デザイン(RDD)を分かりやすく解説。セレクションバイアスへの対処法や局所的な平均処置効果(LATE)の推定など、因果推論の重要手法を傾向スコアとDIDとの差分を確認しながら、共に学びます。計量経済学やEBPMに興味がある人におすすめです。
01/08/2023 / 最終更新日時 : 10/26/2025 Blue 統計学 【統計検定】フィッシャー情報量とクラメール・ラオの不等式について解説|python こんにちは、青の統計学です。 今回は、正規分布を例に取って、フィッシャー情報量とクラメール・ラオの不等式について深掘りできればと思います。 統計検定準一級の試験範囲にもなっておりますので、この機会に是非理解していきましょ […]
01/03/2023 / 最終更新日時 : 10/26/2025 Blue 統計学 【論文解説】多重共線性は回帰分析にどのような影響を与えるのか こんにちは、青の統計学です。 今回は、多重共線性への理解を深め、対処などを考察するために論文を読んでみました。 多変量解析をするとなると、大抵はマルチコ(多重共線性)の壁にあたります。 そこで正確な理解をした方が良いと感 […]
12/30/2022 / 最終更新日時 : 10/26/2025 Blue 推定・検定 p値をわかりやすく解説|検出力を使った具体例 1. p値の定義と計算方法 1.1 p値の定義 p値 は、統計検定において次のように定義される数値です。 ここでいう「極端な値」とは、検定手法や両側検定・片側検定によって定義が変わります。 たとえば平均値に関する両側検定 […]
12/27/2022 / 最終更新日時 : 10/26/2025 Blue Python 【kaggle】ベイズ最適化とXGBでtitanicの予測問題を解く|python 今回はハイパーパラメータのチューニング手法の一つである、ベイズ最適について解説いたします。 グリッドサーチやランダムサーチに比べて、短い時間で最適なパラメータを発見できるとされています。 また、今回はデータ分析コンペのk […]
12/23/2022 / 最終更新日時 : 11/02/2025 Blue 数理最適化 【例題付き】ラグランジュ未定乗数法の基本と応用をわかりやすく解説 ラグランジュ未定乗数法の基本をわかりやすく解説。制約付き最適化問題とは何か、多次元での計算手順、ヘッセ行列による二次条件まで。経済学の効用最大化問題を例題に、具体的な解き方をステップバイステップで学びます。
12/20/2022 / 最終更新日時 : 10/26/2025 Blue Python 【Box-Cox変換】様々な非線形変換について|python 今回は、モデル選択やパラメータチューニングの前に行う、特徴量エンジニアリングについて解説いたします。 中でも、非線形変換は特徴量の偏った分布を正規分布に近づけたりすることができ、高い精度につながることが多いです。 変数変 […]
12/20/2022 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 【判別問題】サポートベクトルマシン(SVM)の仕組み|python 今回は2値の判別問題で効果を発揮する、サポートベクトルマシン(support vector machine)について解説いたします。 数理最適化も扱うことになるのでいい勉強になると思います。 非線形分離に関しては以下のコ […]
12/18/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【ランダムフォレスト】ブートストラップ法を決定木に応用|python 今回は、決定木に対するバギングの拡張系アルゴリズムである「ランダムフォレスト(random forest)」を解説いたします。 アンサンブル手法のひとつである、バギングについても解説します。 決定木について復習したい方は […]
12/16/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【多変量解析】ROC曲線とAUCによる判別分析|python 機械学習の問題は回帰問題と分類問題に大別されます。 そして、分類問題の指標でよく扱われるかつ、不均衡問題で威力を発揮する「ROC曲線」と「AUC」について今回は解説していきます。 統計検定準一級の範囲にもしっかり入ってお […]
12/15/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【python】Ridge(リッジ)回帰で多重共線性を解決する話 リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を使って表現をしますが、 説明変数が増えるほど […]
12/07/2022 / 最終更新日時 : 10/26/2025 Blue Python 【XGB】交差検証法を使った勾配ブースティング決定木の実装|python 今回は、kaggleなどのデータ分析コンペでもよく使われる「勾配ブースティング決定木アルゴリズム」の解説を行います。 このコンテンツでわかること ・実際中身でどのような計算をしているのか ・コード例 勾配ブースティング決 […]
12/02/2022 / 最終更新日時 : 11/07/2025 Blue 統計学 【確率分布の特徴を知りたい】モーメント法をわかりやすく解説 モーメント法とは?確率分布の平均や分散などの特徴を捉える「モーメント」を使い、パラメータを推定する仕組みを数学的背景から解説。統計検定準1級対策にも最適です。
11/30/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【機械学習】決定木の仕組みと実装方法について|python 今回は、決定木(Decision Tree)によるモデル構築方法をご紹介します。 決定木は、ある目的に到達するためにデータの書く属性の条件分岐を繰り返してクラス分けする方法です。 数学的な原理に加え、コードも紹介していき […]
11/27/2022 / 最終更新日時 : 11/03/2025 Blue 確率分布 ロジスティック分布とは?シグモイド関数との関わりも解説 ロジスティック分布の定義と性質をわかりやすく解説。なぜ累積分布関数がシグモイド関数になるのか、ロジスティック回帰や機械学習でどのように使われるのか、その数学的背景を学びます。
11/15/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【機械学習】単回帰分析をわかりやすく解説|python 単回帰分析 教師あり学習 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変 […]
09/14/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【忙しい人のための】基本情報・応用情報の午前チートシート|総集編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシートです。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指します。 何の […]
09/14/2022 / 最終更新日時 : 11/07/2025 Blue 教師なし学習 階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け 階層型クラスタリングとは?ウォード法、最短距離法、群平均法など7手法を徹底比較。メリット・デメリットからクラスタ形状、使い分けまで、デンドログラムと共に解説します。
09/09/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|テクノロジー編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
09/08/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|データベース&プログラミング編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
09/06/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|システム編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
09/04/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|ネットワーク編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
09/04/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|セキュリティ編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
08/21/2022 / 最終更新日時 : 10/26/2025 Blue 確率分布 超幾何分布をわかりやすく解説|非復元抽出 1. 超幾何分布 1.1 超幾何分布とは 超幾何分布は、有限個からなる母集団から非復元抽出を行うときに、「特定の属性を持つ要素がサンプル中に何個含まれるか」を表す確率分布です。 例示:品質検査への応用 このとき、確率変数 […]
08/04/2022 / 最終更新日時 : 10/29/2025 Blue マーケティング 【共変量の調整】傾向スコア・マッチングによる因果推論 | python 傾向スコア・マッチング(PSM)を用いて、共変量を調整しセレクションバイアスを除去する方法を解説。因果推論の基本的なアプローチであるPSMの理論と、具体的な分析手順を学び、介入効果をより正確に推定しましょう。
08/02/2022 / 最終更新日時 : 10/26/2025 Blue 機械学習 【N-gram】テキストをベクトルで表現するには | 自然言語処理 自然言語処理において、モデルへの入力はベクトルで与えることが想定されているので、テキストをモデルに変換する必要があります。 テキストをベクトルで表現するには、まず形態素解析などでテキストを単語に分割する必要があります。 […]
08/01/2022 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 【python】階層型クラスタリングとデンドログラムの実装について クラスタリングには、階層型と非階層型があります。今回は、階層型のクラスタリングについて解説しようと思います。 実装で使うデータは、【共線性解決】pythonで主成分分析をやってみたでも使った、学生のテストのデータを使って […]
07/27/2022 / 最終更新日時 : 10/26/2025 Blue 機械学習 【自然言語処理】検索クエリをベクトル空間に写像してクラスタリングしたい こんにちは、青の統計学です。 筆者の業務で使うので、勉強がてらまとめていきます。 参考となるコードも紹介していますので、ぜひ最後までご覧ください。 タスクについて|検索クエリの分析について 以下のようなことに挑戦してみま […]
07/24/2022 / 最終更新日時 : 10/26/2025 Blue 情報技術者試験 【基本情報技術者】N進法を使った問題 高校数学では、「0110を10進数に直しましょう」などのN進数の問題が扱われます。 ただ、一瞬で単元が終わり、理解ができず、そのまま忘れてしまった方も多いと思います。 また、N進数の問題は基本情報処理技術者試験でも出題さ […]