コンテンツへスキップ ナビゲーションに移動

青の統計学

  • 統計学
    • 統計学基礎
    • ベイズ
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料

Python

  1. HOME
  2. Python
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025 / 最終更新日時 : 03/18/2025 Gunjo.ai Python

スペクトラルクラスタリングとは?非線形データの分類

スペクトラルクラスタリングとは スペクトラルクラスタリングは、データポイント間の類似性に基づいてデータをグループ化する教師なし学習のアルゴリズムです。 特に類似性をグラフとして捉える、というのが特徴ですね。 従来のクラス […]

DBSCANとは?密度ベースのクラスタリング
03/16/2025 / 最終更新日時 : 03/16/2025 bluest Python

DBSCANとは?密度ベースのクラスタリングを解説

DBSCANとは? DBSCAN(Density-Based Spatial Clustering of Applications with Noise)は、密度ベースのクラスタリングアルゴリズムであり、データ点の密度に […]

グラフニューラルネットワークの基礎と応用事例
01/08/2025 / 最終更新日時 : 01/08/2025 bluest Python

グラフニューラルネットワークの基礎と応用事例

1. はじめに 我々の周囲に存在するデータは、必ずしも「画像 (2次元格子)」や「テキスト (系列構造)」のように整然としているわけではありません。ソーシャルネットワークや分子構造、交通ネットワークなど、多くの情報は「ノ […]

パレートの法則についてわかりやすく解説
01/07/2025 / 最終更新日時 : 02/12/2025 bluest Python

パレートの法則についてわかりやすく解説

1. パレートの法則とは? パレートの法則(Pareto Principle)は「全体の成果の80%が、全体を構成する要素の20%によってもたらされる」という経験則です。現代では、ビジネス領域の「選択と集中」やマーケティ […]

負の二項分布を実験に活かした具体例
01/04/2025 / 最終更新日時 : 01/28/2025 bluest Python

負の二項分布をわかりやすく解説

はじめに! 負の二項分布は、ポアソン分布や二項分布よりも過分散を扱いやすい柔軟なモデルとして知られています。 実験・観測データにしばしば見られる「期待値以上の分散」をうまく捉えることができ、免疫学や微生物学などの生物学的 […]

ベイズ因子をABテストに使ってみる
01/01/2025 / 最終更新日時 : 01/07/2025 bluest Python

ベイズ因子とは?──定義と直感的解釈

ベイズ因子 (Bayes Factor) は、2つの仮説 ${H_1, H_2}$​ の相対的な支持度を評価するための指標です。 とくに「帰無仮説 (null hypothesis) vs. 対立仮説 (alternat […]

マーケティングミックスモデリング(MMM)について理解
12/26/2024 / 最終更新日時 : 01/07/2025 bluest Python

【完全版】MMMを課題設定から考える|Google Meridian

Media Mix Model|MMM MMM は、過去の広告支出や売上データを用いて、各マーケティング施策が売上(KPI)にどの程度貢献したかを定量的に分析する手法です。これにより、予算配分の最適化や将来のマーケティン […]

時系列解析の一つ、SARIMAモデルについて理解する記事
11/30/2024 / 最終更新日時 : 12/01/2024 bluest Python

SARIMAモデルについてわかりやすく解説|定常時系列解析

SARIMAモデル SARIMA(Seasonal AutoRegressive Integrated Moving Average)モデルは、時系列データの予測に用いられるモデルです。時系列データに存在する、トレンド、 […]

Transformerでも使われるソフトマックス関数について解説する
04/21/2024 / 最終更新日時 : 11/26/2024 bluest Python

【Transformer】ソフトマックス関数についてわかりやすく解説|python

こんにちは、青の統計学です。 今日は、GPT等の生成AIモデルでも使われているtransformerの中にあるソフトマックス関数についてご紹介いたします。 そのほかの非線形変換について詳しく知りたい方は、以下のコンテンツ […]

状態空間モデルについてわかりやすく解説する
12/29/2023 / 最終更新日時 : 11/12/2024 bluest Python

【時系列】状態空間モデルをわかりやすく解説|カルマンフィルタの仕組み

こんにちは、青の統計学です。 今回は、状態空間モデルについて解説いたします。 MMMと並び広告効果の予測に使われたりと実務での応用も可能な時系列モデルですが、チューニングや実装の難易度が高いという点もあります。 状態の概 […]

12/21/2023 / 最終更新日時 : 11/17/2024 bluest Python

【AICで使う】KL divergence(カルバック-ライブラー情報量)をわかりやすく解説|python

こんにちは、今回はKL divergenceを解説します。 KL divergenceは、2つの確率分布間の相違を測定するために使用され、NLPにおける文書や単語の分布を比較する際に役立ちます。 レベル感としては、統計検 […]

k-medoidsとは?k-meansとの違いをわかりやすく解説
11/11/2023 / 最終更新日時 : 03/18/2025 bluest Python

k-medoidsとは?k-meansとの違いをわかりやすく解説

K-medoidsとは? K-medoidsは、データをグループ(クラスター)に分割するための教師なし学習アルゴリズムです。 この手法の基本的な目標は、データポイントを複数のクラスターに分割し、各クラスターが実際のデータ […]

分散不均一についての記事【青の統計学】
04/22/2023 / 最終更新日時 : 09/07/2024 bluest Python

【統計学】分散不均一だと何が問題なのか|不偏性とガウスマルコフ性について

こんにちは、青の統計学です。 今回は、分散均一と分散不均一について解説いたします。 推定量期待値の分散に関わる問題で、検定方法についても触れようと思います。 各種検定のチートシートは以下をクリック! 【最短】統計検定2級 […]

03/30/2023 / 最終更新日時 : 11/19/2023 bluest Python

【python】カーネルSVMとは?kernel関数を利用した非線形データの判別問題に挑戦|機械学習

こんにちは、青の統計学です。 今回は、判別タスクに関わる解決手法「カーネルSVM」をご紹介します。 判別タスクは、決定木やロジスティック回帰、線型SVM、k近傍法などたくさんあります。 カーネルSVMの特徴は、非線形デー […]

03/23/2023 / 最終更新日時 : 11/19/2023 bluest Python

【SHAP】スタッキング(stacking)で特徴量の解釈はできるのか|pythonアンサンブル学習

こんにちは、青の統計学です。 機械学習アルゴリズムの精度向上において、アンサンブル学習は非常に重要な役割を果たしています。 アンサンブル学習とは、複数の学習アルゴリズムを組み合わせることで、予測精度を向上させる手法です。 […]

03/18/2023 / 最終更新日時 : 04/22/2024 bluest Python

【python】活性化関数の完全ガイド|特徴と効果的な選び方について|勾配消失問題

こんにちは、青の統計学です。 ディープラーニングは、近年の技術革新において大きなインパクトをもたらしており、画像認識や自然言語処理など、多くの分野で広く利用されています。 このコンテンツでは、ディープラーニングの中心的な […]

畳み込みニューラルネットワークの解説
03/17/2023 / 最終更新日時 : 01/12/2025 bluest Python

【python】畳み込みニューラルネットワークによる画像判別プログラムの開発

畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)は、画像認識や物体検出などのコンピュータビジョンタスクに広く使用されるディープラーニングの一種です。 CNNは、局所的な […]

leave one outについてわかりやすく解説する
03/10/2023 / 最終更新日時 : 10/30/2024 bluest Python

【Leave-one-out】データ量が少ない時に使うクロスバリデーション|python

こんにちは、青の統計学です。 今回はデータ量が少ない時に有効な交差検証法の一種、Leave-one-outCVを紹介いたします。 Leave one out CV Leave-One-Out Cross-Validati […]

サムネイル
03/05/2023 / 最終更新日時 : 11/17/2023 bluest Python

【python】主成分分析(+回帰)の仕組みとコード例|教師なし学習

こんにちは、青の統計学です。 今回は教師なし学習の一つ「主成分分析」について解説いたします。 以下の記事よりも数学的背景を重めに取り扱っております。 【共線性解決!?】pythonで主成分分析(PCA)をやってみた 主成 […]

【SHAP】特徴量重要度や寄与度、限界効果を意思決定者にうまく伝えたい話|python
01/29/2023 / 最終更新日時 : 01/13/2025 bluest Python

【SHAP】特徴量重要度や寄与度、限界効果を意思決定者にうまく伝えたい話|python

これは直近仕事で抱えている問題を整理するために書き上げたコンテンツです。 今回は、prediction(予測)ではなくidentification(識別)に関する議論です。 kaggle等のコンペでは、予測に重きが置かれ […]

01/21/2023 / 最終更新日時 : 04/27/2024 bluest Python

【python】Lasso(ラッソ)回帰で疎なデータに対応しよう|機械学習

こんにちは、青の統計学です。 今回は、スパース学習の代表例である、Lasso(回帰)について解説いたします。 正則化項にL2ノルムを使う、リッジ回帰については、以下のコンテンツをご覧ください。 【python】Ridge […]

サムネイル
01/19/2023 / 最終更新日時 : 05/01/2023 bluest Python

【アンサンブル学習】ブートストラップ法をpythonで実装|バギング

今回は、ブートストラップ法を使って推定器を複数作り、予測値を出してみます。 pythonでの実装になるので、Rでの実装に興味がある方は以下のコンテンツをご覧ください。 【少ないデータを多く見せる】ブートストラップ法につい […]

12/27/2022 / 最終更新日時 : 08/26/2024 bluest Python

【kaggle】ベイズ最適化とXGBでtitanicの予測問題を解く|python

今回はハイパーパラメータのチューニング手法の一つである、ベイズ最適について解説いたします。 グリッドサーチやランダムサーチに比べて、短い時間で最適なパラメータを発見できるとされています。 また、今回はデータ分析コンペのk […]

変数変換のうちBoxCox変換をわかりやすく解説する
12/20/2022 / 最終更新日時 : 09/22/2024 bluest Python

【Box-Cox変換】様々な非線形変換について|python

今回は、モデル選択やパラメータチューニングの前に行う、特徴量エンジニアリングについて解説いたします。 中でも、非線形変換は特徴量の偏った分布を正規分布に近づけたりすることができ、高い精度につながることが多いです。 変数変 […]

サムネイル
12/20/2022 / 最終更新日時 : 04/27/2024 bluest Python

【判別問題】サポートベクトルマシン(SVM)の仕組み|python

今回は2値の判別問題で効果を発揮する、サポートベクトルマシン(support vector machine)について解説いたします。 数理最適化も扱うことになるのでいい勉強になると思います。 非線形分離に関しては以下のコ […]

サムネイル
12/18/2022 / 最終更新日時 : 05/01/2023 bluest Python

【ランダムフォレスト】ブートストラップ法を決定木に応用|python

今回は、決定木に対するバギングの拡張系アルゴリズムである「ランダムフォレスト(random forest)」を解説いたします。 アンサンブル手法のひとつである、バギングについても解説します。 決定木について復習したい方は […]

サムネイル
12/16/2022 / 最終更新日時 : 09/09/2023 bluest Python

【多変量解析】ROC曲線とAUCによる判別分析|python

機械学習の問題は回帰問題と分類問題に大別されます。 そして、分類問題の指標でよく扱われるかつ、不均衡問題で威力を発揮する「ROC曲線」と「AUC」について今回は解説していきます。 統計検定準一級の範囲にもしっかり入ってお […]

サムネイル
12/15/2022 / 最終更新日時 : 09/09/2024 bluest Python

【python】Ridge(リッジ)回帰で多重共線性を解決する話

リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を使って表現をしますが、 説明変数が増えるほど […]

12/07/2022 / 最終更新日時 : 11/11/2023 bluest Python

【XGB】交差検証法を使った勾配ブースティング決定木の実装|python

今回は、kaggleなどのデータ分析コンペでもよく使われる「勾配ブースティング決定木アルゴリズム」の解説を行います。 このコンテンツでわかること ・実際中身でどのような計算をしているのか ・コード例 勾配ブースティング決 […]

ニューラルネットワークを数学的背景を踏まえて解説
12/02/2022 / 最終更新日時 : 01/12/2025 bluest Python

【Sequential】Kerasを使ったニューラルネットワーク|python

こんにちは、青の統計学です。 今回はニューラルネットワークについて解説していきます。 【機械学習】単回帰分析をpythonで実装してみましょうで少し触れましたが、 目的変数に対して非線形活性化関数(例えばシグモイド関数) […]

サムネイル
11/30/2022 / 最終更新日時 : 11/11/2023 bluest Python

【機械学習】決定木の仕組みと実装方法について|python

今回は、決定木(Decision Tree)によるモデル構築方法をご紹介します。 決定木は、ある目的に到達するためにデータの書く属性の条件分岐を繰り返してクラス分けする方法です。 数学的な原理に加え、コードも紹介していき […]

単回帰分析をわかりやすく解説する記事【青の統計学】
11/15/2022 / 最終更新日時 : 11/28/2024 bluest Python

【機械学習】単回帰分析をわかりやすく解説|python

単回帰分析 教師あり学習 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変 […]

階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
09/14/2022 / 最終更新日時 : 03/18/2025 bluest Python

階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け

階層的クラスタリングとは? クラスタリングは、教師なし学習の基本的な手法の一つであり、類似したデータ点をグループ化することで、ラベル付けされていないデータから有益な情報を抽出する手法です。 中でも階層的クラスタリングは、 […]

投稿ナビゲーション

  • 固定ページ 1
  • 固定ページ 2
  • »

人気記事

統計検定2級の完全ガイド
統計検定3級の徹底攻略

Udemy

バナー広告

新サービス

青の統計学|X

Update Contents

統計検定2級の完全ガイド
統計検定2級の難易度と範囲を徹底解説【2025年最新版】
05/03/2025
自己組織化マップとは?データの視覚的探索と次元削減の手法
自己組織化マップとは?データの視覚的探索と次元削減の手法
03/18/2025
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
03/18/2025
k-medoidsとは?k-meansとの違いをわかりやすく解説
k-medoidsとは?k-meansとの違いをわかりやすく解説
03/18/2025
スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
03/15/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
03/15/2025
多重共線性を正しく理解する
【完全攻略】多重共線性をわかりやすく解説
02/20/2025
パレートの法則についてわかりやすく解説
パレートの法則についてわかりやすく解説
02/12/2025

New Contents

スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
02/25/2025
効果量とは?サンプルサイズ設計を実務で使うには
効果量とは?サンプルサイズ設計を実務で使うには
02/03/2025
統計的なサンプルサイズ設計の手引き
サンプルサイズ設計のガイド:基礎理論と実践をわかりやすく
01/10/2025
グラフニューラルネットワークの基礎と応用事例
グラフニューラルネットワークの基礎と応用事例
01/08/2025
パレートの法則についてわかりやすく解説
パレートの法則についてわかりやすく解説
01/07/2025
負の二項分布を実験に活かした具体例
負の二項分布をわかりやすく解説
01/04/2025
ベイズ因子をABテストに使ってみる
ベイズ因子とは?──定義と直感的解釈
01/01/2025
マーケティングミックスモデリング(MMM)について理解
【完全版】MMMを課題設定から考える|Google Meridian
12/26/2024

Tag Cloud

AIC F統計量 GBDT GLM K-means法 KL divergence MCMC法 MSE PCA p値 ridge回帰 t検定 カイ2乗分布 ガンマ分布 ブートストラップ法 ポアソン分布 マルコフ連鎖 ラグランジュの未定乗数法 ランダムウォーク ランダムフォレスト ロジスティック回帰 一様分布 不偏性 中心極限定理 二項分布 信頼区間 共分散 再生性 分散分析 回帰分析 固定効果 多重共線性 尤度比検定 尤度関数 層化抽出法 幾何分布 指数分布 最小二乗法 最尤法 標準偏差 標準誤差 正規分布 決定木 深層学習 相関係数

Recent

統計検定2級の完全ガイド
統計検定2級の難易度と範囲を徹底解説【2025年最新版】
05/03/2025
自己組織化マップとは?データの視覚的探索と次元削減の手法
自己組織化マップとは?データの視覚的探索と次元削減の手法
03/18/2025
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
03/18/2025
k-medoidsとは?k-meansとの違いをわかりやすく解説
k-medoidsとは?k-meansとの違いをわかりやすく解説
03/18/2025
スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
03/15/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
03/15/2025
多重共線性を正しく理解する
【完全攻略】多重共線性をわかりやすく解説
02/20/2025
パレートの法則についてわかりやすく解説
パレートの法則についてわかりやすく解説
02/12/2025

サイトマップはこちら

青の統計学|Follow Me!

チートシート

バナー広告


バナー広告

バナー広告
バナー広告
バナー広告
バナー広告

シミュレーション

サンプルサイズ設計ツールのサムネイル

問題演習

統計検定2級問題演習へのリンク
  • 統計学
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料

Copyright © 青の統計学 All Rights Reserved.

Powered by WordPress with Lightning Theme & VK All in One Expansion Unit

MENU

  • 統計学
    • 統計学基礎
    • ベイズ
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料
PAGE TOP