03/18/2025 / 最終更新日時 : 10/28/2025 Gunjo.ai 教師なし学習 スペクトラルクラスタリングとは?非線形データの分類 スペクトラルクラスタリングとは?本記事では、非線形データ(半月形や同心円状)の分類を得意とする教師なし学習手法「スペクトラルクラスタリング」について、数学的背景(ラプラシアン行列、固有値分解)からPythonによる実装方法まで、k-meansとの比較を交えてわかりやすく解説します。
03/16/2025 / 最終更新日時 : 10/28/2025 Blue 教師なし学習 DBSCANとは?密度ベースのクラスタリングを解説 DBSCANとは?本記事では、密度ベースのクラスタリング手法「DBSCAN」について、k-meansとの違い(任意の形状のクラスタ検出、ノイズ識別)を明確にしながら、その仕組み(eps, MinPts, コアポイント)からPythonでの実装、パラメータの選び方までをわかりやすく解説します。
01/08/2025 / 最終更新日時 : 10/28/2025 Blue 機械学習 グラフニューラルネットワークの基礎と応用事例 グラフニューラルネットワーク(GNN)の基礎理論から、GCN, GraphSAGE, GATなど主要モデルの仕組みまでをわかりやすく解説。創薬・分子特性予測への応用事例や、PyTorch Geometricを使った実装コードも紹介します。
07/13/2024 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 重回帰分析をわかりやすく解説 – 目的変数と複数の説明変数の関係を分析する手法 重回帰分析とOLS 重回帰分析は、1つの目的変数と複数の説明変数の間の関係を分析する手法です。 具体的な定義の前に、使い道を確認しておきましょう。 重回帰分析は、実務においてさまざまな分野で広く用いられている統計的手法で […]
04/21/2024 / 最終更新日時 : 10/26/2025 Blue 機械学習 【Transformer】ソフトマックス関数についてわかりやすく解説|python こんにちは、青の統計学です。 今日は、GPT等の生成AIモデルでも使われているtransformerの中にあるソフトマックス関数についてご紹介いたします。 そのほかの非線形変換について詳しく知りたい方は、以下のコンテンツ […]
03/31/2024 / 最終更新日時 : 11/06/2025 Blue 機械学習 【深層生成モデル】VAEの仕組みをわかりやすく解説|ベイズ統計 VAE(変分オートエンコーダ)の仕組みをわかりやすく解説。深層生成モデルの基礎として、オートエンコーダとの違いから、潜在変数、変分下界(ELBO)、KLダイバージェンス、Reparameterization Trickまで数学的背景を交えて説明します。
11/17/2023 / 最終更新日時 : 10/26/2025 Blue データ分析 【API】Google Search Consoleから1000行以上の検索クエリを取得したい|Google Cloud こんにちは、青の統計学です。 今回は、掲題の通りサーチコンソールから検索クエリをたくさんとる方法についてまとめていきます。 業務で使う機会があったので備忘がわりです。 Google Cloudで行うこと Search c […]
11/11/2023 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 k-medoidsとは?k-meansとの違いをわかりやすく解説 K-medoidsとは? K-medoidsは、データをグループ(クラスター)に分割するための教師なし学習アルゴリズムです。 この手法の基本的な目標は、データポイントを複数のクラスターに分割し、各クラスターが実際のデータ […]
03/30/2023 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 【python】カーネルSVMとは?kernel関数を利用した非線形データの判別問題に挑戦|機械学習 こんにちは、青の統計学です。 今回は、判別タスクに関わる解決手法「カーネルSVM」をご紹介します。 判別タスクは、決定木やロジスティック回帰、線型SVM、k近傍法などたくさんあります。 カーネルSVMの特徴は、非線形デー […]
03/23/2023 / 最終更新日時 : 10/26/2025 Blue Python 【SHAP】スタッキング(stacking)で特徴量の解釈はできるのか|pythonアンサンブル学習 こんにちは、青の統計学です。 機械学習アルゴリズムの精度向上において、アンサンブル学習は非常に重要な役割を果たしています。 アンサンブル学習とは、複数の学習アルゴリズムを組み合わせることで、予測精度を向上させる手法です。 […]
03/18/2023 / 最終更新日時 : 10/26/2025 Blue 機械学習 【python】活性化関数の完全ガイド|特徴と効果的な選び方について|勾配消失問題 こんにちは、青の統計学です。 ディープラーニングは、近年の技術革新において大きなインパクトをもたらしており、画像認識や自然言語処理など、多くの分野で広く利用されています。 このコンテンツでは、ディープラーニングの中心的な […]
03/17/2023 / 最終更新日時 : 10/26/2025 Blue 機械学習 【python】畳み込みニューラルネットワークによる画像判別プログラムの開発 畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)は、画像認識や物体検出などのコンピュータビジョンタスクに広く使用されるディープラーニングの一種です。 CNNは、局所的な […]
03/10/2023 / 最終更新日時 : 10/26/2025 Blue Python 【Leave-one-out】データ量が少ない時に使うクロスバリデーション|python こんにちは、青の統計学です。 今回はデータ量が少ない時に有効な交差検証法の一種、Leave-one-outCVを紹介いたします。 Leave one out CV Leave-One-Out Cross-Validati […]
03/05/2023 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 【python】主成分分析(+回帰)の仕組みとコード例|教師なし学習 こんにちは、青の統計学です。 今回は教師なし学習の一つ「主成分分析」について解説いたします。 以下の記事よりも数学的背景を重めに取り扱っております。 【共線性解決!?】pythonで主成分分析(PCA)をやってみた 主成 […]
01/21/2023 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【python】Lasso(ラッソ)回帰で疎なデータに対応しよう|機械学習 こんにちは、青の統計学です。 今回は、スパース学習の代表例である、Lasso(回帰)について解説いたします。 正則化項にL2ノルムを使う、リッジ回帰については、以下のコンテンツをご覧ください。 【python】Ridge […]
12/27/2022 / 最終更新日時 : 10/26/2025 Blue Python 【kaggle】ベイズ最適化とXGBでtitanicの予測問題を解く|python 今回はハイパーパラメータのチューニング手法の一つである、ベイズ最適について解説いたします。 グリッドサーチやランダムサーチに比べて、短い時間で最適なパラメータを発見できるとされています。 また、今回はデータ分析コンペのk […]
12/23/2022 / 最終更新日時 : 11/02/2025 Blue 数理最適化 【例題付き】ラグランジュ未定乗数法の基本と応用をわかりやすく解説 ラグランジュ未定乗数法の基本をわかりやすく解説。制約付き最適化問題とは何か、多次元での計算手順、ヘッセ行列による二次条件まで。経済学の効用最大化問題を例題に、具体的な解き方をステップバイステップで学びます。
12/20/2022 / 最終更新日時 : 10/26/2025 Blue Python 【Box-Cox変換】様々な非線形変換について|python 今回は、モデル選択やパラメータチューニングの前に行う、特徴量エンジニアリングについて解説いたします。 中でも、非線形変換は特徴量の偏った分布を正規分布に近づけたりすることができ、高い精度につながることが多いです。 変数変 […]
12/20/2022 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 【判別問題】サポートベクトルマシン(SVM)の仕組み|python 今回は2値の判別問題で効果を発揮する、サポートベクトルマシン(support vector machine)について解説いたします。 数理最適化も扱うことになるのでいい勉強になると思います。 非線形分離に関しては以下のコ […]
12/18/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【ランダムフォレスト】ブートストラップ法を決定木に応用|python 今回は、決定木に対するバギングの拡張系アルゴリズムである「ランダムフォレスト(random forest)」を解説いたします。 アンサンブル手法のひとつである、バギングについても解説します。 決定木について復習したい方は […]
12/16/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【多変量解析】ROC曲線とAUCによる判別分析|python 機械学習の問題は回帰問題と分類問題に大別されます。 そして、分類問題の指標でよく扱われるかつ、不均衡問題で威力を発揮する「ROC曲線」と「AUC」について今回は解説していきます。 統計検定準一級の範囲にもしっかり入ってお […]
12/15/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【python】Ridge(リッジ)回帰で多重共線性を解決する話 リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を使って表現をしますが、 説明変数が増えるほど […]
12/07/2022 / 最終更新日時 : 10/26/2025 Blue Python 【XGB】交差検証法を使った勾配ブースティング決定木の実装|python 今回は、kaggleなどのデータ分析コンペでもよく使われる「勾配ブースティング決定木アルゴリズム」の解説を行います。 このコンテンツでわかること ・実際中身でどのような計算をしているのか ・コード例 勾配ブースティング決 […]
11/30/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【機械学習】決定木の仕組みと実装方法について|python 今回は、決定木(Decision Tree)によるモデル構築方法をご紹介します。 決定木は、ある目的に到達するためにデータの書く属性の条件分岐を繰り返してクラス分けする方法です。 数学的な原理に加え、コードも紹介していき […]
11/15/2022 / 最終更新日時 : 10/26/2025 Blue 教師あり学習 【機械学習】単回帰分析をわかりやすく解説|python 単回帰分析 教師あり学習 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変 […]
09/14/2022 / 最終更新日時 : 11/07/2025 Blue 教師なし学習 階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け 階層型クラスタリングとは?ウォード法、最短距離法、群平均法など7手法を徹底比較。メリット・デメリットからクラスタ形状、使い分けまで、デンドログラムと共に解説します。
08/02/2022 / 最終更新日時 : 10/26/2025 Blue 機械学習 【N-gram】テキストをベクトルで表現するには | 自然言語処理 自然言語処理において、モデルへの入力はベクトルで与えることが想定されているので、テキストをモデルに変換する必要があります。 テキストをベクトルで表現するには、まず形態素解析などでテキストを単語に分割する必要があります。 […]
08/01/2022 / 最終更新日時 : 11/09/2025 Blue 教師なし学習 階層型クラスタリングとデンドログラムを解説|k-means法との比較 階層型クラスタリング(ウォード法)を実装する方法を解説します。デンドログラム(樹形図)の作成方法と見方、k-means法との違いまで、教師なし学習の基礎をサンプルコード付きで学びましょう。
07/27/2022 / 最終更新日時 : 10/26/2025 Blue 機械学習 【自然言語処理】検索クエリをベクトル空間に写像してクラスタリングしたい こんにちは、青の統計学です。 筆者の業務で使うので、勉強がてらまとめていきます。 参考となるコードも紹介していますので、ぜひ最後までご覧ください。 タスクについて|検索クエリの分析について 以下のようなことに挑戦してみま […]
07/19/2022 / 最終更新日時 : 10/26/2025 Blue 機械学習 【自然言語処理】単語の出現頻度を可視化させてみましょう | python 今回は、形態素解析した単語たちを出現頻度ごとに集計してグラフ化させてみます。 アンケートや問い合わせの文言から、どんなキーワードがユーザーの不満や満足に繋がっているのかという示唆を得られる点では、かなり実務的なスキルにな […]
07/09/2022 / 最終更新日時 : 11/08/2025 Blue 教師なし学習 【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較 k-means法とは何か、そのアルゴリズムの仕組みやビジネスでの活用法をわかりやすく解説します。初期値問題や最適なクラスタ数kの決定方法(エルボー法)に加え、k-means++、X-means、ソフトk-meansなどの発展的手法も比較・紹介する完全ガイドです。
07/05/2022 / 最終更新日時 : 10/26/2025 Blue Python 【周期性を掴もう】pythonでコレログラムを書いてみましょう ヒストグラムや折れ線グラフなどはよく耳にしますが、「コレログラム」は聞いたことがないかたも多いと思います。 今回は統計検定2級や準一級でよく出る「コレログラム」についてまとめてみました。 統計検定のチートシートは以下をク […]
06/27/2022 / 最終更新日時 : 10/26/2025 Blue 教師なし学習 自己組織化マップとは?データの視覚的探索と次元削減の手法 自己組織化マップとは? 自己組織化マップ(Self-Organizing Map,SOM)は、高次元のデータを2次元(時には1次元や3次元も)の格子状に配置されたニューロンの集合体に投影することで、データの可視化と理解を […]