コンテンツへスキップ ナビゲーションに移動

青の統計学

  • 統計学
    • 統計学基礎
    • ベイズ
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料

bluest

  1. HOME
  2. bluest
01/08/2023 / 最終更新日時 : 01/10/2025 bluest 大学数学

【統計検定】フィッシャー情報量とクラメール・ラオの不等式について解説|python

こんにちは、青の統計学です。 今回は、正規分布を例に取って、フィッシャー情報量とクラメール・ラオの不等式について深掘りできればと思います。 統計検定準一級の試験範囲にもなっておりますので、この機会に是非理解していきましょ […]

多重共線性について数学的背景から解説する
01/03/2023 / 最終更新日時 : 09/13/2024 bluest 社会科学

【論文解説】多重共線性は回帰分析にどのような影響を与えるのか

こんにちは、青の統計学です。 今回は、多重共線性への理解を深め、対処などを考察するために論文を読んでみました。 多変量解析をするとなると、大抵はマルチコ(多重共線性)の壁にあたります。 そこで正確な理解をした方が良いと感 […]

p値をわかりやすく解説する【青の統計学】
12/30/2022 / 最終更新日時 : 01/11/2025 bluest マーケティング

p値をわかりやすく解説|検出力を使った具体例

1. p値の定義と計算方法 1.1 p値の定義 p値 は、統計検定において次のように定義される数値です。 ここでいう「極端な値」とは、検定手法や両側検定・片側検定によって定義が変わります。 たとえば平均値に関する両側検定 […]

12/27/2022 / 最終更新日時 : 08/26/2024 bluest Python

【kaggle】ベイズ最適化とXGBでtitanicの予測問題を解く|python

今回はハイパーパラメータのチューニング手法の一つである、ベイズ最適について解説いたします。 グリッドサーチやランダムサーチに比べて、短い時間で最適なパラメータを発見できるとされています。 また、今回はデータ分析コンペのk […]

ラグランジュ未定乗数法を数学的背景から理解する
12/23/2022 / 最終更新日時 : 11/16/2024 bluest 大学数学

【例題付き】ラグランジュ未定乗数法の基本と応用をわかりやすく解説

ラグランジュの未定乗数法の基礎 ラグランジュの未定乗数法は、条件付き(制約付きともいう)最適化問題を解決するための数学的手法です。 条件付き最適化問題とは? ラグランジュ法を使うと、「ある制約条件を満たしながら、一番いい […]

変数変換のうちBoxCox変換をわかりやすく解説する
12/20/2022 / 最終更新日時 : 09/22/2024 bluest Python

【Box-Cox変換】様々な非線形変換について|python

今回は、モデル選択やパラメータチューニングの前に行う、特徴量エンジニアリングについて解説いたします。 中でも、非線形変換は特徴量の偏った分布を正規分布に近づけたりすることができ、高い精度につながることが多いです。 変数変 […]

サムネイル
12/20/2022 / 最終更新日時 : 04/27/2024 bluest Python

【判別問題】サポートベクトルマシン(SVM)の仕組み|python

今回は2値の判別問題で効果を発揮する、サポートベクトルマシン(support vector machine)について解説いたします。 数理最適化も扱うことになるのでいい勉強になると思います。 非線形分離に関しては以下のコ […]

サムネイル
12/18/2022 / 最終更新日時 : 05/01/2023 bluest Python

【ランダムフォレスト】ブートストラップ法を決定木に応用|python

今回は、決定木に対するバギングの拡張系アルゴリズムである「ランダムフォレスト(random forest)」を解説いたします。 アンサンブル手法のひとつである、バギングについても解説します。 決定木について復習したい方は […]

サムネイル
12/16/2022 / 最終更新日時 : 09/09/2023 bluest Python

【多変量解析】ROC曲線とAUCによる判別分析|python

機械学習の問題は回帰問題と分類問題に大別されます。 そして、分類問題の指標でよく扱われるかつ、不均衡問題で威力を発揮する「ROC曲線」と「AUC」について今回は解説していきます。 統計検定準一級の範囲にもしっかり入ってお […]

サムネイル
12/15/2022 / 最終更新日時 : 09/09/2024 bluest Python

【python】Ridge(リッジ)回帰で多重共線性を解決する話

リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を使って表現をしますが、 説明変数が増えるほど […]

12/07/2022 / 最終更新日時 : 11/11/2023 bluest Python

【XGB】交差検証法を使った勾配ブースティング決定木の実装|python

今回は、kaggleなどのデータ分析コンペでもよく使われる「勾配ブースティング決定木アルゴリズム」の解説を行います。 このコンテンツでわかること ・実際中身でどのような計算をしているのか ・コード例 勾配ブースティング決 […]

ニューラルネットワークを数学的背景を踏まえて解説
12/02/2022 / 最終更新日時 : 01/12/2025 bluest Python

【Sequential】Kerasを使ったニューラルネットワーク|python

こんにちは、青の統計学です。 今回はニューラルネットワークについて解説していきます。 【機械学習】単回帰分析をpythonで実装してみましょうで少し触れましたが、 目的変数に対して非線形活性化関数(例えばシグモイド関数) […]

サムネイル
11/30/2022 / 最終更新日時 : 11/11/2023 bluest Python

【機械学習】決定木の仕組みと実装方法について|python

今回は、決定木(Decision Tree)によるモデル構築方法をご紹介します。 決定木は、ある目的に到達するためにデータの書く属性の条件分岐を繰り返してクラス分けする方法です。 数学的な原理に加え、コードも紹介していき […]

ロジスティック分布とは?シグモイド関数との関わりも解説
11/27/2022 / 最終更新日時 : 01/29/2025 bluest 大学数学

ロジスティック分布とは?シグモイド関数との関わりも解説

1. ロジスティック分布の定義と基本性質 「ロジスティック回帰」「シグモイド関数」といったキーワードを聞くと、0 から 1 までの連続値を確率のように扱うイメージを持つ方が多いかもしれません。 たとえば「あるメールがスパ […]

単回帰分析をわかりやすく解説する記事【青の統計学】
11/15/2022 / 最終更新日時 : 11/28/2024 bluest Python

【機械学習】単回帰分析をわかりやすく解説|python

単回帰分析 教師あり学習 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変 […]

09/14/2022 / 最終更新日時 : 05/26/2024 bluest 情報技術者試験

【忙しい人のための】基本情報・応用情報の午前チートシート|総集編

このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシートです。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指します。 何の […]

階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
09/14/2022 / 最終更新日時 : 03/18/2025 bluest Python

階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け

階層的クラスタリングとは? クラスタリングは、教師なし学習の基本的な手法の一つであり、類似したデータ点をグループ化することで、ラベル付けされていないデータから有益な情報を抽出する手法です。 中でも階層的クラスタリングは、 […]

サムネイル
09/09/2022 / 最終更新日時 : 10/10/2022 bluest 情報技術者試験

【試験直前ッ】基本情報・応用情報の午前チートシート|テクノロジー編

このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]

09/08/2022 / 最終更新日時 : 12/10/2023 bluest 情報技術者試験

【試験直前ッ】基本情報・応用情報の午前チートシート|データベース&プログラミング編

このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]

09/06/2022 / 最終更新日時 : 10/25/2022 bluest 情報技術者試験

【試験直前ッ】基本情報・応用情報の午前チートシート|システム編

このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]

サムネイル
09/04/2022 / 最終更新日時 : 04/12/2023 bluest 情報技術者試験

【試験直前ッ】基本情報・応用情報の午前チートシート|ネットワーク編

このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]

サムネイル
09/04/2022 / 最終更新日時 : 10/25/2022 bluest 情報技術者試験

【試験直前ッ】基本情報・応用情報の午前チートシート|セキュリティ編

このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]

超幾何分布を正しく理解する
08/21/2022 / 最終更新日時 : 01/13/2025 bluest ベイズ

超幾何分布をわかりやすく解説|非復元抽出

1. 超幾何分布 1.1 超幾何分布とは 超幾何分布は、有限個からなる母集団から非復元抽出を行うときに、「特定の属性を持つ要素がサンプル中に何個含まれるか」を表す確率分布です。 例示:品質検査への応用 このとき、確率変数 […]

計量経済学でよく使われる、傾向スコアマッチングの解説
08/04/2022 / 最終更新日時 : 01/13/2025 bluest Python

【共変量の調整】傾向スコア・マッチングによる因果推論 | python

こんにちは、青の統計学です。今回は傾向スコアをご紹介します。 因果推論に必要な考え方ですので、しっかり習得しましょう。 傾向スコア (propensity score) 傾向スコアとは、群間比較研究において、介入を受けた […]

サムネイル
08/02/2022 / 最終更新日時 : 02/07/2023 bluest Python

【N-gram】テキストをベクトルで表現するには | 自然言語処理

自然言語処理において、モデルへの入力はベクトルで与えることが想定されているので、テキストをモデルに変換する必要があります。 テキストをベクトルで表現するには、まず形態素解析などでテキストを単語に分割する必要があります。 […]

サムネイル
08/01/2022 / 最終更新日時 : 06/06/2023 bluest Python

【python】階層型クラスタリングとデンドログラムの実装について

クラスタリングには、階層型と非階層型があります。今回は、階層型のクラスタリングについて解説しようと思います。 実装で使うデータは、【共線性解決】pythonで主成分分析をやってみたでも使った、学生のテストのデータを使って […]

07/27/2022 / 最終更新日時 : 04/22/2024 bluest Python

【自然言語処理】検索クエリをベクトル空間に写像してクラスタリングしたい

こんにちは、青の統計学です。 筆者の業務で使うので、勉強がてらまとめていきます。 参考となるコードも紹介していますので、ぜひ最後までご覧ください。 タスクについて|検索クエリの分析について 以下のようなことに挑戦してみま […]

07/24/2022 / 最終更新日時 : 10/31/2023 bluest 情報技術者試験

【基本情報技術者】N進法を使った問題

高校数学では、「0110を10進数に直しましょう」などのN進数の問題が扱われます。 ただ、一瞬で単元が終わり、理解ができず、そのまま忘れてしまった方も多いと思います。 また、N進数の問題は基本情報処理技術者試験でも出題さ […]

順位相関係数についてわかりやすく解説する
07/23/2022 / 最終更新日時 : 10/26/2024 bluest Python

【外れ値に対処】順位相関係数と相関係数の違いについて | python

相関係数は、外れ値があると大きく値が変わってしまうという特徴があり、正確な関係の把握が難しい場合があります。 そこで、外れ値に対処できる頑健(ロバスト)な相関係数が必要とされます。 それが、スピアマンの順位相関係数と呼ば […]

サムネイル
07/19/2022 / 最終更新日時 : 10/21/2023 bluest Python

【自然言語処理】単語の出現頻度を可視化させてみましょう | python

今回は、形態素解析した単語たちを出現頻度ごとに集計してグラフ化させてみます。 アンケートや問い合わせの文言から、どんなキーワードがユーザーの不満や満足に繋がっているのかという示唆を得られる点では、かなり実務的なスキルにな […]

マルコフ連鎖についてわかりやすく解説。
07/16/2022 / 最終更新日時 : 01/04/2025 bluest Python

マルコフ連鎖をわかりやすく解説【MCMC法への応用】

1. マルコフ連鎖の基本原理 1.1 マルコフ連鎖 マルコフ連鎖 (Markov Chain) は、確率過程の一種です。離散時間マルコフ連鎖を例にとると、時刻 ${t = 0, 1, 2, \dots}$ に観測される状 […]

Weltchのt検定をわかりやすく解説する
07/15/2022 / 最終更新日時 : 01/13/2025 bluest Python

【非等分散編】pythonでWelch(ウェルチ)のt検定をやってみた

2標本問題において、標本間の母分散が等しいという等分散の仮定は、限られた場でしか信憑性がありません。 今回は、標本間の母分散が異なるときに使えるWelchのt検定を学びましょう。 等分散の仮定を置いた2標本問題の方が簡単 […]

【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
07/09/2022 / 最終更新日時 : 03/15/2025 bluest Python

【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較

クラスタリングのモチベーション クラスタリングは、似た特徴を持つデータをグループ分けすることで、顧客セグメンテーション、マーケティング戦略、異常検知などの幅広いビジネス課題に対応するための手法です。 データの集合をグルー […]

投稿ナビゲーション

  • «
  • 固定ページ 1
  • 固定ページ 2
  • 固定ページ 3
  • 固定ページ 4
  • 固定ページ 5
  • »

人気記事

統計検定2級の完全ガイド
統計検定3級の徹底攻略

Udemy

バナー広告

新サービス

青の統計学|X

Update Contents

統計検定2級の完全ガイド
統計検定2級の難易度と範囲を徹底解説【2025年最新版】
05/03/2025
自己組織化マップとは?データの視覚的探索と次元削減の手法
自己組織化マップとは?データの視覚的探索と次元削減の手法
03/18/2025
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
03/18/2025
k-medoidsとは?k-meansとの違いをわかりやすく解説
k-medoidsとは?k-meansとの違いをわかりやすく解説
03/18/2025
スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
03/15/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
03/15/2025
多重共線性を正しく理解する
【完全攻略】多重共線性をわかりやすく解説
02/20/2025
パレートの法則についてわかりやすく解説
パレートの法則についてわかりやすく解説
02/12/2025

New Contents

スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
02/25/2025
効果量とは?サンプルサイズ設計を実務で使うには
効果量とは?サンプルサイズ設計を実務で使うには
02/03/2025
統計的なサンプルサイズ設計の手引き
サンプルサイズ設計のガイド:基礎理論と実践をわかりやすく
01/10/2025
グラフニューラルネットワークの基礎と応用事例
グラフニューラルネットワークの基礎と応用事例
01/08/2025
パレートの法則についてわかりやすく解説
パレートの法則についてわかりやすく解説
01/07/2025
負の二項分布を実験に活かした具体例
負の二項分布をわかりやすく解説
01/04/2025
ベイズ因子をABテストに使ってみる
ベイズ因子とは?──定義と直感的解釈
01/01/2025
マーケティングミックスモデリング(MMM)について理解
【完全版】MMMを課題設定から考える|Google Meridian
12/26/2024

Tag Cloud

AIC F統計量 GBDT GLM K-means法 KL divergence MCMC法 MSE PCA p値 ridge回帰 t検定 カイ2乗分布 ガンマ分布 ブートストラップ法 ポアソン分布 マルコフ連鎖 ラグランジュの未定乗数法 ランダムウォーク ランダムフォレスト ロジスティック回帰 一様分布 不偏性 中心極限定理 二項分布 信頼区間 共分散 再生性 分散分析 回帰分析 固定効果 多重共線性 尤度比検定 尤度関数 層化抽出法 幾何分布 指数分布 最小二乗法 最尤法 標準偏差 標準誤差 正規分布 決定木 深層学習 相関係数

Recent

統計検定2級の完全ガイド
統計検定2級の難易度と範囲を徹底解説【2025年最新版】
05/03/2025
自己組織化マップとは?データの視覚的探索と次元削減の手法
自己組織化マップとは?データの視覚的探索と次元削減の手法
03/18/2025
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け
03/18/2025
k-medoidsとは?k-meansとの違いをわかりやすく解説
k-medoidsとは?k-meansとの違いをわかりやすく解説
03/18/2025
スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
03/15/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
03/15/2025
多重共線性を正しく理解する
【完全攻略】多重共線性をわかりやすく解説
02/20/2025
パレートの法則についてわかりやすく解説
パレートの法則についてわかりやすく解説
02/12/2025

サイトマップはこちら

青の統計学|Follow Me!

チートシート

バナー広告


バナー広告

バナー広告
バナー広告
バナー広告
バナー広告

シミュレーション

サンプルサイズ設計ツールのサムネイル

問題演習

統計検定2級問題演習へのリンク
  • 統計学
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料

Copyright © 青の統計学 All Rights Reserved.

Powered by WordPress with Lightning Theme & VK All in One Expansion Unit

MENU

  • 統計学
    • 統計学基礎
    • ベイズ
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料
PAGE TOP