コンテンツへスキップ ナビゲーションに移動

青の統計学

  • 統計学
    • 統計学基礎
    • ベイズ
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料

Python

  1. HOME
  2. Python
サムネイル
08/02/2022 / 最終更新日時 : 02/07/2023 Blue Python

【N-gram】テキストをベクトルで表現するには | 自然言語処理

自然言語処理において、モデルへの入力はベクトルで与えることが想定されているので、テキストをモデルに変換する必要があります。 テキストをベクトルで表現するには、まず形態素解析などでテキストを単語に分割する必要があります。 […]

サムネイル
08/01/2022 / 最終更新日時 : 06/06/2023 Blue Python

【python】階層型クラスタリングとデンドログラムの実装について

クラスタリングには、階層型と非階層型があります。今回は、階層型のクラスタリングについて解説しようと思います。 実装で使うデータは、【共線性解決】pythonで主成分分析をやってみたでも使った、学生のテストのデータを使って […]

07/27/2022 / 最終更新日時 : 04/22/2024 Blue Python

【自然言語処理】検索クエリをベクトル空間に写像してクラスタリングしたい

こんにちは、青の統計学です。 筆者の業務で使うので、勉強がてらまとめていきます。 参考となるコードも紹介していますので、ぜひ最後までご覧ください。 タスクについて|検索クエリの分析について 以下のようなことに挑戦してみま […]

順位相関係数についてわかりやすく解説する
07/23/2022 / 最終更新日時 : 10/26/2024 Blue Python

【外れ値に対処】順位相関係数と相関係数の違いについて | python

相関係数は、外れ値があると大きく値が変わってしまうという特徴があり、正確な関係の把握が難しい場合があります。 そこで、外れ値に対処できる頑健(ロバスト)な相関係数が必要とされます。 それが、スピアマンの順位相関係数と呼ば […]

サムネイル
07/19/2022 / 最終更新日時 : 10/21/2023 Blue Python

【自然言語処理】単語の出現頻度を可視化させてみましょう | python

今回は、形態素解析した単語たちを出現頻度ごとに集計してグラフ化させてみます。 アンケートや問い合わせの文言から、どんなキーワードがユーザーの不満や満足に繋がっているのかという示唆を得られる点では、かなり実務的なスキルにな […]

マルコフ連鎖についてわかりやすく解説。
07/16/2022 / 最終更新日時 : 01/04/2025 Blue Python

マルコフ連鎖をわかりやすく解説【MCMC法への応用】

1. マルコフ連鎖の基本原理 1.1 マルコフ連鎖 マルコフ連鎖 (Markov Chain) は、確率過程の一種です。離散時間マルコフ連鎖を例にとると、時刻 ${t = 0, 1, 2, \dots}$ に観測される状 […]

Weltchのt検定をわかりやすく解説する
07/15/2022 / 最終更新日時 : 08/13/2025 Blue Python

【非等分散編】pythonでWelch(ウェルチ)のt検定をやってみた

2標本問題において、標本間の母分散が等しいという等分散の仮定は、限られた場でしか信憑性がありません。 今回は、標本間の母分散が異なるときに使えるWelchのt検定を学びましょう。 等分散の仮定を置いた2標本問題の方が簡単 […]

【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較
07/09/2022 / 最終更新日時 : 03/15/2025 Blue Python

【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較

クラスタリングのモチベーション クラスタリングは、似た特徴を持つデータをグループ分けすることで、顧客セグメンテーション、マーケティング戦略、異常検知などの幅広いビジネス課題に対応するための手法です。 データの集合をグルー […]

コレログラムの使い方と活用事例
07/05/2022 / 最終更新日時 : 11/03/2024 Blue Python

【周期性を掴もう】pythonでコレログラムを書いてみましょう

ヒストグラムや折れ線グラフなどはよく耳にしますが、「コレログラム」は聞いたことがないかたも多いと思います。 今回は統計検定2級や準一級でよく出る「コレログラム」についてまとめてみました。 統計検定のチートシートは以下をク […]

コサイン類似度を具体例も含めて解説する記事【青の統計学】
06/30/2022 / 最終更新日時 : 01/25/2025 Blue Python

コサイン類似度とは?高校数学で理解する

1. コサイン類似度とは? ベクトル同士の“方向の近さ”を測る指標 コサイン類似度(Cosine Similarity)とは、主に2つのベクトルがどのくらい同じ方向を向いているかを測定するための指標です。計算結果の値は- […]

自己組織化マップとは?データの視覚的探索と次元削減の手法
06/27/2022 / 最終更新日時 : 03/18/2025 Blue Python

自己組織化マップとは?データの視覚的探索と次元削減の手法

自己組織化マップとは? 自己組織化マップ(Self-Organizing Map,SOM)は、高次元のデータを2次元(時には1次元や3次元も)の格子状に配置されたニューロンの集合体に投影することで、データの可視化と理解を […]

主成分分析について数学的背景から解説する
06/22/2022 / 最終更新日時 : 09/11/2024 Blue Python

主成分分析(PCA)をわかりやすく解説【統計検定準一級】|python

主成分分析 青の統計学へようこそ。 今回は、教師なし学習の一つ「主成分分析」について解説いたします。 数学的背景まで掘り下げたコンテンツは以下になります。 【python】主成分分析(+回帰)の仕組みとコード例|教師なし […]

マルチンゲールについての数学的背景を解説
06/20/2022 / 最終更新日時 : 10/14/2024 Blue Python

【統計検定準一級】ランダムウォークとマルチンゲールの話。

こんにちは、青の統計学です。 統計検定準一級では、「この確立過程Sは、マルチンゲールかどうか?」という問題が出ることがあります。 マルコフ性と並んで登場する「マルチンゲール」に、とっつきにくさを感じた方も多いと思います。 […]

06/19/2022 / 最終更新日時 : 10/31/2023 Blue Python

【python】ガウス過程回帰の仕組みと実務での応用|ノンパラメトリック機械学習

こんにちは、青の統計学です。 今回はガウス過程回帰について解説いたします。 製造業の現場など、n=20やそこらぐらいのデータセットで予測を行う必要がある時によく使われます。 ガウス過程は少数データとの相性がよく、予測値の […]

【python】共分散分析(ANCOVA)の基礎から応用まで|因果推論
06/18/2022 / 最終更新日時 : 08/13/2025 Blue Python

共分散分析(ANCOVA)とは?回帰分析や分散分析との違いもわかりやすく解説

こんにちは、青の統計学です。 今回は、共分散分析について解説いたします。交絡因子等のバイアスを排除する上での便利な手法ですので、これを機にしっかり理解しましょう。 共分散分析の数学的背景 共分散分析を理解する上で、まずそ […]

差の差分析(DID)をわかりやすく解説:多期間DIDとサンプルサイズ計算まで
06/11/2022 / 最終更新日時 : 08/10/2025 Blue Python

差の差分析(DID)をわかりやすく解説:多期間DIDとサンプルサイズ計算まで

こんにちは、青の統計学です 今回は、実務でもよく使われる「差の差分析」について解説いたします。社会科学系の授業でも紹介されますね。シンプルで理解しやすいかつ強力な分析手法ですが、並行トレンドの仮定など前提となるルールもあ […]

ロジスティク回帰について数学的背景も踏まえて解説
06/03/2022 / 最終更新日時 : 09/16/2024 Blue Python

ロジスティック回帰についてわかりやすく解説【二項分布】【統計検定】

ロジット関数とロジスティック関数 こんにちは、青の統計学です、 今回は、分類タスクの王道「ロジスティック回帰」について解説していきます。 しっかり復習したい方は、以下の記事をご覧ください。 基本は、線形回帰の拡張でしたね […]

ブートストラップ法についてわかりやすく解説する
05/31/2022 / 最終更新日時 : 11/26/2024 Blue Python

ブートストラップ法についてわかりやすく解説|R

ブートストラップ法(bootstrap method) ブートストラップ法とは、限られた標本データから母集団の特性を推定するための統計的リサンプリング手法です。 特徴は、データの復元抽出による多数のサンプルセットの生成に […]

ポアソン過程を解説する記事【青の統計学】
05/30/2022 / 最終更新日時 : 09/08/2024 Blue Python

【統計検定】ポアソン過程をわかりやすく解説|待ち行列理論

こんにちは、青の統計学です。 今回は統計検定準一級から登場する確立過程の一つ「ポアソン過程」について解説いたします。 このコンテンツに全て詰まっているのでブックマーク推奨です! 関わりの深い生存時間解析は、こちらで学習で […]

尤度比検定の使い方を具体例を通して理解する
05/27/2022 / 最終更新日時 : 08/14/2025 Blue Python

尤度比検定とは?わかりやすく解説|カイ2乗分布との関わり

こんにちは、青の統計学です。 今回は様々な分野で活用されている尤度比検定について解説いたします。 バイオ系でもよく使われていますね。 概要をまずざっくりと理解したい方は、youtubeの聞き流しがおすすめです。 尤度比検 […]

一般化線形モデルについてのわかりやすい解説
05/24/2022 / 最終更新日時 : 09/16/2024 Blue Python

【GLM】一般化線形モデルをわかりやすく解説|ポアソン回帰

一般化線形モデル(generalized liner model) 今回はGLMと呼ばれる「一般化線形モデル(generalized liner model)」を解説します。 よく似た名前として、分散分析や共分散分析など […]

分散分析と共分散分析:基礎からPython実装までわかりやすく解説
05/23/2022 / 最終更新日時 : 08/13/2025 Blue Python

分散分析と共分散分析:基礎からPython実装までわかりやすく解説

こんにちは、青の統計学です。 「分散分析(ANOVA)」と、そこからさらに一歩進んだ「共分散分析(ANCOVA)」について解説します。ビジネスシーンや研究、データ分析の現場でも活用範囲が広い手法であり、知っておくと有用で […]

標準誤差について数学的背景から解説する
05/13/2022 / 最終更新日時 : 06/07/2025 Blue Python

【統計】標準誤差を例題を通してわかりやすく解説|python

統計検定などで、信頼区間を求めることは多くあります。 そこで必要なのが標準誤差という概念です。 分布によって誤差の作り方が異なったりするため厄介です。 丁寧に学んでいきましょう。 標準誤差(standard error) […]

分散と標準偏差を基礎から解説する
05/10/2022 / 最終更新日時 : 09/22/2024 Blue Python

【高校数学でわかる】分散と標準偏差をわかりやすく解説|散らばりの指標

分散(variance)と標準偏差(standard deviation) こんにちは、青の統計学です。 今回は、統計の基本である分散と標準偏差について解説していきます。 高校数学でも扱われる内容なので、高度な数学は必要 […]

回帰診断法についてのわかりやすい解説
05/06/2022 / 最終更新日時 : 09/19/2024 Blue Python

【統計検定準一級】回帰診断法とは?|残差プロットとleverageをわかりやすく解説

回帰診断法 回帰診断法は、回帰分析において誤差項の仮定が成立しているかどうかを評価する手法です。 仮定について詳しく深掘りたい方は、こちらを先に見た方がいいかもしれないです …で、これらの仮定を確認するために […]

ARモデルについてわかりやすく解説する記事
05/03/2022 / 最終更新日時 : 11/30/2024 Blue Python

【時系列】ARモデルをわかりやすく解説|Yule-Walker法や最尤法も

こんにちは、青の統計学です。 今回解説するのは、時系列モデルの基礎であるARモデルです。 まずは数式を見てみましょう。 ARモデル(autoregression model) $$y_{n} = \sum_{j=1}^{ […]

05/01/2022 / 最終更新日時 : 09/09/2024 Blue Python

【python】行列式や逆行列は機械学習でどう使われるのか|線形代数の活用方法

大学数学で習う線形代数は、統計学や機械学習ではどのように活用されているのでしょうか? なんとなく説明変数をたくさん書かなくても行ベクトル一つ書いておけば良いから楽、程度に考えているかもしれませんが、実はもっと役に立ってお […]

歪度と尖度をわかりやすく解説【青の統計学】
04/24/2022 / 最終更新日時 : 08/06/2025 Blue Python

【統計検定2級】歪度と尖度をわかりやすく解説|python

こんにちは、青の統計学です。 今回は尖度と歪度という2つの統計量をみてみましょう。 モーメントを使った算出式を使っておりますが、尖度と歪度の計算の仕方は色々あります。 歪度/skewness $$\frac{E[(x-μ […]

ポアソン過程を解説する記事【青の統計学】
04/23/2022 / 最終更新日時 : 08/17/2025 Blue Python

【統計学】ポアソン分布についてわかりやすく解説

 ポアソン分布(poisson distribution) 統計学および確率論で用いられるポアソン分布とは、ある事象が一定の時間内に発生する回数を表す離散確率分布です。 定数\( \lambda > 0\ […]

決定係数について使い方と注意点を丁寧に解説する
04/22/2022 / 最終更新日時 : 11/04/2024 Blue Python

【R^2】決定係数をわかりやすく説明|python

こんにちは、青の統計学です。 今回は、決定係数について解説します。 決定係数とは、作った回帰モデルはどの程度学習データと当てはまっているのか調べる方法の一つです。 統計検定2級に挑戦したい方は、こちらのnoteもぜひご覧 […]

投稿ナビゲーション

  • «
  • 固定ページ 1
  • 固定ページ 2

人気記事

統計検定2級の完全ガイド
青の統計学DsPlaygroundの販促バナー_統計検定2級
サムネイル_青の統計学_統計検定3級レベルの問題演習
統計検定3級の徹底攻略
青の統計学DsPlaygroundの販促バナー_G検定
青の統計学DsPlaygroundの販促バナー_数学入門
大学生向けのG検定の攻略記事のサムネイル

Youtube

Udemy

バナー広告

Ds Playground

青の統計学|X

Update Contents

【計量経済学】IPW推定量をわかりやすく解説|因果推論
【計量経済学】IPW推定量をわかりやすく解説|因果推論
08/30/2025
固定効果とランダム効果について比較する
【例題つき】固定効果推定と固定効果モデルについてわかりやすく解説|ランダム効果
08/22/2025
ゼロ過剰ポアソン分布について使い道と他の分布との違いを理解
ゼロ過剰ポアソン分布(ZIP分布)をわかりやすく解説
08/17/2025
ポアソン過程を解説する記事【青の統計学】
【統計学】ポアソン分布についてわかりやすく解説
08/17/2025
ベルマン方程式をわかりやすく解説|動的計画法
ベルマン方程式をわかりやすく解説|動的計画法
08/15/2025
F検定の使い方と数学的背景をわかりやすく解説する
F検定とは?F分布も含めてわかりやすく解説|分散分析
08/15/2025
第一種の過誤や第二種の過誤を正しく理解するための記事【青の統計学】
【仮説検定】第1種の過誤と第2種の過誤とは?
08/14/2025
尤度比検定の使い方を具体例を通して理解する
尤度比検定とは?わかりやすく解説|カイ2乗分布との関わり
08/14/2025
【python】共分散分析(ANCOVA)の基礎から応用まで|因果推論
共分散分析(ANCOVA)とは?回帰分析や分散分析との違いもわかりやすく解説
08/13/2025
分散分析と共分散分析:基礎からPython実装までわかりやすく解説
分散分析と共分散分析:基礎からPython実装までわかりやすく解説
08/13/2025

New Contents

【超入門】統計学とは?文系でもわかる『データを武器にする』ための第一歩
【超入門】統計学とは?文系でもわかる『データを武器にする』ための第一歩
08/07/2025
ローレンツ曲線・ジニ係数・パレート分布をまとめて理解|不平等を数学で捉える
ローレンツ曲線・ジニ係数・パレート分布をまとめて理解|不平等を数学で捉える
07/15/2025
【カイ2乗検定】独立性検定と適合度検定についてわかりやすく解説
【カイ2乗検定】独立性検定と適合度検定についてわかりやすく解説
06/23/2025
中心極限定理についてわかりやすく解説|大数の法則との違い
中心極限定理についてわかりやすく解説|大数の法則との違い
06/07/2025
大学生向けのG検定の攻略記事のサムネイル
【体験談】G検定は大学生でも受かる?合格率、難易度、試験範囲を徹底解説
05/17/2025
スペクトラルクラスタリングとは?非線形データの分類
スペクトラルクラスタリングとは?非線形データの分類
03/18/2025
DBSCANとは?密度ベースのクラスタリング
DBSCANとは?密度ベースのクラスタリングを解説
03/16/2025
確率密度関数とは?確率質量関数との違いも解説
確率密度関数とは?確率質量関数との違いも解説
02/25/2025
効果量とは?サンプルサイズ設計を実務で使うには
効果量とは?サンプルサイズ設計を実務で使うには
02/03/2025
統計的なサンプルサイズ設計の手引き
サンプルサイズ設計のガイド:基礎理論と実践をわかりやすく
01/10/2025

Tag Cloud

AIC F統計量 GBDT GLM K-means法 KL divergence MCMC法 MSE PCA p値 ridge回帰 t検定 カイ2乗分布 ガンマ分布 ポアソン分布 マルコフ連鎖 ラグランジュの未定乗数法 ランダムウォーク ランダムフォレスト ロジスティック回帰 一様分布 不偏性 中心極限定理 二項分布 信頼区間 傾向スコア 共分散 再生性 分散分析 回帰分析 固定効果 多重共線性 大数の法則 尤度関数 層化抽出法 幾何分布 指数分布 最小二乗法 最尤法 標準偏差 標準誤差 正規分布 決定木 深層学習 相関係数

Recent

【計量経済学】IPW推定量をわかりやすく解説|因果推論
【計量経済学】IPW推定量をわかりやすく解説|因果推論
08/30/2025
固定効果とランダム効果について比較する
【例題つき】固定効果推定と固定効果モデルについてわかりやすく解説|ランダム効果
08/22/2025
ゼロ過剰ポアソン分布について使い道と他の分布との違いを理解
ゼロ過剰ポアソン分布(ZIP分布)をわかりやすく解説
08/17/2025
ポアソン過程を解説する記事【青の統計学】
【統計学】ポアソン分布についてわかりやすく解説
08/17/2025
ベルマン方程式をわかりやすく解説|動的計画法
ベルマン方程式をわかりやすく解説|動的計画法
08/15/2025
F検定の使い方と数学的背景をわかりやすく解説する
F検定とは?F分布も含めてわかりやすく解説|分散分析
08/15/2025
第一種の過誤や第二種の過誤を正しく理解するための記事【青の統計学】
【仮説検定】第1種の過誤と第2種の過誤とは?
08/14/2025
尤度比検定の使い方を具体例を通して理解する
尤度比検定とは?わかりやすく解説|カイ2乗分布との関わり
08/14/2025
【python】共分散分析(ANCOVA)の基礎から応用まで|因果推論
共分散分析(ANCOVA)とは?回帰分析や分散分析との違いもわかりやすく解説
08/13/2025
分散分析と共分散分析:基礎からPython実装までわかりやすく解説
分散分析と共分散分析:基礎からPython実装までわかりやすく解説
08/13/2025

サイトマップはこちら

青の統計学|Follow Me!

青の統計学DsPlaygroundの販促バナー_統計検定2級
青の統計学DsPlaygroundの販促バナー_G検定

チートシート

バナー広告


バナー広告

バナー広告
バナー広告
バナー広告

シミュレーション

サンプルサイズ設計ツールのサムネイル

問題演習

統計検定2級問題演習へのリンク
  • 統計学
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料

Copyright © 青の統計学 All Rights Reserved.

Powered by WordPress with Lightning Theme & VK All in One Expansion Unit

MENU

  • 統計学
    • 統計学基礎
    • ベイズ
  • 機械学習
  • 統計検定対策
  • 大学の試験対策
  • マーケティング
  • DS Playground
  • 資料
PAGE TOP