03/31/2024 / 最終更新日時 : 04/04/2024 生成AI/GPT ベイズ 【深層生成モデル】VAEの仕組みをわかりやすく解説|ベイズ統計 こんにちは、青の統計学です。 今回は、深層生成モデルのVAEについて解説いたします。 ノイズに頑健な深層生成モデルとして、画像生成モデルとして利用されているので、生成AIの利用が広まってきた今勉強する価値ありです! VA […]
01/16/2024 / 最終更新日時 : 01/16/2024 生成AI/GPT 大学数学 【数理統計学】ヤコビアンをわかりやすく解説|MCMCでの使用例 こんにちは、青の統計学です。 今回は、数理統計学で必須の知識「ヤコビアン」について学習していきます。 最初はなかなか理解が難しいかもしれませんが、MCMC法等の変数変換が必要な統計解析手法では必ず出てくる行列式です。 関 […]
01/06/2024 / 最終更新日時 : 01/14/2024 生成AI/GPT 推測統計学 【統計検定】確率分布のモーメント(積率)母関数完全ガイド|導出チートシート こんにちは、青の統計学です。 今回は、統計検定のチートシート番外編として、確率分布についてまとめようと思います。 各確率分布のモーメント母関数(積率母関数)が求められると、期待値と分散が計算できるようになります。 計算量 […]
12/21/2023 / 最終更新日時 : 03/31/2024 生成AI/GPT NLP 【AICで使う】KL divergence(カルバック-ライブラー情報量)をわかりやすく解説|python こんにちは、今回はKL divergenceを解説します。 KL divergenceは、2つの確率分布間の相違を測定するために使用され、NLPにおける文書や単語の分布を比較する際に役立ちます。 レベル感としては、統計検 […]
11/12/2023 / 最終更新日時 : 01/17/2024 生成AI/GPT 推測統計学 【GPTs】GPT Builder使って面接練習用のGPTを作成してみた こんにちは青の統計学です。 今回はGPTsを使って、日本企業の面接用のGPTを作成してみました。 *本GPTは、BizAIという生成メディアを運営する玉垣様よりご紹介いただきました! こちらも合わせてお読みいただければと […]
11/11/2023 / 最終更新日時 : 03/31/2024 生成AI/GPT 推測統計学 【やや細かい】G検定のチートシート|最短合格 こんにちは、青の統計学です。 今回は、ディープラーニングG検定のチートシートをご紹介します。 ただ、G検定で扱う主要内容だとすでに青の統計学にほぼ網羅されております。 今回は中でも細かい項目を紹介するという「ある程度学習 […]
10/12/2023 / 最終更新日時 : 02/02/2024 生成AI/GPT 大学数学 【最短】統計検定2級合格ロードマップとチートシート|おすすめの本について こんにちは、青の統計学です。 今回は、統計検定2級を合格するために参考になる本とチートシートをご紹介します。 統計検定準一級については以下をご覧くださいませ。 【最短合格】統計検定準一級のチートシート|難易度や出題範囲に […]
09/03/2023 / 最終更新日時 : 02/02/2024 生成AI/GPT ベイズ 【第2弾】統計検定準1級のチートシート|最短合格への道 こんにちは、青の統計学です。 こちらの記事だけでは、紹介しきれない内容があったため第二弾のチートシートになります。 【最短合格】統計検定準一級のチートシート|難易度や出題範囲について 統計検定2級はこちら→【最短】統計検 […]
08/06/2023 / 最終更新日時 : 01/07/2024 生成AI/GPT 大学数学 【最短合格】統計検定準一級のチートシート|難易度や出題範囲について こんにちは、青の統計学です。 今回は、統計検定準一級のチートシートをご紹介します。 第二弾はこちら→【第2弾】統計検定準1級のチートシート|最短合格への道 統計検定2級はこちら→【最短】統計検定2級合格ロードマップとチー […]
05/07/2023 / 最終更新日時 : 01/22/2024 生成AI/GPT 推測統計学 【忙しい方に】TOEICの英単語チートシート こんにちは、青の統計学です。 今日はデータサイエンスの話題からは一旦離れ、自分の備忘用としてTOEICの英単語チートシートを作成しました。 TOEICとして使われる意味合い(ビジネス英語より..?)なので、他の意味もある […]
04/22/2023 / 最終更新日時 : 12/17/2023 生成AI/GPT Python 【統計学】分散不均一だと何が問題なのか|不偏性とガウスマルコフ性について こんにちは、青の統計学です。 今回は、分散均一と分散不均一について解説いたします。 推定量期待値の分散に関わる問題で、検定方法についても触れようと思います。 各種検定のチートシートは以下をクリック! 【最短】統計検定2級 […]
03/30/2023 / 最終更新日時 : 11/19/2023 生成AI/GPT Python 【python】カーネルSVMとは?kernel関数を利用した非線形データの判別問題に挑戦|機械学習 こんにちは、青の統計学です。 今回は、判別タスクに関わる解決手法「カーネルSVM」をご紹介します。 判別タスクは、決定木やロジスティック回帰、線型SVM、k近傍法などたくさんあります。 カーネルSVMの特徴は、非線形デー […]
03/23/2023 / 最終更新日時 : 11/19/2023 生成AI/GPT Python 【SHAP】スタッキング(stacking)で特徴量の解釈はできるのか|pythonアンサンブル学習 こんにちは、青の統計学です。 機械学習アルゴリズムの精度向上において、アンサンブル学習は非常に重要な役割を果たしています。 アンサンブル学習とは、複数の学習アルゴリズムを組み合わせることで、予測精度を向上させる手法です。 […]
03/10/2023 / 最終更新日時 : 04/13/2024 生成AI/GPT Python 【Leave-one-out】データ量が少ない時に使うクロスバリデーション|python こんにちは、青の統計学です。 今回はデータ量が少ない時に有効な交差検証法の一種、Leave-one-outCVを紹介いたします。 Leave one out CV Leave-One-Out Cross-Validati […]
03/05/2023 / 最終更新日時 : 11/17/2023 生成AI/GPT Python 【python】主成分分析(+回帰)の仕組みとコード例|教師なし学習 こんにちは、青の統計学です。 今回は教師なし学習の一つ「主成分分析」について解説いたします。 以下の記事よりも数学的背景を重めに取り扱っております。 【共線性解決!?】pythonで主成分分析(PCA)をやってみた 主成 […]
01/29/2023 / 最終更新日時 : 04/13/2024 生成AI/GPT Python 【SHAP】特徴量重要度や寄与度、限界効果を意思決定者にうまく伝えたい話|python これは直近仕事で抱えている問題を整理するために書き上げたコンテンツです。 今回は、prediction(予測)ではなくidentification(識別)に関する議論です。 kaggle等のコンペでは、予測に重きが置かれ […]
01/28/2023 / 最終更新日時 : 01/19/2024 生成AI/GPT Python 【python】尤度比検定で統計モデルの比較をしよう|統計的仮説検定 こんにちは、青の統計学です。 今回は、汎用性抜群な尤度比検定について解説いたします。 Rで解説したものコンテンツは以下になります。 【汎用性抜群】尤度比検定を解説します|R 尤度比検定(likelihood ratio […]
01/21/2023 / 最終更新日時 : 11/01/2023 生成AI/GPT Python 【python】Lasso(ラッソ)回帰で疎なデータに対応しよう|機械学習 こんにちは、青の統計学です。 今回は、スパース学習の代表例である、Lasso(回帰)について解説いたします。 正則化項にL2ノルムを使う、リッジ回帰については、以下のコンテンツをご覧ください。 【python】Ridge […]
01/19/2023 / 最終更新日時 : 05/01/2023 生成AI/GPT Python 【アンサンブル学習】ブートストラップ法をpythonで実装|バギング 今回は、ブートストラップ法を使って推定器を複数作り、予測値を出してみます。 pythonでの実装になるので、Rでの実装に興味がある方は以下のコンテンツをご覧ください。 【少ないデータを多く見せる】ブートストラップ法につい […]
01/08/2023 / 最終更新日時 : 11/19/2023 生成AI/GPT 大学数学 【統計検定】フィッシャー情報量とクラメール・ラオの不等式について解説|python こんにちは、青の統計学です。 今回は、正規分布を例に取って、フィッシャー情報量とクラメール・ラオの不等式について深掘りできればと思います。 統計検定準一級の試験範囲にもなっておりますので、この機会に是非理解していきましょ […]
01/03/2023 / 最終更新日時 : 02/11/2024 生成AI/GPT 推測統計学 【論文解説】多重共線性は回帰分析にどのような影響を与えるのか こんにちは、青の統計学です。 今回は、多重共線性への理解を深め、対処などを考察するために論文を読んでみました。 多変量解析をするとなると、大抵はマルチコ(多重共線性)の壁にあたります。 そこで正確な理解をした方が良いと感 […]
12/30/2022 / 最終更新日時 : 01/19/2024 生成AI/GPT 推測統計学 【仮説検定】p値をゼロから解説(第一種の過誤,第二種の過誤,検出力) こんにちは、青の統計学です。 p値や有意水準の意味を正しく理解しているでしょうか? 実験計画や分析報告等で、正しく指標を使うためにも統計的仮説検定の正確な理解はとても大事です。 結論を語りますが、P値や有意性は、効果の大 […]
12/20/2022 / 最終更新日時 : 01/16/2024 生成AI/GPT Python 【Box-Cox変換】様々な非線形変換について|python 今回は、モデル選択やパラメータチューニングの前に行う、特徴量エンジニアリングについて解説いたします。 中でも、非線形変換は特徴量の偏った分布を正規分布に近づけたりすることができ、高い精度につながることが多いです。 変数変 […]
12/20/2022 / 最終更新日時 : 11/11/2023 生成AI/GPT Python 【判別問題】サポートベクトルマシン(SVM)の仕組み|python 今回は2値の判別問題で効果を発揮する、サポートベクトルマシン(support vector machine)について解説いたします。 数理最適化も扱うことになるのでいい勉強になると思います。 非線形分離に関しては以下のコ […]
12/15/2022 / 最終更新日時 : 03/22/2023 生成AI/GPT Python 【python】Ridge(リッジ)回帰で多重共線性を解決する話 今回は、リッジ回帰について解説いたします。 リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を […]
11/27/2022 / 最終更新日時 : 02/29/2024 生成AI/GPT Python 【分類タスク】ロジスティック回帰の使い方|python 重回帰モデルは、1つの目的変数に対して、説明変数が複数あるモデルです。 今回ご紹介する、「ロジスティック回帰」は目的変数が数値型ではなく、「Yes or No」の2値であるということが最大の特徴です。 pythonではな […]
11/15/2022 / 最終更新日時 : 05/24/2023 生成AI/GPT Python 【機械学習】単回帰分析をpythonで実装してみましょう 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変数や説明変数があり、あらか […]
08/04/2022 / 最終更新日時 : 12/10/2023 生成AI/GPT Python 【共変量の調整】傾向スコア・マッチングによる因果推論 | python こんにちは、青の統計学です。今回は傾向スコアをご紹介します。 因果推論に必要な考え方ですので、しっかり習得しましょう。 傾向スコア (propensity score) 傾向スコアとは、群間比較研究において、介入を受けた […]
07/23/2022 / 最終更新日時 : 03/20/2024 生成AI/GPT Python 【外れ値に対処】順位相関係数と相関係数の違いについて | python 相関係数は、外れ値があると大きく値が変わってしまうという特徴があり、正確な関係の把握が難しい場合があります。 そこで、外れ値に対処できる頑健(ロバスト)な相関係数が必要とされます。 それが、スピアマンの順位相関係数と呼ば […]
07/15/2022 / 最終更新日時 : 02/29/2024 生成AI/GPT Python 【非等分散編】pythonでWelch(ウェルチ)のt検定をやってみた 2標本問題において、標本間の母分散が等しいという等分散の仮定は、限られた場でしか信憑性がありません。 今回は、標本間の母分散が異なるときに使えるWelchのt検定を学びましょう。 等分散の仮定を置いた2標本問題の方が簡単 […]
06/30/2022 / 最終更新日時 : 01/07/2024 生成AI/GPT 推測統計学 【期待値の応用】モーメント母関数(積率母関数)について 統計検定準一級には、積率母関数についての問題があります。 マクローリン展開や合成関数の微分の知識が必要なことから、避けられがちですが、使う分には便利なものです。 今回は、モーメント法と積率母関数について解説します。 統計 […]
06/28/2022 / 最終更新日時 : 11/11/2023 生成AI/GPT 推測統計学 【等分散の仮定】2標本問題ってなんだ?|python 確率変数が2つ登場するため、難しいですが、応用上用いられることが多いのが「2標本問題」です。 中でも今回は、二つの確率変数が同一の分散であると仮定した「等分散の仮定」に基づいて解説していきます。 等分散の仮定が認められな […]
06/24/2022 / 最終更新日時 : 03/16/2023 生成AI/GPT 推測統計学 【MSEを最小化】ガウス・マルコフの定理と最良線形不偏推定量について 回帰分析等で算出した推定量を評価するとき、どのような指標があるでしょうか。 これまでは、一致性や不偏性を取り上げてきました。簡単に復習しましょう。 一致性(consistency):サンプル数を∞に近づけると、推定量はパ […]