04/22/2023 / 最終更新日時 : 05/05/2024 生成AI/GPT Python 【統計学】分散不均一だと何が問題なのか|不偏性とガウスマルコフ性について こんにちは、青の統計学です。 今回は、分散均一と分散不均一について解説いたします。 推定量期待値の分散に関わる問題で、検定方法についても触れようと思います。 各種検定のチートシートは以下をクリック! 【最短】統計検定2級 […]
03/30/2023 / 最終更新日時 : 11/19/2023 生成AI/GPT Python 【python】カーネルSVMとは?kernel関数を利用した非線形データの判別問題に挑戦|機械学習 こんにちは、青の統計学です。 今回は、判別タスクに関わる解決手法「カーネルSVM」をご紹介します。 判別タスクは、決定木やロジスティック回帰、線型SVM、k近傍法などたくさんあります。 カーネルSVMの特徴は、非線形デー […]
03/23/2023 / 最終更新日時 : 11/19/2023 生成AI/GPT Python 【SHAP】スタッキング(stacking)で特徴量の解釈はできるのか|pythonアンサンブル学習 こんにちは、青の統計学です。 機械学習アルゴリズムの精度向上において、アンサンブル学習は非常に重要な役割を果たしています。 アンサンブル学習とは、複数の学習アルゴリズムを組み合わせることで、予測精度を向上させる手法です。 […]
03/18/2023 / 最終更新日時 : 04/22/2024 生成AI/GPT Python 【python】活性化関数の完全ガイド|特徴と効果的な選び方について|勾配消失問題 こんにちは、青の統計学です。 ディープラーニングは、近年の技術革新において大きなインパクトをもたらしており、画像認識や自然言語処理など、多くの分野で広く利用されています。 このコンテンツでは、ディープラーニングの中心的な […]
03/17/2023 / 最終更新日時 : 02/02/2024 生成AI/GPT Python 【python】畳み込みニューラルネットワークによる画像判別プログラムの開発 畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)は、画像認識や物体検出などのコンピュータビジョンタスクに広く使用されるディープラーニングの一種です。 CNNは、局所的な […]
03/10/2023 / 最終更新日時 : 04/13/2024 生成AI/GPT Python 【Leave-one-out】データ量が少ない時に使うクロスバリデーション|python こんにちは、青の統計学です。 今回はデータ量が少ない時に有効な交差検証法の一種、Leave-one-outCVを紹介いたします。 Leave one out CV Leave-One-Out Cross-Validati […]
03/05/2023 / 最終更新日時 : 11/17/2023 生成AI/GPT Python 【python】主成分分析(+回帰)の仕組みとコード例|教師なし学習 こんにちは、青の統計学です。 今回は教師なし学習の一つ「主成分分析」について解説いたします。 以下の記事よりも数学的背景を重めに取り扱っております。 【共線性解決!?】pythonで主成分分析(PCA)をやってみた 主成 […]
02/14/2023 / 最終更新日時 : 02/19/2023 生成AI/GPT Python 【入門編】データサイエンスとは何か。機械学習や統計学との関連も解説。 こんにちは、青の統計学です。 今回はデータサイエンスに興味があるけど、何をするのかよくわからない。何を学べば良いかわからない。という方向けの記事です。 データサイエンスの基本概念 データサイエンスは、データを活用し、ビジ […]
02/14/2023 / 最終更新日時 : 10/31/2023 生成AI/GPT NLP 【pythonコードつき】機械学習とは何か|データサイエンス入門 機械学習とは何か? 機械学習とは、人工知能の一分野であり、コンピュータにデータを学習させ、人間が行うタスクを自動的に行うことを可能にする技術です。 機械学習は、データからパターンを抽出し、それらのパターンを使用して新しい […]
01/29/2023 / 最終更新日時 : 04/13/2024 生成AI/GPT Python 【SHAP】特徴量重要度や寄与度、限界効果を意思決定者にうまく伝えたい話|python これは直近仕事で抱えている問題を整理するために書き上げたコンテンツです。 今回は、prediction(予測)ではなくidentification(識別)に関する議論です。 kaggle等のコンペでは、予測に重きが置かれ […]
01/28/2023 / 最終更新日時 : 04/29/2024 生成AI/GPT Python 【python】尤度比検定で統計モデルの比較をしよう|統計的仮説検定 こんにちは、青の統計学です。 今回は、汎用性抜群な尤度比検定について解説いたします。 Rで解説したものコンテンツは以下になります。 【汎用性抜群】尤度比検定を解説します|R 尤度比検定(likelihood ratio […]
01/21/2023 / 最終更新日時 : 04/27/2024 生成AI/GPT Python 【python】Lasso(ラッソ)回帰で疎なデータに対応しよう|機械学習 こんにちは、青の統計学です。 今回は、スパース学習の代表例である、Lasso(回帰)について解説いたします。 正則化項にL2ノルムを使う、リッジ回帰については、以下のコンテンツをご覧ください。 【python】Ridge […]
01/19/2023 / 最終更新日時 : 05/01/2023 生成AI/GPT Python 【アンサンブル学習】ブートストラップ法をpythonで実装|バギング 今回は、ブートストラップ法を使って推定器を複数作り、予測値を出してみます。 pythonでの実装になるので、Rでの実装に興味がある方は以下のコンテンツをご覧ください。 【少ないデータを多く見せる】ブートストラップ法につい […]
01/13/2023 / 最終更新日時 : 01/07/2024 生成AI/GPT 因果推論 成田悠輔教授の論文でも使われた回帰不連続デザイン(RDD)を学ぶ|python 今回は、子供に対する教育機関の因果効果を分析した、成田悠輔教授の論文を通して、回帰不連続デザインを解説いたします。 参照文献:Regression Discontinuity in Serial Dictatorship […]
01/08/2023 / 最終更新日時 : 06/02/2024 生成AI/GPT 大学数学 【統計検定】フィッシャー情報量とクラメール・ラオの不等式について解説|python こんにちは、青の統計学です。 今回は、正規分布を例に取って、フィッシャー情報量とクラメール・ラオの不等式について深掘りできればと思います。 統計検定準一級の試験範囲にもなっておりますので、この機会に是非理解していきましょ […]
01/03/2023 / 最終更新日時 : 04/30/2024 生成AI/GPT 推測統計学 【論文解説】多重共線性は回帰分析にどのような影響を与えるのか こんにちは、青の統計学です。 今回は、多重共線性への理解を深め、対処などを考察するために論文を読んでみました。 多変量解析をするとなると、大抵はマルチコ(多重共線性)の壁にあたります。 そこで正確な理解をした方が良いと感 […]
12/30/2022 / 最終更新日時 : 01/19/2024 生成AI/GPT 推測統計学 【仮説検定】p値をゼロから解説(第一種の過誤,第二種の過誤,検出力) こんにちは、青の統計学です。 p値や有意水準の意味を正しく理解しているでしょうか? 実験計画や分析報告等で、正しく指標を使うためにも統計的仮説検定の正確な理解はとても大事です。 結論を語りますが、P値や有意性は、効果の大 […]
12/27/2022 / 最終更新日時 : 06/08/2023 生成AI/GPT Python 【kaggle】ベイズ最適化とXGBでtitanicの予測問題を解く|python 今回はハイパーパラメータのチューニング手法の一つである、ベイズ最適について解説いたします。 グリッドサーチやランダムサーチに比べて、短い時間で最適なパラメータを発見できるとされています。 また、今回はデータ分析コンペのk […]
12/23/2022 / 最終更新日時 : 04/13/2024 生成AI/GPT Python 【XGB】GridSearchを使いつつ特徴量重要度を知りたいッ‥!|python 決定木系のアルゴリズムには、feature_importanceというメソッドがあります。 ただ、GridSearchなどのハイパーパラメーターチューニングと一緒に行うと、 「GridSearchCVには、feature […]
12/20/2022 / 最終更新日時 : 01/16/2024 生成AI/GPT Python 【Box-Cox変換】様々な非線形変換について|python 今回は、モデル選択やパラメータチューニングの前に行う、特徴量エンジニアリングについて解説いたします。 中でも、非線形変換は特徴量の偏った分布を正規分布に近づけたりすることができ、高い精度につながることが多いです。 変数変 […]
12/20/2022 / 最終更新日時 : 04/27/2024 生成AI/GPT Python 【判別問題】サポートベクトルマシン(SVM)の仕組み|python 今回は2値の判別問題で効果を発揮する、サポートベクトルマシン(support vector machine)について解説いたします。 数理最適化も扱うことになるのでいい勉強になると思います。 非線形分離に関しては以下のコ […]
12/18/2022 / 最終更新日時 : 05/01/2023 生成AI/GPT Python 【ランダムフォレスト】ブートストラップ法を決定木に応用|python 今回は、決定木に対するバギングの拡張系アルゴリズムである「ランダムフォレスト(random forest)」を解説いたします。 アンサンブル手法のひとつである、バギングについても解説します。 決定木について復習したい方は […]
12/16/2022 / 最終更新日時 : 09/09/2023 生成AI/GPT Python 【多変量解析】ROC曲線とAUCによる判別分析|python 機械学習の問題は回帰問題と分類問題に大別されます。 そして、分類問題の指標でよく扱われるかつ、不均衡問題で威力を発揮する「ROC曲線」と「AUC」について今回は解説していきます。 統計検定準一級の範囲にもしっかり入ってお […]
12/15/2022 / 最終更新日時 : 03/22/2023 生成AI/GPT Python 【python】Ridge(リッジ)回帰で多重共線性を解決する話 今回は、リッジ回帰について解説いたします。 リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を […]
12/07/2022 / 最終更新日時 : 11/11/2023 生成AI/GPT Python 【XGB】交差検証法を使った勾配ブースティング決定木の実装|python 今回は、kaggleなどのデータ分析コンペでもよく使われる「勾配ブースティング決定木アルゴリズム」の解説を行います。 このコンテンツでわかること ・実際中身でどのような計算をしているのか ・コード例 勾配ブースティング決 […]
12/02/2022 / 最終更新日時 : 04/22/2024 生成AI/GPT Python 【Sequential】Kerasを使ったニューラルネットワーク|python こんにちは、青の統計学です。 今回はニューラルネットワークについて解説していきます。 【機械学習】単回帰分析をpythonで実装してみましょうで少し触れましたが、 目的変数に対して非線形活性化関数(例えばシグモイド関数) […]
11/30/2022 / 最終更新日時 : 11/11/2023 生成AI/GPT Python 【機械学習】決定木の仕組みと実装方法について|python 今回は、決定木(Decision Tree)によるモデル構築方法をご紹介します。 決定木は、ある目的に到達するためにデータの書く属性の条件分岐を繰り返してクラス分けする方法です。 数学的な原理に加え、コードも紹介していき […]
11/27/2022 / 最終更新日時 : 04/22/2024 生成AI/GPT Python 【分類タスク】ロジスティック回帰の使い方|python 重回帰モデルは、1つの目的変数に対して、説明変数が複数あるモデルです。 今回ご紹介する、「ロジスティック回帰」は目的変数が数値型ではなく、「Yes or No」の2値であるということが最大の特徴です。 pythonではな […]
11/15/2022 / 最終更新日時 : 04/27/2024 生成AI/GPT Python 【機械学習】単回帰分析をpythonで実装してみましょう 今回は、教師あり学習の基礎中の基礎である「単回帰分析」を実装します。 教師あり学習とは、説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。 訓練データには目的変数や説明変数があり、あらか […]
09/14/2022 / 最終更新日時 : 05/26/2024 生成AI/GPT 情報技術者試験 【忙しい人のための】基本情報・応用情報の午前チートシート|総集編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシートです。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指します。 何の […]
09/14/2022 / 最終更新日時 : 10/10/2022 生成AI/GPT 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|開発・マネジメント編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
09/09/2022 / 最終更新日時 : 10/10/2022 生成AI/GPT 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|テクノロジー編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]
09/08/2022 / 最終更新日時 : 12/10/2023 生成AI/GPT 情報技術者試験 【試験直前ッ】基本情報・応用情報の午前チートシート|データベース&プログラミング編 このコンテンツは、基本情報技術者試験・応用情報技術者試験に挑む方向けの午前チートシート(随時更新)です。 前日や試験直前に一瞬見るだけでも良いと思います。「おかげで2問解けた!見といて助かった!」となるコンテンツを目指し […]