12/21/2023 / 最終更新日時 : 03/31/2024 生成AI/GPT NLP 【AICで使う】KL divergence(カルバック-ライブラー情報量)をわかりやすく解説|python こんにちは、今回はKL divergenceを解説します。 KL divergenceは、2つの確率分布間の相違を測定するために使用され、NLPにおける文書や単語の分布を比較する際に役立ちます。 レベル感としては、統計検 […]
12/15/2022 / 最終更新日時 : 03/22/2023 生成AI/GPT Python 【python】Ridge(リッジ)回帰で多重共線性を解決する話 今回は、リッジ回帰について解説いたします。 リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を […]
06/03/2022 / 最終更新日時 : 02/29/2024 生成AI/GPT 推測統計学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 モデルを比較する時に、観測したデータとの当てはまりの良さで判断することがあります。 これは最大対数尤度で考えています。 「対数尤度が大きいモデルが良い」と言うのは、一つの軸ではありますが複雑なモデル(=実用的ではないし、 […]
05/03/2022 / 最終更新日時 : 01/16/2024 生成AI/GPT Python 【時系列】ARモデルをわかりやすく解説|Yule-Walker法や最尤法も こんにちは、青の統計学です。 今回解説するのは、時系列モデルの基礎であるARモデルです。 まずは数式を見てみましょう。 ARモデル(autoregression model) $$y_{n} = \sum_{j=1}^{ […]