12/21/2023 / 最終更新日時 : 11/17/2024 bluest Python 【AICで使う】KL divergence(カルバック-ライブラー情報量)をわかりやすく解説|python こんにちは、今回はKL divergenceを解説します。 KL divergenceは、2つの確率分布間の相違を測定するために使用され、NLPにおける文書や単語の分布を比較する際に役立ちます。 レベル感としては、統計検 […]
12/15/2022 / 最終更新日時 : 09/09/2024 bluest Python 【python】Ridge(リッジ)回帰で多重共線性を解決する話 リッジ回帰とは、重回帰分析の一つであり、機械学習には厄介な「多重共線性」の影響を少なくできる手法のひとつです。 複雑なデータをモデルに当てはめるときには、一般に多くの説明変数を使って表現をしますが、 説明変数が増えるほど […]
06/03/2022 / 最終更新日時 : 01/26/2025 bluest 医薬生物学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 1:AICとは何か AICは「複数の統計モデルのうち、どれがより予測に適しているか」を評価するために考案された指標です。 もし「当てはまりの良さ」だけを追求すると、パラメータを増やせば増やすほどモデルはデータにぴったり合 […]
05/03/2022 / 最終更新日時 : 11/30/2024 bluest Python 【時系列】ARモデルをわかりやすく解説|Yule-Walker法や最尤法も こんにちは、青の統計学です。 今回解説するのは、時系列モデルの基礎であるARモデルです。 まずは数式を見てみましょう。 ARモデル(autoregression model) $$y_{n} = \sum_{j=1}^{ […]