06/22/2022 / 最終更新日時 : 05/08/2023 生成AI/GPT Python 【共線性解決!?】pythonで主成分分析(PCA)をやってみた 青の統計学へようこそ。 今回は、教師なし学習の一つ「主成分分析」について解説いたします。 数学的背景まで掘り下げたコンテンツは以下になります。 【python】主成分分析(+回帰)の仕組みとコード例|教師なし学習 主成分 […]
06/20/2022 / 最終更新日時 : 01/14/2024 生成AI/GPT Python 【統計検定準一級】ランダムウォークとマルチンゲールの話。 こんにちは、青の統計学です。 統計検定準一級では、「この確立過程Sは、マルチンゲールかどうか?」という問題が出ることがあります。 マルコフ性と並んで登場する「マルチンゲール」に、とっつきにくさを感じた方も多いと思います。 […]
06/19/2022 / 最終更新日時 : 10/31/2023 生成AI/GPT Python 【python】ガウス過程回帰の仕組みと実務での応用|ノンパラメトリック機械学習 こんにちは、青の統計学です。 今回はガウス過程回帰について解説いたします。 製造業の現場など、n=20やそこらぐらいのデータセットで予測を行う必要がある時によく使われます。 ガウス過程は少数データとの相性がよく、予測値の […]
06/18/2022 / 最終更新日時 : 05/05/2024 生成AI/GPT Python 【python】共分散分析(ANCOVA)の基礎から応用まで|因果推論 こんにちは、青の統計学です。 今回は交絡因子の影響を調整する共分散分析を解説しようと思います 共分散分析 共分散分析は、調整平均を用いて、共変量(covariate)の影響を考慮した上で、群間の平均値の差を検定する方法で […]
06/18/2022 / 最終更新日時 : 06/19/2022 Cas9 免疫学 【論文紹介】PD-L1抗体が疲弊したT細胞を再び元気にする仕組み(1) 今回紹介するのは以下の論文です。 “Type 1 conventional dendritic cells maintain and guide the differentiation of precurso […]
06/15/2022 / 最終更新日時 : 04/27/2024 生成AI/GPT 大学数学 【線形代数】固有値や固有ベクトルは機械学習にどう使われているのか|主成分分析 こんにちは、青の統計学です。 今回は、前回大好評だった「線形代数がデータサイエンスにどう使われているのかシリーズ」の第二弾です。 大学数学で勉強した固有値や固有ベクトルが一体何の役に立っているのか…対角化で冪 […]
06/15/2022 / 最終更新日時 : 05/05/2024 生成AI/GPT 推測統計学 【F値とは】分散分析による検定の多重性について|統計検定準1級 統計検定準一級では、2級同様「分散分析」の内容が出てきます。 今回は、前回と視点を変えた「検定の多重性」について解説します。 例題を通して理解していきましょう。 *確実に理解するために、ある程度時間をかけてみましょう。 […]
06/13/2022 / 最終更新日時 : 05/31/2024 生成AI/GPT ベイズ 【ベイズ因子】オッズ比の使われ方を紹介します こんにちは、青の統計学です。 今回はロジスティック回帰の解釈で定番の、オッズ比について考えていきます。 オッズ比は二つのカテゴリに分けられるデータに対して有用な指標であり、特に、疾患や事象が発生する確率について研究する際 […]
06/13/2022 / 最終更新日時 : 05/05/2023 生成AI/GPT 推測統計学 【説明変数の相関】多重共線性を解説します。 重回帰分析を勉強していると、最小二乗法の仮定の一つに「多重共線性がないこと」と見たことがあると思います。 今回は、多重共線性の内容と、対処法を2つ解説いたします。 多重共線性の論文に関しては、以下で解説しています。 【論 […]
06/12/2022 / 最終更新日時 : 12/10/2023 生成AI/GPT 因果推論 【共変量の罠】シンプソンのパラドクスについて 「相関関係はあるけど、因果関係があるとは限らない」ということは、統計学を学んでしつこく聞いてきたでしょう。 今回は、ある種「因果はあるが、相関がなく見えてしまう」という「シンプソンのパラドクス」について解説いたします。 […]
06/11/2022 / 最終更新日時 : 01/13/2024 生成AI/GPT Python 【因果推論】差の差(DID)分析による平均処置効果の推定|計量経済学 こんにちは、青の統計学です 今回は、社会科学の分野でもよく使われる「差の差分析」について解説いたします。 シンプルで理解しやすいかつ強力な分析手法ですが、並行トレンドの仮定など前提となるルールもあります。 差の差分析(d […]
06/08/2022 / 最終更新日時 : 01/27/2024 生成AI/GPT ベイズ 【GLMM】一般化線形混合モデルについて解説|R こんにちは、青の統計学です。 GLMMを学ぶ前には、固定効果とランダム効果(変量モデル)、そしてGLM(一般化線形モデル)を理解しておく必要があります。 まだ理解が足りてない方には、まず先に以下のコンテンツをご覧ください […]
06/06/2022 / 最終更新日時 : 05/12/2024 生成AI/GPT ベイズ 【尤度って?】尤度関数と最尤推定量の解説と例題 確率分布のパラメータ\(θ\)を推定する方法の一つとして、最尤推定というものがあります。 最尤推定には、尤度関数を使うことが必須です。まずは尤度関数については見てみましょう。 尤度(likelihood)について 抑えて […]
06/06/2022 / 最終更新日時 : 06/15/2022 Cas9 免疫学 【論文解説】リンパ節ごとのレパトア解析(4) (4)では、resultの後半部分、T細胞の移入実験を解説します。 この記事では、以下の論文を紹介しています。 Stephanie K. Lathrop, Nicole A. Santacruz, Dominic Pha […]
06/05/2022 / 最終更新日時 : 06/15/2022 Cas9 免疫学 【論文解説】リンパ節ごとのレパトア解析(3) (3)では、前半部分の、リンパ節ごとのレパトア解析に触れます。 この記事では、以下の論文を紹介しています。 Stephanie K. Lathrop, Nicole A. Santacruz, Dominic Pham, […]
06/04/2022 / 最終更新日時 : 05/11/2024 生成AI/GPT 推測統計学 【例題つき】正規分布(ガウス分布)の確率密度について|R 二項分布やポアソン分布のようなカウントデータを扱う離散分布の他に、連続データを扱う連続分布があります。 今回は、連続分布の代表格である「正規分布」について扱います。 確率密度に関する例題とともに、分布の再生性についても取 […]
06/03/2022 / 最終更新日時 : 02/29/2024 生成AI/GPT 推測統計学 【モデル選択】AIC(赤池情報量基準)についてわかりやすく解説 モデルを比較する時に、観測したデータとの当てはまりの良さで判断することがあります。 これは最大対数尤度で考えています。 「対数尤度が大きいモデルが良い」と言うのは、一つの軸ではありますが複雑なモデル(=実用的ではないし、 […]
06/03/2022 / 最終更新日時 : 05/31/2024 生成AI/GPT Python 【二項分布】ロジスティック回帰について|R こんにちは、青の統計学です、 今回は、分類タスクの王道「ロジスティック回帰」について解説していきます。 一般化線形モデル(GLM)にはポアソン分布だけではなく、色々の分布が使われます。 ロジスティック回帰は、二項分布が使 […]
05/31/2022 / 最終更新日時 : 01/20/2023 生成AI/GPT Python 【少ないデータを多く見せる】ブートストラップ法について|R 今回は、ブートストラップ法について解説します。 ブートストラップ法(bootstrap method) ブートストラップ法とは、乱数を使って何らかの確率分布を予測する方法です。大事なのは、「重複を許し」てデータセットを複 […]
05/30/2022 / 最終更新日時 : 05/08/2023 生成AI/GPT 推測統計学 【統計検定2級】第一種の過誤と第二種の過誤について 今回は、統計検定2級で頻出の「第一種の過誤(type I error)と第二種の過誤(type II error)」について解説します。 仮説検定では、比較するモデル同士を帰無仮説と対立仮説に分けます。パラメーター数が少 […]
05/30/2022 / 最終更新日時 : 07/27/2024 生成AI/GPT Python 【統計検定】ポアソン過程をわかりやすく解説|待ち行列理論 こんにちは、青の統計学です。 今回は統計検定準一級から登場する確立過程の一つ「ポアソン過程」について解説いたします。 このコンテンツに全て詰まっているのでブックマーク推奨です! 関わりの深い生存時間解析は、こちらで学習で […]
05/29/2022 / 最終更新日時 : 06/14/2022 Cas9 免疫学 【論文解説】リンパ節ごとのTCRレパトア解析(2) この記事では、以下の論文を紹介しています。 Stephanie K. Lathrop, Nicole A. Santacruz, Dominic Pham, Jingqin Luo, Chyi-Song Hsieh;An […]
05/28/2022 / 最終更新日時 : 06/14/2022 Cas9 免疫学 【論文解説】リンパ節ごとのTCRレパトア解析(1) これってどんな論文? Antigen-specific peripheral shaping of the natural regulatory T cell population . 今回ご紹介するのは、制 […]
05/27/2022 / 最終更新日時 : 05/12/2024 生成AI/GPT Python 【汎用性抜群】尤度比検定をわかりやすく解説します こんにちは、青の統計学です。 尤度比検定とは、汎用性の高い統計モデルの検定です。 その汎用性の高さは、サンプル数が十分大きい時には、尤度比検定統計量の対数に2をかけたものがカイ2乗分布に従う性質にあります。 行列を使わず […]
05/24/2022 / 最終更新日時 : 01/13/2024 生成AI/GPT Python 【GLM】一般化線形モデルを解説|ポアソン回帰 今回はGLMと呼ばれる「一般化線形モデル(generalized liner model)」を解説します。 よく似た名前として、分散分析や共分散分析などの「一般線形モデル」が有りますが、一般線形モデルは正規線形モデルの一 […]
05/23/2022 / 最終更新日時 : 01/13/2024 生成AI/GPT Python 【python】分散分析(ANOVA)の基礎から応用まで|統計的仮説検定 こんにちは、青の統計学です。 今回は、分散分析について解説いたします。 分散分析(ANOVA) 分散分析(ANOVA)は、統計学において複数の群間で平均値に有意な差があるかどうかを判断する手法です。 管理人の主観ですが、 […]
05/20/2022 / 最終更新日時 : 05/05/2024 生成AI/GPT 推測統計学 【統計検定2級】分散分析の信頼区間について|python 統計検定2級の中でも手強い分野の一つ、「分散分析」を扱います。 中でも、分散分析の信頼区間は盲点になることが多いです。例題を通して学んでいきましょう。 分散分析について基礎から学びたい方は、以下のコンテンツをご覧ください […]
05/19/2022 / 最終更新日時 : 11/27/2022 生成AI/GPT Python 【高校生向け】③分散のn倍問題(Lv.共通テスト) 共通テストには、「分散Wをn倍した時に、分散Zは何倍になるか(もしくは変わらない)」という問題がよく出ます。例題を通してみてみましょう。 今回は政府統計の、平成20年度学校保健調査の都道府県別「5歳から17歳の男子平均身 […]
05/17/2022 / 最終更新日時 : 07/27/2024 生成AI/GPT 推測統計学 【t検定】t統計量(t値)の求め方 統計検定2級の後半で頻出の「t統計量」についてご説明します。 標準誤差を知っておく必要があるので、標準誤差を復習したい方はこちらをどうぞ t統計量 例題1 サンプル数\(100\)のデータで、\(y=β0 + β1(ca […]
05/13/2022 / 最終更新日時 : 04/28/2024 生成AI/GPT Python 【python/Rコードつき】標準誤差を例題を通して解説。 統計検定などで、信頼区間を求めることは多くあります。 そこで必要なのが標準誤差という概念です。 分布によって誤差の作り方が異なったりするため厄介です。 丁寧に学んでいきましょう。 標準誤差(standard error) […]
05/11/2022 / 最終更新日時 : 01/20/2024 生成AI/GPT 確率過程 ベルマン方程式をわかりやすく解説|強化学習や動的計画法 こんにちは、青の統計学です。 今回は、ベルマン方程式についてわかりやすく解説します。 管理人は経済学部出身だったので動的計画法の文脈で学びました。 情報数理であれば、強化学習のアルゴリズムで学びますね。 こちらでも簡単に […]
05/10/2022 / 最終更新日時 : 05/11/2024 生成AI/GPT Python 【高校数学でわかる】分散と標準偏差とは?|散らばりの指標 こんにちは、青の統計学です。 今回は、統計の基本である分散と標準偏差について解説していきます。 高校数学でも扱われる内容なので、高度な数学は必要ございません。 分散(variance)と標準偏差(standard dev […]
05/06/2022 / 最終更新日時 : 01/09/2023 生成AI/GPT 高校数学 【高校生向け】データの活用の例題②(Lv共通テスト) 高校数学で対策が手薄になりやすい「データの活用」の例題を紹介していきます。公式を紹介するだけでは、すぐに忘れてしまうと思うので実際の問題を通して理解していきましょう。実際に10分程度考えてみて、わからなければ解説をみてく […]