03/16/2025 / 最終更新日時 : 03/16/2025 bluest Python DBSCANとは?密度ベースのクラスタリングを解説 DBSCANとは? DBSCAN(Density-Based Spatial Clustering of Applications with Noise)は、密度ベースのクラスタリングアルゴリズムであり、データ点の密度に […]
02/03/2025 / 最終更新日時 : 02/03/2025 bluest マーケティング 効果量とは?サンプルサイズ設計を実務で使うには 「統計的に有意な差が出ました!」 日々の分析で、p値が0.05を下回った結果に一喜一憂しがちです。その「有意差」、本当に意味のある差と言えるのでしょうか? ここに効果量という概念が使えます。 1. 効果量とは何か? – […]
01/10/2025 / 最終更新日時 : 01/11/2025 bluest マーケティング サンプルサイズ設計のガイド:基礎理論と実践をわかりやすく 1. はじめに サンプルサイズ設計は、研究・調査・実験計画(例えばCMの効果を測りたいマーケティング検証、アプリのUX改善のためのABテストなど)において重要なプロセスです。 そもそも、サンプルサイズを設定しようという背 […]
01/07/2025 / 最終更新日時 : 02/12/2025 bluest Python パレートの法則についてわかりやすく解説 1. パレートの法則とは? パレートの法則(Pareto Principle)は「全体の成果の80%が、全体を構成する要素の20%によってもたらされる」という経験則です。現代では、ビジネス領域の「選択と集中」やマーケティ […]
01/04/2025 / 最終更新日時 : 01/28/2025 bluest Python 負の二項分布をわかりやすく解説 はじめに! 負の二項分布は、ポアソン分布や二項分布よりも過分散を扱いやすい柔軟なモデルとして知られています。 実験・観測データにしばしば見られる「期待値以上の分散」をうまく捉えることができ、免疫学や微生物学などの生物学的 […]
01/01/2025 / 最終更新日時 : 01/07/2025 bluest Python ベイズ因子とは?──定義と直感的解釈 ベイズ因子 (Bayes Factor) は、2つの仮説 ${H_1, H_2}$ の相対的な支持度を評価するための指標です。 とくに「帰無仮説 (null hypothesis) vs. 対立仮説 (alternat […]
12/26/2024 / 最終更新日時 : 01/07/2025 bluest Python 【完全版】MMMを課題設定から考える|Google Meridian Media Mix Model|MMM MMM は、過去の広告支出や売上データを用いて、各マーケティング施策が売上(KPI)にどの程度貢献したかを定量的に分析する手法です。これにより、予算配分の最適化や将来のマーケティン […]
12/10/2024 / 最終更新日時 : 01/07/2025 bluest ベイズ 階層ベイズをわかりやすく解説|Google Meridianを例に 階層ベイズモデルとは? 階層ベイズモデルは、データの複雑な構造を扱うための統計手法です。特に、異なるレベルでデータが相互に関連している場合、その特性を効果的に捉えることができます。このモデルは、データのばらつきや不確実性 […]
12/07/2024 / 最終更新日時 : 01/07/2025 bluest マーケティング パス解析をわかりやすく解説:因果推論からMMMまで パス解析とは? パス解析は、複数の変数間の因果関係を明らかにするための統計的手法です。 特に、構造方程式モデリング(SEM)の一種であり、観測変数のみを用いて因果関係を推定することができます。 これにより、単なる相関分析 […]
12/30/2022 / 最終更新日時 : 01/11/2025 bluest マーケティング p値をわかりやすく解説|検出力を使った具体例 1. p値の定義と計算方法 1.1 p値の定義 p値 は、統計検定において次のように定義される数値です。 ここでいう「極端な値」とは、検定手法や両側検定・片側検定によって定義が変わります。 たとえば平均値に関する両側検定 […]
09/14/2022 / 最終更新日時 : 03/18/2025 bluest Python 階層型クラスタリング徹底比較|ウォード法・最短距離法などの使い分け 階層的クラスタリングとは? クラスタリングは、教師なし学習の基本的な手法の一つであり、類似したデータ点をグループ化することで、ラベル付けされていないデータから有益な情報を抽出する手法です。 中でも階層的クラスタリングは、 […]
07/09/2022 / 最終更新日時 : 03/15/2025 bluest Python 【完全ガイド】k-means法とは?周辺のクラスタリング手法と比較 クラスタリングのモチベーション クラスタリングは、似た特徴を持つデータをグループ分けすることで、顧客セグメンテーション、マーケティング戦略、異常検知などの幅広いビジネス課題に対応するための手法です。 データの集合をグルー […]
06/30/2022 / 最終更新日時 : 01/25/2025 bluest Python コサイン類似度とは?高校数学で理解する 1. コサイン類似度とは? ベクトル同士の“方向の近さ”を測る指標 コサイン類似度(Cosine Similarity)とは、主に2つのベクトルがどのくらい同じ方向を向いているかを測定するための指標です。計算結果の値は- […]
06/29/2022 / 最終更新日時 : 01/19/2025 bluest マーケティング 対数正規分布とは?ビジネスで使える便利な確率分布 1. 対数正規分布とは? まず、抑えて欲しいのが 対数正規分布は、「ある変数 ${X}$ の対数 ${\ln(X)}$が正規分布に従う」ときに、変数${X}$そのものが従う分布のことです。より具体的には、確率変数${X} […]
06/28/2022 / 最終更新日時 : 01/13/2025 bluest マーケティング 幾何分布とは?意外とビジネスに役立つ確率分布 1. 幾何分布(Geometric Distribution)の概要 幾何分布は、離散確率分布の一種で「ある試行を繰り返したときに、初めて成功が得られる試行回数に関する分布」を表します。 ビジネスの現場では「初回成功まで […]
06/28/2022 / 最終更新日時 : 01/17/2025 bluest マーケティング 多項分布とは?ビジネスの活用範囲の多い分布 多項分布って? 多項分布とは、複数のカテゴリにまたがって起こりうる事象を、一定回数の試行によって観測したときに、その観測結果がどのような確率で生じるかを表す分布です。 具体的には、サイコロを何度も振った場合に1の目が何回 […]
06/27/2022 / 最終更新日時 : 01/28/2025 bluest マーケティング ガンマ分布とは?リスク解析と保険数理に使える分布 ガンマ分布とは ガンマ分布とは、連続型の確率分布の一種で、主に「待ち時間」や「寿命」「損害額」などのモデリングに広く使われる分布です。その汎用性の高さが特徴的です。 ガンマ分布はふたつのパラメータ(しばしば形状パラメータ […]
06/18/2022 / 最終更新日時 : 01/11/2025 bluest マーケティング UI/UX 改善における統計的アプローチ: ~サンプリング設計とベイズ推論の活用~ 1. UI/UX 改善と統計学の関係 ユーザーの操作感やインタラクションをより快適にするためのUI/UX改善は、データドリブンなアプローチができるようになってます。 たとえば「新しいボタン配置Aが既存配置Bよりもコンバー […]
06/08/2022 / 最終更新日時 : 01/12/2025 bluest マーケティング 【GLMM】一般化線形混合モデルについてわかりやすく解説 1. 一般化線形モデル (GLM) と固定効果モデル まずは、前提知識を確認しましょう。 2. 一般化線形混合モデル (GLMM) の位置づけと特長 「GLMM = 一般化線形モデル + 混合効果」GLMM は、一般化線 […]
05/17/2022 / 最終更新日時 : 01/29/2025 bluest マーケティング 【t検定】t統計量(t値)の求め方 t統計量(t value)について t統計量とは、t検定で使う検定統計量のことです。 t統計量は、回帰分析や仮説検定において重要な役割を果たす検定統計量です。特に、回帰係数の統計的有意性を評価する際に用いられます。 統計 […]