A new coefficient of correlation#
Chatterjeeによって提案された非線形相関係数 \(\xi\) についての論文紹介です。
この相関係数は任意の二変数\((X, Y)\)の関係を測ることができます。特に古典的な相関係数(ピアソン、スピアマン)などとは違い、非線形な関係も捉えられます。 以下のような望ましい特性を持っています。
古典的な相関係数と同じぐらい計算がシンプル
ランクベースの手法のため, 外れ値に頑健で単調変換に対して不変
変数間の依存度を測れる解釈性の高い指標
サンプル数 \(n\) が十分あるとき、\(\xi_n(X, Y)\) の値は\([0, 1]\) の範囲になり、
0であれば、\((X, Y)\)は独立
1 であれば可測関数, \(Y=f(X)\)
\(Y\) が定数ではない、という条件以外の\((X, Y)\) に対する仮定を必要としない
\(\xi_n\) はカテゴリカルデータにも適用できる
帰無仮説のもとで単純な漸近理論が存在
特に振動するような信号に対する検出力が高い
参考文献#
Chatterjee, Sourav. “A New Coefficient of Correlation.” Journal of the American Statistical Association 116 (2019): 2009 - 2022.