A new coefficient of correlation

目次

A new coefficient of correlation#

Chatterjeeによって提案された非線形相関係数 \(\xi\) についての論文紹介です。

この相関係数は任意の二変数\((X, Y)\)の関係を測ることができます。特に古典的な相関係数(ピアソン、スピアマン)などとは違い、非線形な関係も捉えられます。 以下のような望ましい特性を持っています。

  • 古典的な相関係数と同じぐらい計算がシンプル

  • ランクベースの手法のため, 外れ値に頑健で単調変換に対して不変

  • 変数間の依存度を測れる解釈性の高い指標

    • サンプル数 \(n\) が十分あるとき、\(\xi_n(X, Y)\) の値は\([0, 1]\) の範囲になり、

      • 0であれば、\((X, Y)\)は独立

      • 1 であれば可測関数, \(Y=f(X)\)

  • \(Y\) が定数ではない、という条件以外の\((X, Y)\) に対する仮定を必要としない

    • \(\xi_n\) はカテゴリカルデータにも適用できる

  • 帰無仮説のもとで単純な漸近理論が存在

  • 特に振動するような信号に対する検出力が高い

PDFを開く

参考文献#

  • Chatterjee, Sourav. “A New Coefficient of Correlation.” Journal of the American Statistical Association 116 (2019): 2009 - 2022.