用語集(や・ら・わ行)#

#

#

有意水準#

  • 読み: ゆういすいじゅん

  • 英語での表現: significance level

  • Tags: 確率・統計

仮説検定において第一種の過誤を犯す確率のことで、どの程度の正確さをもって帰無仮説を棄却するかを表す定数。有意水準\(\alpha\)の仮説検定では、p値\(\alpha\)より小さい場合に帰無仮説を棄却する。一般的に\(\alpha=0.05\)\(\alpha=0.01\)と設定されることが多い。有意水準\(\alpha\)は第一種の過誤を犯す確率に等しいため、第一種の過誤の確率の上限値と定義される場合もある。


ユークリッド距離#

  • 読み: ゆーくりっどきょり

  • 英語での表現: Euclidean distance

  • Tags: 基礎数学

有限個の実数の組の集合 \(\mathbf{R}^n\) ( \(n < \infty\) ) に定義される距離の一つで、 \(\mathbf{R}^n\) の2つの要素 \(\mathbf{x} = ( x_1, \ldots, x_n )\) および \(\mathbf{y} = ( y_1, \ldots, y_n )\) (各 \(x_i, y_i \in \mathbf{R}\) ) に対して

\[ d ( \mathbf{x}, \mathbf{y} ) = \sqrt{\sum_{i = 1}^n ( x_i - y_i )^2 } \]

で与えらえれるもの。一般的な \(n\) 次元実数ベクトルの空間( \(n\) 次元のユークリッド空間)において2点 \(\mathbf{x}, \mathbf{y}\) を結ぶ線分の長さに相当し、このような空間で単に「距離」と言った場合はユークリッド距離を指すことが多い。

関連項目

#

#

#

#

累積分布関数#

  • 読み: るいせきぶんぷかんすう

  • 英語での表現: cumulative distribution function, CDF

  • Tags: 確率・統計

確率変数 \(X: \Omega \to \mathbf{R}\) がある値 \(x \in \mathbf{R}\) 以下の値を取る確率を表す関数

\[\begin{split} \begin{align} F ( x ) & = P ( X \le x ) \\ & = P ( \{ \omega; X ( \omega ) \le x \} ) \end{align} \end{split}\]

を累積分布関数、または単に 分布関数 (distribution function) と呼ぶ。累積分布関数は定義より明らかに単調増加である。

確率変数 \(X\) の累積分布関数は \(X\) に対応する確率分布を完全に特徴づける。これは確率変数 \(X\) が離散であるか連続であるかを問わない。離散確率分布の累積分布関数は階段状の関数となる。

関連項目

  • 確率関数: 離散確率分布において、累積分布関数の「階段の高さ」を表す関数と思うことができる

  • 確率密度関数: 狭義には、連続確率分布における累積分布関数の導関数

#

#

#

歪度#

  • 読み: わいど

  • 英語での表現: skewness

  • Tags: 確率・統計

確率分布やデータの特徴を表す指標の一つで、平均を中心とした分布の非対称性の程度を示すもの。確率変数 \(X\) の平均を \(\mu\)標準偏差\(\sigma\) としたとき、 \(X\) の歪度を

\[ \mathrm{Skew} [ X ] = \frac{\mathrm{E} [ ( X - \mu ) ^3 ]}{\sigma^3} \]

で定める。歪度が負の値を取る場合は分布が実軸上で平均より小さい向きに、逆に正の値を取る場合は平均より大きい向きにそれぞれ偏っていると考えられる。データ \(\{ X_1, \ldots, X_n \}\) の平均を \(\bar{X}\)不偏分散\(s^2\) とすると、データの歪度はモーメントの推定値から

\[ \gamma_1 = \frac{\frac{1}{n} \sum_{i=1}^n ( X_i - \bar{X} ) ^3}{s^3} \]

や、キュムラントの推定値から

\[ G_1 = \frac{\sqrt{n ( n - 1 )}}{n - 2} \frac{\frac{1}{n} \sum_{i=1}^n ( X_i - \bar{X} ) ^3}{\left( \frac{1}{n} \sum_{i=1}^n ( X_i - \bar{X} ) ^2 \right) ^\frac{3}{2}} \]

とそれぞれ計算される。