用語集(ま行)#

#

マルコフの不等式#

  • 読み: まるこふのふとうしき

  • 英語での表記: Markov's inequality

  • タグ: 確率・統計

確率論における基本的な不等式の一つ。確率変数の非負値関数の値が、ある正の定数以上になる確率の上限を与える不等式である。任意の確率変数\(X\)と正実数\(a>0\)に対して、(期待値\(E[|X|]\)が存在するとき)次の不等式が成り立ち、これをマルコフの不等式という。

\[ P(|X|\geq a)\leq\frac{E[|X|]}{a} \]

マルコフの不等式は\(|X|\)の期待値が大きくなければ\(|X|\)が大きくなる確率はあまり高くないことを意味する。特に\(k=\frac{a}{E[|X|]}\)とおくと、マルコフの不等式は

\[ P(|X|\geq kE[|X|])\leq\frac{1}{k} \]

となり、これは平均\(k\)倍を超える確率が\(\frac{1}{k}\)以下であることを意味している。

マルコフの不等式は以下のように導かれる。ここでは連続型確率変数の場合のみ示すが、離散型確率変数の場合も同様である。

\[\begin{split} \begin{align*} E[|X|]&=\int_{-\infty}^{\infty}|x|f(x)dx\\ &\geq\int_{-\infty}^{-a}|x|f(x)dx+\int_{a}^{\infty}|x|f(x)dx\\ &\geq a\int_{-\infty}^{-a}f(x)dx+a\int_{a}^{\infty}f(x)dx\\ &=aP(X\leq-a)+aP(X\geq a)\\ &=aP(|X|\geq a) \end{align*} \end{split}\]

マハラノビス距離#

  • 読み: まはらのびすきょり

  • 英語での表現: Mahalanobis distance

  • Tags: 基礎数学, 確率・統計

有限個の実数の組の集合 \(\mathbf{R}^n\) ( \(n < \infty\) ) に定義される距離の一つで、同じく \(n\) 次元の共分散行列 \(\Sigma = ( \sigma_{i j} )_{1 \le i, j \le n}\) が与えられているときに \(\mathbf{R}^n\) の2つの要素 \(\mathbf{x} = ( x_1, \ldots, x_n )^\mathrm{T}\) および \(\mathbf{y} = ( y_1, \ldots, y_n )^\mathrm{T}\) (各 \(x_i, y_i \in \mathbf{R}\) ) に対して

\[ d_\Sigma ( \mathbf{x}, \mathbf{y} ) = \sqrt{( \mathbf{x} - \mathbf{y} )^\mathrm{T} \Sigma^{- 1} ( \mathbf{x} - \mathbf{y} ) } \]

で与えらえれるもの。正規分布 \(\mathrm{N} ( \mu, \Sigma )\)確率密度関数の等高線は平均 \(\mu\) からのマハラノビス距離が一定になるという性質があり、このため異常検知などの文脈でしばしば利用される。

関連項目


マルコフ連鎖モンテカルロ法#

  • 読み: まるこふれんさもんてかるろほう

  • 英語での表記: Markov chain Monte Carlo methods, MCMC

  • タグ: 確率・統計

確率分布からサンプリングを行う手法の一つ。興味がある分布 \(p ( x )\) を均衡分布に持つようなマルコフ連鎖を構成し、このマルコフ連鎖を利用したサンプリングを通じて元の分布 \(p ( x )\) からのサンプリングを行う。実用上はマルコフ連鎖の推移確率 \(p ( x' | x )\) が詳細釣り合い条件 (detailed balance condition, DBC)

\[ p ( x' | x ) p ( x ) = p ( x | x' ) p ( x' ) \]

を満たすようにマルコフ連鎖を設計することが多い。

ベイズ統計においては、データ \(X\) を観測した後のパラメータ \(\theta\)事後分布 \(p ( \theta | X )\) を均衡分布に持つようなマルコフ連鎖を設計し、マルコフ連鎖モンテカルロ法によって得たサンプル \(\theta_1, \ldots, \theta_K\) を用いて

\[ \int f ( \theta ) p ( \theta | X ) d \theta \approx \frac{1}{K} \sum_{k = 1}^K f ( \theta_k ) \]

のように(事後分布それ自身を陽に導出することなく)事後分布による期待値を近似するという形で利用される。


マンハッタン距離#

  • 読み: まんはったんきょり

  • 英語での表現: Manhattan distance

  • Tags: 基礎数学

有限個の実数の組の集合 \(\mathbf{R}^n\) ( \(n < \infty\) ) に定義される距離の一つで、 \(\mathbf{R}^n\) の2つの要素 \(\mathbf{x} = ( x_1, \ldots, x_n )\) および \(\mathbf{y} = ( y_1, \ldots, y_n )\) (各 \(x_i, y_i \in \mathbf{R}\) ) に対して

\[ d ( \mathbf{x}, \mathbf{y} ) = \sum_{i = 1}^n | x_i - y_i | \]

で与えらえれるもの。ニューヨーク市のマンハッタン地区のような碁盤目状の都市区画において2地点間を最短で結ぶ道のりの長さで例えられることからこの名前がついている。

#

#

#

#

モーメント#

  • 読み: もーめんと

  • 英語での表現: moment

  • Tags: 確率・統計

確率変数 \(X\) が与えられたとき、定数 \(c\) 並びに正整数 \(k\) に対して計算される期待値

\[ \mu_k^{(c)} = E [ ( X - c ) ^ k ] \]

\(X\)\(c\) 周りの \(k\) 次モーメント ( \(k\)-th moment about \(c\) ) と呼ぶ。訳語で積率(せきりつ)と呼ぶこともある。特に0周りのモーメント

\[ \mu_k^{(0)} = E [ X^k ] \]

のことは原モーメント (raw moment) と呼ぶか、単にモーメントと呼ぶ。確率変数の1次の原モーメントは平均である。原モーメントはモーメント母関数の高次の微係数として計算できる。

確率変数 \(X\) の1次の原モーメント \(\mu = \mu_1^{(0)}\) が存在するとき、この \(\mu\) 周りのモーメント

\[ \mu_k = E [ ( X - \mu ) ^ k ] \]

\(X\)\(k\) 次の中心化モーメント (central moment) と呼ぶ。確率変数の2次の中心化モーメントは分散である。

さらに確率変数 \(X\) の2次の中心化モーメント \(\sigma^2 = \mu_2\) が存在するとき、次の期待値

\[ E \left[ \left( \frac{X - \mu}{\sigma} \right) ^ k \right] \]

\(X\)\(k\) 次の標準化モーメント (standardized moment) と呼ぶことがある。確率変数の3次の標準化モーメントは歪度、4次の標準化モーメントは尖度である。


モーメント母関数#

  • 読み: もーめんとぼかんすう

  • 英語での表現: moment generating function

  • Tags: 確率・統計

確率変数 \(X\) に対して \(e^{tX}\)期待値 \(M_X(t):=E[e^{tX}]\) をモーメント母関数(積率母関数)という。

\[\begin{split} M_X(t)=E[e^{tX}]=\left\{ \begin{array}{ll} \sum_{x=0}^{\infty}e^{tx}P(X=x) & (\mathrm{離散変数})\\ \int_{-\infty}^{\infty}e^{tx}f(x)dx & (\mathrm{連続変数}) \end{array} \right. \end{split}\]

モーメント母関数はこれらの級数や積分が定義される場合のみ存在する。

モーメント母関数の1階微分と2階微分は次のようになる。

\[\begin{split} \begin{align*} M_X^{(1)}(t)&:=\frac{dM_X(t)}{dt}=E[Xe^{tX}]\\ M_X^{(2)}(t)&:=\frac{d^2M_X(t)}{dt^2}=E[X^2e^{tX}] \end{align*} \end{split}\]

これを利用して確率変数 \(X\) の期待値 \(E[X]\)分散 \(V[X]\) を求めることができる。

\[\begin{split} \begin{align*} E[X]&=M_X^{(1)}(0)\\ V[X]&=E[X^2]-(E[X])^2\\ &=M_X^{(2)}(0)-(M_X^{(1)}(0))^2 \end{align*} \end{split}\]

確率母関数 \(G_X(s)\) とは次の関係にある。

\[ M_X(t)=G_X(e^t) \]