大津の二値化(判別分析法)の式変形とか

背景

画像処理の勉強をしていたら「判別分析法」という二値化方法が出てきました。

調べて見ると「大津の二値化」の別名らしく、これを機に中身を勉強してみました。

大津の二値化概要

f:id:kazenoha:20190414153542p:plain

二値化はグレースケール画像を「閾値 $t$ 」を用いて輝度の異なる二つのクラスに分類します。

ここで大津の二値化(判別分析法)とは、閾値 $t$ をそれっぽくうまく選ぶ手法の一つです。

まず大津の二値化では、クラス内分散 $S^2_w$ とクラス間分散 $S^2 _b$ を考えます。

クラス内分散 $S^2_w$

まずクラス内分散 $S^2_w$ は、各クラスの分散 $S^2_1$ 、 $S^2_2$ を用いて

\begin{align}
S^2_w = \frac{n_1}{n} S^2_1 + \frac{n_2}{n} S^2_2
\end{align}

と定義されます。

各クラスの分散が小さくシャープになるような閾値 $t$ は $S^2_w$ を小さくします。

クラス間分散 $S^2_b$

クラス間分散 $S^2_b$ は、各クラスの平均 $\mu_1$ 、 $\mu_2$ と全体の平均 $\mu$ を用いて

\begin{align}
S^2_b = \frac{n_1}{n} (\mu_1 - \mu)^2 + \frac{n_2}{n} (\mu_2 - \mu)^2
\end{align}

と定義されます。

各クラスの平均値が全体の平均から離れるような閾値 $t$ は $S^2_b$ を大きくします。

分離度X

ここで分離度 $X$ を以下で定義します。

\begin{align}
X = \frac{S^2_b}{S^2_w}
\end{align}

ここで全分散 $S^2$ に対して

\begin{align}
S^2 = S^2_b + S^2_w
\end{align}

の関係(あとで導出)を用いると

\begin{align}
X = \frac{S^2_b}{S^2 - S^2_b}
\end{align}

となり、 $S^2$ は閾値 $t$ の位置に依存しないので $X$ は $S^2_b$ にのみ依存します。

閾値tの決め方

大津の二値化では分離度 $X$ 最大となる時の閾値 $t$ をもっともそれっぽい閾値として選択します。

$S^2_b$ 最大の時に $X$ が最大となるので、

$S^2_b$ が最大となる時の閾値 $t$ を探しましょう。

数式処理

僕がつまづいたのは

\begin{align}
S^2 = S^2_b + S^2_w
\end{align}

ってなんだよというところです。

そこで色々式変形のあとを残しておきます

$S^2_b$ の式変形

まず $S^2_b$ について、

\begin{align}
S^2_b &= \frac{n_1}{n} (\mu_1 - \mu)^2 + \frac{n_2}{n} (\mu_2 - \mu)^2 \\
&= \frac{n_1}{n} \left( \mu_1^2 -2\mu_1 \mu + \mu^2 \right) + \frac{n_2}{n} \left( \mu_2^2-2\mu_2 \mu + \mu^2 \right) \\
&=\frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) + \frac{n_1 + n_2}{n} \mu^2 -2 \frac{1}{n} \mu \left( n_1 \mu_1 + n_2 \mu_2 \right)
\end{align}

ここで、 $n = n_1 + n_2$ 、 $n \mu = n_1 \mu_1 +n_2 \mu_2$ より、

\begin{align}
S^2_b &= \frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) + \mu^2 -2 \mu^2 \\
&= \frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) - \mu^2
\end{align}

と表すことができます。上式はあとで使います。

またもうちょっと頑張ると、

\begin{align}
S^2_b &= \frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) - \mu^2　\\
&= \frac{1}{n^2} \left[ n n_1 \mu_1^2 + n n_2 \mu^2 - n^2 \mu^2 \right] \\
&= \frac{1}{n^2} \left[ \left(n_1 + n_2 \right) n_1 \mu_1^2 + \left(n_1 + n_2 \right) n_2 \mu^2_2 - \left( n_1 \mu_1 + n_2 \mu_2 \right)^2 \right] \\
&= \frac{1}{n^2}\left[ n_1 n_2 \mu_1^2 + n_1 n_2 \mu_2^2 + \left( n_1^2 \mu_1^2 + n_2^2
\mu_2^2 \right) - \left( n_1^2 \mu_1^2 + n_2^2 \mu_2^2 + 2n_1 n_2 \mu_1 \mu_2 \right) \right] \\
&= \frac{n_1 n_2}{n^2} \left( \mu_1^2 -2 \mu_1 \mu_2 + \mu_2^2 \right) \\
&= \frac{n_1 n_2}{n^2} \left( \mu_1 - \mu_2 \right)^2
\end{align}

となります。この式はよく見かけますね。実際使うときもこの形が楽です。

全分散 $S^2 = S^2_b + S^2_w$ の導出

$S^2_w$ について式変換しておきます。

\begin{align}
S^2_1 &= \frac{1}{n_1} \sum_1 \left( x_i - \mu_1 \right)^2 \\
S^2_2 &= \frac{1}{n_2} \sum_2 \left( x_i - \mu_2 \right)^2
\end{align}

から、

\begin{align}
S^2_w &= \frac{n_1}{n} S^2_1 + \frac{n_2}{n} S^2_2 \\
&= \frac{1}{n} \left[ \sum_1 \left( x_i - \mu_1 \right)^2 + \sum_2 \left( x_i - \mu_2 \right)^2 \right] \\
&= \frac{1}{n} \left[ \sum_1 \left( x_i^2 -2 \mu_1 x_i + \mu_1^2 \right) + \sum_2 \left( x_i^2 -2 \mu_2 x_i + \mu_2^2 \right) \right] \\
&= \frac{1}{n} \left[ \left( \sum_1 x_i^2 + \sum_2 x_i^2 \right) -2 \left( \mu_1 \sum_1 x_i + \mu_2 \sum_2 x_i \right) + \left( \mu_1^2 \sum_1 1 + \mu_2^2 \sum_2 1 \right) \right] \\
&= \frac{1}{n} \left[ \sum_{all} x_i^2 -2 \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) + \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) \right] \\
&= \frac{1}{n} \sum_{all} x_i^2 -\frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right)
\end{align}

やっと準備が整いました。

\begin{align}
S^2_w &= \frac{1}{n} \sum_{all} x_i^2 -\frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) \\
S^2_b &= \frac{1}{n} \left( n_1 \mu_1^2 + n_2 \mu_2^2 \right) - \mu^2
\end{align}

から、

\begin{align}
S^2_b + S^2_w &= \\
&= \frac{1}{n} \sum_{all} x_i^2 - \mu^2 \\
&= \frac{1}{n} \left[\sum_{all} x_i^2 - n \mu^2 \right] \\
&= \frac{1}{n} \left[\sum_{all} x_i^2 - 2 n \mu^2 + n\mu^2 \right] \\
&= \frac{1}{n} \left[\sum_{all} x_i^2 - 2 n \mu \left( \frac{1}{n} \sum_{all} x_i \right) + n\mu^2 \right] \\
&= \frac{1}{n} \left[\sum_{all} x_i^2 - 2 \mu \sum_{all} x_i + \mu^2 \sum_{all} 1 \right] \\
&= \frac{1}{n} \left[\sum_{all} \left( x_i^2 -2 \mu x_i + \mu^2 \right) \right] \\
&= \frac{1}{n} \sum_{all} \left( x_i - \mu \right)^2 \\
&= S^2
\end{align}

やっとでました。

疲れたよもう

背景

大津の二値化概要

クラス内分散

クラス間分散