【老文新发】Otsu大津法详解及python实现

原文：A Threshold Selection Method from Gray-Level Histograms
A Fast Algorithm for Multilevel Thresholding

前言

大津法包含两个重要的概念：类间方差（between-class variance）和类内方差（within-class variance）

两者的详细关系推导可后文。

大津法又称为最大类间方差法是有原因的。因为这个算法的目的就是最大化类间方差，且这个最优阈值一定存在。

大津法作为阈值自动分割的经典算法，其思想很巧妙，值得学习。

大津法推导

在这里插入图片描述
如图所示，右边分割分明，其类间的差异大，区分明显，所以其类间方差更大。

大津法就是要实现这个过程。

我们先做图像的直方图，统计每个很小像素区间包含的像素个数。

即将图像像素值分为 [ 1 , 2 , 3 , …. , L] 个区间。用 $n_{i}$ 表示各个水平像素值的像素个数，总像素个数与 $n_{i}$ 关系为：
$N=n_1+n_2+\ldots+n_L$
像元个数 $ni$ 比上总像元数 N 即可得到某个像素区间出现的频率，定义 $p i$
$p_i=n_i / N_i, p_i \geq 0, \sum_{i=1}^L p_i=1$
根据原文，是利用一个阈值 k 把图像分为两类 $C 0 、 C 1 。 k \in [1, 2, 3, \dots ., L]$
我们分别求出这个阈值前后的局部频率之和，定义如下：

\begin{matrix} C_{0} = [1, k] \\ C_{1} = [k + 1, L] \\ w_{0} = \Pr (C_{0}) = \sum_{i = 1}^{k} p_{i} = w (k) \\ w_{1} = \Pr (C_{1}) = \sum_{i = k + 1}^{L} p_{i} = 1 - w (k) \end{matrix}

C_{0} = [1, k] C_{1} = [k + 1, L] w_{0} = Pr (C_{0}) = i = 1 \sum k p_{i} = w (k) w_{1} = Pr (C_{1}) = i = k + 1 \sum L p_{i} = 1 - w (k)

则灰度图像频率直方图的总的数学期望和 C0 、C1的数学期望如下：

\begin{matrix} u_{0} = \sum_{i = 1}^{k} i * \Pr (i ∣ C_{0}) = \sum_{i = 1}^{k} i * p_{i} / w_{0} = \frac{u (k)}{w (k)} \\ u_{1} = \sum_{i = k + 1}^{L} i * \Pr (i ∣ C_{1}) = \sum_{i = k + 1}^{L} i * p_{i} / w_{1} = \frac{u_{T} - u (k)}{1 - w (k)} \\ u_{T} = u (L) = \sum_{i = 1}^{L} i * p_{i} \end{matrix}

上式各个变量之间的关系如下：

w_0 u_0+w_1 u_1=u_T \quad w_0+w_1=1

期望有了，计算一下对应的方差：

\begin{matrix} σ_{0}^{2} = \sum_{i = 1}^{k} {(i - u_{0})}^{2} \Pr (i ∣ C_{0}) = \sum_{i = 1}^{k} {(i - u_{0})}^{2} p_{i} / w_{0} \\ σ_{1}^{2} = \sum_{i = k + 1}^{L} {(i - u_{1})}^{2} \Pr (i ∣ C_{1}) = \sum_{i = k + 1}^{L} {(i - u_{1})}^{2} p_{i} / w_{0} \\ σ_{T}^{2} = \sum_{i = 1}^{L} {(i - u_{T})}^{2} p_{i} \end{matrix}

根据文献：Introduction to statistical pattern recognition，260-267。类内误差、类间误差、总误差有如下关系：

\sigma_w^2=w_0 \sigma_0^2+w_1 \sigma_1^2

类间误差\sigma_b^2=w_0\left(u_0-u_T\right)^2+w_1\left(u_1-u_T\right)^2

$总误差\sigma_w^2+\sigma_b^2=\sigma_T^2$
注意：总误差是与阈值k无关的，但类间误差和类内误差是与阈值k相关的函数

\begin{matrix} σ_{b}^{2} = w_{0} {(u_{0} - u_{T})}^{2} + w_{1} {(u_{1} - u_{T})}^{2} \\ = w_{0} {(u_{0} - (w_{0} u_{0} + w_{1} u_{1}))}^{2} + w_{1} {(u_{1} - (w_{0} u_{0} + w_{1} u_{1}))}^{2} \\ = w_{0} w_{1} {(u_{1} - u_{0})}^{2} \end{matrix}

σ_{b}^{2} = w_{0} (u_{0} - u_{T})^{2} + w_{1} (u_{1} - u_{T})^{2} = w_{0} (u_{0} - (w_{0} u_{0} + w_{1} u_{1}))^{2} + w_{1} (u_{1} - (w_{0} u_{0} + w_{1} u_{1}))^{2} = w_{0} w_{1} (u_{1} - u_{0})^{2}

然后再分别把w0,u1,u0带入，可得到：

\sigma_b^2=\frac{\left[u_T w(k)-u(k)\right]^2}{w(k)[1-w(k)]}

则求解最大类间误差为:
$\sigma_b^2\left(k^*\right)=\max _{1 \leq kσb2(k∗)=1≤k<Lmaxσb2(k)$

由上述 $\sigma_b^2$ 的分母可以发现， $w (k)$ 可以取到 1 也可以取到0，因此在边界上 $\sigma_b^2$ 可以无穷大，而在开基 $(0, 1)$ 则类间方差有限，因此在定义域
$S^*=k: w_0 w_1=w(k)[1-w(k)]>0$
因此必定存在一个阈值k使得两类类间方差最大。
以下是python代码实现：

def otsu(gray_img):
    n_count = gray_img.size

    gray_img_array = gray_img.flatten()
    index = np.flatnonzero(gray_img_array)
    gray_img_data = gray_img_array[index]
    
    threshold_t = 0
    max_g = 0
    
    t = np.linspace(start=-1, stop=1, num=256)
    # 遍历每一个灰度层
    for i in range(len(t)):
    	# 使用numpy直接对数组进行运算
        n0 = gray_img_data[np.where(gray_img_data < t[i])]
        n1 = gray_img_data[np.where(gray_img_data >= t[i])]
        w0 = len(n0) / n_count
        w1 = len(n1) / n_count
        u0 = np.mean(n0) if len(n0) > 0 else 0.
        u1 = np.mean(n1) if len(n0) > 0 else 0.
        
        g = w0 * w1 * (u0 - u1) ** 2
        if g > max_g:
            max_g = g
            threshold_t = t[i]
    print('类间方差最大阈值：', threshold_t)
    gray_img[gray_img < threshold_t] = 0
    gray_img[gray_img >= threshold_t] = 1
    return gray_img
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

这个在opencv中已经有实现，可以直接调用

import cv2
t, otsu = cv2.threshold(img, 0, 255, cv2>THRESH_BINARY + cv2.THRESH_OTSU)
1
2

多分类最大类间方差法

根据以上公式类推到多分类的最大类间方差法，假设有 $\mathrm{m}-1$ 个阈值 $\{\mathrm{t} 1, \mathrm{t} 2, \ldots, \mathrm{tM}-1\}$ 将图像分为 $\mathrm{M}$ 类， $C_1$ ， $C_2 \ldots C_M$ 。则存在一组阈值 $\left\{t 1^*, \mathrm{t} 2^*, \ldots, \mathrm{tM}-1^*\right\}$ 使得

\begin{aligned} {t_{1} *, t_{2} *, \dots, t_{M - 1} *} = & Arg Max {σ_{B}^{2} (t_{1}, t_{2}, \dots, t_{M - 1})}, \\ 1 \leq t_{1} < \dots < t_{M - 1} < L \end{aligned}

{t_{1} *, t_{2} *, \dots, t_{M - 1} *} = Arg Max {σ_{B}^{2} (t_{1}, t_{2}, \dots, t_{M - 1})}, 1 \leq t_{1} < \dots < t_{M - 1} < L

成立
其中:

\begin{aligned} σ_{B}^{2} & = \sum_{k = 1}^{M} ω_{k} {(μ_{k} - μ_{T})}^{2} \\ ω_{k} & = \sum_{i \in C k} p_{i}, \\ μ_{k} & = \sum_{i \in C k} i p_{i} / ω (k) . \end{aligned}

σ_{B}^{2} ω_{k} μ_{k} = k = 1 \sum M ω_{k} (μ_{k} - μ_{T})^{2} = i \in Ck \sum p_{i}, = i \in Ck \sum i p_{i} / ω (k) .

因为

\begin{matrix} \sum_{k = 1}^{M} ω_{k} = 1 \\ μ_{T} = \sum_{k = 1}^{M} ω_{k} μ_{k} . \end{matrix}

k = 1 \sum M ω_{k} = 1 μ_{T} = k = 1 \sum M ω_{k} μ_{k} .

因此

\sigma_{\mathrm{B}}{ }^{2}\left(\mathrm{t}_{1}, \mathrm{t}_{2}, \ldots, \mathrm{t}_{\mathrm{M}-1}\right)=\sum_{k=1}^{\mathrm{M}} \omega_{\mathrm{k}} \mu_{\mathrm{k}}^{2}-\mu_{\mathrm{T}}{ }^{2}

$\mu \mathrm{T}$ 与间值无关，因此求上式的最大值可转为:

\begin{matrix} {t_{1}^{*}, t_{2}^{*}, \dots, t_{M - 1}^{*}} = Arg Max {{(σ_{B}^{'})}^{2} {{t_{1}, t_{2}, \dots, t_{M - 1}}} \\ 1 \leq t_{1} < \dots < t_{M - 1} < L \\ {(σ_{B})}^{2} = \sum_{k = 1}^{M} ω_{k} μ_{k}^{2} \end{matrix}

{t_{1}^{*}, t_{2}^{*}, \dots, t_{M - 1}^{*}} = Arg Max {(σ_{B}^{'})^{2} {{t_{1}, t_{2}, \dots, t_{M - 1}}} 1 \leq t_{1} < \dots < t_{M - 1} < L (σ_{B})^{2} = \sum_{k = 1}^{M} ω_{k} μ_{k}^{2}

类间方差、类内方差和总方差关系

https://blog.csdn.net/qq_42164483/article/details/119064535
https://blog.csdn.net/m0_38024332/article/details/104226806
以上这两篇博文讲的也很详细，内容有所参考，欢迎访问阅读。

相关阅读:
JavaScript命名冲突不可避免？冲突源有哪些
ATA-8061射频功率放大器在心室导管式扩压电式测力传感器中的应用
三元组顺序表表示的稀疏矩阵转置Ⅱ
C语言 - 数组
JDBC中ResultSet的使用
开发工程师必备————【Day29】Django补充（四）
吴恩达机器学习-可选实验:使用ScikitLearn进行线性回归（Linear Regression using Scikit-Learn）
场景交互与场景漫游-场景漫游器（6）
【二分】二分模板+二分题目
Nginx多IP端口路由配置

原文地址：https://blog.csdn.net/stone_tigerLI/article/details/134547688