图像处理中的矩:从几何矩到Hu不变矩
图像处理中的矩:从几何矩到Hu不变矩
图像的矩是一种描述图像特征的数学工具,用于量化图像的形状、大小和位置等属性。本文将介绍几种常见的图像矩,包括几何矩、中心矩、惯性矩、归一化中心矩和Hu不变矩。
几何矩
几何矩是描述图像形状的基本工具,定义如下:
$$
m_{pq}=\sum\limits_{(x,y) \in Object}{x^py^q}
$$
其中,$x$ 和 $y$ 分别是物体上每个像素的 $x$、$y$ 位置坐标。特别地:
- $m_{00}$ 表示图像像素个数
- $(m_{10}, m_{01})$ 表示图像质心
中心矩
中心矩具有平移不变性,定义如下:
$$
\mu_{pq}=\sum\limits_{(x,y) \in Object}{(x-m_{10})^p(y-m_{01})^q}
$$
惯性矩
惯性矩是一个 $2 \times 2$ 的矩阵,定义如下:
$$
I=\begin{bmatrix}\mu_{20} & \mu_{11} \\mu_{11} & \mu_{02}\end{bmatrix}
$$
计算 $I$ 的特征值和特征向量,特征向量的方向即为图像的主轴方向,可用于判断物体的倾斜角度。若特征值为 $\lambda_1$、$\lambda_2$,且 $\lambda_1 > \lambda_2$,则物体的惯性比为 $\frac{\lambda_2}{\lambda_1}$,离心率为 $\sqrt{1-(\frac{\lambda_2}{\lambda_1})^2}$。
惯性矩的应用思想其实就是多元统计分析中的主成分分析法(Principal Component Analysis, PCA),多用于数据降维。惯性矩将物体的二维像素点视为一个个样本,对像素点做 PCA($I$ 为像素点的协方差矩阵)。
将样本投影到特征值最大的那个特征向量方向,样本方差最大。
归一化中心矩
归一化中心矩具有平移不变性和尺度不变性,定义如下:
$$
y_{pq}=\frac{\mu_{pq}}{\mu_{00}^r}
$$
其中,$r = \frac{p+q+2}{2}$,$p+q=2,3,\cdots$
Hu不变矩
Hu不变矩具有平移不变性、尺度不变性和旋转不变性,定义如下:
$$
\begin{align*}
h1&=y_{20}+y_{02} \
h2&=(y_{20}+y_{02})^2+4y_{11}^2 \
h3&=(y_{30}-3y_{12})^2+(3y_{21}-y_{03})^2 \
h4&=(y_{30}+y_{12})^2+(y_{21}+y_{03})^2 \
h5&=(y_{30}-3y_{12})(y_{30}+y_{12})((y_{30}+y_{12})^2-3(y_{21}+y_{03})^2) \
&\quad+(3y_{21}-y_{03})(y_{21}+y_{03})(3(y_{30}+y_{12})^2-(y_{21}+y_{03})^2) \
h6&=(y_{20}-y_{02})((y_{30}+y_{12})^2-(y_{21}+y_{03})^2)+4y_{11}(y_{30}+y_{12})(y_{21}+y_{03}) \
h7&=(3y_{21}-y_{03})(y_{30}+y_{12})((y_{30}+y_{12})^2-3(y_{21}+y_{03})^2) \
&\quad-(y_{30}-3y_{12})(y_{21}+y_{03})(3(y_{30}+y_{12})^2-(y_{21}+y_{03})^2)
\end{align*}
$$
$$
H=[h1,h2,h3,h4,h5,h6,h7]
$$
Hu不变矩一般用于识别图像中大的物体,对物体的形状描述得比较好,如识别水果形状、车牌中的简单字符。