图像兴趣点的定位与描述研究
图像兴趣点的定位与描述研究
毛金玲 辽宁建筑职业学院 辽宁辽阳
111000
【文章摘要】
由金字塔图像可以对每一尺度层求出局部最值,这样的点数目将是十分可观的,所以需要使用某种方法抑制去除一部分点,但又使得同一尺度下的兴趣点得以保存,这里就需要对图像兴趣点进行定位。
【关键词】
图像兴趣点;Surf 算法;Hessian 矩阵
Surf (Speed-up
Robust Features)算法是Sift (Scale-invariant
Feature Transform) 算法的加速版,其在适中的条件下可以完成两幅图像中物体匹配的实时处理,其快速的基础实际上只有一个,即积分图像Haar 求导。提取图像Surf 特征可以分为提取图像兴趣点和兴趣点的描述2 个大的步骤,本文主要探讨兴趣点的定位和描述。
1 Hessian 矩阵
Surf 特征兴趣点的检测是基于Hessian 矩阵的行列式。给定一个连续的函数()y f x= ,则其Hessian 矩阵表示为
2
2 2 2 22 (
( )) f f x x y H f x f f x y y ∂ ∂ ∂ ∂ ∂ = ∂ ∂ ∂ ∂ ∂
(1)
那么,该矩阵的行列式为
2
2 2 2 2 2 det()
( ) f f f Hx y x y ∂ ∂ ∂ = − ∂ ∂ ∂ ∂ (2)
该行列式的值可以用来判断函数()y f x=
的极值点,如果矩阵在点(, )xy处的行列式值为负数,则说明其特征值异号,那么点(, )xy不为极值点;反之,则说明其特征值同号,不管同为正或同为负, 点(, )xy都为极值点。
对于一幅图像,我们可以运用同样的理论来计算图像中某点处的Hessian 矩阵。给定图像I 中的一点(, )x xy=
, Hessian 矩阵(,)Hxσ 在x处并且尺度为σ 的定义如下:
( , ) ( , ) ( , ) ( , ) ( , ) xx xy xy yy L x L x H x
L x L x σ σ σ σ σ = (3)
这里, ( , ) xx L xσ 是高斯二阶导数2 2( ) gxσ
∂ ∂ 与图像I 在点(, ) x xy= 处的卷积, xy L 和yy L 用同一方法求得。通过这种方法我们可以得到图像中每一个像素点的Hessian 行列式值,并且能通过这些值找到图像的兴趣点。
2 兴趣点的定位
由金字塔图像可以对每一尺度层求出局部最值,这样的点数目将是十分可观的,所以需要使用某种方法抑制去除一部分点,但又使得同一尺度下的兴趣点得以保存,这里就需要对图像兴趣点进行定位。图像兴趣点的定位分为三个步骤。
(1)设置阈值。将低于阈值的所有兴趣点去除,只留下特征比较强的点。
(2)三维非极大抑制。方法是将某点与它周围的26 个点进行比较,若不是局部最值,则去除,见图1。
(3)内插子像素精确定位。这里将Hessian 矩阵进行Taylor 展开,如下式
2 2 1( ) 2 T T H H H x H x xx
x x ∂
∂ = + + ∂ ∂ (4)
当() 0Hx= 时,可求得极值的差值点 (, ,)xxyσ
= ,为
2 1 2 H H x x x − ∂ ∂ = − ∂ ∂ (5)
当x的值在x,y或者σ
方向上大于0.5 是,继续进行差值操作,直到x在所有方向上小于0.5 或插值操作过多。得到的一系列点中,去除那些不收敛的点,剩余的点就作为兴趣点保存下来。
图1 三维非极大抑制示意图
3 兴趣点描述
Surf 算法中采用的描述子与SIFT 类似,也是基于兴趣点的领域分布,具体是计算了在x 和y 方向上的Harr 小波值分布。这样做同样是因为可以借助积分图加速运算,同时只用了64 维信息。兴趣点描述子的提取可以分为两个步骤,将在下面进行描述。
3.1 方向分配
为了使旋转图像具有方向不变性,图像中每个兴趣点被指派了一个主方向,兴趣点描述子的构成与这个主方向紧紧联系在一起,主方向的确定方法如下:
(1)在以6s 为半径的圆形领域内,采样计算x 和y 方向上的Haar 小波响应,采样步长设为s,小波的大小设为4s。这里s 指的是被检测兴趣点所处的尺度。
Haar 小波是一种可以用来找到x 和y 方向上梯度的简单滤波器,如图2 所示。
(a)x
方向 (b) y 方向
图2 Haar 小波滤波器
其中,黑色区域的权值为1,白色区域的权值为-1。采用积分图像,6
次模板滤波可完成响应的计算。
小波响应计算完毕后以兴趣点为中心进行高斯加权(2sσ = ),这样得到的对兴趣点的描述可用一个点坐标(, )xy表示, 其中x 和y 分别表示x 方向上和y 方向上的响应。
采用一个大小为3π 的滑动窗口,计算窗口内响应总和(水平和垂直方向分别求和),这样就产生一个新的矢量,然后找到最长的矢量作为对该兴趣点的矢量描述,如图3 所示。
图3 兴趣点主方向确定示意图
3.2 基于Haar 小波响应的描述子
对于描述子的提取,第一步是在兴趣点附近构造一个带方向(上文所述主方向)方框,这个方框应该包括兴趣点的所有特征向量,边长大小设为20s。这里s 同样指的是被检测兴趣点所处的尺度。如图4 所示。
这些方框将被分为44× 共16个子区域,对每个子区域我们计算25 (55×)个空间归一化的采样点的Haar 小波响应。假定用dx表示水平方向上的Haar 小波响应,dy 表示垂直方向上的Haar 小波响应(滤波器大小为2s),这里的“水平”和“垂直”是相对于兴趣点的主方向而言的,参见图5。
在图5 中我们可以看到,每个兴趣点所在方框被分成16
个子区域后,没个子区域有被分为4 个小块,这里的小块即是实际中描述子的基本元。
4 结语
对于每一个基本元,我们分别计算四个量:dxΣ,dx Σ ,dy Σ,dy Σ ,这样我们可以用矢量(,,,) dxdx
dydy ν = ΣΣ
ΣΣ 来表示每个区域,对每个方框将44× 个子区域的响应矢量组合,就形成了一个64 维的描述子矢量。最后再对这个64 维的矢量单位归一化,则得到的矢量就具有了尺度不变性。
【参考文献】
[1] 朱志文, 沈占锋, 骆剑承. 改进SIFT 点特征的并行遥感影像配准[J]. 遥感学报.2011(05)
[2] 刘玉, 王敬东, 李鹏. 一种基于SIFT 和KLT 相结合的特征点跟踪方法研究[J]. 宇航学报. 2011(07)
[3] 梁栋, 颜普, 朱明, 胡根生. 一种基于NSCT 和SIFT 的遥感图像配准算法[J].
仪器仪表学报. 2011(05)
【作者简介】
毛金玲(1974-)女, 汉族,辽宁海城人,讲师,硕士,研究方向为软件开发。