基于局部色度特征的图像聚类方法及系统的制作方法
【技术领域】
[0001]本发明涉及图像处理技术领域,特别涉及一种基于图像局部色度特征的图像聚类方法及系统。
【背景技术】
[0002]随着数码相机、智能手机等便携拍摄设备的普及,人们日常生活中的数字图像数量出现了爆炸式的增长,对这些图像进行归类、管理的需求也日益增长,而面对大量的图像数据,人工进行分拣归类是非常费时费力的,而图像的聚类技术可以在一定程度上缓解这个问题。图像聚类技术可以将杂乱无章的大量图像分为多个类别,属于同一类别的图像在特定意义下彼此之间是相似的,而属于不同类别的图像彼此之间相似度则是很低的,例如某一类别中的图像大都是足球比赛画面,而另外一个类别中的图像则大都是海滨风景画面等。得益于图像聚类技术,人们可以方便地对大量的图像数据进行管理。目前,已有较多的特征提取方法用于聚类与聚类分析,其中基于局部特征的方法得到了广泛的应用,但这些方法中有许多只站在灰度梯度特征的角度考虑问题,而忽略了色度特征的作用,未见基于图像局部色度特征的聚类方法的报道。
[0003]因而现有技术还有待改进和提高。
【发明内容】
[0004]本发明要解决的技术问题在于,针对现有技术的不足,提供一种基于局部色度特征的图像聚类方法及系统,其利用图像局部灰度梯度与色度的特征,提高对图像的特性的表征能力,改善了图形聚类的效果。
[0005]为了解决上述技术问题,本发明所采用的技术方案如下:
一种基于局部色度特征的图像聚类方法,其包括:
A、对每幅训练图像采用SURF特征提取算法提取SURF特征,根据所述SURF特征获取其对应的SURF-色度特征向量;
B、对整个训练图像集合的SURF-色度特征向量采用K均值聚类算法聚类得到SURF-色度特征向量词典;
C、对待聚类的每幅图像提取用于生成B0W特征向量的SURF-色度特征向量,并结合所述SURF-色度特征向量词典生成表征所述待聚类的每幅图像的B0W特征向量;
D、对所有待聚类图像的BOW特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,并根据所述聚类对图像进行相应的聚类。
[0006]所述的基于局部色度特征的图像聚类方法,其中,所述步骤A具体包括:
A1、对每幅训练图像提取SURF特征点,根据所述SURF特征点获取其对应的SURF特征向量;
A2、提取所述SURF特征向量对应的色度特征向量,根据所述SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量。
[0007]所述的基于局部色度特征的图像聚类方法,其中,所述步骤A2中所述的提取所述SURF特征向量对应的色度特征向量具体过程为:将提取所述SURF特征向量的图像区域划分为若干子区域,分别提取所述若干子区域的平均色度分量,所述平均色度分量构成色度特征向量。
[0008]所述的基于局部色度特征的图像聚类方法,其中,所述步骤A2中所述的根据SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量具体过程为:将所述SURF特征向量及与其对应的色度特征向量进行拼接并归一化得到SURF-色度特征向量。
[0009]所述的基于局部色度特征的图像聚类方法,其中,所述步骤B中所述的对待聚类的每幅图像提取SURF-色度特征向量采用的提取方法与步骤A中提取训练图像SURF-色度特征向量的方法相同。
[0010]所述的基于局部色度特征的图像聚类方法,其中,所述步骤C中基于SNN相似度的DBSCAN聚类算法中SNN相似度的计算基于余弦相似度。
[0011]—种基于局部色度特征的图像聚类系统,其包括:
提取模块,用于采用SURF特征提取算法提取每幅图像的SURF-色度特征向量;
聚类模块,用于对整个训练图像集合的SURF-色度特征采用K均值聚类算法聚类得到特征向量词典;
生成模块,用于将待聚类的每幅图像的SURF-色度特征向量结合所述SURF-色度特征向量词典生成表征所述待聚类的每幅图像的B0W特征向量;
划分模块,用于对所有待聚类图像的B0W特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,并根据所述聚类对图像进行相应的聚类。
[0012]所述的基于局部色度特征的图像聚类系统,其中,所述提取模块包括:
SURF特征向量提取子模块,用于对每幅图像提取SURF特征点,根据所述SURF特征点获取其对应的SURF特征向量;
SURF-色度特征向量提取子模块,用于提取所述SURF特征向量对应的色度特征向量,根据所述SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量。
[0013]所述的基于局部色度特征的图像聚类系统,其中,所述SURF-色度特征向量提取子模块还用于将提取所述SURF特征向量的图像区域划分为若干子区域,分别提取所述若干子区域的平均色度分量,所述平均色度分量构成色度特征向量。
[0014]所述的基于局部色度特征的图像聚类系统,其中,所述SURF-色度特征向量提取子模块还用于将所述SURF特征向量以及与其对应的色度特征向量拼接并归一化。
[0015]有益效果:与现有技术相比,本发明所提供一种基于局部色度特征的图像聚类方法及系统,对每幅训练图像提取SURF-色度特征向量,对整个训练图像集合的SURF-色度特征进行K均值聚类以得到特征向量词典;对待聚类的所有图像提取SURF-色度特征向量,根据所述特征向量词典生成相应的B0W特征向量;对所有待聚类图像的B0W特征向量执行基于SNN相似度的DBSCAN聚类,根据所述聚类对相应的图像进行类别划分。本发明提出的方法充分利用了图像局部灰度梯度和色度的特征,对图像的特性有更好的表征能力,也改善了聚类的效果。此外,在对图像进行聚类时,使用基于SNN相似性的DBSCAN聚类方法,可以处理不同大小、形状和密度的簇,改善了图像的聚类效果。
【附图说明】
[0016]图1为本发明基于局部色度特征的图像聚类方法较佳实施例的流程图。
[0017]图2为本发明基于局部色度特征的图像聚类系统的结构原理图。
【具体实施方式】
[0018]本发明提供基于局部色度特征的图像聚类方法及系统,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0019]对本发明提供实施例中的术语进行说明,其中所使用的“SURF特征提取算法”为Speeded Up Robust Features,加速稳健性特征提取算法,其为一种局部特征提取算法。“SURF-色度特征向量”为局部色度特征向量,其有SURF特征向量与其对应的平均色度向量构成。“K均值聚类算法”为K-means聚类算法,采用的欧式距离度量方法,即计算每个对象到各个聚类中心的距离,离哪个聚类中心的距离最短则属于哪一类。“BoW”(Bag Of Words)算法也称为词袋算法,起源于基于语义的文本检索算法,是一种有效地基于语义特征提取与描述的物体识别算法。BoW模型通过对图像进行特征提取和描述,得到大量特征进行处理,从而得到用来表示图像的单词,并在此基础上构建视觉词典,然后对待聚类图像采用相同的处理方法并生成B0W特征,将结果代入到训练的聚类器中进行聚类。“SNN相似度”为计算共享最近邻相似度。“DBSCAN聚类算法”为Density Based Spatial Clustering ofApplicat1ns with Noise聚类算法,其为基于密度聚类算法,其中心思想为:若一个点簇可由其中的任何核心对象唯一确定,对于某一点簇中的对象,给定半径的邻域内数据对象个数必须大于给定值。“基于SNN相似度的DBSCAN聚类算法”为将SNN的相似度与DBSCAN聚类算法相结合的聚类算法,即基于计算共享最近邻相似度的DBSCAN聚类算法。
[0020]下面结合附图,通过对实施例的描述,对
【发明内容】
作进一步说明。
[0021]请参见图1,图1为本发明提供基于局部色度特征的图像聚类方法较佳实施例的流程图。所述方法包括:
S1、对每幅训练图像采用SURF特征提取算法提取SURF特征,根据所述SURF特征获取其对应的SURF-色度特征向量。
[0022]具体地,所述SURF特征提取算法为一种局部特征提取算法,其算法提取的特征具有尺度不变、旋转不变的性能,对光照变化、仿射变化、透视变换具有部分不变性。在实际应用中,对每幅训练图像采用SURF特征提取算法提取SURF特征,根据所述SURF特征获取每幅训练图像SURF-色度特征向量的过程可以为:首先,对于每幅训练图像提取其所有SURF(Speeded Up Robust Features,加速稳健性特征)特征点,并基于所述训练图像的每个SURF特征点提取SURF特征向量。其中,提取图像中的SURF特征点及SURF特征向量为数字图像处理领域的公知技术,这里不再赘述。值得注意的,本实施例中基于图像的SURF特征点提取SURF特征向量时,是以SURF特征点为中心的方形图像区域内进行,在其他实施例中,其可以采用以SURF特征点为中心的其他形状,如长方形、圆形等,这里不做具体限制。
[0023 ]其次,将每个提取SURF特征向量由SURF特征点的主方向确定的方形图像区域进一步分割成若干个方形子区域,例如,9、16、25、36等,对于这个这边不做具体限制,其可以根据待聚类图像的特征及对图像聚类准确性的要求而设定。本实施例中分割成16个方形子区域,在分别提取所述16方形子区域的平均色度分量,所述16个平均色度分量组成一个16维色度向量,将所述16维色度向量与相应SURF特征点的SURF特征向量拼接为一个维度更高的新向量,并将所述新向量进行归一化处理,就得到所述SURF特征点对应的SURF-色度特征向量。在实际应用中,所述若干方形子区域可以是全等的子区域,这样可以提高色度向量的准确性。其中,提取图像的色度分量及归一化处理为数字图像处理领域的公知技术,这里不再赘述。
[0024]S2、对整个训练图像集合的SURF-色度特征向量采用K均值聚类算法聚类得到SURF-色度特征向量词典。
[0025]具体地,每幅训练图像都提取出了一定数量的SURF-色度特征向量,整个训练图像集合中的图像提取的SURF-色度特征向量
数量巨大。从而采用K均值聚类算法对所有训练图像中提取出的全部SURF-色度特征向量进行聚类,以得到特征向量词典。所述“K均值聚类算法”为K-means聚类算法,其采用的欧式距离度量方法,即计算每个对象到各个聚类中心的距离,离哪个聚类中心的距离最短则属于哪一类。进一步,通过K均值聚类生成特征向量词典为数字图像处理领域的公知技术,这里不再赘述。
[0026]S3、对待聚类的每幅图像提取用于生成B0W特征向量的SURF-色度特征向量,并结合所述SURF-色度特征向量词典生成表征所述待聚类的每幅图像的B0W特征向量。
[0027]具体地,对于需要进行聚类的每幅图像,提取图像中所有SURF-色度特征向量,并结合特征向量词典生成用以表征该幅图像的BoW(Bag of Words词袋)特征向量,这样就将需要进行聚类的所有图像都转化成了与其对应的B0W特征向量。值得的注意的,对于需要聚类的每幅图像提取图像中所有SURF-色度特征向量的方法与提取训练图像中所有SURF-色度特征向量的方法相同,其不可以采用不同的方法,这样采用利用由SURF-色度特征向量生成的特征向量词典生成以表征该幅图像的B0W特征向量。其中,B0W(Bag Of Words)算法也称为词袋算法,起源于基于语义的文本检索算法,是一种有效地基于语义特征提取与描述的物体识别算法。B0W模型通过对图像进行特征提取和描述,得到大量特征进行处理,从而得到用来表示图像的单词,并在此基础上构建视觉词典,然后对待聚类图像采用相同的处理方法并生成B0W特征,将结果代入到训练的聚类器中进行聚类。对于基于特征向量词典生成图像的B0W特征向量为数字图像处理领域公知技术,这里不再赘述。
[0028]S4、对所有待聚类图像的B0W特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,并根据所述聚类对图像进行相应的聚类。
[0029]具体地,对所有待聚类图像的B0W特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,以将所有待聚类图像的B0W特征向量划分为不同的簇,属于同一个簇中的B0W特征向量对应的图像也相应地划分为同一个类别的图。其采用DBSCAN聚类算法对B0W特征向量进行聚类处理,针对分布不规则和含有大量噪音的数据进行处理,使得生成的密度簇参考点具有较高的精度。在实际应用中,所述SNN相似度基于余弦相似度来计算。需要注意的是,使用DBSCAN聚类后,有一部分图像会被抛弃,即这部分图像不属于已经划分好的任一类另IJ,这部分图像可以留待人工处理。在这里,SNN相似度为计算中使用的基本邻近性的度量,DBSCAN (Density Based Spatial Clustering of Applicat1ns with Noise)聚类算法为基于密度的聚类方法,其中心思想为:若一个点簇可由其中的任何核心对象唯一确定,对于某一点簇中的对象,给定半径的邻域内数据对象个数必须大于给定值。对于SNN相似度计算、DBSCAN聚类算法和余弦相似度皆为数字图像处理领域公知技术,这里不再赘述。
[0030]本发明所提供一种基于局部色度特征的图像聚类方法,对每幅训练图像提取SURF-色度特征向量,对整个训练图像集合的SURF-色度特征进行K均值聚类以得到特征向量词典;对待聚类的所有图像提取SURF-色度特征向量,根据所述特征向量词典生成相应的B0W特征向量;对所有待聚类图像的B0W特征向量执行基于SNN相似度的DBSCAN聚类,根据所述聚类对相应的图像进行类别划分。本方法结合了图像的局部灰度梯度和局部色度特征,可以简单、有效地实现图像的聚类。同时对图像的特性有更好的描述能力,更能表现类内样本的相似性和类间样本的相异性,可以得到更好的聚类结果。
[0031]本发明还提供了一种基于局部色度特征的图像聚类系统,请参照图2,所述系统包括:
提取模块100,用于采用SURF特征提取算法提取每幅图像的SURF-色度特征向量,具体如上所述;
聚类模块200,用于对整个训练图像集合的SURF-色度特征采用K均值聚类算法聚类得到特征向量词典,具体如上所述;
生成模块300,用于将待聚类的每幅图像的SURF-色度特征向量结合所述SURF-色度特征向量词典生成表征所述待聚类的每幅图像的B0W特征向量,具体如上所述;
划分模块400,用于对所有待聚类图像的B0W特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,并根据所述聚类对图像进行相应的聚类。
[0032]所述的基于局部色度特征的图像聚类系统,其中,所述提取模块100包括:
SURF特征向量提取子模块,用于对每幅图像提取SURF特征点,根据所述SURF特征点获取其对应的SURF特征向量;
SURF-色度特征向量提取子模块,用于提取所述SURF特征向量对应的色度特征向量,根据所述SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量。
[0033]所述的基于局部色度特征的图像聚类系统,其中,所述SURF-色度特征向量提取子模块还用于将提取所述SURF特征向量的图像区域划分为若干子区域,分别提取所述若干子区域的平均色度分量,所述平均色度分量构成色度特征向量。
[0034]所述的基于局部色度特征的图像聚类系统,其中,所述SURF-色度特征向量提取子模块还用于将所述SURF特征向量以及与其对应的色度特征向量拼接并归一化。
[0035]上述基于局部色度特征的图像聚类系统的各个单元模块都已经在上述方法中进行了详细介绍,这里就不再赘述了。
[0036]可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
【主权项】
1.一种基于局部色度特征的图像聚类方法,其特征在于,其包括: A、对每幅训练图像采用SURF特征提取算法提取SURF特征,根据所述SURF特征获取其对应的SURF-色度特征向量; B、对整个训练图像集合的SURF-色度特征向量采用K均值聚类算法聚类得到SURF-色度特征向量词典; C、对待聚类的每幅图像提取用于生成BOW特征向量的SURF-色度特征向量,并结合所述SURF-色度特征向量词典生成表征所述待聚类的每幅图像的BOW特征向量; D、对所有待聚类图像的BOW特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,并根据所述聚类对图像进行相应的聚类。2.根据权利要求1所述的基于局部色度特征的图像聚类方法,其特征在于,所述步骤A具体包括: A1、对每幅训练图像提取SURF特征点,根据所述SURF特征点获取其对应的SURF特征向量; A2、提取所述SURF特征向量对应的色度特征向量,根据所述SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量。3.根据权利要求2所述的基于局部色度特征的图像聚类方法,其特征在于,所述步骤A2中所述的提取所述SURF特征向量对应的色度特征向量具体过程为:将提取所述SURF特征向量的图像区域划分为若干子区域,分别提取所述若干子区域的平均色度分量,所述平均色度分量构成色度特征向量。4.根据权利要求2所述的基于局部色度特征的图像聚类方法,其特征在于,所述步骤A2中所述的根据SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量具体过程为:将所述SURF特征向量及与其对应的色度特征向量进行拼接并归一化得到SURF-色度特征向量。5.根据权利要求1-4任一所述的基于局部色度特征的图像聚类方法,其特征在于,所述步骤B中所述的对待聚类的每幅图像提取SURF-色度特征向量采用的提取方法与步骤A中提取训练图像SURF-色度特征向量的方法相同。6.根据权利要求1所述的基于局部色度特征的图像聚类方法,其特征在于,所述步骤C中基于SNN相似度的DBSCAN聚类算法中SNN相似度的计算基于余弦相似度。7.一种基于局部色度特征的图像聚类系统,其特征在于,其包括: 提取模块,用于采用SURF特征提取算法提取每幅图像的SURF-色度特征向量; 聚类模块,用于对整个训练图像集合的SURF-色度特征采用K均值聚类算法聚类得到特征向量词典; 生成模块,用于将待聚类的每幅图像的SURF-色度特征向量结合所述SURF-色度特征向量词典生成表征所述待聚类的每幅图像的BOW特征向量; 划分模块,用于对所有待聚类图像的BOW特征向量采用基于SNN相似度的DBSCAN聚类算法进行聚类,并根据所述聚类对图像进行相应的聚类。8.根据权利要求7所述的基于局部色度特征的图像聚类系统,其特征在于,所述提取模块包括: SURF特征向量提取子模块,用于对每幅图像提取SURF特征点,根据所述SURF特征点获取其对应的SURF特征向量; SURF-色度特征向量提取子模块,用于提取所述SURF特征向量对应的色度特征向量,根据所述SURF特征向量以及与其对应的色度特征向量得到SURF-色度特征向量。9.根据权利要求8所述的基于局部色度特征的图像聚类系统,其特征在于,所述SURF-色度特征向量提取子模块还用于将提取所述SURF特征向量的图像区域划分为若干子区域,分别提取所述若干子区域的平均色度分量,所述平均色度分量构成色度特征向量。10.根据权利要求9所述的基于局部色度特征的图像聚类系统,其特征在于,所述SURF-色度特征向量提取子模块还用于将所述SURF特征向量以及与其对应的色度特征向量拼接并归一化。
【专利摘要】本发明公开了一种基于局部色度特征的图像聚类方法及系统,对每幅训练图像提取SURF-色度特征向量,对整个训练图像集合的SURF-色度特征进行K均值聚类以得到特征向量词典;对待聚类的所有图像提取SURF-色度特征向量,根据所述特征向量词典生成相应的BOW特征向量;对所有待聚类图像的BOW特征向量执行基于SNN相似度的DBSCAN聚类,根据所述聚类对图像进行相应的类别划分。本发明提出的方法充分利用图像局部灰度梯度和色度的特征,对图像的特性有更好的表征能力,改善了聚类的效果。此外,在对图像进行聚类时,使用基于SNN相似性的DBSCAN聚类方法,可以处理不同大小、形状和密度的簇,改善图像的聚类效果。
【IPC分类】G06K9/62, G06K9/46
【公开号】CN105488509
【申请号】CN201510801871
【发明人】陈永洒
【申请人】Tcl集团股份有限公司
【公开日】2016年4月13日
【申请日】2015年11月19日