一种基于改进k均值聚类算法的天空图像云空辨识方法
【技术领域】
[0001] 本发明涉及一种数字图像处理技术领域,尤其涉及一种基于改进k均值聚类算法 的天空图像云空辨识方法。
【背景技术】
[0002] 由于常规化石燃料的不可再生性以及使用化石燃料带来的气候变化和环境污染 的问题,以风电和光伏为主的可再生能源发电得到发展。太阳能发电的决定因素是地面接 收太阳短波辐射的强度。云的遮挡作用是造成太阳入射辐射随机波动的主要原因。光伏发 电短期预测无法捕捉因云团瞬时遮挡造成输出功率的瞬时大幅度波动,导致预测精度有 限。因此云团关键特征提取和描述的准确性,对于提高超短期预测的精度具有重要的意义, 进而对于提高光伏发电系统的效率、利用率以及电网的运行安全性和稳定性具有重要的工 程应用价值,对于地基天空图像的云空识别具有十分重要的意义。
[0003] 由于天空中云种类繁多、变幻莫测。以MATLAB软件数字图像处理功能进行云提取 为例,需按照经验选取固定的全局阈值对天空图像进行处理,全局阈值具有一定的局限性, 根据全局阈值取值的不同,造成对部分类型的天空图像呈现较好的处理结果,其余类型的 天空图像云提取效果较差的现象。因此,通过选取固定阈值进行图像云提取的方法适应性 差。
【发明内容】
[0004] 本发明提供一种基于改进k均值聚类算法的天空图像云空辨识方法,以解决现有 技术适应性差的问题。
[0005] 本发明提供一种基于改进k均值聚类算法的天空图像云空辨识方法,所述基于改 进k均值聚类算法的天空图像云空辨识方法包括以下步骤:针对天空图像中各个像素点,分 别提取所述天空图像中红颜色通道值R、绿颜色通道值G、蓝颜色通道值B以及R/B*100四个 矩阵,并根据所述四个矩阵提取特征矩阵;根据所述天空图像中需要辨识的区域种类个数 确定初始聚类数量,并基于历史图像数据设定各类别的初始聚类中心;基于改进k均值聚类 算法,根据所述初始聚类中心对所述像素点的特征向量进行聚类,获取新的聚类中心;根据 所述新的聚类中心对所述特征矩阵中的特征向量进行聚类;根据聚类结果确定各像素点所 属区域类型并绘制云空辨识图像。
[0006] 优选的,所述根据所述四个矩阵提取特征矩阵包括:将所述四个矩阵中的每一列 按列编号顺序排列成一个元素个数为m*n的列向量;将所述四个列向量按列向量R、列向量 G、列向量B和列向量R/B*100的顺序合并成一个四列特征矩阵。
[0007] 优选的,所述基于历史图像数据设定各类别的初始聚类中心包括:从历史数据中 选择各类别区域间差异明显的天空图像;分别提取各个区域中的N个像素点的特征向量,并 计算所述N个像素点的特征向量的算术平均值作为本区域的初始聚类中心,其中,N由天空 图像数量、天空图像分辨率以及天空图像区域的大小确定。
[0008] 优选的,所述基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点的特 征向量进行聚类,获取新的聚类中心包括:计算每个像素点特征向量到对应的所述初始聚 类中心的距离;将所述特征向量分配给与所述特征向量距离最近的所述初始聚类中心所对 应的类别;计算各类别中所包含的特征向量的算术平均值,并将所述算术平均值作为该类 别新的聚类中心。
[0009] 优选的,所述将所述特征向量分配给与所述特征向量距离最近的所述初始聚类中 心所对应的类别包括:若特征向量所属类别不唯一,则选取小类别标号作为所述特征向量 类别;若类别未包含任何像素点特征向量,则删除所述类别以及与所述类别对应的聚类中 心。
[0010]优选的,所述基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点的特 征向量进行聚类,获取新的聚类中心包括:基于改进k均值聚类算法重复获取新的聚类中 心,直到新的聚类中心不再改变或达到预设的最大重复次数后,输出聚类结果。
[0011]优选的,所述计算每个像素点特征向量到对应的所述初始聚类中心的距离的计算
2. 公式为: 其中XdPyi为像素点特征向量第i维数值,ai为特征向量第 i维数值的权重系数。
[0012]优选的,所述特征向量第i维数值的权重系数ai的计算方法为:将所述特征矩阵分 别删除各列,获取四个三列矩阵;利用传统k均值聚类算法,对所述特征矩阵和所述四个三 列矩阵分别聚类,获得聚类结果;计算所述四个三列矩阵聚类结果与所述特征矩阵聚类结 果的相关系数r 1;根据所述相关系数Γι计算权重系数,所述权重系数的计算公式为:ai = l- Γ?ο
[0013] 本发明的实施例提供的技术方案可以包括以下有益效果:
[0014] 本发明提供一种基于改进k均值聚类算法的天空图像云空辨识方法,所述基于改 进k均值聚类算法的天空图像云空辨识方法包括以下步骤:针对天空图像中各个像素点,分 别提取所述天空图像中红颜色通道值R、绿颜色通道值G、蓝颜色通道值B以及R/B*100四个 矩阵,并根据所述四个矩阵提取特征矩阵;根据所述天空图像中需要辨识的区域种类个数 确定初始聚类数量,并基于历史图像数据设定各类别的初始聚类中心;基于改进k均值聚类 算法,根据所述初始聚类中心对所述像素点的特征向量进行聚类,获取新的聚类中心;根据 所述新的聚类中心对所述特征矩阵中的特征向量进行聚类;根据聚类结果确定各像素点所 属区域类型并绘制云空辨识图像。本发明基于改进k均值聚类算法,提取效果较稳定,可以 将云和天空清晰的分割。同时,本方案不仅把三个彩色分量作为一个整体进行聚类还添加 了云空对比度较高的R/B*100列向量,与全局阈值仅对灰度图像进行云空识别相比,大大提 高了图像识别的适应能力,可以解决现有技术适应性差的问题。
[0015] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本发明。
【附图说明】
[0016] 图1是本发明实施例中提供的一种基于改进k均值聚类算法的天空图像云空辨识 方法的流程图;
[0017] 图2是本发明实施例中提供的根据所述四个矩阵提取特征矩阵的方法流程图;
[0018] 图3是本发明实施例中提供的基于历史图像数据设定各类别的初始聚类中心的方 法流程图;
[0019] 图4是本发明实施例中提供的步骤S03的方法流程图;
[0020] 图5是本发明实施例中提供的权重系数ai的计算方法流程图。
【具体实施方式】
[0021] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本发明的一些方面相一致的装置的例子。
[0022] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。
[0023] 请参看图1,所示为本发明实施例中提供的一种基于改进k均值聚类算法的天空图 像云空辨识方法的流程图。
[0024]由图1可知,本发明提供一种基于改进k均值聚类算法的天空图像云空辨识方法, 所述基于改进k均值聚类算法的天空图像云空辨识方法包括以下步骤:针对天空图像中各 个像素点,分别提取所述天空图像中红颜色通道值R、绿颜色通道值G、蓝颜色通道值B以及 R/B*100四个矩阵,并根据所述四个矩阵提取特征矩阵;根据所述天空图像中需要辨识的区 域种类个数确定初始聚类数量,并基于历史图像数据设定各类别的初始聚类中心;基于改 进k均值聚类算法,根据所述初始聚类中心对所述像素点的特征向量进行聚类,获取新的聚 类中心;根据所述新的聚类中心对所述特征矩阵中的特征向量进行聚类;根据聚类结果确 定各像素点所属区域类型并绘制云空辨识图像。本发明基于改进k均值聚类算法,提取效果 较稳定,可以将云和天空清晰的分割。同时,本方案不仅把三个彩色分量作为一个整体进行 聚类还添加了云空对比度较高的R/B*100列向量,与全局阈值仅对灰度图像进行云空识别 相比,大大提高了图像识别的适应能力,可以解决现有技术适应性差的问题。
[0025] 请参看图2,所示为本发明实施例中提供的根据所述四个矩阵提取特征矩阵的方 法流程图。
[0026] 由图2可知,将所述四个矩阵中的每一列按列编号顺序排列成一个元素个数为m*n 的列向量;将所述四个列向量按列向量R、列向量G、列向量B和列向量R/B* 100的顺序合并成 一个四列特征矩阵。
[0027] 请参看图3,所示为本发明实施例中提供的基于历史图像数据设定各类别的初始 聚类中心的方法流程图。
[0028] 由图3可知,所述基于历史图像数据设定各类别的初始聚类中心包括:从历史数据 中选择各类别(如天空区域、云团区域等)区域间差异明显的天空图像;分别提取各个区域 中的N个像素点的特征向量,并计算所述N个像素点的特征向量的算术平均值作为本区域的 初始聚类中心,其中,N由天空图
像数量、天空图像分辨率以及天空图像区域的大小确定,天 空图像数量越大、天空图像分辨率越低以及天空图像区域越大,则像素点的特征向量的选 取个数N越大。
[0029] 请参看图4,所示为本发明实施例中提供的步骤S03的方法流程图。
[0030] 由图4可知,所述基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点 的特征向量进行聚类,获取新的聚类中心包括:计算每个像素点特征向量到对应的所述初 始聚类中心的距离;将所述特征向量分配给与所述特征向量距离最近的所述初始聚类中心 所对应的类别;计算各类别中所包含的特征向量的算术平均值,并将所述算术平均值作为 该类别新的聚类中心。其中,所述将所述特征向量分配给与所述特征向量距离最近的所述 初始聚类中心所对应的类别包括:若特征向量所属类别不唯一,则选取小类别标号作为所 述特征向量类别;若类别未包含任何像素点特征向量,则删除所述类别以及与所述类别对 应的聚类中心。
[0031] 进一步的,所述基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点的 特征向量进行聚类,获取新的聚类中心包括:基于以上改进k均值聚类算法重复获取新的聚 类中心,直到新的聚类中心不再改变或达到预设的最大重复次数后,输出聚类结果,经过以 上过程的不断修正,使得本天空图像云空辨识方法准确性更高,适应能力更强。
[0032] 计算每个像素点特征向量到对应的所述初始聚类中心的距离的计算公式为:
[0033]
( 1 )
[0034] 公式(1)中xi和yi为像素点特征向量第i维数值,ai为特征向量第i维数值的权重系 数。
[0035] 请参看图5,所示为本发明实施例中提供的权重系数ai的计算方法流程图。
[0036] 由图5可知,将所述特征矩阵分别删除各列,获取四个三列矩阵;利用传统k均值聚 类算法,对所述特征矩阵和所述四个三列矩阵分别聚类,获得聚类结果;计算所述四个三列 矩阵聚类结果与所述特征矩阵聚类结果的相关系数η;根据所述相关系数rHf算权重系数, 所述权重系数的计算公式为:ai = 1 -r i。
[0037] ri的计算公式为:
(2.)
[0038]
[0039]公式(2)中,Γι为特征矩阵删除第i列得到的聚类结果矩阵与特征矩阵聚类结果矩 阵之间的相关系数,pmn为m行η列的特征矩阵聚类结果矩阵,>为矩阵P的均值,p的计算公 式为:
[0040]
[0041] 公式(3)中pxy为矩阵Ρ中X行y列的元素,m为矩阵Ρ的行数,η为矩阵Ρ的列数。
[0042] Qmni为特征矩阵删除第i列进行聚类得到的m行η列的聚类结果矩阵,g为矩阵Q的 均值,计算公式为:
[0043] (4)
[0044] ?M4j〒yxy73:i€件y〒x行y列的元素,m为矩阵Q的行数,η为矩阵Q的列数。
[0045] 本发明提出的基于改进k均值聚类算法的天空图像云空辨识方法与采用全局阈值 进行云提取的方法相比较具有以下优点:
[0046] 改进k均值聚类算法提取效果较稳定,并且能够通过权值的大小体现各分量图对 云空识别效果的影响,能将云和天空清晰的分割。
[0047]改进k均值聚类算法不仅把三个彩色分量作为一个整体进行聚类还添加了云空对 比度较高的R/B*l 00列向量,全局阈值仅对灰度图像进行云空识别。
[0048]本发明采用改进k均值聚类算法进行天空图像的云空辨识,聚类简洁,收敛速度 快;把三个彩色分量作为一个整体进行聚类,克服了处理灰度图像进行云空识别过于单一 的缺点,可以解决现有技术适应性差的问题。
[0049] 以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明 的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。
[0050] 以上所述仅是本发明的【具体实施方式】,使本领域技术人员能够理解或实现本发 明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的 一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明 将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一 致的最宽的范围。
【主权项】
1. 一种基于改进k均值聚类算法的天空图像云空辨识方法,其特征在于,所述基于改进 k均值聚类算法的天空图像云空辨识方法包括以下步骤: 针对天空图像中各个像素点,分别提取所述天空图像中红颜色通道值R、绿颜色通道值 G、蓝颜色通道值B以及R/B*100四个矩阵,并根据所述四个矩阵提取特征矩阵; 根据所述天空图像中需要辨识的区域种类个数确定初始聚类数量,并基于历史图像数 据设定各类别的初始聚类中心; 基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点的特征向量进行聚类, 获取新的聚类中心; 根据所述新的聚类中心对所述特征矩阵中的特征向量进行聚类; 根据聚类结果确定各像素点所属区域类型并绘制云空辨识图像。2. 根据权利要求1所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述根据所述四个矩阵提取特征矩阵包括: 将所述四个矩阵中的每一列按列编号顺序排列成一个元素个数为m*n的列向量; 将所述四个列向量按列向量R、列向量G、列向量B和列向量R/B* 100的顺序合并成一个 四列特征矩阵。3. 根据权利要求1所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述基于历史图像数据设定各类别的初始聚类中心包括: 从历史数据中选择各类别区域间差异明显的天空图像; 分别提取各个区域中的N个像素点的特征向量,并计算所述N个像素点的特征向量的算 术平均值作为本区域的初始聚类中心,其中,N由天空图像数量、天空图像分辨率以及天空 图像区域的大小确定。4. 根据权利要求1所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点的特征向量进行聚 类,获取新的聚类中心包括: 计算每个像素点特征向量到对应的所述初始聚类中心的距离; 将所述特征向量分配给与所述特征向量距离最近的所述初始聚类中心所对应的类别; 计算各类别中所包含的特征向量的算术平均值,并将所述算术平均值作为该类别新的 聚类中心。5. 根据权利要求4所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述将所述特征向量分配给与所述特征向量距离最近的所述初始聚类中心所对应的类 别包括: 若特征向量所属类别不唯一,则选取小类别标号作为所述特征向量类别; 若类别未包含任何像素点特征向量,则删除所述类别以及与所述类别对应的聚类中 心。6. 根据权利要求4所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述基于改进k均值聚类算法,根据所述初始聚类中心对所述像素点的特征向量进行聚 类,获取新的聚类中心包括:基于改进k均值聚类算法重复获取新的聚类中心,直到新的聚 类中心不再改变或达到预设的最大重复次数后,输出聚类结果。7. 根据权利要求4所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述计算每个像素点特征向量到对应的所述初始聚类中心的距离的计算公式为:其中XdPy1为像素点特征向量第i维数值,ai为特征向量第i维数值的权重系数。8.根据权利要求7所述的基于改进k均值聚类算法的天空图像云空辨识方法,其特征在 于,所述特征向量第i维数值的权重系数ai的计算方法为: 将所述特征矩阵分别删除各列,获取四个三列矩阵; 利用传统k均值聚类算法,对所述特征矩阵和所述四个三列矩阵分别聚类,获得聚类结 果; 计算所述四个三列矩阵聚类结果与所述特征矩阵聚类结果的相关系数r1; 根据所述相关系数η计算权重系数,所述权重系数&1的计算公式为:ai=i-ri。
【专利摘要】本发明提供一种基于改进k均值聚类算法的天空图像云空辨识方法,包括:提取所述天空图像中红颜色通道值R、绿颜色通道值G、蓝颜色通道值B以及R/B*100四个矩阵,提取特征矩阵;确定初始聚类数量以及初始聚类中心;基于改进k均值聚类算法,根据初始聚类中心进行聚类,获取新的聚类中心;根据新的聚类中心进行聚类并根据聚类结果确定各像素点所属区域类型,绘制云空辨识图像。本发明基于改进k均值聚类算法,提取效果较稳定,不仅把三个彩色分量作为一个整体进行聚类还添加了云空对比度较高的R/B*100列向量,与全局阈值仅对灰度图像进行云空识别相比,大大提高图像识别的适应能力,可以解决现有技术适应性差的问题。
【IPC分类】G06K9/62
【公开号】CN105488538
【申请号】CN201510929496
【发明人】苏适, 王飞, 严玉廷, 陆海, 李浩涛, 罗因博, 杨家全
【申请人】云南电网有限责任公司电力科学研究院, 华北电力大学(保定)
【公开日】2016年4月13日
【申请日】2015年12月15日