本发明涉及产量估测领域。更具体地,涉及一种作物产量估测模型构建方法及估测方法。
背景技术:
1、目前,作物产量的变化显著影响着国内的社会稳定和人民基本生活要求,准确、高效和及时地预测作物产量在品种选育和优化田间管理等方面发挥着重要作用。作物估产方法主要包括基于作物生长模型的估产方法和基于统计回归的经验估产方法。前者机理性强,但所需参数较多,在一定程度上限制了其应用;而后者则无需大量参数,且非线性回归模型应用更为广泛,如偏最小二乘回归(partial least squares regression,plsr)、支持向量回归(support vector regression,svr)、随机森林(random forest,rf)等。
2、目前的估产模型在精准度和普适性方面仍存在不足,主要的问题包括:
3、受作物品种特性影响,数据采集周期长,然而模型准确度与数据样本集的大小有直接关系,在较大规模样本的训练下可达到较高的精度,在较小规模样本下易出现过拟合现象。同时随机采样的过程中也容易导致样本不平衡问题。
技术实现思路
1、本发明的目的在于提供一种小规模样本下有效避免噪声数据对样本平衡的影响的作物产量估测模型构建方法及估测方法,以解决现有技术存在的问题中的至少一个。
2、为达到上述目的,本发明采用下述技术方案:
3、本发明第一方面提供一种作物产量估测模型构建方法,包括:
4、获取各采样区域的多光谱图像、可见光图像以及产量数据;
5、合成各采样区域的多光谱图像和可见光图像,得到各采样区域的合成图像,从各采样区域的合成图像中提取并筛选所需的植被指数,将筛选出的植被指数作为各采样区域的输入特征,构建包括各采样区域输入特征以及各采样区域对应的产量数据的原始数据集;
6、通过第一机器学习算法对所述原始数据集进行降噪,并通过第二机器学习算法对降噪后的所述原始数据集进行扩充以得到扩充数据集;
7、将降噪后的所述原始数据集划分为第一训练集和第一测试集,将扩充数据集划分为第二训练集和第二测试集,通过第三机器学习算法构建作物产量估测模型并通过第一训练集和第二训练集进行训练。
8、进一步地,各所述采样区域选取自大田环境。
9、进一步地,所述获取各采样区域的多光谱图像,可见光图像以及产量数据包括
10、通过无人机携带多光谱相机拍摄各采样区域的多光谱图像;
11、在各采样区域的作物成熟时,收获各采样区域的作物并通过无人机携带可见光相机拍摄各采样区域的可见光图像;
12、对各采样区域的作物收获后经晾晒、烘干以及称重得到各采样区域的产量数据。
13、进一步地,所述从各采样区域的合成图像中提取并筛选所需的植被指数包括
14、从各采样区域的合成图像中提取所需的植被指数;
15、通过随机森林算法对植被指数进行重要性排序,根据重要性排序对植被指数进行筛选。
16、进一步地,在从各采样区域的合成图像中提取并筛选所需的植被指数后,所述方法还包括将无人机反射率添加到各采样区域输入特征中。
17、进一步地,所述无人机反射率包括无人机六波段反射率;所述六波段分别为450nm、555nm、660nm、720nm、750nm以及840nm波段。
18、进一步地,所述通过第一机器学习算法对原始数据集进行降噪包括
19、根据各采样区域的产量,通过支持向量机算法对各采样区域进行分类,从原始数据集中删除分类结果为错误的采样区域的数据,得到降噪后的原始数据集。
20、进一步地,所述通过第二机器学习算法对降噪后的原始数据集进行扩充得到扩充数据集包括
21、通过smote算法对降噪后的原始数据集进行扩充,生成至少一个少数类样本数据,得到扩充数据集。
22、进一步地,所述第三机器学习算法包括深度神经网络算法。
23、本发明第二方面提供了一种作物产量估测方法,包括,获取待采样区域的多光谱图像并提取待采样区域的各输入特征的数据;将待采样区域的各输入特征的数据输入如第一方面中任一项所述的作物产量估测模型构建方法所构建的训练完成的作物产量估测模型,以得到所述待采样区域的产量估测结果。
24、本发明的有益效果如下:
25、本公开通过第一机器学习算法对原始数据集进行降噪,以提升原始数据集中各数据的合理性和有效性;通过第二机器学习算法对降噪后的原始数据集进行扩充,有效解决了样本不平衡问题,大幅提升了产量估测模型的预测效果。
1.一种作物产量估测模型构建方法,其特征在于,包括:
2.根据权利要求1所述的产量估测模型构建方法,其特征在于,各所述采样区域选取自大田环境。
3.根据权利要求1所述的产量估测模型构建方法,其特征在于,所述获取各采样区域的多光谱图像,可见光图像以及产量数据包括
4.根据权利要求1所述的产量估测模型构建方法,其特征在于,所述从各采样区域的合成图像中提取并筛选所需的植被指数包括
5.根据权利要求1所述的产量估测模型构建方法,其特征在于,在从各采样区域的合成图像中提取并筛选所需的植被指数后,所述方法还包括将无人机反射率添加到各采样区域输入特征中。
6.根据权利要求5所述的产量估测模型构建方法,其特征在于,所述无人机反射率包括无人机六波段反射率;所述六波段包括450nm、555nm、660nm、720nm、750nm以及840nm波段。
7.根据权利要求1所述的产量估测模型构建方法,其特征在于,所述通过第一机器学习算法对原始数据集进行降噪包括
8.根据权利要求1所述的产量估测模型构建方法,其特征在于,所述通过第二机器学习算法对降噪后的原始数据集进行扩充得到扩充数据集包括
9.根据权利要求1所述的产量估测模型构建方法,其特征在于,所述第三机器学习算法包括深度神经网络算法。
10.一种作物产量估测方法,其特征在于,包括,获取待采样区域的多光谱图像并提取待采样区域的各输入特征的数据;