一种光伏电站发电量预测的方法
【技术领域】
[0001] 本发明涉及一种光伏电站发电量预测的方法,属于光伏电站发电技术领域。
【背景技术】
[0002] 光伏电站的日输出功率具有随机波动特点,在发电过程中由于天气和光照强度的 突变,会造成短时间输出功率急剧变化的现象。因此,逆变器在进行并网时,会给电网稳定、 可靠运行带来影响,而且给电网调度增加困难,影响传统开机方式和调度方式。
[0003] 有鉴于此,有必要提供一种光伏电站发电量预测的方法,以满足实际应用需要。
【发明内容】
[0004] 本发明的目的是:为克服现有技术的不足,本发明提供一种光伏电站发电量预测 的方法,通过光伏电站所在区域的环境监测数据和运行数据,应用多元回归技术拟合回归 模型,得到预测样本数据,并不断与历史数据和历史预测结果进行对比与改进,实现发电量 的较小误差预测。
[0005] 本发明所采用的技术方案是:一种光伏电站发电量预测的方法,其特征在于,通过 以下几个步骤反复拟合、筛选、对比和改进来完成: (1) 把采集到的环境监测数据通过交互不可测变量方法来量化天气变量,由于天气变 量具有季节性变化,因此在量化天气时,需要考虑季节性;首先将天气变量进行虚拟化,然 后选择与虚拟化变量有强相关性的变量进行交互式分析得出系数,并拟合变量得到量化后 的观测,然后合并数据集得到一个新的样本数据; (2) 划分样本数据集,分为训练数据集和验证数据集;训练数据集用来创建模型的子数 据集;验证数据集用来验证模型的子数据集; (3 )计算SPEARMAN秩相关系数,并对其进行检验,此时原假设H0:两个变量不相关,在原 假设成立的情况下,对于大样本情形,检验统计量近似服从自由度为(n-2)的t分布,根据样 本观测值计算出检验统计量的P值,并与显著性水平α比较,可得出检验结论:如果P值小于 α,则拒绝原假设,即认为两变量是相关的;如果Ρ值大于α,则不能拒绝原假设,即认为两个 变量不相关。则初步筛选出变量; (4)用新训练数据集拟合回归模型得到初步模型,设y为因变量,Xi,Χ2,…,Xk为k个自变 量,则回归模型可以写为:y=0〇+0iXi+02X2+ · · · +&Xk+e,其中,β〇是常数项,β」(j=l,2,…, k)是y对Xj的回归系数,ε是随机误差项; (5 )用逐步回归法筛选变量得到数学模型,逐步回归是首先加入一个变量,如果加入的 变量对模型的影响显著,则保留此变量,然后再对当前模型中所有变量进行检验,剔除那些 不显著的变量,依次进行下去,直到没有显著的变量要加入且模型中已有的变量都显著为 止; (6)把验证数据集代入数学模型得到一个预测样本,并对预测样本结果进行对比与改 进,实现发电量的较小误差预测,通过后验概率验证模型的准确率,即1_(预测需求值与预 测值差的绝对值/预测需求值),若准确率大于80%,则得到最终模型:y^o+hXi+f^Xs + ·· ·+βιΑ,否则回到⑶重新拟合模型,筛选变量,直到预测准确率达到80%以上为止。
[0006] 本发明的有益效果是:本发明提供的光伏电站发电量预测的方法,通过光伏电站 所在区域的环境监测数据和运行数据,应用多元回归技术拟合回归模型,得到预测样本数 据,并不断与历史数据和历史预测结果进行对比与改进,实现发电量的较小误差预测。完成 对光伏电站发电量的预测,可以提前预知发电量,提高电网运行稳定性的能力;还可以校验 数据的准确性,提高数据质量。
【附图说明】
[0007] 图1为本发明的光伏电站发电量预测的方法流程示意图。
【具体实施方式】
[0008] 为了更好地理解本发明,下面结合实施例进一步阐明本发明的内容,但本发明的 内容不仅仅局限于下面的实施例。本领域技术人员可以对本发明作各种改动或修改,这些 等价形式同样在本申请所列权利要求书限定范围之内。
[0009] 如图1所示,本发明实施例提供的光伏电站发电量预测的方法,通过以下几个步骤 反复拟合、筛选、对比和改进来完成,如图1。
[0010] (1)把采集到的环境监测数据通过交互不可测变量方法来量化天气变量,由于天 气变量具有季节性变化,因此在量化天气时,需要考虑季节性。首先将天气变量进行虚拟 化,然后选择与虚拟化变量有强相关性的变量进行交互式分析得出系数,并拟合变量得到 量化后的观测。然后合并数据集得到一个新的样本数据。
[0011] (2)划分样本数据集,分为训练数据集和验证数据集;训练数据集用来创建模型的 子数据集;验证数据集是用来验证模型的子数据集。由于天气具有季节性变化,在量化划分 数据集时,需要考虑季节性。因此,把新样本数据集根据年份划分为训练数据样本(2014年 数据)和验证数据样本(2015年数据)。
[0012] (3)计算SPEARMAN秩相关系数,并对其进行检验。此时原假设Η0:两个变量不相关。 在原假设成立的情况下,对于大样本情形,检验统计量近似服从自由度为(n-2)的t分布。根 据样本观测值计算出检验统计量的P值,并与显著性水平α比较,可得出检验结论:如果P值 小于α,则拒绝原假设,即认为两变量是相关的;如果Ρ值大于α,则不能拒绝原假设,即认为 两个变量不相关。则初步筛选出变量。
[0013] ⑷用新训练数据集拟合回归模型得至I」初步模型。设y为因变量,Xi,χ2,…,Xk为k个 自变量,则回归模型可以写为:Υ=β〇+βιΧι+β2Χ 2+ · · · +&Xk+e,其中,β〇是常数项,f3j(j=l, 2,…,k)是y对Xj的回归系数,ε是随机误差项。
[0014] (5)用逐步回归法筛选变量得到数学模型。逐步回归是首先加入一个变量,如果加 入的变量对模型的影响显著,则保留此变量,然后再对当前模型中所有变量进行检验,剔除 那些不显著的变量。依次进行下去,直到没有显著的变量要加入且模型中已有的变量都显 著为止。
[0015] (6)把验证数据集代入数学模型得到一个预测样本,并对预测样本结果进行对比 与改进,实现发电量的较小误差预测。通过后验概率验证模型的准确率(即1-(预测需求值 与预测值差的绝对值/预测需求值)),若准确率大于80%,则得到最终模型:yio+hXi+feXs + ··
·+βιΑ,否则回到⑶重新拟合模型,筛选变量,直到预测准确率达到80%以上为止。
[0016] 下面以青海某光伏电站为例,详细描述本发明的实施方案。
[0017] (1)利用环境监测数据,通过计算机对天气变量进行虚拟化,然后选择与天气变量 有强相关性的发电量变量进行交互式分析并拟合,得到量化后的变量WEATHER_PR_AVG。且 合并数据集,得到一个新样本数据(环境监测、运行数据)。
[0018] (2)划分样本数据集,分为训练数据集和验证数据集;训练数据集用来创建模型的 子数据集;验证数据集是用来验证模型的子数据集。由于天气具有季节性变化,在划分数据 集时,需要考虑季节性。因此,把新样本数据集根据年份划分为训练数据样本(2014年数据) 和验证数据样本(2015年数据)。
[0019] (3)计算SPEARMAN秩相关系数,并对其进行检验。
[0020] 对训练数据样本进行相关性分析,剔除与有功功率没有相关性的变量,如表1,由 表1可知,量化后的天气变量(WEATHER_PR_AVG)、辐照度(IRRADIANCE)和温度 (TEMPERATURE)与有功功率(ACT I VE_P0WER)有较强的相关性,风速(WI ND_SPEED)与有功功 率(ACTIVE_P0WER)有弱相关性,所以,从相关性来看,不能剔除任何变量,但是,在预测变量 时,辐照度是未知变量,因此,本方法需要剔除辐照度,即得到新训练数据集。
[0021] 表1有功功率与其它变量之间的Spearman相关系数
(4)用新训练数据集拟合回归模型,如表2可知,风速变量的T值为2.09,所对应的P值是 0.0665,大于α(若α=0.05),接受原假设,没有通过参数检验。因此,需要进行变量筛选。根据 参数估计值,即可得到初步模型: ACTIVE_P0ffER=3767.595+23.33983*ffEATHER_PR_AVG-228.949*TEMPERATURE+ 87.87631*ffIND_SPEED〇
[0022] 表2全变量回归参数估计
(5) 用逐步回归筛选变量,并设引入自变量的显著性水平为0.5,剔除自变量的显著性 水平为0.1。得出数学模型,如表3,由表3可知,变量的T值所对应的P值都小于0.01,则全部 通过参数检验。根据参数估计值,得到数学模型: ACTIVE_POWER=3795.723+16.23482*WEATHER_PR_AVG-228.159*TEMPERATURE。
[0023] 表3逐步回归后的参数估计
(6) 把新验证数据代入模型,得到预测样本,并利用后验概率验证模型的准确率(SP1-(预测需求值与预测值差的绝对值/预测需求值)),得出准确率为83.2%,大于80%。即得出最 终模型为: ACTIVE_P0WER=3795.723+16.23482*WEATHER_PR_AVG-228.159*TEMPERATURE。
[0024] 以上仅为本发明的实施例而已,并不用于限制本发明,因此,凡在本发明的精神和 原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
【主权项】
1. 一种光伏电站发电量预测的方法,其特征在于,通过以下几个步骤反复拟合、筛选、 对比和改进来完成: (1) 把采集到的环境监测数据通过交互不可测变量方法来量化天气变量,由于天气变 量具有季节性变化,因此在量化天气时,需要考虑季节性;首先将天气变量进行虚拟化,然 后选择与虚拟化变量有强相关性的变量进行交互式分析得出系数,并拟合变量得到量化后 的观测,然后合并数据集得到一个新的样本数据; (2) 划分样本数据集,分为训练数据集和验证数据集;训练数据集用来创建模型的子数 据集;验证数据集用来验证模型的子数据集; (3 )计算SPEARMAN秩相关系数,并对其进行检验,此时原假设H0:两个变量不相关,在原 假设成立的情况下,对于大样本情形,检验统计量近似服从自由度为(n-2)的t分布,根据样 本观测值计算出检验统计量的P值,并与显著性水平α比较,可得出检验结论:如果P值小于 α,则拒绝原假设,即认为两变量是相关的;如果Ρ值大于α,则不能拒绝原假设,即认为两个 变量不相关,则初步筛选出变量; (4) 用新训练数据集拟合回归模型得到初步模型,设y为因变量,Xi,Χ2,…,Xk为k个自变 量,则回归t旲型可以与为:y=0o+0iXi+&X2+ · · · +0kXk+e,其中,β〇是常数项,β」(j=l,2,…, k)是y对Xj的回归系数,ε是随机误差项; (5) 用逐步回归法筛选变量得到数学模型,逐步回归是首先加入一个变量,如果加入的 变量对模型的影响显著,则保留此变量,然后再对当前模型中所有变量进行检验,剔除那些 不显著的变量,依次进行下去,直到没有显著的变量要加入且模型中已有的变量都显著为 止; (6) 把验证数据集代入数学模型得到一个预测样本,并对预测样本结果进行对比与改 进,实现发电量的较小误差预测,通过后验概率验证模型的准确率,即1_(预测需求值与预 测值差的绝对值/预测需求值),若准确率大于80%,则得到最终模型: + ·· ·+βιΑ,否则回到⑶重新拟合模型,筛选变量,直到预测准确率达到80%以上为止。
【专利摘要】本发明提供一种光伏电站发电量预测的方法,通过光伏电站所在区域的环境监测数据和运行数据,应用多元回归技术拟合回归模型,得到预测样本数据,并不断与历史数据和历史预测结果进行对比与改进,实现发电量的较小误差预测。完成对光伏电站发电量的预测,可以提前预知发电量,提高电网运行稳定性的能力;还可以校验数据的准确性,提高数据质量。
【IPC分类】G06Q10/04, G06Q50/06
【公开号】CN105488592
【申请号】CN201510869813
【发明人】王东方, 杜贵兰, 张节潭, 杨晟, 李正曦, 赵争鸣, 杨军, 赵越, 孟可风, 李春来, 杨立滨
【申请人】国家电网公司, 国网青海省电力公司, 国网青海省电力公司电力科学研究院, 清华大学
【公开日】2016年4月13日
【申请日】2015年12月2日