用于月度用电预测模型的先行性指数构建方法
【技术领域】
[0001]本发明涉及到用电预测领域,特别涉及一种用于月度用电预测模型的先行性指数 构建方法。
【背景技术】
[0002] 现有的用电预测模型有GM灰色预测模型、ARB1A模型、回归模型等。
[0003] 1、GM灰色预测模型
[0004] 基于用电数据本身的趋势,通过实际数据的累加生成灰色系统,得到规律较强的 曲线之后,用指数曲线拟合生成模型,再利用生成模型得到的数据通过累加逆运算一一累 减生成得到还原模型,由还原模型作为预测模型。
[0005] 2、电力弹性系数
[0006] -种系数计算法,把影响用电的因素(如气温)和用电量两者之间计算弹性系数, 即气温每增加1%,带来用电量变量百分之多少。根据历史数据对弹性进行估算,把得到的 弹性系数和新的气温变化结合,对新的用电量的变化进行估计和预测。
[0007] 3、ARB1A 模型
[0008] 自回归移动平均模型(ARMA)是基于用电量本身的自身规律进行刻画的模型。如 果用电序列{yt}的当前值不仅与自身过去值有关,而且还与其以前进入系统的外部冲击e 存在一定依存关系,则在用模型刻画这种动态特征时,模型中既包括自身的滞后项,也包括 过去的外部冲击。一般模型表达为AR頂A(p,d,q)其中,p为用电序列{y t}的滞后阶数,q为外 部冲击e的滞后阶数,d为差分次数。其一般结构为:
[0009] yt= Φ iyt-1+ Φ 2yt------Φ pyt-p+et+9iet-i+92et- l-0qet-q
[0010] 利用滞后算子,此模型可写为:
[0011] Φ(Β)γ?= Θ (B)et
[0012] 实际中,为了保证数据的平稳性,常常先对数据进行差分,然后建立模型,即:Φ (B)Bdyt= Θ (B)et,这就是ARIMA模型。
[0013] 若序列的当前值还受到其他变量的影响,则需要建立AR頂A-X模型,即:
[0014]
[0015] 其中{yt},{Xt}为平稳序列,或者经过差分后的平稳序列,{yt}为用电量,{ Xt}为影 响用电的因素。
[0016] 4、多元线性回归
[0017] 为了刻画多个因素对用电的线性影响,线性回归模型可对用电量先估计系数后, 在使用拟合的模型进行预测。其基本回归表达式为:
[0018] yt = b〇+bixit+b2X2t+· · .+bqXqt+et
[0019] 其中q个x为影响用电的因素,y为用电量。通过最小二乘估计法,估计系数b。然后 利用估计的系数和X的取值,以及方程式表达的关系,求得y的预测值。
[0020] 5、随机森林模型
[0021] 随机森林回归模型,由很多决策树回归组成的组合回归模型,且参数集是独立同 分布的随机向量,在给定自变量X下,每个决策树回归模型都有一票投票权来选择最优的回 归结果,最后输出所有的投票判别结果或是得到估计的平均值。
[0022] 随机森林回归的基本方法是:首先利用自助法从原始训练集抽取k个样本,然后对 k个样本分别建立k个决策树模型,得到k种回归结果;最后根据k种回归结果对每个记录进 行投票表决决定其最终回归。不仅可有效抑制训练样本噪音和解决属性缺失,还不容易出 现过度拟合。在构建随机森林的过程中生成一个泛化误差的内部无偏估计,使预测结果更 加精确。
[0023] 在上述预测模型的输入量中,指标输入量的常规做法是:首先,对用电影响的因素 一般选取外部指标,通常选择宏观经济指标,产业行业指标,如GDP、固定资产投资额等。其 次,使用指标进行预测时,当月输入量对当月的用电进行建模,即同期指标预测。因此,在预 测未来用电指标时,必须使用与未来时期一致的输入量。如果没有未来期的输入量,则首先 需要对此时期的输入量本身进行预测,最后再用预测值作为输入量。
[0024] 根据上述常规指标预测方法,其有如下不足。首先,现有预测指标来自外部宏观经 济变量,缺乏反映电力行业内部规律(内生性)的指标。宏观经济变量发布滞后,传导机制复 杂。而电力数据统计核算及时,信息反应灵敏,使用电力行业内生性指标,能及时有效刻画 生产经营运行规律。其次,现有预测因素多使用同期指标,即预测因素和被预测的用电量是 同期的。当期的用电数据获得较为及时,而当期的其他经济数据相比发布滞后,预测期的数 据不可获得。尤其是这种基于同期指标的预测,需要先对预测期的预测因素进行预测,再使 用预测数据作为输入变量,对预测期的用电进行预测,这里对变量的双重预测,会使预测误 差加大。
[0025] 因此,我们一方面需要使用具有先行意义的指标进行预测,并科学地确定指标的 先行期;另一方面,我们也要在指标结构上进行完善,在外部指标的基础上加入内生性指 标,从而构建完善的预测指标体系。
【发明内容】
[0026] 本发明所要解决的技术问题是提供一种用于月度用电预测模型的先行性指标的 构建方法,并且,加入的内生性指标对用电的影响更为直接和敏感,相对于外部经济指标而 言,对数据变动的反应更有效,预测精度提高。
[0027] 为解决上述技术问题,本发明采用的技术方案是:
[0028] -种用于月度用电预测模型的先行性指标的构建方法,包括以下步骤:
[0029] 通过专家评定法梳理了影响售电量的先行指标,其中加入了业扩指标,作为反映 行业内生性增长的因素,与外部指标一起形成用电预测的先行指标体系;
[0030] 将影响因素分为要确定先行期的因素和其他因素,确定先行期的因素称为影响指 标X,其他因素称为控制指标Z,用电量称为被影响指标y,使用售电量y对其他影响因素 Z进 行回归得到残差6:,再把要确定先行期的因素 X对其他影响因素 z进行回归,得到残差e2,计 算ei和e2的简单相关系数r,回归方程为l)yt= F zt+ei,2)xt= nZt+e2,其中,1)式和2)式是 回归方程,t为时间下标,Γ,Π 为系数矩阵;
[0031 ]根据相关系数的计算公式,可得偏相关系数r
[0032] 根据X的每个时期,分别计算所有时期的偏相关系数,选择相关系数较大的期数, 确定X的
先行期的初步预选集;
[0033] 根据上述方案,分别按照这个初步先行期集进行模型预测,最终确定预测误差小 的先行期,为指标最终的先行期。
[0034] 确定了最终先行期的所有指标,区分为外部和内部指标,以及通过时间维度构建 出横向纵向的预测指标体系
[0035] 与现有技术相比,本发明的有益效果是:
[0036] 1、具有行业内生性增长的指标(业扩)作为模型预测的输入因素,对用电影响更为 直接和显著。
[0037] 2、具有先行意义的指标作为模型预测的输入因素,克服使用同期指标预测,造成 双重误差的缺点。另外,先行意义的指标也考虑了输入因素对用电的滞后影响和传导效应。
[0038] 3、确定了指标的先行期之后,模型因素对用电的影响刻画的更为准确,提高了模 型的拟合程度和预测精度。
【附图说明】
[0039] 图1是本发明中状态空间模型的观测量与状态量对应关系示意图。
[0040] 图2是本发明中状态空间模型基本流程示意图。
[0041] 图3是发明用于月度用电预测模型的先行性指数构建方法。
【具体实施方式】
[0042] 1、确定初选指标
[0043] 通过专家评定法梳理了影响售电量的先行指标,其中加入了业扩指标,作为反映 行业内生性增长的因素,与常用的外部指标一起形成用电预测的先行指标体系。这些指标 根据经验判断,和行业自身的运行规律具有先行意义,但是并未通过实际检验来确定是否 具备先行期以及先行期期数。因此,需要通过模型测算和系数计算来确定先行期。
[0044] 2、售电量和影响因素分别对其他控制因素做回归
[0045]将影响因素分为要确定先行期的因素和其他因素。要确定先行期的因素称为影响 指标X,其他因素称为控制指标Z,用电量称为被影响指标y。使用售电量y对其他影响因素 Z 进行回归得到残差ei,再把要确定先行期的因素 X对其他影响因素 z进行回归,得到残差e2, 最后计算简单相关系数r。回归方程如下:
[0046] l)yt= Γ zt+ei
[0047] 2)xt= Π zt+e2
[0048] 其中1)式和2)式是回归方程,t为时间下标。Γ,Π 为系数矩阵。要注意的是2)式中 的X变量是要确定先行期的影响指标,它是指标当期值或前期值等。逐步对X使用其当期值, 滞后一期,滞后两期等进行回归,计算所有的残差。
[0049] 3、对所有指标引入"偏相关系数响应法"
[0050] 得到回归残差的和防后,根据相关系数的计算公式,可得偏相关系数r:
[0051]
.,根据X的每个时期,分别计算所有时期的偏相 关系数。最终选择相关系数较大的期数,作为X的先行期初选集合。
[0052] 例如,需要计算钢铁行业业扩完成容量的偏相关系数,把售电量对其他所有影响 因素比如商品房新开工面积等进行回归,得到残差e 1;再把钢铁行业业扩完成容量对其他 影响因素进行回归,得到残差e2。最后,利用上述公式计算的和的的简单相关系数。这仅仅得 到钢铁业扩完成本期值和本期售电量的一个偏相关系数,按照上述步骤,再把刚也业扩完 成前一期,前两期等所有先行期分别计算相应的偏相关系数,最后选择系数值较大的时期, 作为指标的先行期。如经测算,影响较大的先行期在1-5期之间,那么这就形成了先行期的 初选集合。
[0053] 4、确定指标体系
[0054] 最后,在初选的先行期集内进行模型预测,确定预测误差小的先行期作为最终指 标的先行期。确定了最终先行期的所有指标,区分为外部和内部指标,以及通过时间维度构 建出横向纵向的预测指标体系。最终确立的先行指标如表1所示。
[0055] 表1确立后的先行指标
[0056]
【主权项】
1. 一种用于月度用电预测模型的先行性指数构建方法,其特征在于,包括以下步骤: 通过专家评定法梳理了影响售电量的先行指标,其中加入了业扩指标,作为反映行业 内生性增长的因素,与外部指标一起形成用电预测的先行指标体系; 将影响因素分为要确定先行期的因素和其他因素,确定先行期的因素称为影响指标X, 其他因素称为控制指标Z,用电量称为被影响指标y,使用售电量y对其他影响因素Z进行回 归得到残差ei,再把要确定先行期的因素X对其他影响因素z进行回归,得到残差e 2,计算ei 和e2的简单相关系数r,回归方程为l)yt= F zt+el,2)xt=Πzt+e2,其中,l)式和2)式是回归 方程,t为时间下标,Γ,Π为系数矩阵; 根据相关系数的计算公式,可得偏相关系数r,根据X的每个时期,分别计算所有时期的偏相关系数,选择相关系数较大的期数,确定X 的先行期初选集; 确定了最终先行期的所有指标,区分为外部和内部指标,以及通过时间维度构建出横 向纵向的预测指标体系。2. 如权利要求1所述的用于月度用电预测模型的先行性指数构建方法,其特征在于,分 别按照这个初选的先行期集进行模型预测,最终确定预测误差小的先行期为指标最终的先 行期。
【专利摘要】本发明公开了一种用于月度用电预测模型的先行性指数构建方法,包括以下步骤:通过专家评定法梳理了预测售电量的先行指标;确定先行期的因素称为影响指标x,其他因素称为控制指标z,用电量称为被影响指标y,使用售电量y对其他影响因素z进行回归得到残差e1,再把要确定先行期的因素x对其他影响因素z进行回归,得到残差e2,计算e1和e2的简单相关系数r;根据x的所有先行期,分别计算偏相关系数,并选择较大的期数,形成x的先行期集合;在集合中选择预测误差最小的先行期,从而构建月度预测的先行指标体系。本发明提高用电内生因素刻画能力和用电预测精度,捕捉不可观测因素带来的用电波动,提高模型对用电变动的预测能力。
【IPC分类】G06Q10/04, G06Q50/06
【公开号】CN105488595
【申请号】CN201510918254
【发明人】李晨, 李新, 何为, 李科, 张睿, 史爽, 鲁万波, 龚金国, 刘宏鲲, 喻开志, 马云蓓
【申请人】四川省电力公司供电服务中心, 国家电网公司
【公开日】2016年4月13日
【申请日】2015年12月10日