用于预测空气质量的系统和方法
【技术领域】
[0001] 本申请涉及数据分析领域,具体涉及一种用于预测空气质量的系统和方法。
【背景技术】
[0002] 空气污染与空气质量越来越被人们重视。但由于空气污染物检测设备通常造价很 高、操作麻烦,所W利用其它环境信息(如温度、湿度及可见度等)对空气中有害颗粒(如 PM2. 5等)进行预测具有极高的社会效益和经济价值。
[0003] 通常,借助历史信息、邻近地区信息等污染物变化信息,对未来时间段和不具有实 地检测条件的空间进行污染物浓度预测。为了预测浓度,主要依赖于统计方法去寻找污染 物浓度分布相似的站点,对待测站点的浓度进行拟合。
【发明内容】
[0004] 在现实的城市环境中,有害因子往往不止一种,而送些有害因子的浓度变化通常 具有一定联系。单一建模的现有技术无法充分利用各个预测任务间的送种联系。为了提高 模型在全局范围内的预测能力,本发明对同一时空范围内的多种污染因子进行协同建模, 提高了各个任务的预测精度。
[0005] 根据本发明的第一方面,提供了一种基于多个预测任务的用于预测空气质量的系 统,包括:确定单元,被配置为根据距离阔值来确定待测地点的邻近区域;训练单元,被配 置为训练预测模型W获得所述预测模型的最优参数,其中,所述预测模型是基于所述多个 预测任务并根据所述邻近区域的空间特征而构建的;W及预测单元,被配置为利用具有所 述最优参数的所述预测模型来预测待测地点的空气质量。
[0006] 在一个实施例中,邻近区域的空间特征包括数值型特征和布尔型特征。
[0007] 在一个实施例中,数值型特征包括W下一项或更多项;邻近区域中的监测站处测 量的风速、温度、湿度、降水量,W及邻近区域中的监测站之间的距离和夹角。
[0008] 在一个实施例中,布尔型特征包括W下一项或更多项;邻近区域中的监测站的相 对方位是否满足特定条件,W及邻近区域中的监测站的相对距离是否大于阔值。
[0009] 在一个实施例中,训练单元被配置为;针对邻近区域中的任意两个监测站,计算任 意两个监测站的空间特征和预测值;W及针对邻近区域中的所有监测站,根据计算出的任 意两个监测站的空间特征和预测值,计算预测模型的所述最优参数,使得从多个预测任务 的整体上来说通过具有最优参数的预测模型得到的预测值与真实测量值之差的绝对值之 和最小。
[0010] 在一个实施例中,预测单元被配置为:利用待测地点的邻近区域的空间特征,计算 邻近区域中的各个监测站的预测值的加权求和,由此来预测待测地点的空气质量。
[0011] 在一个实施例中,用于每一个监测站的权重与该监测站的训练误差的倒数成正 比,所述训练误差与该监测站的真实测量值和通过具有最优参数的预测模型得到的预测值 的差有关。
[0012] 根据本发明的第二方面,提供了一种基于多个预测任务的用于预测空气质量的方 法,包括:根据距离阔值来确定待测地点的邻近区域;训练预测模型W获得所述预测模型 的最优参数,其中,所述预测模型是基于所述多个预测任务并根据所述邻近区域的空间特 征而构建的;W及利用具有所述最优参数的所述预测模型来预测待测地点的空气质量。
[0013] 在一个实施例中,邻近区域的空间特征包括数值型特征和布尔型特征。
[0014] 在一个实施例中,数值型特征包括W下一项或更多项;邻近区域中的监测站处测 量的风速、温度、湿度、降水量,W及邻近区域中的监测站之间的距离和夹角。
[0015] 在一个实施例中,布尔型特征包括W下一项或更多项;邻近区域中的监测站的相 对方位是否满足特定条件,W及邻近区域中的监测站的相对距离是否大于阔值。
[0016] 在一个实施例中,针对所述邻近区域中的任意两个监测站,计算任意两个监测站 的空间特征和预测值;W及针对邻近区域中的所有监测站,根据计算出的任意两个监测站 的空间特征和预测值,计算预测模型的最优参数,使得从多个预测任务的整体上来说通过 具有最优参数的预测模型得到的预测值与真实测量值之差的绝对值之和最小。
[0017] 在一个实施例中,利用待测地点的邻近区域的空间特征,计算邻近区域中的各个 监测站的预测值的加权求和,由此来预测待测地点的空气质量。
[0018] 在一个实施例中,用于每一个监测站的权重与该监测站的训练误差的倒数成正 比,所述训练误差与该监测站的真实测量值和通过具有最优参数的预测模型得到的预测值 的差有关。
[0019] 本发明通过对多个预测任务协同建模,充分利用了相似任务间的关联性,从而提 高了空气污染预测的精确度。
【附图说明】
[0020] 通过下文结合附图的详细描述,本发明的上述和其它特征将会变得更加明显,其 中:
[0021] 图1是示出了根据本发明的用于预测空气质量的系统的框图。
[0022] 图2是示出了根据本发明的用于确定邻近区域的示意图。
[0023] 图3是示出了根据本发明的两个示例监测站与风向的关系的示意图。
[0024] 图4是示出了根据本发明的待测地点与邻近的监测站的示意图。
[0025] 图5是示出了根据本发明的待测地点与邻近的监测站的示意图。
[0026] 图6是示出了根据本发明的用于预测空气质量的方法的流程图。
【具体实施方式】
[0027] 下面,通过结合附图对本发明的具体实施例的描述,本发明的原理和实现将会变 得明显。应当注意的是,本发明不应局限于下文所述的具体实施例。另外,为了简便起见, 省略了与本发明无关的公知技术的详细描述。
[0028] 图1是示出了根据本发明的用于预测空气质量的系统的框图。如图1所示,系统 10包括确定单元110、训练单元120和预测单元130。下面,详细描述用于预测空气质量的 系统10中的各个单元的操作。
[0029] 确定单元110根据距离阔值来确定待测地点的邻近区域。通过定义距离阔值,获 得待测地点的邻近监测站。距离阔值可w依靠经验来确定。距离阔值越大,则待测地点的 邻近监测站的数目越多。图2是示出了根据本发明的用于确定邻近区域的示意图。如图2 所示,P表示待测地点。当确定距离阔值后,郝些距离P小于送一距离阔值的监测站A、B、 C、D被看成P的邻近监测站,而距离P大于送一距离阔值的监测站E和F不被看成P的邻 近监测站,因此监测站E和F的空气污染指数不用于预测P点的污染指数。
[0030] 训练单元120训练预测模型W获得预测模型的最优参数,该预测模型是基于多个 预测任务并根据邻近区域的空间特征而构建的。在本发明的一个实施例中,邻近区域的空 间特征可W包括数值型特征和布尔型特征。例如,数值型特征可W包括W下一项或更多项: 邻近区域中的监测站处测量的风速、温度、湿度、降水量,W及邻近区域中的监测站之间的 距离和夹角。布尔型特征可W包括W下一项或更多项;邻近区域中的监测站的相对方位是 否满足特定条件,W及邻近区域中的监测站的相对距离是否大于阔值。下面,结合附图3来 说明数值型特征和布尔型特征的示例。
[0031] 如图3所示,从监测站A的角度出发,A包括与邻近监测站B的一组数值型特征。 例如,该数值型特征可W是A和B之间的距离或夹角,W及其他特征(例如距离乘W夹角、 距离乘W夹角乘W风速等)。同时,A也包含与其他监测站无关的数值型特征,例如风速、温 度、湿度、降水量等。需要注意的是,A与B之间的夹角是W A为起点的风向为基准而计算 的夹角,取值范围是大于等于0度且小于等于180度。
[0032] 此外,监测站A还具有布尔型特征(即0-1特征)。送组特征可用于描述监测站 A到其他监测站的关系。例如,布尔型特征可W描述监测站B是否处于监测站A的正东、正 西、正南、正北等方向(比如,对于正东特征,当取值为1时代表B处在A的正东方向,当取 值为0时代表B不在A的正东方向),或监测站B与监测站A的距离是否超过一定阔值(比 女口,当取值为1时代表监测站B与监测站A的距离超过一定阔值,当取值为0时代表监测站 B与监测站A的距离小于一定阔值)。
[0033] 训练单元120针对邻近区域中的任意两个监测站,计算任意两个监测站的空间特 征和预测值。然后,训练单元120针对所
述邻近区域中的所有监测站,根据计算出的任意两 个监测站的空间特征和预测值,计算所述预测模型的所述最优参数,使得从所述多个预测 任务的整体上来说通过具有所述最优参数的所述预测模型得到的预测值与真实测量值之 差的绝对值之和最小。下面,结合图2所示场景来描述训练单元120的具体操作。
[0034] 表1示出了训练单元120计算得到的与监测站A和监测站B有关的特征值。具体 地,表1的第一行描述了 A- > B的特征,第二行描述了从B- > A的特征。表1的最后一列 为每行数据需要预测的目标值。送里,预测目标是两个监测站A和B之间的污染指数的差。 [00351
[0036] 表 1
[0037] 训练单元120可W按照类似方式,计算邻近区域中的其他监测站彼此之间的特征 值。例如,对于图2的场景来说,训练单元120还计算A- > C,A- > D,B- > C,B- > D,C- > A, C- > B,C- > D,D- > A, D- > B,D- > C 的特征值。
[0038] 在一个实施例中,训练单元120采用如下预测模型:
[0039] fi 狂)=入 1声1+ 入 12而+. . . + 入 inXn
[0040] 其中,i是任务的id,不同的i就对应不同的空气污染物预测任务。λ表示预测模 型的参数,代表每种特征对预测结果的重要程度。X表示特征值。送里,特征值共有η项。
[0041] flOO表示特征值向量X所对应的待测值,yOO代表特征值向量X所对应待测值 的真实值。在本实施例中,优化目标可W是:求得一组λ,使If狂)-y〇〇|最小,其中χ = 找1,Χ2,…,,1是训练样本的个数(对于图2的场景来说1 = 12),Xi表示第i个特征 值向量。
[0042] 因此,最终求得的一组参数具有巧
i小的 性质。其中,m为任务数目,1为训练样本总数。狂,)表示向量X,对应的任务i的真实值。 其中第一巧
用于使训练得到的模型与真实值接近。第二项 用于保留多任务间的相关性。其具体计算公式例如可W是:
[0043]
[0044] 其中分子λ 1,是任务i在第j个特征的参数值,分母为任务i的所有参数之和。 即λ' 1,为一个参数的归一化平均值。矩阵A的公式例如可W是:
[0045]
[0046] Λ,ν'描述了不同任务子模型之间的相似度,即矩阵中每行之间的相似度。该相似 度越大说明任务之间越相似。为了控制送种相似度对前一部分拟合真实值的影响,可W引 入一个因子μ来控制该项的权重。
[0047] 预测单元130利用具有最优参数的预测模型来预测待测地点的空气质量。优选 地,预测单元130利用待测地点的邻近区域的空间特征,计算所述邻近区域中的各个监测 站的预测值的加权求和,由此来预测待测地点的空气质量。其中,用于每一个监测站的权重 与该监测站的训练误差的倒数成正比,所述训练误差与该监测站的真实测量值和通过具有 最优参数的预测模型得到的预测值的差有关。
[0048] 下面,结合图4所示的示例场景,详细描述训练单元120和预测单元130的操作。
[0049] 如图4所示,待测地点Ρ的周围存在4个邻近监测站Α、Β、C、D。待测地点Ρ与其 所有邻近监测站Α、Β、C、D之间都可W计算出一组特征值。因为各邻近监测站的真实值都 是已知的,通过计算差值和真实值的和就可W计算出待测地点Ρ的估计值。通过对各点估 计出的值进行融合,就得到最终的预测结果。
[0050] 具体地,设diffA(i)表示监测站A和地点i的空气质量的真实差值。fA(i)表示 监测站A和地点i的空气质量的预测差值,index表示空气污染指数。
[0051] diffA(i) = I index (A)-index (i)
[0052] 定义监测站A的损失值如下:
[0053]
[0054] 其中,监测站A的损失值loss (A)表示监测站A到其他各个邻近监测站的训练误 差之和。该值越大,说明W监测站A为基准做出的偏差预测越不精确,所W其在最终预测待 测地点P时所占比重就应当越小。Φ为预设的正值,其目的是防止被零除的发生。例如, Φ可W取0到1之间的某个值。
[0055] 监测站A点的权重可W是监测站A的损失值的倒数与倒数总和的比例:
[0056]
[0057] 其中,分母表示邻近区域内的所有监测站的损失值的倒数之和。
[0058] 最终的预测结果index (巧是各个预测值的加权和,如下:
[0059]
[0060] 其中,(巧表示地点i和待测地点P的空气质量的预测差值。
[0061] 下面的算法描述了训练单元120的整个训练过程:
[0062]
[0063] 上述算法的详细描述如下:
[0064] 输入;数据矩阵X,任务数m,特征值个数η,数据实例个数1,学习率η ;
[0065] 输出;模型参数λ 1,...,入。
[006引具体过程:
[0067] 1 ;初始化所有模型参数λ 1,...,λ。,即给所有参数赋一个随机值。
[0068] 2;对m个任务进行循环
[006引3 ;计算每个任务的损失值,即计算真实值和预测值之间的误差。
[0070] 4 ;对η个特征的参数进行循环
[0071] 5 ;根据误差求得各参数的更新梯度值。
[0072] 6 ;根据求得的梯度值,对每个参数值进行更新,使总误差变小。其中,学习率是梯 cLas\s\ 度下降的步长,…77""是梯度下降的方向。 ?-A/
[007引 7 ;结束循环
[0074] 8 ;结束循环
[00巧]9-11 ;检测是否收敛,若模型收敛则结束迭代过程。判断标准为:如果更新后的模 型得出的误差比前一次模型的误差大,模型就会收敛。收敛表示模型已经达到最优的位置, 再向其他方向寻找得到的都不是最优的。
[007引 12;返回模型参数入1,...,入。。
[0077] 下面,结合图5所示的示例场景,给出系统10用于两个预测任务(任务1 ;PM2. 5 和任务2 ;PM10)的值的一个具体操作示例。
[0078] 在设定距离阔值后,确定单元110确定待测地点P的周围存在3个邻近监测站A、 B、C,如图5所示。
[0079] 然后,训练单元120抽取出A、B、C Η点的特征值(即上文中提到的布尔型特征和 数值型特征)。然后,训练单元120抽取A、B、C之间的空气污染指数的差。送样,得到下表 2中的训练数据。
[0080]
[0081 ]表 2
[0082] 训练单元120按照上文所描述的过程计算使整体预测误差最小的一组参数值 (即,获得基于A、B、C Η点的最优模型)。之后,再次将训练数据输入到最优模型中,得到空 气质量差值的预测值(见下表3的最后两列)。
[0083]
[0084] 表 3
[0085] 之后,训练单元120求出各个监测站的训练误差,如下表4所示。
[0086]
[0087]表 4
[008引进一步,训练单元120得到各个监测站的权重值,如下表5所示。
[0089]
[0090] 表 5
[0091] 然后,预测单元130计算各个监测站对待测地点P的预测值(即,预测P与其他监 测站之间的空气质量的差值,见下表6中的最后两列)。
[0092]
[0093] 表 6
[0094] 最后,预测单元130根据之前生成的权重值对送些预测值进行融合,得到最终结 果如下:
[0095] PM2. 5 任)=(2/11) * (-2+37) + 化/11) * (-13+48) + (3/11) * (8巧9) = 35. 54
[0096] PMIO(P) = (2/11)*(-14+45) +巧/11)*(13+16) + (3/11)*(-1+31) = 29. 64
[0097] 本
实施例的空气质量预测系统通过对多个预测任务协同建模,充分利用了相似任 务间的关联性,从而提高了空气污染预测的精确度。
[009引图6是示出了根据本发明一个示例实施例的用于预测空气质量的方法的流程图。 如图6所示,方法60在步骤S610处开始。
[0099] 在步骤S620,根据距离阔值来确定待测地点的邻近区域。
[0100] 在步骤S630,训练预测模型w获得预测模型的最优参数,其中预测模型是基于多 个预测任务并根据邻近区域的空间特征而构建的。例如,邻近区域的空间特征可W包括数 值型特征和布尔型特征。优选地,数值型特征可W包括W下一项或更多项:邻近区域中的监 测站处测量的风速、温度、湿度、降水量,W及邻近区域中的监测站之间的距离和夹角。布尔 型特征可W包括W下一项或更多项;邻近区域中的监测站的相对方位是否满足特定条件, W及邻近区域中的监测站的相对距离是否大于阔值。
[0101] 优选地,针对邻近区域中的任意两个监测站,计算所述任意两个监测站的空间特 征和预测值。然后,针对邻近区域中的所有监测站,根据计算出的任意两个监测站的空间特 征和预测值,计算预测模型的最优参数,使得从所述多个预测任务的整体上来说通过具有 最优参数的预测模型得到的预测值与真实测量值之差的绝对值之和最小。
[0102] 在步骤S640,利用具有最优参数的预测模型来预测待测地点的空气质量。优选地, 可W利用待测地点的邻近区域的空间特征,计算邻近区域中的各个监测站的预测值的加权 求和,由此来预测待测地点的空气质量。优选地,用于每一个监测站的权重与该监测站的训 练误差的倒数成正比,训练误差与该监测站的真实测量值和通过具有最优参数的预测模型 得到的预测值的差有关。
[0103] 最后,方法60在步骤S650处结束。
[0104] 应该理解,本发明的上述实施例可W通过软件、硬件或者软件和硬件两者的结合 来实现。例如,上述实施例中的设备内的各种组件可W通过多种器件来实现,送些器件包括 但不限于:模拟电路、数字电路、通用处理器、数字信号处理值SP)电路、可编程处理器、专 用集成电路(ASIC)、现场可编程口阵列(FPGA)、可编程逻辑器件(CPLD),等等。
[0105] 另外,本领域的技术人员可W理解,本发明实施例中描述的初始参数可W存储在 本地数据库中,也可W存储在分布式数据库中或者可W存储在远程数据库中。
[0106] 此外,送里所公开的本发明的实施例可W在计算机程序产品上实现。更具体地,该 计算机程序产品是如下的一种产品;具有计算机可读介质,计算机可读介质上编码有计算 机程序逻辑,当在计算设备上执行时,该计算机程序逻辑提供相关的操作W实现本发明的 上述技术方案。当在计算系统的至少一个处理器上执行时,计算机程序逻辑使得处理器执 行本发明实施例所述的操作(方法)。本发明的送种设置典型地提供为设置或编码在例如 光介质(例如CD-ROM)、软盘或硬盘等的计算机可读介质上的软件、代码和/或其他数据结 构、或者诸如一个或多个ROM或RAM或PROM芯片上的固件或微代码的其他介质、或一个或 多个模块中的可下载的软件图像、共享数据库等。软件或固件或送种配置可安装在计算设 备上,W使得计算设备中的一个或多个处理器执行本发明实施例所描述的技术方案。
[0107] 尽管W上已经结合本发明的优选实施例示出了本发明,但是本领域的技术人员将 会理解,在不脱离本发明的精神和范围的情况下,可W对本发明进行各种修改、替换和改 变。因此,本发明不应由上述实施例来限定,而应由所附权利要求及其等价物来限定。
【主权项】
1. 一种基于多个预测任务的用于预测空气质量的系统,包括: 确定单元,被配置为:根据距离阈值来确定待测地点的邻近区域; 训练单元,被配置为:训练预测模型以获得所述预测模型的最优参数,其中,所述预测 模型是基于所述多个预测任务并根据所述邻近区域的空间特征而构建的,所述邻近区域的 空间特征包括数值型特征和布尔型特征;以及 预测单元,被配置为:利用具有所述最优参数的所述预测模型来预测待测地点的空气 质量。2. 根据权利要求1所述的系统,其中,所述数值型特征包括以下一项或更多项:所述邻 近区域中的监测站处测量的风速、温度、湿度、降水量,以及所述邻近区域中的监测站之间 的距离和夹角。3. 根据权利要求1所述的系统,其中,所述布尔型特征包括以下一项或更多项:所述邻 近区域中的监测站的相对方位是否满足特定条件,以及所述邻近区域中的监测站的相对距 离是否大于阈值。4. 根据权利要求1所述的系统,其中,所述训练单元被配置为: 针对所述邻近区域中的任意两个监测站,计算所述任意两个监测站的空间特征和预测 值;以及 针对所述邻近区域中的所有监测站,根据计算出的任意两个监测站的空间特征和预测 值,计算所述预测模型的所述最优参数,使得从所述多个预测任务的整体上来说通过具有 所述最优参数的所述预测模型得到的预测值与真实测量值之差的绝对值之和最小。5. 根据权利要求4所述的系统,其中,所述训练单元被配置为: 还基于所述多个预测任务中的各个任务之间的相似度来计算所述预测模型的所述最 优参数。6. 根据权利要求1所述的系统,其中,所述预测单元被配置为:利用待测地点的邻近区 域的空间特征,计算所述邻近区域中的各个监测站的预测值的加权求和,由此来预测待测 地点的空气质量。7. 根据权利要求6所述的系统,其中,用于每一个监测站的权重与该监测站的训练误 差的倒数成正比,所述训练误差与该监测站的真实测量值和通过具有所述最优参数的所述 预测模型得到的预测值的差有关。8. -种基于多个预测任务的用于预测空气质量的方法,包括: 根据距离阈值来确定待测地点的邻近区域; 训练预测模型以获得所述预测模型的最优参数,其中,所述预测模型是基于所述多个 预测任务并根据所述邻近区域的空间特征而构建的,所述邻近区域的空间特征包括数值型 特征和布尔型特征;以及 利用具有所述最优参数的所述预测模型来预测待测地点的空气质量。9. 根据权利要求8所述的方法,其中,所述数值型特征包括以下一项或更多项:所述邻 近区域中的监测站处测量的风速、温度、湿度、降水量,以及所述邻近区域中的监测站之间 的距离和夹角。10. 根据权利要求8所述的方法,其中,所述布尔型特征包括以下一项或更多项:所述 邻近区域中的监测站的相对方位是否满足特定条件,以及所述邻近区域中的监测站的相对 距离是否大于阈值。11. 根据权利要求8所述的方法,其中, 针对所述邻近区域中的任意两个监测站,计算所述任意两个监测站的空间特征和预测 值;以及 针对所述邻近区域中的所有监测站,根据计算出的任意两个监测站的空间特征和预测 值,计算所述预测模型的所述最优参数,使得从所述多个预测任务的整体上来说通过具有 所述最优参数的所述预测模型得到的预测值与真实测量值之差的绝对值之和最小。12. 根据权利要求11所述的方法,其中,还基于所述多个预测任务中的各个任务之间 的相似度来计算所述预测模型的所述最优参数。13. 根据权利要求8所述的方法,其中,利用待测地点的邻近区域的空间特征,计算所 述邻近区域中的各个监测站的预测值的加权求和,由此来预测待测地点的空气质量。14. 根据权利要求13所述的方法,其中,用于每一个监测站的权重与该监测站的训练 误差的倒数成正比,所述训练误差与该监测站的真实测量值和通过具有所述最优参数的所 述预测模型得到的预测值的差有关。
【专利摘要】提供了一种基于多个预测任务的用于预测空气质量的系统,包括:确定单元,被配置为根据距离阈值来确定待测地点的邻近区域;训练单元,被配置为训练预测模型以获得所述预测模型的最优参数,其中,所述预测模型是基于所述多个预测任务并根据所述邻近区域的空间特征而构建的;以及预测单元,被配置为利用具有所述最优参数的所述预测模型来预测待测地点的空气质量。还提供了一种基于多个预测任务的用于预测空气质量的方法。本发明充分利用了相似任务间的关联性,提高了空气污染预测的精确度。
【IPC分类】G06F19/00
【公开号】CN105488317
【申请号】CN201410475151
【发明人】刘博 , 邬亮, 胡卫松, 刘晓炜
【申请人】日本电气株式会社
【公开日】2016年4月13日
【申请日】2014年9月17日