基于Apriori算法的警情预测方法及警情预测系统的制作方法
【技术领域】
[0001] 本发明涉及警情预测的领域,具体地,涉及一种基于Apriori算法的警情预测方法 以及使用该方法进行警情预测的系统。
【背景技术】
[0002] 数据挖掘是一种从大型数据库或数据仓库中发现并提取出隐藏在其中的信息的 一种新技术,受到人工智能与数据库领域的广泛重视。其中的关联规则发现是数据挖掘一 个重要的研究分支。关联规则发现的目标是确定数据库中项目集(属性)之间的关系。这些 从大量事务记录中发现的关联规则,可以帮助人们做出决策。
[0003] 在所有关联规则挖掘的算法中,著名的算法是R.Agrawal (阿格拉沃尔)等人于 1993年提出的Apriori算法,该算法是最有影响的挖掘布尔型频繁项目集的算法,是通过发 现支持度大于用户设定的最小支持度的频繁项目集,再从频繁项目集中挖掘出置信度大于 用户设定的最小置信度的关联规则。
[0004]在现有的技术中,对于警情并没有一个预测的机制,只有当警情发生的时候,才能 进行处理,对于警情,并不能做到很好的预防,以往发生警情后都是事后分析研判,被动处 警的模式会降低地区的安全平稳。
【发明内容】
[0005] 本发明的目的是提供一种基于Apriori算法的警情预测方法及警情预测系统,该 基于Apriori算法的警情预测方法及警情预测系统克服了以往发生警情后都是事后分析研 判,被动处警的模式,实现了警情的预测。
[0006] 为了实现上述目的,本发明提供了一种基于Apriori算法的警情预测方法,该方法 包括:步骤1,将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的关联 规则,并对所述关联规则进行建模得到序列模型和函数表达式;步骤3,将发生的警情根据 所述序列模型得到预测案件发生率,并带入函数表达式中得到函数模型。
[0007] 优选地,在步骤1中,所述警情数据包括:动态影响因子和静态影响因子;
[0008] 所述动态影响因子包括:警情发生类型、警情发生天气和警情发生时间;
[0009] 所述静态影响因子包括:警情发生区域和警情发生道路。
[0010] 优选地,在步骤1之前还包括:将警情发生区域和警情发生道路进行数据初始化。 [0011]优选地,将警情发生区域和警情发生道路进行数据初始化的步骤包括:将城市地 图划分为多个辖区,并对每个辖区进行编号,其中,所述辖区为道路相交而形成的闭合区 域;将道路进行切片,并标上标号。
[0012] 优选地,在步骤1中,将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各 数据之间的关联规则的方法包括:
[0013] 通过Apriori算法对所述警情发生数据进行剪枝,去除小于预设支持度的频繁项 目集;
[0014] 将剪枝之后的警情发生数据挖掘出置信度大于预设置信度的关联规则,获得结果 集。
[0015] 本发明还提供一种基于Apriori算法的警情预测系统,该系统包括:
[0016] 将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的关联规 则的设备;
[0017] 对所述关联规则进行建模得到序列模型和函数表达式的设备;
[0018] 将发生的警情根据所述序列模型得到预测案件发生率,并带入函数表达式中得 到函数模型的设备。
[0019 ]优选地,所述警情数据包括:动态影响因子和静态影响因子;
[0020] 所述动态影响因子包括:警情发生类型、警情发生天气和警情发生时间;
[0021] 所述静态影响因子包括:警情发生区域和警情发生道路。
[0022]优选地,该系统还包括:将警情发生区域和警情发生道路进行数据初始化的设备。 [0023]优选地,将警情发生区域和警情发生道路进行数据初始化的设备包括:将城市地 图划分为多个辖区,并对每个辖区进行编号的设备,其中,所述辖区为道路相交而形成的闭 合区域;将道路进行切片,并标上标号的设备。
[0024] 优选地,将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的 关联规则的设备包括:
[0025] 通过Apriori算法对所述警情发生数据进行剪枝,去除小于预设支持度的频繁项 目集的设备;
[0026] 将剪枝之后的警情发生数据挖掘出置信度大于预设置信度的关联规则,获得结果 集的设备。
[0027]通过上述的【具体实施方式】,本发明的警情预测的方法基于大数据分析技术,结合 PGIS技术和标准地址匹配,克服了以往发生警情后事后分析研判,被动处警的模式,实现了 对未来警情的预测和区域治安形势的分析,可以主动加强巡逻防控,减少警情的发生。 [0028]本发明的其他特征和优点将在随后的【具体实施方式】部分予以详细说明。
【附图说明】
[0029]附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具 体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0030] 图1是说明本发明的一种基于Apriori算法的警情预测方法的流程图;
[0031] 图2是说明本发明的一种基于Apriori算法的警情预测方法的函数模型图。
【具体实施方式】
[0032] 以下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描 述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0033 ]本发明提供一种基于Apr i or i算法的警情预测方法,该方法包括:
[0034] 步骤1,将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的 关联规则;
[0035] 步骤2,对所述关联规则进行建模得到序列模型和函数表达式;
[0036]步骤3,将发生的警情根据所述序列模型得到预测案件发生率,并带入函数表达式 中得到函数模型。
[0037]事情的发生有其偶然性,也有其必然性。事情的发生都是由"因"和"缘"共同作用 的结"果"。某地警情("果")在某时("缘")发生具有偶然性,但辖区固有的一些"因"是发生 警情的必然。狭义的空间包括:区域、路段、派出所辖区、分局辖区等。广义的空间具有空间 结构、区域人员结构、区域人员失业率、性别比等特征。狭义的时间是指:天、周、月、年、自定 义的时间段等。广义的时间具有节假日、事件、天气等特征。广义的空间就是"因",广义的时 间就是"缘"。
[0038] 通过输入影响警情的各类数据,精确预测哪些区域在什么时间会发生什么类型的 警情。
[0039] -般警情的发生有一定时序性,比如发生强奸案后,亦会发生抢劫案。发生盗窃案 后,可能嫌犯会跨区域继续实施盗窃。通过是时间进行切割,找寻警情案件的时序性关系, 建立序列模型,从而对未来警情进行预判。
[0040] 通过序列模型发现,根据某区域近期发生的警情,预测未来该区域会发生什么警 情;根据某几个区域发生了某类警情,预测未来几天内,哪些区域会发生同样警情;根据某 几个区域近期发生某些警情,预测未来哪些区域会发生哪些警情。
[0041] 通过上述的实施方式,可以实现隐藏数据的挖掘从而建立序列模型,通过函数表 达式可以得到函数模型,通过向函数模型中输入影响警情的各类数据,精确预测哪些区域 在什么时间会发生什么类型的警情。
[0042] 在本发明的一种【具体实施方式】中,在步骤1中,所述警情数据可以包括:动态影响 因子和静态影响因子;
[0043] 所述动态影响因子包括:警情发生类型、警情发生天气和警情发生时间;
[0044] 所述静态影响因子包括:警情发生区域和警情发生道路。
[0045] 对于动态影响因子需要根据实际情况输入,静态影响因子,是通过下述的方法得 到的。
[0046] 在该种实施方式中,在步骤1之前还包括:将警情发生区域和警情发生道路进行数 据初始化。
[0047]在该种实施方式中,将警情发生区域和警情发生道路进行数据初始化的步骤包 括:将城市地图划分为多个辖区,并对每个辖区进行编号,其中,所述辖区为道路相交而形 成的闭合区域;将道路进行切片,并标上标号。
[0048]在上述的方式中,由城市主干道(可根据用户定义)相交的闭合区域,将城市地理 图层切片,并标上序号。区域采取"分局辖区+编码"的命名规则,如A01区域,表示鸠江分局 01号区域。
[0049] 由城市主干道(可根据用户定义)相切割的路段,将城市道路切片,并标上序号。区 域采取"分局辖区+纵向横向标识+第几条+第几段"的命名规则,如AZ0102道路,表示鸠江 分局纵1道路的第2段。
[0050] 由城市主干道(可根据用户实际需要定义)相交,定义为"路口"。如上
图。路口采取 "分局辖区+路口标识(L)+纵向道路标号+横向道路标号"的命名规则,如AL0103道路,表示 鸠江分局纵1道路和横3道路的路口。
[0051]在该种实施方式中,在步骤1中,将警情发生数据通过Apriori算法进行隐藏数据 挖掘,获得各数据之间的关联规则的方法包括:
[0052]通过Apriori算法对所述警情发生数据进行剪枝,去除小于预设支持度的频繁项 目集;
[0053]将剪枝之后的警情发生数据挖掘出置信度大于预设置信度的关联规则,获得结果 集。
[0054]警情预测数据如下所示:
[0055] 模拟警情数据
[0056]
[0057] 表 1
[0058] 假设:
[0059] T1、T2、T3、T4 权值为 3;
[0060] Α1、Α2、Α3、Α4 权值为 4;
[0061 ] II、12、13、15 权值为 3,14 权值为 6。
[0062]假设:
[0063] 最小支持度为0.4。
[0064] 那么:
[0065] T1出现5次,T权值为3,
[0066]总共23条数据,
[0067] 得:f(Tl)=5*3/23 = 0.65。
[0068] 在上述表中,通过Apriori算法,对数据进行挖掘修剪的方式如下表2所示:
[0069]
[0070] 表 2
[0071 ]对数据进行剪枝,去掉小于最小支持度0.4的项。
[0072] 通过关联规则,挖掘出的结果集如表3和表4所示:
[0073]
[0076] 表 4
[0077] 初始化数据,建立"时间-区域-警情"模型如表5所示,
[0078]
[0079] 表 5
[0080] 对于区域An,按时间段序列找寻关系,如:11-12-(13,14)对于跨区域,亦有序列 模型。
[0081] 如图2所示,以区域为单位,根据历史数据建立函数模型,利用函数模型的推导,对 区域的警情精确预测。图2中,通过对现有的警情数据深度分析,可得出警情曲线Y;
[0082] 以区域为单位,以影响警情的条件(第几周,星期几,天气,法定节假日,重大事件) 为变量,根据不同的参数反推函数模型f (XI,X2,X3,X4,X5),使得f (X)曲线接近警情曲线Y; [0083]根据推导出的线性函数模型Y = f (X1,X2,X3,X4,X5),在给定不同值的参数,便可 预测警情Y。
[0084] 本发明提供一种基于Apriori算法的警情预测系统,该系统包括:
[0085] 将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的关联规 则的设备;
[0086] 对所述关联规则进行建模得到序列模型和函数表达式的设备;
[0087] 将发生的警情根据所述序列模型得到预测案件发生率,并带入函数表达式中得到 函数模型的设备。
[0088] 通过上述的【具体实施方式】,本发明的警情预测的系统基于大数据分析技术,结合 PGIS技术和标准地址匹配,克服了以往发生警情后事后分析研判,被动处警的模式,实现了 对未来警情的预测和区域治安形势的分析,可以主动加强巡逻防控,减少警情的发生。
[0089] 在该种实施方式中,所述警情数据包括:动态影响因子和静态影响因子;
[0090] 所述动态影响因子包括:警情发生类型、警情发生天气和警情发生时间;
[0091] 所述静态影响因子包括:警情发生区域和警情发生道路。
[0092] 在该种实施方式中,该系统还包括:将警情发生区域和警情发生道路进行数据初 始化的设备。
[0093]在该种实施方式中,将警情发生区域和警情发生道路进行数据初始化的设备包 括:将城市地图划分为多个辖区,并对每个辖区进行编号的设备,其中,所述辖区为道路相 交而形成的闭合区域;将道路进行切片,并标上标号的设备。
[0094] 在该种实施方式中,将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各 数据之间的关联规则的设备包括:
[0095] 通过Apriori算法对所述警情发生数据进行剪枝,去除小于预设支持度的频繁项 目集的设备;
[0096]将剪枝之后的警情发生数据挖掘出置信度大于预设置信度的关联规则,获得结果 集的设备。
[0097]以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实 施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简 单变型,这些简单变型均属于本发明的保护范围。
[0098] 另外需要说明的是,在上述【具体实施方式】中所描述的各个具体技术特征,在不矛 盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可 能的组合方式不再另行说明。
[0099] 此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本 发明的思想,其同样应当视为本发明所公开的内容。
【主权项】
1. 一种基于Apriori算法的警情预测方法,其特征在于,该方法包括: 步骤1,将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的关联 规则,并对所述关联规则进行建模得到序列模型和函数表达式; 步骤2,将发生的警情根据所述序列模型得到预测案件发生率,并带入函数表达式中得 到函数模型。2. 根据权利要求1所述的警情预测方法,其特征在于,在步骤1中,所述警情数据包括: 动态影响因子和静态影响因子; 所述动态影响因子包括:警情发生类型、警情发生天气和警情发生时间; 所述静态影响因子包括:警情发生区域和警情发生道路。3. 根据权利要求2所述的警情预测方法,其特征在于,在步骤1之前还包括:将警情发生 区域和警情发生道路进行数据初始化。4. 根据权利要求3所述的警情预测方法,其特征在于,将警情发生区域和警情发生道路 进行数据初始化的步骤包括:将城市地图划分为多个辖区,并对每个辖区进行编号,其中, 所述辖区为道路相交而形成的闭合区域;将道路进行切片,并标上标号。5. 根据权利要求4所述的警情预测方法,其特征在于,在步骤1中,将警情发生数据通过 Apriori算法进行隐藏数据挖掘,获得各数据之间的关联规则的方法包括: 通过Apriori算法对所述警情发生数据进行剪枝,去除小于预设支持度的频繁项目集; 将剪枝之后的警情发生数据挖掘出置信度大于预设置信度的关联规则,获得结果集。6. -种基于Apriori算法的警情预测系统,其特征在于,该系统包括: 将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的关联规则的 设备; 对所述关联规则进行建模得到序列模型和函数表达式的设备; 将发生的警情根据所述序列模型得到预测案件发生率,并带入函数表达式中得到函数 模型的设备。7. 根据权利要求6所述的警情预测系统,其特征在于,所述警情数据包括:动态影响因 子和静态影响因子; 所述动态影响因子包括:警情发生类型、警情发生天气和警情发生时间; 所述静态影响因子包括:警情发生区域和警情发生道路。8. 根据权利要求7所述的警情预测系统,其特征在于,该系统还包括:将警情发生区域 和警情发生道路进行数据初始化的设备。9. 根据权利要求8所述的警情预测系统,其特征在于,将警情发生区域和警情发生道路 进行数据初始化的设备包括:将城市地图划分为多个辖区,并对每个辖区进行编号的设备, 其中,所述辖区为道路相交而形成的闭合区域;将道路进行切片,并标上标号的设备。10. 根据权利要求9所述的警情预测系统,其特征在于,将警情发生数据通过Apriori算 法进行隐藏数据挖掘,获得各数据之间的关联规则的设备包括: 通过Apriori算法对所述警情发生数据进行剪枝,去除小于预设支持度的频繁项目集 的设备; 将剪枝之后的警情发生数据挖掘出置信度大于预设置信度的关联规则,获得结果集的 设备。
【专利摘要】本发明公开了一种基于Apriori算法的警情预测方法及警情预测系统,该方法包括:将警情发生数据通过Apriori算法进行隐藏数据挖掘,获得各数据之间的关联规则,并对所述关联规则进行建模得到序列模型和函数表达式;步骤2,将发生的警情根据所述序列模型得到预测案件发生率,并带入函数表达式中得到函数模型。该基于Apriori算法的警情预测方法及警情预测系统克服了以往发生警情后都是事后分析研判,被动处警的模式,实现了警情的预测。
【IPC分类】G06Q10/04
【公开号】CN105488588
【申请号】CN201510835213
【发明人】刁吉水
【申请人】安徽瑞信软件有限公司
【公开日】2016年4月13日
【申请日】2015年11月25日