一种基于用户行为数据的车主身份识别方法及装置的制造方法
【技术领域】
[0001]本发明涉及智能识别技术领域,尤其涉及一种基于用户行为数据的车主身份识别方法及装置。
【背景技术】
[0002]随着互联网的快速发展以及有车用户数量的快速增加,与车相关的互联网服务逐渐被人们接受,例如:用车出行、洗车或汽车保养查询或预约等互联网服务。在这些与车相关的互联网服务中,车主为所有服务的核心,尤其在互联网服务的业务推广和用户发展中,所以确认用户的车主身份显得至关重要。
[0003]如今,只有部分用户会提供是否为车主的身份信息,大部分用户并未提供身份信息,因此需要获取未知身份用户是否为车主的身份信息。
[0004]现有技术并未提供能够自动且准确识别用户车主身份的方法,使得车主身份用户的识别率很低,也就无法基于用户的车主身份为用户提供相关业务服务。
【发明内容】
[0005]有鉴于此,本发明实施例提供一种基于用户行为数据的车主身份识别方法及装置,以解决现有技术中车主识别率较低的技术问题。
[0006]第一方面,本发明实施例提供了一种基于用户行为数据的车主身份识别方法,所述方法包括:
[0007]获取未知身份用户的行为数据;
[0008]利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。
[0009]第二方面,本发明实施例还提供了一种基于用户行为数据的车主身份识别装置,所述装置包括:
[0010]行为数据获取模块,用于获取未知身份用户的行为数据;
[0011 ]车主身份识别模块,用于利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。
[0012]本发明实施例提供的基于用户行为数据的车主身份识别方法及装置,利用用户的行为数据进行车主身份的识别,可以自动高效的识别车主身份,且提高了车主身份识别的正确率,在用户用车出行或查询与车相关服务时,可以针对用户的身份,采用不同的推广活动吸引用户,提高推广活动的效果,降低推广成本。
【附图说明】
[0013]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0014]图1为本发明实施例一提供的一种基于用户行为数据的车主身份识别方法的流程图;
[0015]图2为本发明实施例二提供的一种基于用户行为数据的车主身份识别方法的流程图;
[0016]图3为本发明实施例三提供的一种基于用户行为数据的车主身份识别装置的结构图。
【具体实施方式】
[0017]下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
[0018]实施例一
[0019]图1为本发明实施例一提供的一种基于用户行为数据的车主身份识别方法的流程图。本实施例可适用于想要识别未知身份用户是否为车主的情况。该方法可以由基于用户行为数据的车主身份识别装置来执行,其中该装置可以由软件和/或硬件来实现,参考图1,本实施例提供的基于用户行为数据的车主身份识别方法具体可以包括如下:
[0020]S110、获取未知身份用户的行为数据。
[0021]其中,所述行为数据为通过互联网或各种应用程序客户端采集的用户行为,主要是用户使用网络服务的行为,尤其是与是否有车相关联的行为。可以通过经验分析来确定哪些用户行为与是否有车的关联密切。
[0022]优选是,行为数据包含下述至少一项:对地图的检索行为;在地图进行基本信息点的检索行为;公交路线检索行为;驾车路线检索行为;步行路线检索行为;以及地铁路线检索行为。
[0023]优选的,与车相关的基本信息点可以包含:加油站、汽车服务、汽车销售、4S店、汽车美容、汽车保养、汽车装饰、洗车、汽车配件、以及汽车检验场等。在地图类应用程序进行基本信息点检索时输入上述检索词可以认为是进行基本信息点的检索行为。
[0024]优选的,获取未知身份用户的行为数据可以是获取一定时间范围内未知身份用户的行为数据和/或获取一定数量的未知身份用户的行为数据,具体获取规则与车主身份识别器的训练数据获取规则相同。获取的行为数据应与车主身份识别器识别的行为数据对应。例如,车主身份识别器对地图的检索行为和驾车路线检索行为进行识别,则获取未知身份用户的对地图的检索行为和驾车路线检索行为。
[0025]S120、利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。
[0026]其中,所述设定维度是在行为数据中,能够反映是否有车的典型参数,这些典型参数可以由人工确定,也可以基于模型进行训练来确定。例如,可以就行为数据的各个方面进行统计,如果某个维度的数据,在是否有车的用户之间,差异明显,则该维度即可作为训练识别器的设定维度。否则,不可用于训练识别器。例如,在地图应用程序的使用中,用户对地图的使用次数这一维度,进行统计后发现无论是否有车,都会使用地图,所以使用次数这一维度在车主和非车主之间的差异不明显,则这一维度不可设定用于训练车主身份识别器。
[0027]本实施例中,设定维度优选包括下述至少一项:在地图中的检索次数和/或天数;基本信息点的检索次数和/或天数;公交路线检索次数和/或天数;驾车路线检索次数和/或天数;步行路线检索次数和/或天数;地铁路线检索次数和/或天数;各检索次数在总检索次数中的占比;各检索天数在总检索天数中的占比。
[0028]所述车主身份识别器基于已确认身份用户的行为数据按照上述至少一种维度训练而确定。具体的,车主身份识别器对获取的未知身份用户的行为数据进行识别,根据识别结果判断未知身份用户的身份是车主还是非车主。各设定维度的统计结果可以单独训练,优选是结合进行训练。
[0029]例如,车主身份识别器认定,若用户三个月内在地图中的检索次数大于75次且天数不小于60天,驾车路线检索次数不小于50次且检索天数不小于50天,驾车路线检索次数在总检索次数中的占比高于65%,则被识别为车主身份,否则被识别为非车主身份。获取未知身份用户三个月内对地图的检索行为和驾车路线检索行为,经过车主身份识别器进行识另IJ,识别结果为该未知身份用户在地图中的检索次数为80次且天数为72天,驾车路线检索次数为60次且检索天数为52天,驾车路线检索次数在总检索次数中的占比高于65%,满足车主身份识别器确认车主身份的条件,则认为该未知身份用户对应的身份为车主。
[0030]本发明实施例一提供的基于用户行为数据的车主身份识别方法,利用车主身份识别器,对获取的未知身份用户的行为数据进行识别,根据识别结果确定所述未知身份用户的身份是否为车主,其中,车主身份识别器是基于已知身份用户的行为数据按照设定维度进行训练得到的。通过车主身份识别器可以准确地识别出用户的身份,提高车主身份识别率,在用户用车出行或查询与车相关服务时,可以针对用户的身份,采用不同的推广活动吸引用户,提高推广活动的效果,降低推广成本。
[0031]实施例二
[0032]本实施例以上述实施例为基础提供了一种基于用户行为数据的车主身份识别方法。图2为本发明实施例二提供的一种基于用户行为数据的车主身份识别方法的流程图。参考图2,本实施例提供的基于用户行为数据的车主身份识别方法可以包括如下:
[0033]S210、获取已知身份用户的行为数据。
[0034]示例性的,获取已知身份用户的行为数据,可以是获取已知身份用户在预设时间间隔内的行为数据和/或获取已知身份用户的一定数量的行为数据,具体的预设时间间隔和数量可以根据实际情况进行设定。其中,获取的行为数据包含下述至少一项:对地图的检索行为;在地图进行基本信息点的检索行为;公交路线检索行为;驾车路线检索行为;步行路线检索行为;地铁路线检索行为。
[0035]具体的,获取已知身份用户的行为数据具体可以包括:通过用户的注册信息获取用户是否为车主的身份;或,通过车辆关联业务的使用行为确定用户是否为车主身份;根据车主身份或非车主身份,分别获取对应用户的行为数据。
[0036]示例性的,确认用户身份的方式可以通过用户在注册信息时提供的身份,也可以通过有偿奖励的方法激励用户提供身份,还可以根据车辆关联业务的使用行为。例如根据顺风车等叫车应用的使用情况确认用户是否为车主身份。获取车主数据和非车主数据,分别提取车主数据中的部分车主行为数据和非车主数据中的部分非车主行为数据。其中提取的车主行为数据和非车主行为数据可以相同,也可以不同。
[0037]S220、将所述已知身份用户的行为数据构造为车主用户行为数据集和非车主用户行为数据集。
[0038]具体的,可以提取一定数量的已知车主身份用户的车主行为数据构造车主用户行为数据集,提取一定数量的已知非车主身份用户的非车主行为数据构造非车主用户行为数据集。具体的数量可以根据实际情况进行设定。
[0039]S230、车主用户行为数据集和非车主用户行为数据集作为车主身份识别器的训练数据,基于设定维度对车主身份识别器进行训练,以确定所述车主身份识别器。
[0040]优选的,所述车主身份识别器可以通过机器学习系统模型进行训练,具体的模型可以根据实际情况进行选择,例如选择决策树、随机森林(random forest)或决策向量机等。
[0041 ]具体的,设定维度可以包括下述至少一项:在地图中的检索次数和/或天
数;基本信息点的检索次数和/或天数;公交路线检索次数和/或天数;驾车路线检索次数和/或天数;步行路线检索次数和/或天数;地铁路线检索次数和/或天数;各检索次数在总检索次数中的占比;各检索天数在总检索天数中的占比。将车主用户行为数据集和非车主用户行为数据集作为车主身份识别器的训练数据,基于设定的维度,利用机器学习系统模型对车主身份识别器进行训练,以确定所述车主身份识别器。
[0042]例如,获取200个已知车主身份用户和200个已知非车主身份用户在三个月内使用地图类应用程序得到的全部数据,提取其中对地图的检索行为数据、公交线路检索行为数据、驾车线路检索行为数据和地铁线路检索行为数据作为训练数据,按照在地图中的检索次数和天数,公交路线检索次数和天数、驾车路线检索次数和天数、地铁路线检索次数和天数、各检索次数在总检索次数中的占比、各检索天数在总检索天数中的占比的维度,利用决策树对车主身份识别器进行训练。训练得到的结果为:三个月内各已知车主身份用户平均在地图中的检索次数高于70次,在地图中的检索天数大于60天,公交路线检索次数低于40次且天数低于20天,驾车路线检索次数高于55次且天数高于45天,地铁路线检索次数低于40次且天数低于15天,公交路线检索次数低于总检索次数的57%,驾车路线检索次数高于总检索次数的78%,地铁路线检索次数低于总检索次数的57%,公交路线检索天数低于总检索天数的33%,驾车路线检索天数高于总检索天数的75%,地铁路线检索天数低于总检索天数的25%。设定若满足驾车路线检索次数高于总检索次数的78%且满足其它任意两项结果的用户身份为车主,若不满足设定条件的用户身份为非车主。
[0043]S240、获取未知身份用户的行为数据。
[0044]S250、利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主。
[0045]本发明实施例二提供的基于用户行为数据的车主身份识别方法,通过获取已知身份用户的行为数据构造车主用户行为数据集和非车主用户行为数据集,并将车主用户行为数据集和非车主用户行为数据集作为车主身份识别器的训练数据按照预设维度对车主身份识别器进行训练,使得车主身份识别器的识别结果更加准确。通过车主身份识别器识别未知身份用户是否为车主身份,可以在用户用车出行或查询与车相关服务时,针对用户的身份,采用不同的推广活动吸引用户,提高推广活动的效果,降低推广成本。
[0046]实施例三
[0047]图3为本发明实施例三提供的一种基于用户行为数据的车主身份识别装置的结构图。本实施例可适用于想要识别未知身份用户是否为车主的情况。参考图3,所述基于用户行为数据的车主身份识别装置的结构可以具体如下:
[0048]行为数据获取模块301,用于获取未知身份用户的行为数据;
[0049]车主身份识别模块302,用于利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。
[0050]进一步的,所述装置还可以包括:
[0051]已知行为数据获取模块,用于获取已知身份用户的行为数据;
[0052]数据集构造模块,用于将所述已知身份用户的行为数据构造为车主用户行为数据集和非车主用户行为数据集;
[0053]训练数据确定模块,用于将车主用户行为数据集和非车主用户行为数据集作为车主身份识别器的训练数据,基于设定维度对车主身份识别器进行训练,以确定所述车主身份识别器。
[0054]进一步的,所述行为数据可以包含下述至少一项:
[0055]对地图的检索行为;在地图进行基本信息点的检索行为;公交路线检索行为;驾车路线检索行为;步行路线检索行为;地铁路线检索行为。
[0056]进一步的,所述设定维度可以包括下述至少一项:
[0057]在地图中的检索次数和/或天数;基本信息点的检索次数和/或天数;公交路线检索次数和/或天数;驾车路线检索次数和/或天数;步行路线检索次数和/或天数;地铁路线检索次数和/或天数、各检索次数在总检索次数中的占比;各检索天数在总检索天数中的占比。
[0058]进一步的,所述车主身份识别器可以通过机器学习系统模型进行训练。
[0059]进一步的,所述已知行为数据获取模块可以包括:
[0060]车主身份确定子模块,用于通过用户的注册信息获取用户是否为车主的身份;或,通过车辆关联业务的使用行为确定用户是否为车主的身份;
[0061]行为数据获取子模块,用于根据车主身份或非车主身份,分别获取对应用户的行为数据。
[0062]本发明实施例三提供的基于用户行为数据的车主身份识别装置,与本发明任意实施例所提供的基于用户行为数据的车主身份识别方法属于同一发明构思,可执行本发明任意实施例所提供的基于用户行为数据的车主身份识别方法,具备执行基于用户行为数据的车主身份识别方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的基于用户行为数据的车主身份识别方法。
[0063]注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
【主权项】
1.一种基于用户行为数据的车主身份识别方法,其特征在于,包括: 获取未知身份用户的行为数据; 利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。2.根据权利要求1所述的方法,其特征在于,获取未知身份用户的行为数据之前,还包括: 获取已知身份用户的行为数据; 将所述已知身份用户的行为数据构造为车主用户行为数据集和非车主用户行为数据集; 车主用户行为数据集和非车主用户行为数据集作为车主身份识别器的训练数据,基于设定维度对车主身份识别器进行训练,以确定所述车主身份识别器。3.根据权利要求2所述的方法,其特征在于,所述行为数据包含下述至少一项: 对地图的检索行为;在地图进行基本信息点的检索行为;公交路线检索行为;驾车路线检索行为;步行路线检索行为;地铁路线检索行为。4.根据权利要求3所述的方法,其特征在于,所述设定维度包括下述至少一项: 在地图中的检索次数和/或天数;基本信息点的检索次数和/或天数;公交路线检索次数和/或天数;驾车路线检索次数和/或天数;步行路线检索次数和/或天数;地铁路线检索次数和/或天数;各检索次数在总检索次数中的占比;各检索天数在总检索天数中的占比。5.根据权利要求2所述的方法,其特征在于,所述车主身份识别器通过机器学习系统模型进行训练。6.根据权利要求2所述的方法,其特征在于,获取已知身份用户的行为数据包括: 通过用户的注册信息获取用户是否为车主的身份;或,通过车辆关联业务的使用行为确定用户是否为车主的身份; 根据车主身份或非车主身份,分别获取对应用户的行为数据。7.—种基于用户行为数据的车主身份识别装置,其特征在于,包括: 行为数据获取模块,用于获取未知身份用户的行为数据; 车主身份识别模块,用于利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。8.根据权利要求7所述的装置,其特征在于,还包括: 已知行为数据获取模块,用于获取已知身份用户的行为数据; 数据集构造模块,用于将所述已知身份用户的行为数据构造为车主用户行为数据集和非车主用户行为数据集; 训练数据确定模块,用于将车主用户行为数据集和非车主用户行为数据集作为车主身份识别器的训练数据,基于设定维度对车主身份识别器进行训练,以确定所述车主身份识别器。9.根据权利要求8所述的装置,其特征在于,所述行为数据包含下述至少一项: 对地图的检索行为;在地图进行基本信息点的检索行为;公交路线检索行为;驾车路线检索行为;步行路线检索行为;地铁路线检索行为。10.根据权利要求9所述的装置,其特征在于,所述设定维度包括下述至少一项: 在地图中的检索次数和/或天数;基本信息点的检索次数和/或天数;公交路线检索次数和/或天数;驾车路线检索次数和/或天数;步行路线检索次数和/或天数;地铁路线检索次数和/或天数;各检索次数在总检索次数中的占比;各检索天数在总检索天数中的占比。11.根据权利要求8所述的装置,其特征在于,所述车主身份识别器通过机器学习系统模型进行训练。12.根据权利要求8所述的装置,其特征在于,所述已知行为数据获取模块包括: 车主身份确定子模块,用于通过用户的注册信息获取用户是否为车主的身份;或,通过车辆关联业务的使用行为确定用户是否为车主的身份; 行为数据获取子模块,用于根据车主身份或非车主身份,分别获取对应用户的行为数据。
【专利摘要】本发明公开了一种基于用户行为数据的车主身份识别方法及装置。所述基于用户行为数据的车主身份识别方法包括:获取未知身份用户的行为数据;利用车主身份识别器对所述行为数据进行识别,根据识别结果确认所述未知身份用户的身份是否为车主,其中,所述车主身份识别器基于已知身份用户的行为数据按照设定维度训练而确定。本发明实施例的技术方案提供了一种识别率高的车主身份识别方法。
【IPC分类】G08G1/017
【公开号】CN105489021
【申请号】CN201511029749
【发明人】王超
【申请人】百度在线网络技术(北京)有限公司
【公开日】2016年4月13日
【申请日】2015年12月31日