本发明涉及一种虚假订单识别方法、训练方法和相关产品。
背景技术:
1、虚假订单会造成库存积压或断货、运输成本增加,对供应链上下游企业造成损失。目前虚假订单识别方法多是基于专家手动提取的特征的传统机器学习方法如svm、knn和hmm等方法,鲁棒性较差。此外,虚假订单的行为数据远低于普通用户,难以获取。订单数据的多样性和不平衡性使得传统的机器学习方法不适用,而无监督或半监督深度学习方法可以更好地克服上述问题。
2、中国专利申请cn114547128a提出了虚假订单的识别方法、系统、计算机设备及存储介质。中国专利申请cn112465522a提出了一种虚假订单识别方法、装置、电子设备及存储介质。中国专利申请cn104866953a提出了一种虚假订单的识别方法及装置。
3、目前的虚假订单识别研究中还面临下面的问题。(1)订单的原始特征提供的信息有限,导致应用传统的深度学习方法识别精确度低。为了挖掘用户事务序列中的复杂依赖关系,需要更多更准确的提取订单特征信息。(2)缺少用于训练模型的虚假订单样本而导致传统深度学习模型训练困难,识别效果差。
技术实现思路
1、本发明提供一种虚假订单识别方法、训练方法和相关产品。
2、本发明的技术方案为:一种训练方法,包括:由真实订单数据训练第一自编码器,得到真实订单数据的潜在空间表示,将真实订单数据及其潜在空间表示拼接成真实订单样本;生成虚假订单数据的潜在空间表示,由虚假订单数据的潜在空间表示以及真实订单数据的潜在空间表示训练第一对抗生成网络,得到虚假订单数据的潜在空间表示对应的虚假订单数据,将虚假订单数据及其潜在空间表示拼接成虚假订单样本;由虚假订单样本和真实订单样本训练第二自编码器,训练后的第二自编码器中的编码器作为订单特征提取器;由虚假订单样本和真实订单样本训练第二对抗生成网络,训练后的第二对抗生成网络中的判别器作为虚假订单识别器;其中,所述潜在空间表示包括语义子码和随机子码,语义子码是对真实订单数据的编码,随机子码是对语义子码遗留信息的编码;其中训练得到的订单特征提取器和虚假订单识别器通信连接,用于虚假订单识别。
3、本发明的技术方案为:一种虚假订单识别方法,包括:将待判别订单数据输入预先训练好的订单特征提取器,得到待判别订单数据的潜在空间表示,潜在空间表示包括语义子码和随机子码,语义子码是对待判别订单数据信息的编码,随机子码是对语义子码遗留信息的编码;将待判别订单数据及其潜在空间表示进行拼接,拼接结果输入预先训练好的虚假订单识别器,得到识别结果。
4、本发明的技术方案为:一种训练装置,包括存储器和处理器,存储器存储程序,处理器运行该程序以执行前述的训练方法。
5、本发明的技术方案为:一种虚假订单识别装置,包括存储器和处理器,存储器存储程序,处理器运行该程序以执行前述的虚假订单识别方法。
6、本发明的技术方案为:一种程序产品,其在处理器上运行时执行前述的训练方法或前述的虚假订单识别方法。
7、本发明的训练方法和虚假订单识别方法能够得到原始订单数据更丰富的有用信息,进而使得订单信息提取器以及虚假订单识别器的识别效果更为精确。训练方法中所需的虚假订单样本是丰富的,解决了虚假订单样本不足的问题。
1.一种训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,第一自编码器的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,第一对抗生成网络的训练过程包括:
4.根据权利要求1所述的方法,其特征在于,第二自编码器的训练过程包括:
5.根据权利要求1所述的方法,其特征在于,第二对抗生成网络的训练过程包括:
6.一种虚假订单识别方法,其特征在于,包括:
7.一种训练装置,其特征在于,包括存储器和处理器,存储器存储程序,处理器运行该程序以执行权利要求1至5中任一项所述的训练方法。
8.一种虚假订单识别装置,其特征在于,包括存储器和处理器,存储器存储程序,处理器运行该程序以执行权利要求6所述的虚假订单识别方法。
9.一种程序产品,其特征在于,其在处理器上运行时执行权利要求1至5中任一项所述的训练方法或权利要求6所述的虚假订单识别方法。