本技术涉及工业物联网,尤其涉及物联网系统的模型更新方法及相关设备。
背景技术:
1、随着工业物联网的处理数据的数量和来源的增加,传统的集中式学习方案无法满足多源多量数据的处理需求,基于此,将学习过程放置于边缘设备上进行数据学习处理的联邦学习可以有效地满足多源多量数据的处理需求。
2、在相关技术中,在物联网系统中进行联邦学习,通常是多个设备节点从控制器中下载全局训练模型,然后在每一次训练后,控制器从多个设备节点中获取节点训练参数,然后基于多个节点训练参数得到全局训练参数,并将全局训练参数发送至所有设备节点上进行新一轮的模型训练。但由于在设备节点进行模型训练的过程中,存在受到网络攻击的情况,使得得到的节点训练参数受到影响,从而使得在物联网系统进行联邦学习的过程中进行模型性能提升效率低。
技术实现思路
1、本技术实施例的提供了一种物联网系统的模型更新方法及相关设备,能够提高在物联网系统中进行模型更新的可靠性和模型性能的提升效率。
2、为实现上述目的,本技术实施例的第一方面提出了一种物联网系统的模型更新方法,所述物联网系统包括多个设备节点,所述方法包括:
3、获取当前时刻每个所述设备节点的群体特征感知信息,所述群体特征感知信息用于表征所述设备节点的活跃程度、所述设备节点与所述控制器之间的交互频率,以及所述设备节点和其他所述设备节点之间的通信质量;
4、获取上一时刻每个所述设备节点的cpu利用率以及上一时刻可信设备节点序列;
5、将所有所述群体特征感知信息、所述cpu利用率和所述上一时刻可信设备节点序列输入联邦节点选择模型中进行节点选择,得到当前时刻可信设备节点序列;
6、根据所述当前时刻可信设备节点序列确定目标设备节点,获取所述目标设备节点中部署的数据处理模型的局部模型参数,对所述局部模型参数进行聚合得到全局模型参数,将所述全局模型参数发送至每个所述设备节点,以使得所述设备节点利用所述全局模型参数更新本地部署的所述数据处理模型。
7、在一些实施例,所述群体特征感知信息包括节点活跃度、节点控制器交互度以及通信空间约束信息,所述获取当前时刻每个所述设备节点的群体特征感知信息,包括:
8、获取当前时刻所述设备节点与其他所述设备节点之间的交互次数,并基于所述交互次数与所述设备节点的节点数量的比值得到所述节点活跃度;
9、获取当前时刻所述设备节点与所述控制器之间的交互频次以及每个所述交互频次的交互持续时间,并基于所述交互频次和所述交互持续时间得到所述节点控制器交互度;
10、获取当前时刻所述设备节点与其他所述设备节点之间的通信信噪比,以及获取最小信噪比阈值,并基于所述通信信噪比和所述最小信噪比阈值得到所述通信空间约束信息。
11、在一些实施例,所述节点控制器交互度包括平均交互持续时间、交互程度以及通信概率,所述基于所述交互频次和所述交互持续时间得到所述节点控制器交互度,包括:
12、累加当前时刻内所有所述交互持续时间得到时刻交互时间,并基于所述时刻交互时间与所述交互频次的比值得到所述平均交互持续时间;
13、获取所述设备节点与所述控制器之间的交互时间和交互间隔时间,累加所述交互时间和所述交互间隔时间得到交互成本时间,并基于所述时刻交互时间和所述交互成本时间的比值得到所述交互程度;
14、基于指数衰减函数和所述交互程度得到衰减交互函数,并基于预设通信数量与所述衰减交互函数的比值得到所述通信概率。
15、在一些实施例,所述获取当前时刻所述设备节点与其他所述设备节点之间的通信信噪比,以及获取最小信噪比阈值,包括:
16、获取所述设备节点与第一个其他所述设备节点之间的第一节点信道增益,获取第二个其他所述设备节点与第一个其他所述设备节点之间的第二节点信道增益,获取所述设备节点的第一发射功率,以及获取所述第二个其他所述设备节点的第二发射功率;
17、基于所述第一节点信道增益和所述第一发射功率的乘积得到第一接收功率,基于所述第二节点信道增益和所述第二发射功率的乘积得到第二接收功率,并基于所述第一接收功率和所述第二接收功率的比值得到所述通信信噪比;
18、获取信道带宽,从多个所述通信信噪比中选取最小的通信信噪比作为最小信噪比,基于所述最小信噪比的对数,并乘以所述信道带宽得到最小通信速率;
19、基于预设通信数量的所述最小通信速率的指数得到所述最小信噪比阈值。
20、在一些实施例,所述基于所述通信信噪比和所述最小信噪比阈值得到所述通信空间约束信息,包括:
21、基于所述第二接收功率与所述最小信噪比阈值的乘积得到最小信号功率;
22、基于所述最小信号功率与所述通信信噪比的比值得到所述通信空间约束信息。
23、在一些实施例,所述将所有所述群体特征感知信息、所述cpu利用率和所述上一时刻可信设备节点序列输入联邦节点选择模型中进行节点选择之前,所述方法还包括:
24、获取群体特征感知信息参数、cpu利用率参数、可信设备节点策略参数,以及获取局部损失值参数,并基于所述群体特征感知信息参数、所述cpu利用率参数、所述可信设备节点策略参数以及所述局部损失值参数,得到状态空间;
25、基于所述设备节点的选取动作,得到动作空间,基于所述局部损失值参数和所述可信设备节点策略参数得到奖励函数;
26、基于长短时记忆算法构建动作网络和评价网络,基于所述动作网络构建对应的目标动作网络,并基于所述评价网络构建对应的目标评价网络;
27、基于所述状态空间和所述动作空间获取训练样本,并利用训练样本和所述奖励函数训练所述动作网络和所述评价网络,并在训练过程中更新所述目标动作网络和所述目标评价网络;
28、将训练后的所述目标动作网络作为所述联邦节点选择模型。
29、在一些实施例,所述获取局部损失值参数,包括:
30、获取所述设备节点的节点损失函数,并基于所述节点损失函数得到节点累加损失值;
31、基于所述节点累加损失值与训练样本的样本数量的比值,得到所述局部损失值参数。
32、在一些实施例中,所述利用训练样本和所述奖励函数训练所述动作网络和所述评价网络,包括:
33、获取所述动作网络的动作网络参数和所述评价网络的评价网络参数,获取所述训练样本对应的当前训练状态和当前训练动作,基于所述可信设备节点策略参数确定所述当前训练状态和所述当前训练动作对应的下一训练状态和下一训练动作;
34、基于动作价值函数更新动作网络参数;
35、基于所述奖励函数得到所述当前训练状态和所述当前训练动作对应的当前奖励,基于所述动作价值函数获取所述下一训练状态和所述下一训练动作的预测状态动作价值,基于所述当前奖励和所述预测状态动作价值更新所述动作价值函数中当前时刻的状态动作价值;
36、基于评价损失函数和更新后的所述动作价值函数更新所述评价网络参数。
37、为实现上述目的,本技术实施例的第二方面提出了一种物联网系统的模型更新装置,所述物联网系统包括多个设备节点,所述装置包括:
38、第一获取模块,用于获取当前时刻每个所述设备节点的群体特征感知信息,所述群体特征感知信息用于表征所述设备节点的活跃程度、所述设备节点与所述控制器之间的交互频率,以及所述设备节点和其他所述设备节点之间的通信质量;
39、第二获取模块,用于获取上一时刻每个所述设备节点的cpu利用率以及上一时刻可信设备节点序列;
40、数据处理模块,用于将所有所述群体特征感知信息、所述cpu利用率和所述上一时刻可信设备节点序列输入联邦节点选择模型中进行节点选择,得到当前时刻可信设备节点序列;
41、联邦学习模块,用于根据所述当前时刻可信设备节点序列确定目标设备节点,获取所述目标设备节点中部署的数据处理模型的局部模型参数,对所述局部模型参数进行聚合得到全局模型参数,将所述全局模型参数发送至每个所述设备节点,以使得所述设备节点利用所述全局模型参数更新本地部署的所述数据处理模型。
42、为实现上述目的,本技术实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的物联网系统的模型更新方法。
43、为实现上述目的,本技术实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的物联网系统的模型更新方法。
44、本技术实施例提出的物联网系统的模型更新方法及相关设备,物联网系统包括多个设备节点,方法包括:首先,获取当前时刻每个设备节点的群体特征感知信息,群体特征感知信息用于表征设备节点的活跃程度、设备节点与控制器之间的交互频率,以及设备节点和其他设备节点之间的通信质量;并且,获取上一时刻每个设备节点的cpu利用率以及上一时刻可信设备节点序列;然后,将所有群体特征感知信息、cpu利用率和上一时刻可信设备节点序列输入联邦节点选择模型中进行节点选择,得到当前时刻可信设备节点序列;最后,根据当前时刻可信设备节点序列确定目标设备节点,获取目标设备节点中部署的数据处理模型的局部模型参数,对局部模型参数进行聚合得到全局模型参数,将全局模型参数发送至每个设备节点,以使得设备节点利用全局模型参数更新本地部署的数据处理模型。本技术实施例利用表征设备节点的活跃程度、交互频率以及通信质量的群体特征感知信息,以及设备节点的cpu利用率作为联邦节点选择模型的输入参数之二,提高选择节点的可靠性,降低选择到受攻击的节点作为目标设备节点的概率,从而提高获取的目标设备节点的局部模型参数的可靠性和精准性,间接提高利用局部模型参数所得到的全局模型参数的可靠性和精准性,进而提高模型训练过程中的模型性能的提升效率。
45、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
1.一种物联网系统的模型更新方法,其特征在于,所述物联网系统包括多个设备节点,所述方法包括:
2.根据权利要求1所述的物联网系统的模型更新方法,其特征在于,所述群体特征感知信息包括节点活跃度、节点控制器交互度以及通信空间约束信息,所述获取当前时刻每个所述设备节点的群体特征感知信息,包括:
3.根据权利要求2所述的物联网系统的模型更新方法,其特征在于,所述节点控制器交互度包括平均交互持续时间、交互程度以及通信概率,所述基于所述交互频次和所述交互持续时间得到所述节点控制器交互度,包括:
4.根据权利要求2所述的物联网系统的模型更新方法,其特征在于,所述获取当前时刻所述设备节点与其他所述设备节点之间的通信信噪比,以及获取最小信噪比阈值,包括:
5.根据权利要求4所述的物联网系统的模型更新方法,其特征在于,所述基于所述通信信噪比和所述最小信噪比阈值得到所述通信空间约束信息,包括:
6.根据权利要求1所述的物联网系统的模型更新方法,其特征在于,所述将所有所述群体特征感知信息、所述cpu利用率和所述上一时刻可信设备节点序列输入联邦节点选择模型中进行节点选择之前,所述方法还包括:
7.根据权利要求6所述的物联网系统的模型更新方法,其特征在于,所述获取局部损失值参数,包括:
8.根据权利要求6所述的物联网系统的模型更新方法,其特征在于,所述利用训练样本和所述奖励函数训练所述动作网络和所述评价网络,包括:
9.一种物联网系统的模型更新装置,其特征在于,所述物联网系统包括多个设备节点,所述装置包括:
10.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的物联网系统的模型更新方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的物联网系统的模型更新方法。