2、与集中式的机器学习方法相比,联邦学习方法具有优秀的数据隐私保护能力。在联邦学习中,参与者无需上传隐私敏感数据,模型的训练在参与者的本地进行,训练出本地模型后仅与服务器共享模型的参数、梯度等特征,不交换原始数据,能够非常有效地解决数据分析中的隐私保护问题。因此联学习方法在智能电网的涉及隐私数据的数据挖掘、状态诊断与负荷预测等场景有广阔的应用前景。
技术实现思路
1、针对现有技术中的上述不足,本发明提供了联邦学习在电力数据分析中的应用及隐私保护方法,联邦学习方法能够有效保证客户端敏感数据的隐私性,应用利用主成分分析提取特征,识别模型获得了更好的性能,同时联邦识别模型具有与集中式方法相当的性能。
2、为了达到上述发明目的,本发明采用的具体方案为:
3、联邦学习在电力数据分析中的应用及隐私保护方法,联邦学习方法是客户端(电脑、平板、手机等设备)在中央服务器的协调下共同训练模型,客户端接收服务器下发的初始化模型,根据本地数据训练出一个本地模型并上传给服务器,服务器对客户端上传的模型参数进行安全聚合并反馈给客户端,客户端根据更新的模型进行下一次迭代,如此进行多次迭代直至模型收敛;
4、在恶意参与者和恶意服务器同时存在的情况下,采用一种混合防御机制同时对恶意参与者和恶意服务器采取防御,采用了将同态加密和差分隐私结合的方法,使用差分隐私对参与方上传的模型参数δi添加噪声,使其满足ε-差分隐私,然后再对添加噪声后的参数使用同态加密进行加密,这种方法可以有效防止联邦学习中的恶意参与者和恶意服务器勾结情况下的隐私泄露问题。
5、优选地,所述联邦学习的模型训练包括以下3个步骤:
6、(1)初始化:服务器预先给n个参与方d1,d2,…,dn分配一个初始神经网络模型,每个参与方可以选择加入联邦学习并以相同的机器学习方法训练模型;
7、(2)本地训练:在其中一轮通信过程中,参与方接受服务器下发的全局模型参数,每个参与方根据本地数据集(即私有样本数据)d1,d2,…,dn对模型进行训练,生成本地模型更新参数,并将模型参数ωi更新上传至服务器;
8、(3)模型平均:服务器按照一定的规则对所有服务器上传的本地模型参数进行聚合,训练出全局模型mg,更新全局模型参数ωg并下发给各参与者,让他们进行本地模型训练。
9、优选地,假设n个参与方p1,p2,…,pn分别拥有本地隐私数据d1,d2,…,dn,这n个参与方在不泄露本地隐私数据的前提下共同执行协议计算:f(d1,d2,…,dn)→(f1,f2,…,fn),参与方pi只能获得结果fi但是无法获得任何其他额外的信息。
10、优选地,所述联邦学习在电力数据分析中的应用为:将联邦学习用于电力消费者特征提取与识别,主成分分析法(pca)被用来从智能电表数据中提取特征,数据集d的第m行表示为dm,即第m个客户端的特征数据,令协方差矩阵可以表示为:令式(1)可以改成为:式中,cn表示第n个消费者的所有特征数据在数据集中的范围。
12、优选地,基于pca提取的特征,对每个特征训练出一个前馈ann模型,ωk表示人工神经网络对第k个特征的所有权重和偏差的集合,利用主成分分析提取特征,识别模型获得了更好的性能,同时联邦识别模型具有与集中式方法相当的性能。
13、本发明的有益效果为:
14、客户端(电脑、平板、手机等设备)在中央服务器的协调下共同训练模型。客户端接收服务器下发的初始化模型,根据本地数据训练出一个本地模型并上传给服务器。服务器对客户端上传的模型参数进行安全聚合并反馈给客户端,客户端根据更新的模型进行下一次迭代,如此进行多次迭代直至模型收敛。联邦学习方法能够有效保证客户端敏感数据的隐私性。研究表明,利用主成分分析提取特征,识别模型获得了更好的性能,同时联邦识别模型具有与集中式方法相当的性能。
1.联邦学习在电力数据分析中的应用及隐私保护方法,其特征在于,联邦学习方法是客户端(电脑、平板、手机等设备)在中央服务器的协调下共同训练模型,客户端接收服务器下发的初始化模型,根据本地数据训练出一个本地模型并上传给服务器,服务器对客户端上传的模型参数进行安全聚合并反馈给客户端,客户端根据更新的模型进行下一次迭代,如此进行多次迭代直至模型收敛;
2.根据权利要求1所述的联邦学习在电力数据分析中的应用及隐私保护方法,其特征在于,所述联邦学习的模型训练包括以下3个步骤:
3.根据权利要求1所述的联邦学习在电力数据分析中的隐私保护方法,其特征在于,假设n个参与方p1,p2,…,pn分别拥有本地隐私数据d1,d2,…,dn,这n个参与方在不泄露本地隐私数据的前提下共同执行协议计算:f(d1,d2,…,dn)→(f1,f2,…,fn),参与方pi只能获得结果fi但是无法获得任何其他额外的信息。
4.根据权利要求1所述的联邦学习在电力数据分析中的应用及隐私保护方法,所述联邦学习在电力数据分析中的应用为:将联邦学习用于电力消费者特征提取与识别,主成分分析法(pca)被用来从智能电表数据中提取特征,数据集d的第m行表示为dm,即第m个客户端的特征数据,令协方差矩阵可以表示为:令可以改成为:式中,cn表示第n个消费者的所有特征数据在数据集中的范围。
6.根据权利要求5所述的联邦学习在电力数据分析中的应用,基于pca提取的特征,对每个特征训练出一个前馈ann模型,ωk表示人工神经网络对第k个特征的所有权重和偏差的集合,利用主成分分析提取特征,识别模型获得了更好的性能,同时联邦识别模型具有与集中式方法相当的性能。