利索能及
我要发布
收藏
专利号: 2021110059196
申请人: 华侨大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种电力用户异常用电行为检测方法,其特征在于,包括如下步骤:

1)通过非侵入式负荷监测得到用户用电数据;

2)采用深度Q网络学习方法对用户用电数据进行处理得到用户用电行为模式图,其包括已查实的异常的用户用电行为模式图;

3)对已查实的异常的用户用电行为模式图提取用电行为特征,具体的,将提取的用电行为特征均分为K+1个调度时段,其中调度时段k∈{0,1,…K};

4)根据提取的用电行为特征建立多个分析模型;

5)采用Q网络学习方法对多个分析模型分别进行训练和评估,选取评估效果最优的分析模型,具体包括如下:构造深度Q网络,包括当前值网络和目标值网络,初始化当前值网络权重参数θi、目标值‑网络权重参数θi=θi,输入序列宽度W、经验池容量D、批训练样本数B、学习因子a、贪心概率e和折扣因子Y,i为提取的用户行为特征数,定义任意一个样本轨道为m,样本轨道总数为M,且令m=0;

5.1)令k=0,随机初始化当前状态sk;

5.2)构造深度Q网络的输入序列 其包括当前状态sk和记录的前W个决策时刻的状态和动作,当k

0的学习因子,sk‑1为调度时段k‑1的初始状态,ak‑1为调度时段k‑1的学习因子,sk为调度时段k的当前状态;当k>W时, 将序列 输入到当前值网络,当前值greedy

网络的输出 用来评估当前状态行动对的值函数,选取最小Q值对应的行动a ,rand greedy同时,随机选取有效行动a ,采用ε‑贪心策略选取行动ak,若ε

5.3)区域用户用电执行决策时刻tk的行动ak,并观察决策周期内产生的运行代价ckCk,经过一个决策周期后,观察下一决策时刻的状态sk+1并构造输入序列 将一个学习样本存储到经验池,判断经验池内学习样本数是否大于经验池容量D,若是,则移除记忆最久远的一条样本;

5.4)判断经验池内学习样本数是否大于批训练样本数B,若是,则从经验池中随机抽取B条学习样本对当前值网络进行批训练,并判断k与K的大小,即若k

5.5)若m

6)采用评估效果最优的分析模型来检测用户的用电行为是否异常。

2.如权利要求1所述的一种电力用户异常用电行为检测方法,其特征在于,所述步骤1)中,所述用户用电数据至少包括用电设备能耗情况与用户用电规律。

3.如权利要求1所述的一种电力用户异常用电行为检测方法,其特征在:所述步骤2)中,所述用户用电行为模式图还包括有正常的用户用电行为模式图和疑似异常的用户用电行为模式图;则步骤6)中,可采用评估效果最优的分析模型对疑似异常的用户用电行为模式图进行检测,判断用户的用电行为是否异常。

4.如权利要求1所述的一种电力用户异常用电行为检测方法,其特征在于:所述步骤3)中,提取的用电行为特征包括有日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征、空值特征、随机性特征和正态性特征。

5.如权利要求1所述的一种电力用户异常用电行为检测方法,其特征在于:所述步骤4)中,多个分析模型包括有K‑Means聚类算法模型、Apriori算法模型和线性回归算法模型。

6.如权利要求1所述的一种电力用户异常用电行为检测方法,其特征在于:所述步骤5)中,对训练好的多个分析模型进行评估,选取评估效果最优的分析模型具体为:对分析模型进行测试,将得到的异常的用户用电清单和已知的用户清单进行比对,根据准确率对多个分析模型进行评估,选择准确率高的分析模型。

7.如权利要求1所述的一种电力用户异常用电行为检测方法,其特征在于:所述Q学习算法是智能体从环境状态到智能体动作行为的策略学习,从而获取最大的奖励值;其学习过程包括有反复试验探索和奖励延迟,根据奖励值的大小分析判定疑似异常用电行为的用户是否存在异常用电行为。

8.一种电力用户异常用电行为检测系统,其特征在于,包括如下:

非侵入式负荷监测模块,用于获取用户用电数据;

图谱分类模块,采用深度Q网络学习方法对用户用电数据进行处理得到用户用电行为模式图,其包括已查实的异常的用户用电行为模式图;

特征提取模块,对已查实的异常的用户用电行为模式图提取用电行为特征,将提取的用电行为特征均分为K+1个调度时段,其中调度时段k∈{0,1,…K};

用电分析模块,根据提取的用电行为特征建立多个分析模型,采用Q网络学习方法对多个分析模型分别进行训练和评估,选取评估效果最优的分析模型,具体包括如下:构造深度Q网络,包括当前值网络和目标值网络,初始化当前值网络权重参数θi、目标值‑网络权重参数θi=θi,输入序列宽度W、经验池容量D、批训练样本数B、学习因子a、贪心概率e和折扣因子Y,i为提取的用户行为特征数,定义任意一个样本轨道为m,样本轨道总数为M,且令m=0;

5.1)令k=0,随机初始化当前状态sk;

5.2)构造深度Q网络的输入序列 其包括当前状态sk和记录的前W个决策时刻的状态和动作,当k

0的学习因子,sk‑1为调度时段k‑1的初始状态,ak‑1为调度时段k‑1的学习因子,sk为调度时段k的当前状态;当k>W时, 将序列 输入到当前值网络,当前值greedy

网络的输出 用来评估当前状态行动对的值函数,选取最小Q值对应的行动a ,rand greedy同时,随机选取有效行动a ,采用ε‑贪心策略选取行动ak,若ε

5.3)区域用户用电执行决策时刻tk的行动ak,并观察决策周期内产生的运行代价ckCk,经过一个决策周期后,观察下一决策时刻的状态sk+1并构造输入序列 将一个学习样本存储到经验池,判断经验池内学习样本数是否大于经验池容量D,若是,则移除记忆最久远的一条样本;

5.4)判断经验池内学习样本数是否大于批训练样本数B,若是,则从经验池中随机抽取B条学习样本对当前值网络进行批训练,并判断k与K的大小,即若k

5.5)若m

9.如权利要求8所述的一种电力用户异常用电行为检测系统,其特征在于,所述非侵入式负荷监测模块是在电力入口处安装传感器仪表来收集和监测终端用户的数据,将用户总负荷信息分解为各用电设备的信息,进而获取用电设备能耗情况和用户用电规律。