利索能及
我要发布
收藏
专利号: 2024111166095
申请人: 山东建筑大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种双重半监督集成式的异常心理沙盘检测方法,其特征在于,包括:步骤S1:获取待检测的心理沙盘样本;

所述心理沙盘样本由时间维、操作类型维、操作对象维组成;其中将沙盘总用时进行等分得到时间维;

步骤S2:利用半监督特征提取方法,从预处理后的心理沙盘样本中提取特征;

所述半监督特征提取方法,通过半监督训练后的特征提取模型,进行特征提取;

所述特征提取模型,包括用于特征提取的卷积神经网络和用于分类预测的多层感知机组成,所述多层感知机用于辅助训练卷积神经网络;

所述卷积神经网络由卷积层、池化层和全连接层组成,经过多层卷积和池化后,将最后一层的特征展平成一维向量,作为全连接层的输入,全连接层通过线性和非线性变换组合不同特征,生成高维特征表示,得到提取的特征;

特征提取模型的半监督训练过程为:将少量有标记的样本数据U1={X1, …,Xi,…,Xn}输入到卷积神经网络中进行特征提取,Xi表示第i个心理沙盘样本,n为标记样本的数量;

使用标记样本对初始的特征提取模型进行训练,优化模型参数,获得初步的特征提取模型;初步训练完成后,将未标记的样本数据 输入到训练好的特征提取模型中进行特征提取和分类预测, 表示第j个心理沙盘样本,m为未标记样本的数量,通过特征提取模型对未标记样本进行预测,得到伪标记样本;将这些伪标记样本与标记样本合并,形成新的训练集;

使用新的训练集重新训练特征提取模型,不断迭代优化;每次迭代中,使用标记样本和伪标记样本进行卷积和池化,提取特征并优化模型参数;

步骤S3:基于提取的特征,通过半监督集成式检测算法,判断所述心理沙盘样本是否异常;

其中,所述半监督集成式检测算法是集成多个半监督异常分类器,分别对特征进行异常检测,对得到的各个异常检测结果进行综合判断,满足预设条件时,最终判定为异常样本;

集成的多个半监督异常分类器,包括分别基于改进后的聚类k‑Means算法、改进后的局部异常因子LOF算法、改进后的k近邻kNN算法和改进后的孤立森林iForest算法构建的四个分类器;

其中,这四个分类器都是利用少量的标记样本并结合海量的无标记样本进行异常样本的建模预测;

改进后的聚类k‑Means算法,是根据标记样本的标签,初始化两个聚类中心,一个中心初始化为所有正常样本的平均值,另一个中心初始化为所有异常样本的平均值,依据未标记样本到两个聚类中心的距离,判断未标记样本的异常分类;

改进后的局部异常因子LOF算法,是利用标记样本训练初始的LOF模型,确定最优的邻居数k值,使用训练好的LOF模型计算无标记样本的LOF值,并根据LOF值进行异常分类;

改进后的k近邻kNN算法,是使用标记样本训练初始的kNN模型,得到最优的邻居数k,对于每个无标记样本,找到其k个最近的邻居,根据这些邻居的标签进行投票,确定该样本的异常分类;

改进后的孤立森林iForest算法,是利用未标记样本初始化一个孤立森林模型,孤立森林模型中所有决策树路径的权重为1,利用标记样本集中的标记样本对孤立森林模型进行迭代更新,根据标记样本的标签调整对应路径上的权重,直到标记样本集为空,得到最终构建的孤立森林模型。

2.如权利要求1所述的一种双重半监督集成式的异常心理沙盘检测方法,其特征在于,所述心理沙盘样本,是用户使用虚拟心理沙盘软件创建虚拟沙盘的过程中生成的用户操作日志,记录着用户操作步骤和流程。

3.如权利要求1所述的一种双重半监督集成式的异常心理沙盘检测方法,其特征在于,所述对得到的各个异常检测结果进行综合判断,具体为:对各个异常检测结果中认定异常的结果数进行统计,当结果数不小于预先设定的阈值,则最终判定为异常样本。

4.一种双重半监督集成式的异常心理沙盘检测系统,其特征在于,包括样本获取模块、特征提取模块和异常判断模块:样本获取模块,被配置为:获取待检测的心理沙盘样本;

所述心理沙盘样本由时间维、操作类型维、操作对象维组成;其中将沙盘总用时进行等分得到时间维;

特征提取模块,被配置为:利用半监督特征提取方法,从预处理后的心理沙盘样本中提取特征;

所述半监督特征提取方法,通过半监督训练后的特征提取模型,进行特征提取;

所述特征提取模型,包括用于特征提取的卷积神经网络和用于分类预测的多层感知机组成,所述多层感知机用于辅助训练卷积神经网络;

所述卷积神经网络由卷积层、池化层和全连接层组成,经过多层卷积和池化后,将最后一层的特征展平成一维向量,作为全连接层的输入,全连接层通过线性和非线性变换组合不同特征,生成高维特征表示,得到提取的特征;

特征提取模型的半监督训练过程为:将少量有标记的样本数据U1={X1, …,Xi,…,Xn}输入到卷积神经网络中进行特征提取,Xi表示第i个心理沙盘样本,n为标记样本的数量;

使用标记样本对初始的特征提取模型进行训练,优化模型参数,获得初步的特征提取模型;初步训练完成后,将未标记的样本数据 输入到训练好的特征提取模型中进行特征提取和分类预测, 表示第j个心理沙盘样本,m为未标记样本的数量,通过特征提取模型对未标记样本进行预测,得到伪标记样本;将这些伪标记样本与标记样本合并,形成新的训练集;

使用新的训练集重新训练特征提取模型,不断迭代优化;每次迭代中,使用标记样本和伪标记样本进行卷积和池化,提取特征并优化模型参数;

异常判断模块,被配置为:基于提取的特征,通过半监督集成式检测算法,判断所述心理沙盘样本是否异常;

其中,所述半监督集成式检测算法是集成多个半监督异常分类器,分别对特征进行异常检测,对得到的各个异常检测结果进行综合判断,满足预设条件时,最终判定为异常样本;

半监督特征提取方法,通过半监督训练后的特征提取模型,进行特征提取;

其中,所述半监督集成式检测算法是集成多个半监督异常分类器,分别对特征进行异常检测,对得到的各个异常检测结果进行综合判断,满足预设条件时,最终判定为异常样本;

集成的多个半监督异常分类器,包括分别基于改进后的聚类k‑Means算法、改进后的局部异常因子LOF算法、改进后的k近邻kNN算法和改进后的孤立森林iForest算法构建的四个分类器;

其中,这四个分类器都是利用少量的标记样本并结合海量的无标记样本进行异常样本的建模预测;

改进后的聚类k‑Means算法,是根据标记样本的标签,初始化两个聚类中心,一个中心初始化为所有正常样本的平均值,另一个中心初始化为所有异常样本的平均值,依据未标记样本到两个聚类中心的距离,判断未标记样本的异常分类;

改进后的局部异常因子LOF算法,是利用标记样本训练初始的LOF模型,确定最优的邻居数k值,使用训练好的LOF模型计算无标记样本的LOF值,并根据LOF值进行异常分类;

改进后的k近邻kNN算法,是使用标记样本训练初始的kNN模型,得到最优的邻居数k,对于每个无标记样本,找到其k个最近的邻居,根据这些邻居的标签进行投票,确定该样本的异常分类;

改进后的孤立森林iForest算法,是利用未标记样本初始化一个孤立森林模型,孤立森林模型中所有决策树路径的权重为1,利用标记样本集中的标记样本对孤立森林模型进行迭代更新,根据标记样本的标签调整对应路径上的权重,直到标记样本集为空,得到最终构建的孤立森林模型。

5.一种电子设备,其特征是,包括:

存储器,用于非暂时性存储计算机可读指令;

处理器,用于运行所述计算机可读指令;

其中,所述计算机可读指令被所述处理器运行时,执行权利要求1‑3任一项所述的方法。

6.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述计算机可读指令由计算机执行时,执行权利要求1‑3任一项所述的方法。