1.一种基于偏好树和知识图谱的智能网络检测方法,其特征在于,包括如下步骤:步骤1:对用户数据、网络检测技术数据以及历史交互数据进行清洗和预处理,定义数据知识图谱框架,构建所需的知识图谱G;
步骤1.1:定义用户集合U={u1,u2,...,un},网络检测技术集合T={t1,t2,...,tn},历史交互数据集合D={d1,d2,...,dn},n表示个数,集合D中包含着用户与网络之间的交互关系;
步骤1.2:对用户集合U、网络检测技术集合T、历史交互数据集合D进行清洗以及预处理得到数据源U1,T1,D1,确保数据的准确性和一致性;
步骤1.3:根据用户与网络检测技术之间的交互关系通过图数据库Neo4j构建知识图谱G,知识图谱G由三元组(h,r,t)构成,其中h为头实体,r为实体之间的关系、t为尾实体,h∈E,t∈E,r∈R,集合E由实体组成,R表示实体之间的关系集合;
步骤2:根据知识图谱G中的每个关系类型构建关系子图Gp;
步骤2.1:对于网络检测技术知识图谱G=(E,R),提取知识图谱G中所有关系p,构成关系p集合P={p1,p2,…,pb,…,plen(P)},其中P∈R;
步骤2.2:定义循环变量i,且i赋初值为1;
步骤2.3:对于关系p∈P,提取p关系类型的所有三元组,构成关系p的结点集合Vp、对于关系集合Vp中每个节点v,在知识图谱G中找到所有包含v的三元组(v,r,e)和(e,r,v),其中e属于实体集E,r属于关系集R;
步骤2.4:将步骤2.3中三元组中的另一个实体e添加到v的直接邻居节点集合N(v);
步骤2.5:对于每个邻居节点u∈N(v),在Ep中添加一条无向边(v,u),其中Ep为关系节点的直接邻居节点构成边集合;
步骤2.6:使用Vp和Ep作为节点集合和边集合,构建关系p的子图Gp=(Vp,Ep);
步骤2.7:跳转到步骤2.3;
步骤2.8:结束循环,输出全部关系子图G_P={Gp1,Gp2,…,Gpc,…,Gplen(G_P);
步骤3:利用node2vec算法对每个关系类型的子图进行嵌入,得到基于关系类型的实体d d向量表示,即v∈Gp→R,其中v为节点,R为实体向量空间;
步骤3.1:对于每个关系子图Gp=(Vp,Ep),每个节点v∈Vp,从节点v开始,随机选择一条边(v,u),将邻居节点u添加到集合N(v),然后使v=u,重复上述步骤n次,得到节点v的邻居节点集合N(v);
步骤3.2:对关系子图Gp所有节点v,随机初始化其特征向量表示xp(v);
步骤3.3:对集合N(v),计算xp(v)与xp(u)的点积,对点积结果进行指数运算,即exp(xp(v)·xp(u)),exp(xp(v)·xp(u))为v与u的点积在指数空间的值;
步骤3.4:定义节点v分区函数 对步骤3.3中计算的v和u点积在指数空间的值求和,衡量v与所有节点的相关度;
步骤3.5:定义Node2vec目标函数 ‑logZv表示让分区函数值趋近0, 表示让邻居节点的向量点积趋近于1,将上两项组合作为目标函数,平衡这两个目标;
步骤3.6:定义循环变量j,且j赋初值为1;
步骤3.7:对分区函数采样估计,使用随机梯度下降优化更新每个节点的向量表示xp(v),计算目标函数的值;
步骤3.8:当目标函数不是最大化时,跳转到步骤3.7;
步骤3.9:当目标函数最大化时,结束循环,输出优化过程中学到的节点向量表示xp(v);
步骤4:根据用户的历史数据,构建反映用户对网络检测技术偏好的树结构;
步骤4.1:对用户的历史交互数据进行分析,提取内容的类别属性作为特征,对类别属性进行编码,得到类别编码c;
步骤4.2:通过余弦相似度计算内容之间的相似度,确定树的父子节点之间的从属关系,使用类别编码c作为节点,构建树的层次结构,并且统计每个类别的出现次数nc,计算每个类别的深度dc;
步骤4.3:定义公式 对每一个类别节点c计算该节点
的偏好度,使用 和 对深度和广度进行归一化,提高推荐的准确性,其中N为节点c的子节点,dc为c节点的深度,nd为深度d处的类别总数,dmax为后代节点的最大深度,α为权重系数,控制个性化推荐和新颖性推荐的程度,ωi为时间段i的权重,给不同时间段的历史交互设置权重;
步骤4.4:对用户的历史交互数据按概率ρ进行随机采样,对采样数据根据步骤4.1,步骤4.2,步骤4.3构建联合偏好树;
步骤4.5:针对每个用户的个性化偏好树T,遍历任意两棵个性化树Tree‑A和Tree‑B,找到共同的节点n;
步骤4.6:对于每个共同节点n,分别获取Tree‑A中该节点的偏好度为P(A)以及Tree‑B中该节点的偏好度为P(B);
步骤4.7:对所有的共同节点,计算偏好度乘积之和S=∑P(A)*P(B),对S做归一化处理,得到两棵树之间的相似程度;
步骤4.8:任意两棵个性化树Tree‑A和Tree‑B作为节点构建相似树,它们之间的边为两棵树之间的相似程度;
步骤5:通过学习排序算法学习对用户与网络检测技术之间的关系并赋予相应的权重,进行加权组合获得用户与网络检测技术之间的相关性;通过构建的偏好树,联合多个树预测偏好,通过权重系数β基于用户个性化偏好树、联合树和相似树预测综合偏好分数;
步骤5.1:对知识图谱G,利用余弦相似度
计算用户与检测技术之间基于关系p的
相似度,xp(u)为用户u在关系p上的向量表达,xp(t)为检测技术t在关系p上的向量表达;
步骤5.2:定义加权相似度 wp为关系p的权重参数,其中对用户与检测技术之间进行相似度计算并且排序,得到rank(r(u,t))排序结果;
步骤5.3:根据用户u与检测技术t真实标记结果进行排序得到rank(y(u,t)),通过损失函数 衡量两个排序结果之间的差异;
步骤5.4:通过随机梯度下降迭代优化更新wp以最小化损失L;
步骤5.5:当损失值为最小时,使用加权相似度r(u,t)重新计算相似度,得到用户与检测技术之间的最终的相关度;否则继续迭代直至损失值最小;
步骤5.6:对于用户的偏好树,利用用户的个性化树、联合树分别得到检测技术在偏好树中最长共同类别节点的偏好分数Pl、Fl;
步骤5.7:相似树体现用户之间的相似关系,通过 得到检测技术在相似用i
户偏好树中的最长共同类别节点的平均偏好分数,其中N为相似用户数,Pl 为第i个相似用户树中的最长共同类别节点偏好分数;
步骤5.8:结合用户的个性化树、联合树、相似树之间的关系,定义P=β*(Fl+CSl)+(1‑β)*Pl计算综合偏好树分数,β为权重系数;
步骤6:依据用户对网络检测技术基于关系的加权相似度得到加权语义关系推荐列表,通过用户偏好树评估网络检测技术对用户的偏好分数,生成个性化偏好推荐列表,取两者的交集作为最终推荐列表;
步骤6.1:将偏好评分按照分数降序排序,选取分值最高的Top‑N作为偏好评分推荐列表Tg,同样将基于关系的加权相似度按照降序排序,选取相似度最高的Top‑N作为加权语义推荐列表Ts;
步骤6.2:取评分推荐列表和加权语义推荐列表的交集Tz=Tg∩Ts最终的推荐列表。
2.一种基于偏好树和知识图谱的智能网络检测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现根据权利要求1所述的基于偏好树和知识图谱的智能网络检测方法。