利索能及
我要发布
收藏
专利号: 2023103716224
申请人: 沈鹏
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于在线业务会话交互的大数据安全分析方法,其特征在于,应用于人工智能服务系统,所述方法包括:对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组;

对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,所述第一文本检测变量用于表征所述第一异常文本描述集反映所述目标会话安全检测文本中风险主题词向量的检测偏移指数;

依据所述第一异常文本描述数组、所述第一文本检测变量以及参考会话安全检测文本的第二异常文本描述集对应的第二异常文本描述数组、所述第二异常文本描述集对应的第二文本检测变量,获取所述目标会话安全检测文本和所述参考会话安全检测文本之间的共性度量值,所述第二文本检测变量用于表征所述第二异常文本描述集反映所述参考会话安全检测文本中风险主题词向量的检测偏移指数;

在所述共性度量值大于设定度量值的基础上,确定所述目标会话安全检测文本与所述参考会话安全检测文本为相似文本,并基于所述参考会话安全检测文本对所述目标会话安全检测文本进行安全分析;

所述基于所述参考会话安全检测文本对所述目标会话安全检测文本进行安全分析的步骤,包括:

将所述目标会话安全检测文本传入至所述参考会话安全检测文本对应的决策树模型中,得到所述决策树模型生成的针对所述目标会话安全检测文本的会话文本分块池,所述会话文本分块池包括不少于两个会话文本分块;

获得所述会话文本分块池中的各个会话文本分块相对于所述目标会话安全检测文本的贡献权重;

根据所述各个会话文本分块对应的贡献权重,以及所述各个会话文本分块的异常决策向量,对所述各个会话文本分块进行文本分块整理,得到相应的会话文本分块队列;

基于所述会话文本分块队列确定关于所述目标会话安全检测文本的安全分析决策结果集,所述安全分析决策结果集包括至少两个异常事件概率;

利用所述异常事件概率,从所述目标会话安全检测文本中确定出异常事件文本块。

2.根据权利要求1所述的方法,其特征在于,所述对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组。

3.根据权利要求2所述的方法,其特征在于,所述对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量,包括:通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量。

4.根据权利要求2所述的方法,其特征在于,所述文本描述挖掘子网包括文本描述挖掘单元和文本描述投影单元,所述通过Transformer网络中的文本描述挖掘子网,对目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集及所述第一异常文本描述集对应的第一异常文本描述数组,包括:通过所述文本描述挖掘单元,对所述目标会话安全检测文本进行文本描述挖掘,得到所述目标会话安全检测文本对应的第一异常文本描述集;

通过所述文本描述投影单元,对所述第一异常文本描述集进行文本描述投影,得到所述第一异常文本描述集对应的第一异常文本描述数组。

5.根据权利要求3所述的方法,其特征在于,所述通过所述Transformer网络中的描述特征解析子网,对所述第一异常文本描述集进行处理,得到所述第一异常文本描述集对应的第一文本检测变量之前,所述方法还包括:根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网;

在维持调校后的文本描述挖掘子网不变的基础上,依据所述异常文本描述数组样例和所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,调校所述描述特征解析子网;

其中,所述根据会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例,调校所述文本描述挖掘子网,包括:获取所述会话安全检测文本样例和所述会话安全检测文本样例对应的异常文本描述数组样例;

通过所述文本描述挖掘子网,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集及所述异常文本解析描述集对应的异常文本解析数组;

依据所述异常文本解析数组和所述异常文本描述数组样例之间的比较结果,调校所述文本描述挖掘子网;

其中,所述文本描述挖掘子网包括文本描述挖掘单元和文本描述投影单元,所述通过所述文本描述挖掘子网,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集及所述异常文本解析描述集对应的异常文本解析数组,包括:通过所述文本描述挖掘单元,对所述会话安全检测文本样例进行文本描述挖掘,得到所述会话安全检测文本样例对应的异常文本解析描述集;通过所述文本描述投影单元,对所述异常文本解析描述集进行文本描述投影,得到所述异常文本解析描述集对应的异常文本解析数组;

其中,所述Transformer网络还包括网络代价生成子网,所述网络代价生成子网包括每个风险主题标签对应的置信度描述数组,所述依据所述异常文本解析数组和所述异常文本描述数组样例之间的比较结果,调校所述文本描述挖掘子网,包括:通过所述网络代价生成子网,按照所述会话安全检测文本样例所对应风险主题标签对应的置信度描述数组对所述异常文本解析数组进行强化操作,得到所述异常文本解析数组对应的异常文本描述强化数组;获取所述异常文本描述强化数组和所述异常文本描述数组样例之间的第二调校代价指标,所述第二调校代价指标表示所述异常文本描述强化数组和所述异常文本描述数组样例之间的比较结果;依据所述第二调校代价指标,调校所述文本描述挖掘子网和所述网络代价生成子网;

其中,所述在维持调校后的文本描述挖掘子网不变的基础上,依据所述异常文本描述数组样例和所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,调校所述描述特征解析子网,包括:获取所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,所述关键文本描述数组表示所述风险主题标签对应的风险主题词向量;通过所述描述特征解析子网,对所述异常文本解析描述集进行处理,得到所述异常文本解析描述集对应的文本检测变量解析结果,所述文本检测变量解析结果用于表征所述异常文本解析描述集反映所述会话安全检测文本样例中风险主题词向量的检测偏移指数;依据所述异常文本解析数组、所述关键文本描述数组和所述文本检测变量解析结果,获取第三调校代价指标,所述第三调校代价指标表示所述异常文本解析描述集对应的文本检测变量解析结果的训练代价;依据所述第三调校代价指标,调校所述描述特征解析子网。

6.根据权利要求5所述的方法,其特征在于,所述依据所述异常文本解析数组、所述关键文本描述数组和所述文本检测变量解析结果,获取第三调校代价指标,包括:依据所述异常文本解析数组和所述关键文本描述数组之间的差异特征,获取目标文本检测变量;

依据所述目标文本检测变量和所述文本检测变量解析结果之间的比较结果,获取所述第三调校代价指标。

7.根据权利要求5所述的方法,其特征在于,所述获取所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,包括:获取所述会话安全检测文本样例所对应风险主题标签的多个会话安全检测文本对应的异常文本描述数组;

根据获取到的多个异常文本描述数组,确定所述关键文本描述数组。

8.根据权利要求5所述的方法,其特征在于,所述获取所述会话安全检测文本样例所对应风险主题标签的关键文本描述数组,包括:获取所述会话安全检测文本样例所对应风险主题标签对应的置信度描述数组;

将所述会话安全检测文本样例对应的置信度描述数组确定为所述关键文本描述数组。

9.一种人工智能服务系统,其特征在于,包括:存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述人工智能服务系统执行如权利要求1‑8中任意一项所述的方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行时如权利要求1‑8中任意一项所述的方法。