利索能及
我要发布
收藏
专利号: 2024105290095
申请人: 杭州集华科技有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-02-20
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于人工智能的文本数据挖掘分析系统,其特征在于,包括:景区相关数据采集模块,用于采集景区相关介绍数据以及平台中的多条景区网评数据;

景区相关数据特征获取模块,用于分别对所述景区相关介绍数据以及所述平台中的多条景区网评数据进行特征提取和分析以得到景区综合介绍特征向量以及景区网评全局特征矩阵;

景区相关数据特征融合模块,用于将所述景区综合介绍特征向量以及所述景区网评全局特征矩阵进行相乘以得到景区评价特征向量;

景区相关数据特征分类结果生成模块,用于基于所述景区评价特征向量以得到分类结果,所述分类结果用于表示平台中是否存在恶意评论。

2.根据权利要求1所述的基于人工智能的文本数据挖掘分析系统,其特征在于,所述景区相关数据特征获取模块,包括:景区介绍特征提取单元,用于对所述景区相关介绍数据进行特征编码操作以得到所述景区综合介绍特征向量;

景区网评特征提取单元,用于对所述平台中的多条景区网评数据进行特征编码操作以得到所述景区网评全局特征矩阵。

3.根据权利要求2所述的基于人工智能的文本数据挖掘分析系统,其特征在于,所述景区介绍特征提取单元,包括:景区介绍文本嵌入编码子单元,用于将所述景区相关介绍数据按类型维度排列为多个景区相关介绍文本序列后分别进行嵌入编码以得到多个景区介绍嵌入向量;

景区介绍上下文特征获取子单元,用于将所述多个景区介绍嵌入向量通过基于上下文编码器的景区综合介绍特征提取模块以得到所述景区综合介绍特征向量。

4.根据权利要求3所述的基于人工智能的文本数据挖掘分析系统,其特征在于,所述景区介绍上下文特征获取子单元,用于:将所述多个景区介绍嵌入向量输入所述基于转化器的上下文编码器以得到多个上下文景区简介特征向量;以及将所述多个上下文景区简介特征向量进行级联以得到所述景区综合介绍特征向量。

5.根据权利要求4所述的基于人工智能的文本数据挖掘分析系统,其特征在于,所述景区网评特征提取单元,包括:景区网评编码子单元,用于将所述平台中的多条景区网评数据分别进行嵌入编码以得到多个景区网评嵌入向量;

景区网评特征提取子单元,用于将所述多个景区网评嵌入向量分别通过基于特征编码器的景区网评特征提取模块以得到多个景区网评特征向量;

景区网评全局特征提取子单元,用于将所述多个景区网评特征向量排列为景区网评综合输入矩阵后通过基于二维卷积神经网络模型的景区网评全局特征提取模块以得到所述景区网评全局特征矩阵。

6.根据权利要求5所述的基于人工智能的文本数据挖掘分析系统,其特征在于,所述景区相关数据特征分类结果生成模块,包括:景区评价特征提取单元,用于将所述景区评价特征向量通过基于卷积神经网络模型的景区评价特征提取模块以得到景区评价分类特征向量;

景区评价特征优化单元,用于对所述景区评价分类特征向量进行基于模型参数空间的稀疏性约束以得到稀疏优化景区评价分类特征向量;

景区评价特征分类单元,用于将所述稀疏优化景区评价分类特征向量通过分类器以得到所述分类结果。

7.根据权利要求6所述的基于人工智能的文本数据挖掘分析系统,其特征在于,所述景区评价特征优化单元,包括:提取模型参数空间,其中,所述模型参数空间包括模型权重矩阵和模型偏置向量;

对所述模型权重矩阵和所述模型偏置向量进行基于正则化项的稀疏性约束以得到稀疏模型权重矩阵和稀疏模型偏置向量;

基于所述稀疏模型权重矩阵和所述稀疏模型偏置向量,以如下公式对所述景区评价分类特征向量进行处理以得到所述稀疏优化景区评价分类特征向量,其中,所述公式为:T

Vsparse=WVc+B

其中,Vc表示景区评价分类特征向量、W表示稀疏模型权重矩阵,B表示稀疏模型偏置向量,T表示矩阵的转置,Vsparse表示稀疏优化景区评价分类特征向量。

8.根据权利要求7所述的基于人工智能的文本数据挖掘分析系统,其特征在于,基于所述稀疏模型权重矩阵和所述稀疏模型偏置向量,对所述景区评价分类特征向量进行处理以得到所述稀疏优化景区评价分类特征向量,包括:创建控制器类,所述控制器类用于处理稀疏性约束请求;

响应于接收到所述稀疏性约束请求,从所述稀疏性约束请求提取所述稀疏模型权重矩阵、所述稀疏模型偏置向量和所述景区评价分类特征向量;

使用所述控制器类,并使用所述稀疏模型权重矩阵和所述稀疏模型偏置向量,对所述景区评价分类特征向量进行稀疏约束以得到所述稀疏优化景区评价分类特征向量;

返回所述稀疏优化景区评价分类特征向量。

9.一种基于人工智能的文本数据挖掘分析方法,其特征在于,包括:采集景区相关介绍数据以及平台中的多条景区网评数据;

分别对所述景区相关介绍数据以及所述平台中的多条景区网评数据进行特征提取和分析以得到景区综合介绍特征向量以及景区网评全局特征矩阵;

将所述景区综合介绍特征向量以及所述景区网评全局特征矩阵进行相乘以得到景区评价特征向量;

基于所述景区评价特征向量以得到分类结果,所述分类结果用于表示平台中是否存在恶意评论。

10.根据权利要求9所述的基于人工智能的文本数据挖掘分析方法,其特征在于,分别对所述景区相关介绍数据以及所述平台中的多条景区网评数据进行特征提取和分析以得到景区综合介绍特征向量以及景区网评全局特征矩阵,包括:景区介绍特征提取单元,用于对所述景区相关介绍数据进行特征编码操作以得到所述景区综合介绍特征向量;

景区网评特征提取单元,用于对所述平台中的多条景区网评数据进行特征编码操作以得到所述景区网评全局特征矩阵。