利索能及
我要发布
收藏
专利号: 2021109721509
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种摘要生成方法,其特征在于,所述摘要生成方法包括:当接收到摘要生成请求时,根据所述摘要生成请求获取待处理文本;

对所述待处理文本中每个文本语句进行分词处理,得到每个文本语句的语句分词;

根据所述语句分词的分词向量生成所述文本语句的初始语句向量,并根据所述初始语句向量生成所述待处理文本的初始摘要;

根据所述分词向量及所述初始摘要生成所述语句分词的分词权值;

根据所述分词权值对所述分词向量进行加权和运算处理,得到所述文本语句的目标语句向量;

根据所述目标语句向量生成所述待处理文本的中间摘要;

计算所述初始摘要与所述中间摘要的摘要相似度;

若所述摘要相似度大于或者等于预设相似度阈值,将所述中间摘要确定为所述待处理文本的目标摘要。

2.如权利要求1所述的摘要生成方法,其特征在于,所述根据所述摘要生成请求获取待处理文本包括:

解析所述摘要生成请求的报文,得到所述报文携带的数据信息;

从所述数据信息中获取文本路径及文本标识;

根据所述文本路径及所述文本标识生成查询语句;

执行所述查询语句,得到所述待处理文本。

3.如权利要求1所述的摘要生成方法,其特征在于,所述对所述待处理文本中每个文本语句进行分词处理,得到每个文本语句的语句分词包括:对于每个文本语句,基于预设词典对所述文本语句进行切分处理,得到多个切分路径及每个切分路径所对应的路径分词;

获取所述路径分词在所述预设词典的词汇权值;

计算所述词汇权值的总和,得到所述切分路径的切分概率;

将所述切分概率最大的切分路径所对应的路径分词确定为所述语句分词。

4.如权利要求3所述的摘要生成方法,其特征在于,在获取所述路径分词在所述预设词典的词汇权值之前,所述方法还包括:获取训练样本,所述训练样本包括训练文本及训练词汇;

统计所述训练词汇在所述训练文本中的词汇数量;

统计所述训练文本的训练总量,并统计包含有所述训练词汇的训练文本的文本数量;

计算所述训练总量在所述文本数量中的比值的对数值,得到所述训练词汇的重要度;

计算所述词汇数量与所述重要度的乘积,得到所述训练词汇的训练权值;

将所述训练词汇与所述训练权值的映射关系存储至所述预设词典中。

5.如权利要求1所述的摘要生成方法,其特征在于,所述根据所述语句分词的分词向量生成所述文本语句的初始语句向量,并根据所述初始语句向量生成所述待处理文本的初始摘要包括:

从预设向量表中获取与所述语句分词对应的向量作为所述分词向量;

对于每个文本语句,计算所述分词向量在同一向量维度上的平均值,得到所述初始语句向量;

根据所述初始语句向量计算每个语句对的语句相似度,所述语句对是指任意两个所述文本语句;

根据所述语句相似度确定所述文本语句的语句重要度;

根据所述语句重要度从所述文本语句中筛选初始语句;

根据所述初始语句在所述待处理文本中的语句顺序拼接所述初始语句,得到所述初始摘要。

6.如权利要求1所述的摘要生成方法,其特征在于,所述根据所述分词向量及所述初始摘要生成所述语句分词的分词权值包括:基于所述分词向量及所述初始语句向量计算所述语句分词与所述初始摘要的词汇相似度;

对所述词汇相似度进行归一化处理,得到所述分词权值。

7.如权利要求1所述的摘要生成方法,其特征在于,所述方法还包括:若所述摘要相似度小于所述预设相似度阈值,将所述中间摘要确定为下一次迭代处理的初始摘要;

基于所述语句分词对所述初始摘要进行迭代处理,并计算所述初始摘要的迭代次数,直至所述摘要相似度大于或者等于所述预设相似度阈值,或者所述迭代次数大于或者等于预设次数,将所述中间摘要确定为所述目标摘要。

8.一种摘要生成装置,其特征在于,所述摘要生成装置包括:获取单元,用于当接收到摘要生成请求时,根据所述摘要生成请求获取待处理文本;

处理单元,用于对所述待处理文本中每个文本语句进行分词处理,得到每个文本语句的语句分词;

生成单元,用于根据所述语句分词的分词向量生成所述文本语句的初始语句向量,并根据所述初始语句向量生成所述待处理文本的初始摘要;

所述生成单元,还用于根据所述分词向量及所述初始摘要生成所述语句分词的分词权值;

所述处理单元,还用于根据所述分词权值对所述分词向量进行加权和运算处理,得到所述文本语句的目标语句向量;

所述生成单元,还用于根据所述目标语句向量生成所述待处理文本的中间摘要;

计算单元,用于计算所述初始摘要与所述中间摘要的摘要相似度;

确定单元,用于若所述摘要相似度大于或者等于预设相似度阈值,将所述中间摘要确定为所述待处理文本的目标摘要。

9.一种电子设备,其特征在于,所述电子设备包括:存储器,存储有计算机可读指令;及处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的摘要生成方法。

10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的摘要生成方法。