买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种双注意力训练序列生成方法、装置及可读存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种双注意力训练序列生成方法、装置及可读存储介质

￥21000

专利号： 2021106466058

申请人：杭州芯声智能科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-07-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种双注意力训练序列生成方法，其特征在于，通过构建面向输入文本中字符的重要度和输入文本中字符对应槽值关联度的双注意力机制模型来生成对应输入文本的双注意力训练序列，所述双注意力训练序列用于供面向语言理解的深度学习模型进行训练学习；

所述双注意力机制模型用于包括对输入文本的向量转换，对输入文本本向量的维度转换，对输入文本矩阵的关联转换和对输入文本中字符的重要度、输入文本中字符对应槽值关联度进行状态关联；

所述双注意力机制模型包括字符‑隐状态路径、槽值‑query值路径和状态关联路径；

通过字符‑隐状态路径得到输入文本的关联隐状态矩阵，所述关联隐状态矩阵用于衡量输入文本中各字符的重要度；

通过槽值‑query值路径得到槽值序列的释义矩阵，释义矩阵用于衡量输入文本中字符对应槽值关联度；

状态关联路径用于将释义矩阵和关联隐状态矩阵进行状态关联，并得到关联状态矩阵，所述关联状态矩阵用于生成双注意力训练序列。

2.根据权利要求1所述的一种双注意力训练序列生成方法，其特征在于，所述双注意力机制模型包括输入文本层、Embedding层、Bi‑lstm层、query值释义层、Bi‑attention层、Dense层和Softmax函数层；

所述输入文本层包括文本‑向量转化层和文本‑槽值标注层；所述文本‑向量转化层通过字符‑索引字典将输入文本转化成以索引为元素的输入文本向量；所述文本‑槽值标注层用于对输入文本中各字符的槽值进行标注，并得到与输入文本所对应的槽值序列；

所述Embedding层用于对输入文本中的每个字符进行预处理，得到所述输入文本中的每个字符的字向量并组成向量矩阵，按维度需求将低纬度向量映射到高纬度向量并组成高纬度向量的映射矩阵；

所述Bi‑lstm层包括前向LSTM和后向LSTM；所述Bilstm层将经Embedding层转换的高纬向量矩阵输入到Bilstm层中，将前向LSTM输出的隐向量与后向LSTM在各个位置的隐状态向量按位进行拼接，得到前后关联的隐状态向量；

所述query值释义层用于对输入文本所对应的槽值序列进行槽值释义，释义内容保存至各槽值元素释义向量中；

所述Bi‑attention层用于分析输入文本中字符的重要度和输入文本中字符对应槽值关联度，并得到包含字符的重要度和槽值关联度双注意力的双注意力训练序列；

所述Dense层用于通过线性变换对输入向量进行维度变换，并将设定维度向量进行输出；

所述Softmax函数层通过归一化指数函数分别对输入向量中各元素的权值占比进行计算，并根据权值占比进行分类输出。

3.根据权利要求2所述的一种双注意力训练序列生成方法，其特征在于，所述双注意力机制模型通过字符‑隐状态路径得到关联隐状态矩阵，所述字符‑隐状态路径步骤如下：通过所述输入文本层将输入文本转化为输入文本向量将输入文本向量输入到Embedding层，并通过Embedding层将输入文本向量转化成与槽值序列维度相同的输入文本矩阵；

将输入文本矩阵输入给Bi‑lstm层；Bi‑lstm层通过前向LSTM和后向LSTM得到输入文本矩阵的前向隐状态向量和后向隐状态向量；

Bi‑lstm层将前向隐状态向量和后向隐状态向量按照在元素对应位置进行拼接，得到前后关联的关联隐状态向量；

通过Bi‑lstm层得到输入文本矩阵中各输入文本向量的关联隐状态向量，并组成关联隐状态矩阵。

4.根据权利要求1与权利要求2所述的一种双注意力训练序列生成方法，其特征在于，所述双注意力机制模型通过槽值‑query值路径得到释义矩阵，所述槽值‑query值路径步骤如下：

通过对输入文本中各字符进行槽值标注，得到对应的槽值序列；

通过query值释义层对槽值序列中各槽值元素进行释义，释义内容保存至各槽值元素释义向量中；

通过槽值元素和对应的释义向量得到释义矩阵。

5.根据权利要求4所述的一种双注意力训练序列生成方法，其特征在于，所述槽值标注通过人工和/或机器进行标注；所述释义向量中的释义内容包括槽值的同义替换词、槽值的文意释义、槽值的替换词关联度信息和与槽值对应的释义信息，所述释义向量的维度与释义内容量成正比。

6.根据权利要求1与权利要求2所述的一种双注意力训练序列生成方法，其特征在于，所述双注意力机制模型通过状态关联路径得到关联状态矩阵，所述状态关联路径步骤如下：

将关联隐状态矩阵与释义矩阵做矩阵乘法得到关联状态矩阵；

对关联状态矩阵做重要状态向求和，得到字符重要状态向量；

通过Softmax函数层求出字符重要状态向量中各字符在输入文本中的重要度权重值；