利索能及
我要发布
收藏
专利号: 2023104462899
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于注意力的多项选择机器阅读理解方法,其特征在于,包括:

S1:获取阅读理解数据,将阅读理解数据划分为多项选择数据集和句子选择数据集;

S2:将句子选择数据集中的文章问题和选项进行二次掩码操作,将掩码后的数据输入到BERT‑wwm‑ext预训练模型中进行增量训练,得到预训练模型D;

对BERT‑wwm‑ext预训练模型中进行增量训练的过程包括:句子选择数据输入BERT‑wwm‑ext模型进行一轮迭代预训练,得到预训练模型M;随机选取选项中的词语,使用[MASK]掩码遮盖,并将正确答案句子填入文章,将mask的词语作为选项,得到新的文本数据;重复上述过程,将所有的新数据文本输入到模型M得到当前预训练模型D;

对BERT‑wwm‑ext模型进行迭代训练的过程包括:给定一个段落P和n个选项a1,a2...an,用词汇表[unusedNum]中的特殊标签替换P中的空格,其中Num范围从0到空格数减去1;对于答案选项中的每个ai,将ai和带有标签[SEP]的P连接起来作为输入序列;将长度为l的输入序列输入到BERT中,并通过权重移动平均优化方法对模型的学习率进行衰减,得到一个隐藏的表示 将H和可训练参数 进行点积得到 当前选项出现空白的概率t通过softmax进行对数计算,并选择概率最大的选项作为空白的预测;

S3:在预训练模型D中加入多头注意力机制,计算多项选择数据集中每个选项之间相互ij ij注意力权重a ,得到选项的注意力输出向量Attention(a );

S4:通过门控通道注意力机制将注意力输出向量融入原始的选项表示中,得到候选选项集合options;

S5:对选项与文章中的每个句子进行相似度匹配检测,对问题与文章中的每个句子进行相似度匹配检测,保留文章与选项以及问题相关性最高的k个句子,将k个句子组合成文章P’;

S6:根据候选选项集合options、文章P’以及问题构建全连接信息,通过构建的全连接线性层去预测问题最后的答案。

2.根据权利要求1所述的一种基于注意力的多项选择机器阅读理解方法,其特征在于,采用权重移动平均优化方法对模型的学习率进行衰减包括:对于n个权重数据[θ1,θ2,...θn],权重平均值公式为:vt=β·vt‑1+(1‑β)·θt

其中,vt表示第t个影子权重,β为超参数,vt‑1表示第t‑1个影子权重,θt表示第t个权重数据。

3.根据权利要求1所述的一种基于注意力的多项选择机器阅读理解方法,其特征在于,ij计算每个选项之间相互注意力权重a 的公式为:

m=1,2,3...head

ij i j ij m

其中,a 代表第i个选项向量o与第j个对比选项向量p的注意力权重,Attention(a )表示由选项向量和对比选项向量计算得出的注意力输出向量,softmax()表示softmax函数,W1、W2、W3都是可训练权重矩阵。

4.根据权利要求1所述的一种基于注意力的多项选择机器阅读理解方法,其特征在于,通过门控通道注意力机制将注意力输出向量融入原始的选项表示包括:i

其中, 表示第i个选项的注意力输出向量的集合,a 表示,第i个选项,i表示选项a 的注意力输出向量拼接得到的矩阵,c表示门控单元, 表

i

示选项a与其他选项的对比结果输出,tanh表示双曲正切函数,W4、W5、W6表示可训练权重矩阵,sigm代表sigmoid函数。

5.根据权利要求1所述的一种基于注意力的多项选择机器阅读理解方法,其特征在于,对选项与文章中的每个句子进行相似度匹配检测,对问题与文章中的每个句子进行相似度匹配检测包括:计算句子中单词向量的加权平均值,去除平均向量在主成分上的公共值;给定句子s,计算句子中每个单词w的加权平均值;获取句子s中的语义信息;根据加权平均值对语义信息进行筛选,删除与语义信息想法方向上的分量,得到关键信息;将所有的关键信息进行相似度比较,得到k个句子;其中计算加权平均值时,每个单词的权重表示为其中a为超参数,p(w)为单词w在语料库中出现的频率,语料库为随机数据组成的数据库。