利索能及
我要发布
收藏
专利号: 202110921072X
申请人: 北京工业大学
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-02-06
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种事件提取方法,其特征在于,包括:

获取目标文本,将所述目标文本输入至事件提取模型中,得到事件提取结果;

其中,所述事件提取模型是基于所述目标文本和所述目标文本对应的正负样本,通过对比学习的方式进行训练后得到的;所述目标文本对应的正样本为表达所述目标文本上下文语义的第一特征向量,所述目标文本对应的负样本为表达所述目标文本局部语义的第二特征向量;所述对比学习包括将所述正样本和所述负样本代入预设的对比损失函数,并优化所述对比损失函数,直到所述对比损失函数小于预设阈值。

2.根据权利要求1所述的事件提取方法,其特征在于,所述事件提取模型由循环神经网络和卷积神经网络组成;

其中,所述循环神经网络用于提取所述目标文本上下文语义的第一特征向量,所述卷积神经网络用于提取所述目标文本局部语义的第二特征向量。

3.根据权利要求2所述的事件提取方法,其特征在于,所述事件提取模型基于以下步骤进行训练,包括:步骤1:提取所述目标文本中的词并映射为词向量;

步骤2:将所述词向量输入至循环神经网络和卷积神经网络中,分别得到表达所述目标文本上下文语义的第一特征向量和表达所述目标文本局部语义特征的第二特征向量;

步骤3:根据所述第一特征向量和所述第二特征向量,求解所述预设的对比损失函数,所述对比损失函数越小表示所述第一特征向量和所述第二特征向量越接近;

步骤4:通过不断优化所述对比损失函数进行所述循环神经网络和所述卷积神经网络的优化,当所述对比损失函数小于所述预设阈值时训练结束,从而获取训练好的由所述循环神经网络和所述卷积神经网络所组成的事件提取模型。

4.根据权利要求3所述的事件提取方法,其特征在于,将所述词向量输入至循环神经网络中,得到表达所述目标文本上下文语义的第一特征向量,包括:将所述词向量输入至循环神经网络中,得到所述循环神经网络正向输出的所述目标文本上文特征向量和后向输出的所述目标文本下文特征向量;

将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量。

5.根据权利要求3所述的事件提取方法,其特征在于,所述对比损失函数为:T +

其中,LN为对比损失函数,f(x) 为锚点特征向量,f(x)为表达所述目标文本上下文语义的第一特征向量,N为目标文本数量,f(xi)为第i个表达所述目标文本局部语义特征的第二特征向量。

6.根据权利要求4所述的事件提取方法,其特征在于,将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量,包括:根据下面第一公式将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量;所述第一公式为:T

其中,Ht为第一特征向量,w 为转置向量, 为上文特征向量, 为下文特征向量,b为偏置值,α和β分别为上文特征向量和下文特征向量对应的权值。

7.根据权利要求3所述的事件提取方法,其特征在于,将所述词向量输入至卷积神经网络中,得到表达所述目标文本局部语义特征的第二特征向量,包括:根据下面第二公式将所述词向量输入至卷积神经网络中,得到表达所述目标文本局部语义特征的第二特征向量;所述第二公式为:ft=f(kiνt:t+j‑1+b)

其中,ft为第二特征向量,j为卷积核k的窗口大小,b为偏置值,i为当前卷积神经网络层数,ki为第i层卷积核,kivt:t+j‑1为第t到第t+j‑1的词向量。

8.一种事件提取装置,其特征在于,包括:

处理模块,用于获取目标文本,将所述目标文本输入至事件提取模型中,得到事件提取结果;

其中,所述事件提取模型是基于所述目标文本和所述目标文本对应的正负样本,通过对比学习的方式进行训练后得到的;所述目标文本对应的正样本为表达所述目标文本上下文语义的第一特征向量,所述目标文本对应的负样本为表达所述目标文本局部语义的第二特征向量;所述对比学习包括将所述正样本和所述负样本代入预设的对比损失函数,并优化所述对比损失函数,直到所述对比损失函数小于预设阈值。

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑7任一项所述事件提取方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑7任一项所述事件提取方法的步骤。