利索能及
我要发布
收藏
专利号: 2022103652995
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种事件关系识别方法,其特征在于,包括:

获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件;

基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件;

基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系;

基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。

2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个事件组构建目标事件关系图,包括:在所述至少一个事件组的数量为多个的情况下,基于多个所述事件组构建事件对节点,得到多个事件对节点,其中,每个事件组对应一个事件对节点;

建立任意两个所述事件对节点之间的节点关联关系,得到初始事件关系图;

获取各事件对节点之间的节点约束条件,并删除所述初始事件关系图中不满足所述节点约束条件的节点关联关系,得到所述目标事件关系图。

3.根据权利要求1所述的方法,其特征在于,所述基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系,包括:获取目标事件关系识别模型;

将所述目标事件关系图输入至所述目标事件关系识别模型中进行识别处理,得到所述待处理文本数据中各目标事件之间的事件关系,其中,所述事件关系包含:每个所述事件组中所包含目标事件之间的第一事件关系,和/或,各事件组之间的第二事件关系得到所述待处理文本数据中各目标事件之间的事件关系。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取训练数据集;其中,所述训练数据集中包含多个训练样本和训练标签,每个所述训练样本包含待训练事件关系图,每个所述训练样本的训练标签包含相对应待训练事件关系图中每个待训练事件组中所包含事件的事件关系的关系标签和/或各事件组之间的事件关系的关系标签;

基于所述训练数据集对待训练的事件关系识别模型进行训练,得到所述目标事件关系识别模型。

5.根据权利要求4所述的方法,其特征在于,所述基于所述训练数据集对待训练的事件关系识别模型进行训练,得到所述目标事件关系识别模型,包括:将所述训练数据集输入至所述待训练的事件关系识别模型中进行训练,得到每个所述训练样本的初始训练结果;其中,所述初始训练结果用于指示所述待训练事件关系图中每个待训练事件组中所包含事件的事件关系的预测结果和/或各事件组之间事件关系的预测结果;

确定所述初始训练结果中的目标训练结果,其中,所述目标训练结果为与对应的训练标签不相同的训练结果;

基于所述目标训练结果调整焦点损失函数的计算权重,并基于调整之后的计算权重,确定焦点损失函数的函数值;

基于所述焦点损失函数的函数值调整所述待训练的事件关系识别模型的模型参数,直至得到满足训练要求的所述待训练的事件关系识别模型,并将满足训练要求的所述待训练的事件关系识别模型确定为所述目标事件关系识别模型。

6.根据权利要求1至5中任一项所述的方法,其特征在于,所述基于所述多个目标事件构建至少一个事件组,包括:为所述多个目标事件中的每个目标事件生成对应的事件表示标识,得到多个事件表示标识;

基于所述多个事件表示标识构建所述至少一个事件组,其中,每个所述事件组中包含该事件组所对应目标事件的事件表示标识。

7.根据权利要求6所述的方法,其特征在于,所述为所述多个目标事件中的每个目标事件生成对应的事件表示标识,包括:获取所述多个目标事件中每个目标事件的文本信息;

对所述文本信息进行编码,得到编码结果,并基于所述编码结果确定对应目标事件的事件表示标识。

8.根据权利要求7所述的方法,其特征在于,所述基于所述编码结果确定对应目标事件的事件表示标识,包括:在所述编码结果为多个的情况下,确定多个所述编码结果的总和,得到目标编码结果;

将所述目标编码结果与所述编码结果的数量进行求平均值计算,得到该目标事件的事件表示标识。

9.根据权利要求1至8中任一项所述的方法,其特征在于,所述在所述待处理文本数据中确定多个目标事件,包括:确定动态窗口的窗口参数;所述动态窗口为用于对所述待处理文本数据中进行遍历的窗口;

确定当前时刻所述待处理文本数据中位于所述动态窗口内的目标文本数据,并在所述目标文本数据中识别事件识别标识;

基于所述事件识别标识在所述目标文本数据中识别对应事件的文本信息,得到至少一个初始事件,并基于所述至少一个初始事件确定所述目标事件。

10.根据权利要求9所述的方法,其特征在于,所述基于所述至少一个初始事件确定所述目标事件,包括:在所述至少一个初始事件的事件数量为多个的情况下,对多个所述初始事件进行事件去重处理,并基于去重之后的初始事件确定所述目标事件。

11.一种事件关系识别装置,其特征在于,包括:

获取单元,用于获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件;

第一构建单元,用于基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件;

第二构建单元,用于基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系;

识别单元,用于基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。

12.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至10任一所述的事件关系识别方法的步骤。

13.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至10任意一项所述的事件关系识别方法的步骤。