利索能及
我要发布
收藏
专利号: 2021110177224
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种事件数据处理方法,包括:

响应于接收到包括目标事件数据的查询请求,确定与所述目标事件数据对应的目标特征数据;所述目标特征数据表征了所述目标事件数据的语义特征;

基于所述目标特征数据,从候选特征数据中选择关联特征数据,其中,所述关联特征数据与所述目标特征数据彼此之间的相似度满足预设相似度条件;所述候选特征数据表征了与所述候选特征数据对应的候选事件数据的语义特征,其中,对应于所述关联特征数据的关联事件与对应于所述目标特征数据的目标事件为同一事件;

确定与所述关联特征数据相关联的操作数据,其中,所述操作数据表征了针对与所述关联特征数据对应的关联事件数据的关注度;以及基于所述操作数据,确定针对所述目标事件数据的关注度;

其中,所述候选特征数据存储于ES数据库;所述基于所述目标特征数据,从候选特征数据中选择关联特征数据包括:利用所述ES数据库的语义召回功能,对所述目标特征数据和所述候选特征数据进行处理,以从所述候选特征数据中选择所述关联特征数据。

2.根据权利要求1所述的方法,其中,所述关联事件数据包括多个关联事件数据,所述操作数据包括与所述多个关联事件数据一一对应的多个浏览次数;

其中,所述基于所述操作数据,确定针对所述目标事件数据的关注度包括:对所述多个浏览次数进行求和,得到总浏览次数;以及

将所述总浏览次数确定为针对所述目标事件数据的关注度。

3.根据权利要求2所述的方法,其中,与所述候选特征数据相关联的操作数据存储于第一类型数据库;所述对所述多个浏览次数进行求和,得到总浏览次数包括:利用所述第一类型数据库的上卷操作功能,对所述多个浏览次数进行求和,得到所述总浏览次数。

4.根据权利要求3所述的方法,其中,所述第一类型数据库包括分析型数据库。

5.根据权利要求1所述的方法,其中,所述查询请求还包括时间条件;所述方法还包括:基于所述时间条件和与初始特征数据对应的操作时间信息,从所述初始特征数据中确定所述候选特征数据,其中,与所述候选特征数据对应的操作时间信息满足所述时间条件。

6.根据权利要求1‑5中任意一项所述的方法,其中,所述目标事件数据包括事件标题;

所述确定与所述目标事件数据对应的目标特征数据包括:利用经训练的语义向量模型处理所述事件标题,得到句向量;以及将所述句向量确定为所述目标特征数据,

其中,所述预设相似度条件包括所述关联特征数据对应的句向量与所述目标特征数据对应的句向量彼此之间的向量距离小于预设句向量距离。

7.一种事件数据处理装置,包括:

第一确定模块,用于响应于接收到包括目标事件数据的查询请求,确定与所述目标事件数据对应的目标特征数据;所述目标特征数据表征了所述目标事件数据的语义特征;

选择模块,用于基于所述目标特征数据,从候选特征数据中选择关联特征数据,其中,所述关联特征数据与所述目标特征数据彼此之间的相似度满足预设相似度条件;所述候选特征数据表征了与所述候选特征数据对应的候选事件数据的语义特征,其中,对应于所述关联特征数据的关联事件与对应于所述目标特征数据的目标事件为同一事件;

第二确定模块,用于确定与所述关联特征数据相关联的操作数据,其中,所述操作数据表征了针对与所述关联特征数据对应的关联事件数据的关注度;以及第三确定模块,用于基于所述操作数据,确定针对所述目标事件数据的关注度;

其中,所述候选特征数据存储于ES数据库;所述选择模块还用于:利用所述ES数据库的语义召回功能,对所述目标特征数据和所述候选特征数据进行处理,以从所述候选特征数据中选择所述关联特征数据。

8.根据权利要求7所述的装置,其中,所述关联事件数据包括多个关联事件数据,所述操作数据包括与所述多个关联事件数据一一对应的多个浏览次数;

其中,所述第三确定模块包括:

求和子模块,用于对所述多个浏览次数进行求和,得到总浏览次数;以及第一确定子模块,用于将所述总浏览次数确定为针对所述目标事件数据的关注度。

9.根据权利要求8所述的装置,其中,与所述候选特征数据相关联的操作数据存储于第一类型数据库;所述求和子模块还用于:利用所述第一类型数据库的上卷操作功能,对所述多个浏览次数进行求和,得到所述总浏览次数。

10.根据权利要求9所述的装置,其中,所述第一类型数据库包括分析型数据库。

11.根据权利要求7所述的装置,其中,所述查询请求还包括时间条件;所述装置还包括:第四确定模块,用于基于所述时间条件和与初始特征数据对应的操作时间信息,从所述初始特征数据中确定所述候选特征数据,其中,与所述候选特征数据对应的操作时间信息满足所述时间条件。

12.根据权利要求7‑11中任意一项所述的装置,其中,所述目标事件数据包括事件标题;所述第一确定模块包括:处理子模块,用于利用经训练的语义向量模型处理所述事件标题,得到句向量;以及第二确定子模块,用于将所述句向量确定为所述目标特征数据,其中,所述预设相似度条件包括所述关联特征数据对应的句向量与所述目标特征数据对应的句向量彼此之间的向量距离小于预设句向量距离。

13.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1‑6中任一项所述的方法。