利索能及
我要发布
收藏
专利号: 2020111915885
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据处理方法,所述方法包括:

从多源数据中抽取第一类实体及小实体;

对所述小实体进行数据格式统一及合并处理,得到第二类实体;

建立所述第一类实体与所述第二类实体的关联结果;

响应数据搜索操作,根据所述关联结果得到与搜索操作关键词对应的目标实体数据。

2.根据权利要求1所述的方法,其中,所述多源数据包括:员工数据、平台数据、项目数据、接口人数据、wiki数据中的至少一种。

3.根据权利要求1所述的方法,其中,所述响应数据搜索操作,根据所述关联结果得到与搜索操作关键词对应的目标实体数据,包括:响应数据搜索操作,得到所述搜索操作关键词;

所述搜索操作关键词包含所述第一类实体的情况下,根据所述关联结果得到对应所述第一类实体的目标第二类实体,将所述目标第二类实体作为所述目标实体数据;

所述搜索操作关键词包含所述第二类实体的情况下,根据所述关联结果得到对应所述第二类实体的目标第一类实体,将所述目标第一类实体作为所述目标实体数据。

4.根据权利要求1-3中任一项所述的方法,其中,所述从多源数据中抽取第一类实体及小实体,包括:从所述多源数据中抽取员工数据,根据所述员工数据及所述第一类实体对应的属性生成所述第一类实体;

从所述多源数据中抽取所述第二类实体对应的名称及相匹配的别名,根据所述第二类实体对应的名称及相匹配的别名、及第二类实体对应的角色属性生成所述小实体。

5.根据权利要求4所述的方法,其中,所述根据所述员工数据及所述第一类实体对应的属性生成所述第一类实体,包括:所述第一类实体为人实体的情况下,将所述员工数据映射到人实体对应的属性中。

6.根据权利要求5所述的方法,还包括:

将与所述人实体相关的事件属性增补到所述第一类实体中;

其中,所述与所述人实体相关的事件属性的获取方式,包括从已有关系图谱中查询第一类实体与第二类实体的关联结果,或者,从所述多源数据中实时挖掘所述第一类实体与第二类实体的关联结果。

7.根据权利要求4所述的方法,其中,所述根据所述第二类实体对应的名称及相匹配的别名、及第二类实体对应的角色属性生成所述小实体,包括:从所述多源数据中抽取结构化数据类型;

根据所述结构化数据类型,得到第二类实体对应的名称及相匹配的别名,将所述第二类实体对应的名称及相匹配的别名,根据角色归一化标识映射到所述第二类实体对应的角色属性中。

8.根据权利要求7所述的方法,还包括:

从所述多源数据中抽取非结构化数据类型;

根据所述非结构化数据类型,得到用于表征所述第二类实体对应的名称及相匹配的别名的描述信息;

根据所述描述信息,确定所述第二类实体对应的名称及相匹配的别名。

9.根据权利要求1-3中任一项所述的方法,其中,所述对所述小实体进行数据格式统一及合并处理,得到第二类实体,包括:所述小实体来自于不同数据源的数据格式情况下,对所述小实体的数据格式进行统一;

将所述小实体中的同名小实体进行合并处理,得到所述第二类实体。

10.一种数据处理装置,所述装置包括:

抽取模块,用于从多源数据中抽取第一类实体及小实体;

格式统一及合并模块,用于对所述小实体进行数据格式统一及合并处理,得到第二类实体;

关联建立模块,用于建立所述第一类实体与所述第二类实体的关联结果;

搜索模块,用于响应数据搜索操作,根据所述关联结果得到与搜索操作关键词对应的目标实体数据。

11.根据权利要求10所述的装置,其中,所述多源数据包括:员工数据、平台数据、项目数据、接口人数据、wiki数据中的至少一种。

12.根据权利要求10所述的装置,其中,所述搜索模块,用于:响应数据搜索操作,得到所述搜索操作关键词;

所述搜索操作关键词包含所述第一类实体的情况下,根据所述关联结果得到对应所述第一类实体的目标第二类实体,将所述目标第二类实体作为所述目标实体数据;

所述搜索操作关键词包含所述第二类实体的情况下,根据所述关联结果得到对应所述第二类实体的目标第一类实体,将所述目标第一类实体作为所述目标实体数据。

13.根据权利要求10-12中任一项所述的装置,其中,所述抽取模块,包括:第一抽取子模块,用于从所述多源数据中抽取员工数据,根据所述员工数据及所述第一类实体对应的属性生成所述第一类实体;

第二抽取子模块,用于从所述多源数据中抽取所述第二类实体对应的名称及相匹配的别名,根据所述第二类实体对应的名称及相匹配的别名、及第二类实体对应的角色属性生成所述小实体。

14.根据权利要求13所述的装置,其中,所述第一抽取子模块,用于:所述第一类实体为人实体的情况下,将所述员工数据映射到人实体对应的属性中。

15.根据权利要求14所述的装置,还包括增补模块,用于:将与所述人实体相关的事件属性增补到所述第一类实体中;

其中,所述与所述人实体相关的事件属性的获取方式,包括从已有关系图谱中查询第一类实体与第二类实体的关联结果,或者,从所述多源数据中实时挖掘所述第一类实体与第二类实体的关联结果。

16.根据权利要求13所述的装置,其中,所述第二抽取子模块,用于:从所述多源数据中抽取结构化数据类型;

根据所述结构化数据类型,得到第二类实体对应的名称及相匹配的别名,将所述第二类实体对应的名称及相匹配的别名,根据角色归一化标识映射到所述第二类实体对应的角色属性中。

17.根据权利要求16所述的装置,还包括第三抽取子模块,用于:从所述多源数据中抽取非结构化数据类型;

根据所述非结构化数据类型,得到用于表征所述第二类实体对应的名称及相匹配的别名的描述信息;

根据所述描述信息,确定所述第二类实体对应的名称及相匹配的别名。

18.根据权利要求10-12中任一项所述的装置,其中,所述格式统一及合并模块,用于:所述小实体来自于不同数据源的数据格式情况下,对所述小实体的数据格式进行统一;

将所述小实体中的同名小实体进行合并处理,得到所述第二类实体。

19.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。