1.一种用于语音连麦互动的互动词汇更新方法,其特征在于,包括:通过对包含有与语音连麦互动标识所对应的特征词的检索式进行检索,从网络侧获取各搜索结果所对应的原始网页;
从所述原始网页中提取出与预设网页模板所匹配的词汇获取网页;
从所述词汇获取网页中提取出满足预设特征的至少一对目标词汇,并将所述至少一对目标词汇添加至互动词汇数据库中;
所述从所述词汇获取网页中提取出满足预设特征的至少一对目标词汇,并将所述至少一对目标词汇添加至互动词汇数据库中,包括:将所述词汇获取网页中的文本信息进行分词处理,并判断各分词之间的词性关系及语义关系;
将满足预设词性关系及预设语义关系的一对分词作为一对目标词汇;
在将所述至少一对目标词汇添加至互动词汇数据库中之前,还包括:利用预设的敏感词对所述至少一对目标词汇进行筛选,删除与所述敏感词匹配的目标词汇对,将筛选后的至少一对目标词汇添加至所述互动词汇数据库中。
2.根据权利要求1所述的方法,其特征在于,所述从所述原始网页中提取出与预设网页模板所匹配的词汇获取网页,包括:选取预设网页类型的网页模板,对所述网页模板的源代码进行解析,得到与所述网页模板对应的网页模型;
根据所述网页模型对所述原始网页进行筛选,将所述原始网页中与所述网页模型匹配的网页作为词汇获取网页。
3.根据权利要求1所述的方法,其特征在于,所述从所述词汇获取网页中提取出满足预设特征的至少一对目标词汇,并将所述至少一对目标词汇添加至互动词汇数据库中,包括:获取所述词汇获取网页中的文本信息,将所述文本信息输入预先训练的目标词汇提取模型中,获得所述目标词汇提取模型输出的至少一对目标词汇。
4.根据权利要求3所述的方法,其特征在于,在将所述文本信息输入预先训练的目标词汇提取模型中之前,还包括:
获取文本信息和所述文本信息对应的互动词汇;
基于所述文本信息和所述互动词汇生成训练样本集,使用所述训练样本集对预先建立好的目标词汇提取模型进行训练,得到训练好的目标词汇提取模型。
5.根据权利要求1所述的方法,其特征在于,在将所述至少一对目标词汇添加至互动词汇数据库中之前,还包括:
将包含有所述至少一对目标词汇的词汇审核请求发送至词汇管理端,以使所述词汇管理端对所述至少一对目标词汇进行审核;
接收所述词汇管理端反馈的审核结果,根据所述审核结果将审核通过的目标词汇添加至所述互动词汇数据库中。
6.一种用于语音连麦互动的互动词汇更新装置,其特征在于,包括:原始网页获取模块,用于通过对包含有与语音连麦互动标识所对应的特征词的检索式进行检索,从网络侧获取各搜索结果所对应的原始网页;
词汇网页获取模块,用于从所述原始网页中提取出与预设网页模板所匹配的词汇获取网页;
目标词汇提取模块,用于从所述词汇获取网页中提取出满足预设特征的至少一对目标词汇,并将所述至少一对目标词汇添加至互动词汇数据库中;
其中,所述目标词汇提取模块具体用于:将所述词汇获取网页中的文本信息进行分词处理,并判断各分词之间的词性关系及语义关系;
将满足词性相同及预设语义关系的一对分词作为一对目标词汇;
所述装置还包括敏感词过滤模块,用于在将所述至少一对目标词汇添加至互动词汇数据库中之前,利用预设的敏感词对所述至少一对目标词汇进行筛选,删除与所述敏感词匹配的目标词汇对,将筛选后的至少一对目标词汇添加至所述互动词汇数据库中。
7.一种计算机设备,其特征在于,所述设备包括:一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑5中任一所述的用于语音连麦互动的互动词汇更新方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5中任一所述的用于语音连麦互动的互动词汇更新方法。