1.一种直播间标签的添加方法,其特征在于,所述方法包括:将待添加标签的直播间进行分类,根据分类之后所述直播间所属的类别获取所述直播间的Q个待选标签所对应的Q个标签文本信息,其中,Q为大于或等于1的正整数;
根据预设时间内属于同一所述类别的直播间中出现的弹幕文本,获取所述待添加标签的直播间的第一内容文本信息以及其余直播间的相对应内容文本信息;
将所述标签文本信息、所述第一内容文本信息和所述相对应内容文本信息进行向量化,获取向量化之后的所述标签文本信息与所述第一内容文本信息之间的第一欧式距离,获取向量化之后的所述标签文本信息与所述相对应内容文本信息之间的第二欧式距离;
通过所述第一欧式距离和所述第二欧式距离获取所述标签文本信息与所述第一内容文本信息的匹配度;
选择所述匹配度大于预设值的所述标签文本信息,将所述标签文本信息对应的待选标签作为直播间标签进行添加。
2.根据权利要求1所述的方法,其特征在于,所述根据预设时间内直播间中出现的弹幕文本,获取所述待添加标签的直播间的第一内容文本信息以及其余直播间的相对应内容文本信息包括:将所述弹幕文本进行分词,得到的词语文本即为所述第一内容文本信息和相对应内容文本信息。
3.根据权利要求2所述的方法,其特征在于,所述将所述标签文本信息、所述第一内容文本信息和所述相对应内容文本信息进行向量化包括:对Q个标签文本信息进行向量化得到第一空间向量集合,其中一个待选标签对应所述空间向量集合中的一个空间向量;
对第一内容文本信息进行向量化得到第二空间向量集合,其中所述第一内容文本中的一个分词对应一个空间向量;
对相对应内容文本信息进行向量化得到第三空间向量集合,其中所述相对应内容文本中的一个分词对应一个空间向量。
4.根据权利要求3所述的方法,其特征在于,所述第一欧式距离通过下列公式得到:其中, 为一个标签文本信息向量化之后的空间向量,为第一内容文本信息中第i个词向量化之后的空间向量,
5.根据权利要求4所述的方法,其特征在于,所述第二欧式距离通过下列公式得到:其中, 为一个标签文本信息向量化之后的空间向量,为 相 对 应内 容 文本 信 息中 第y 个 词向 量 化之 后 的 空间 向 量 ,
6.根据权利要求5所述的方法,其特征在于,所述通过所述第一欧式距离和所述第二欧式距离获取所述标签文本信息与所述第一内容文本信息的匹配度,包括:所述匹配度通过以下公式获得:
其中,
其中,
Score(L,R)为待选标签与第一内容文本信息的匹配度,L为一个待选标签的标签文本信息,R为待添加标签的直播间的第一内容文本信息,Tm为其余直播间的相对应内容文本信息,NR为直播间的总个数,
NRL为待选标签L在其余直播间中出现的总次数,
Nm为其余直播间分词后所得到的词的数量,
p(L,Tm)为待选标签L在其余直播间中出现的次数,为第一欧式距离,
为第二欧式距离,
为一个待选标签的标签文本信息L向量化之后的空间向量,为待添加标签的直播间的第一内容文本信息中第i个词向量化之后的空间向量,为其余直播间的相对应内容文本信息中第y个词向量化之后的空间向量,Nwi为待添加标签的直播间分词后所得到的词的数量。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:当两个以上p(L,Tm)=1时,判断使所述两个以上p(L,Tm)=1的 是否属于同一个直播间,若是,则所述两个以上p(L,Tm)=1之和为1。
8.一种直播间标签添加的电子设备,其特征在于,所述电子设备包括:处理器;
存储器,其存储有计算机可执行程序,该程序在被所述处理器执行时,使得所述处理器执行如权利要求1-7中直播间标签的添加方法。
9.一种直播问标签添加的系统,其特征在于,所述系统包括:第一获取模块,用于将待添加标签的直播间进行分类,根据分类之后所述直播间所属的类别获取所述直播间的Q个待选标签所对应的Q个标签文本信息,其中,Q为大于或等于1的正整数;
第二获取模块,用于根据预设时间内属于同一所述类别的直播间中出现的弹幕文本,获取所述待添加标签的直播间的第一内容文本信息以及其余直播间的相对应内容文本信息;
第三获取模块,将所述标签文本信息、所述第一内容文本信息和所述相对应内容文本信息进行向量化,获取向量化之后的所述标签文本信息与所述第一内容文本信息之间的第一欧式距离,获取向量化之后的所述标签文本信息与所述相对应内容文本信息之间的第二欧式距离;
第四获取模块,用于通过所述第一欧式距离和所述第二欧式距离获取所述待选标签与所述第一内容文本信息的匹配度;
标签添加模块,用于选择所述匹配度大于预设值的所述标签文本信息,将所述标签文本信息对应的待选标签作为直播间标签进行添加。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中直播间标签的添加方法。