利索能及
我要发布
收藏
专利号: 2018110527955
申请人: 武汉斗鱼网络科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种弹幕识别模型建立方法,其特征在于,包括:使用弹幕训练样本对对预先构建的卷积神经网络进行训练;

其中,所述弹幕训练样本对包括:弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值;所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值;

将训练完成的卷积神经网络作为所述弹幕识别模型;

将训练完成的卷积神经网络作为所述弹幕识别模型,包括:对训练后的卷积神经网络进行模型评价,若模型评价结果满足模型生成条件,则将训练后的卷积神经网络作为弹幕识别模型;所述模型评价结果包括下述至少一种:正常弹幕被预测为正常弹幕的概率,异常弹幕被预测为异常弹幕的概率,正常弹幕被预测为异常弹幕的概率,以及异常弹幕被预测为正常弹幕的概率。

2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络,包括:输入层、隐藏层、全连接层和输出层首尾相连;

所述隐藏层包括至少两个计算网络分支;

所述计算网络分支包括卷积层、与所述卷积层连接的激活层、与所述激活层连接的池化层和与所述池化层连接的折叠层。

3.根据权利要求1所述的方法,其特征在于,在所述使用弹幕训练样本对预先构建的卷积神经网络进行训练之前,还包括:获取原始弹幕样本;

根据预设标准词表,对各所述原始弹幕样本进行独热编码,生成初始弹幕样本词向量;

对所述初始弹幕样本词向量进行降维处理,生成所述弹幕样本词向量。

4.根据权利要求3所述的方法,其特征在于,在根据预设标准词表,对各所述原始弹幕样本进行独热编码,生成初始弹幕样本词向量之前,还包括:去除各原始弹幕样本中的异常字符,并更新所述原始弹幕样本;和/或去除各所述原始弹幕样本中内容相同的弹幕样本,并更新所述原始弹幕样本。

5.根据权利要求1所述的方法,其特征在于,使用弹幕训练样本对对预先构建的神经网络进行训练,包括:

选取设定数量的弹幕训练样本对;

依次获取一个弹幕训练样本对输入至预先构建的卷积神经网络中,得到所述卷积神经网络基于弹幕样本词向量的输出结果,并基于所述输出结果对预先构建的卷积神经网络中的加权参数进行调整;

返回执行获取一个弹幕样本词向量输入至所述卷积神经网络的操作,直至达到预先设定的训练结束条件。

6.根据权利要求5所述的方法,其特征在于,所述基于所述输出结果对预先构建的卷积神经网络中的加权参数进行调整,包括:计算所述输出结果和弹幕类型值之间的交叉熵函数;

采用设定权重更新算法,沿着最小化交叉熵函数的方向,反向逐层更新预先构建的卷积神经网络中各层的加权参数。

7.根据权利要求1-6任一项所述的方法,其特征在于,在所述将训练完成的卷积神经网络作为所述弹幕识别模型之后,还包括:获取弹幕预测样本作为输入样本输入所述弹幕识别模型中;

根据所述弹幕识别模型的预测结果,标记所述弹幕预测样本;

根据标记结果,对所述弹幕样本对应的原始弹幕进行显示。

8.一种弹幕识别模型建立装置,其特征在于,包括:训练模块,用于使用弹幕训练样本对对预先构建的卷积神经网络进行训练;

其中,所述弹幕训练样本对包括:至少两个弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值;所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值;

模型生成模块,用于将训练完成的卷积神经网络作为所述弹幕识别模型;

所述模型生成模块,具体用于:对训练后的卷积神经网络进行模型评价,若模型评价结果满足模型生成条件,则将训练后的卷积神经网络作为弹幕识别模型;所述模型评价结果包括下述至少一种:正常弹幕被预测为正常弹幕的概率,异常弹幕被预测为异常弹幕的概率,正常弹幕被预测为异常弹幕的概率,以及异常弹幕被预测为正常弹幕的概率。

9.一种服务器,其特征在于,包括:一个或多个处理器;

存储装置,用于存储一个或多个程序;

所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的一种弹幕识别模型建立方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的一种弹幕识别模型建立方法。