1.一种直播视频数据智能处理系统,其特征在于,包括:
信息收集模块,采用爬虫技术从直播数据源中采集直播视频数据;
预分类模块,对采集到的直播视频数据通过使用机器学习算法来自动分类;
评估分析模块,根据搜索内容匹配对应的直播类型,并在该直播类型下获取对应主播中直播视频数据内的所需信息,在每个对应类型主播的所需信息中二次提取评估参数,且评估参数包括当前观看人数、单位时间内的弹幕发送量以及主播与观众互动的频次,依据预处理后的评估参数和获取到对应类型主播的实时违规次数、直播时长,搭建直播数据评估模型,生成对应主播的直播效果评估值Ir;
智能推送模块,将同类型直播数据对应的主播按照直播效果评估指标U的大小进行排序,生成排序表,该排序表中的直播效果评估指标U从大到小依次排布,在搜索该类型主播时,按照排序表依次推送各个对应的主播;
生成直播效果评估值Ir的过程如下:
S301、依据当前观看人数、单位时间内的弹幕发送量、主播与观众互动的频次、对应类型主播的实时违规次数以及直播时长,生成直播效果评估指标U,所依据的公式如下:式中,公式(1)中的uΔ表示正向指数,公式(2)中的gs、ds、pc分别表示当前观看人数、单位时间内的弹幕发送量、主播与观众互动的频次,a1、a2、a3分别为当前观看人数、单位时间内的弹幕发送量、主播与观众互动的频次的预设比例系数,且a1>a2>a3>0,公式(3)中的wc、zs分别表示对应类型主播的实时违规次数和直播时长,G为常数修正系数;
S302、获取T时间内不同时刻下的直播效果评估指标Ut,t表示T时间内不同时刻下直播效果评估指标的编号,t=1、2、3、4、…、n,n为正整数;
S303:根据T时间内不同时刻下的直播效果评估指标的平均值以及直播效果评估指标Ut,计算直播效果评估值Ir,计算公式如下:式中,表示T时间内不同时刻下的直播效果评估指标的平均值。
2.根据权利要求1所述的一种直播视频数据智能处理系统,其特征在于:直播数据源包括各类直播平台和网站,且采集的直播视频数据包括所需信息,所需信息包括主播信息、直播间信息、观看人数、弹幕内容以及互动信息。
3.根据权利要求2所述的一种直播视频数据智能处理系统,其特征在于:主播信息包括主播ID、主播昵称、主播等级;直播间信息包括直播间ID、直播间标题、直播时长;观看人数包括当前观看人数、观看人数峰值;弹幕内容包括弹幕发送者昵称、弹幕语句、弹幕发送时间、单位时间内的弹幕发送量;互动信息包括主播与观众互动的频次。
4.根据权利要求3所述的一种直播视频数据智能处理系统,其特征在于:预分类模块中使用的机器学习算法包括朴素贝叶斯分类器、支持向量机SVM以及卷积神经网络CNN中的任一种,且预分类模块用于在同一类型的游戏主播视频数据中区分视频所属的游戏类型。
5.根据权利要求4所述的一种直播视频数据智能处理系统,其特征在于:对评估参数和实时违规次数、直播时长进行预处理的过程为:进行数据清洗和对各个数据进行无量纲化处理。
6.根据权利要求5所述的一种直播视频数据智能处理系统,其特征在于:对应类型主播的实时违规次数的获取过程为:在正常直播过程中,直播视频的观看人数在相邻时刻的波动值超过预设标准阈值的次数F1,对应主播在直播间出现违规内容,收到管理员警告的次数F2,通过将F1和F2累加,得到的总和即为对应类型主播的实时违规次数,其中,相邻时刻的波动值的计算方式为:相邻时刻的波动值=上一时刻在线观看人数-下一时刻在线观看人数。
7.一种直播视频数据智能处理方法,使用权利要求1至6中的任一种所述系统,其特征在于:包括如下步骤:S1、采用爬虫技术从直播数据源中采集直播视频数据;
S2、对采集到的直播视频数据通过使用机器学习算法来自动分类;
S3、根据搜索内容匹配对应的直播类型,并在该直播类型下获取对应主播中直播视频数据内的所需信息,在每个对应类型主播的所需信息中二次提取评估参数;
S4、将同类型直播数据对应的主播按照直播效果评估指标U的大小进行排序,生成排序表,该排序表中的直播效果评估指标U从大到小依次排布,在搜索该类型主播时,按照排序表依次推送各个对应的主播。
8.根据权利要求7所述的直播视频数据智能处理方法,其特征在于,所述评估参数包括当前观看人数、单位时间内的弹幕发送量以及主播与观众互动的频次,依据预处理后的评估参数和获取到对应类型主播的实时违规次数、直播时长,搭建直播数据评估模型,生成对应主播的直播效果评估值Ir。