1.一种目标用户识别方法,其特征在于,包括:
获取用户当天发布的所有弹幕的文本特征;
根据所述文本特征,构建逻辑回归模型,得到所述用户当天的特征值;
获取所述用户的历史弹幕数据;
基于所述用户当天的特征值以及历史弹幕数据,判断所述用户是否为目标用户;所述基于所述用户当天的特征值以及历史弹幕数据,判断所述用户是否为目标用户包括:基于所述用户当天的特征值以及历史弹幕数据,计算所述用户的综合特征值;
判断所述用户的综合特征值是否大于预设阈值;
若所述用户的综合特征值大于所述预设阈值,则所述用户为目标用户;
所述基于所述用户当天的特征值以及历史弹幕数据,计算所述用户的综合特征值包括:获取所述用户的活跃天数N,所述用户历史的所有弹幕集合Ttotal,所述用户历史的目标弹幕集合Tspam,所述用户当天的所有弹幕集合Ctotal,所述用户当天的目标弹幕集合Cspam;
令所述用户的综合特征值为Y,所述用户当天的特征值f(x),所述用户在前一天的特征值为 则:其中,σ为预置参数,1≤σ≤1.5。
2.根据权利要求1所述的目标用户识别方法,其特征在于,所述基于所述用户当天的特征值以及历史弹幕数据,计算所述用户的综合特征值包括:获取所述用户的活跃天数N;
令所述用户的综合特征值为Y,所述用户当天的特征值为f(x),所述用户在前一天的特征值为 则:
3.根据权利要求1至2任意一项所述的目标用户识别方法,其特征在于,所述文本特征包括标点符号特征、表情特征、负面词语特征和所述所有弹幕中各词条的TF‑IDF值。
4.根据权利要求3所述的目标用户识别方法,其特征在于,所述根据所述文本特征,构建逻辑回归模型,得到所述用户当天的特征值包括:获取所述文本特征内各特征对应的预设权重系数;
令所述文本特征内第N个特征为Xn,第Xn对应的预设权重系数为θi,所述用户当天的特征值为f(x),则:其中,e为自然常数,b为自然数。
5.根据权利要求1所述的目标用户识别方法,其特征在于,当所述文本特征包括所述所有弹幕中各词条的TF‑IDF值时,所述获取用户当天发布的所有弹幕的文本特征包括:令第i个词条在第j个弹幕中的TF‑IDF值为TF‑IDFi,j,则:其中,ni,j表示第i个词条在第j个弹幕中出现的次数,∑knk,j表示第j个弹幕中所有词语的个数,|D|表示所述所有弹幕的弹幕总条数,|{j:ti∈dj}|表示所述所有弹幕中包含第i个词条的弹幕条数。
6.一种目标用户识别装置,其特征在于,包括:
第一获取模块,用于获取用户当天发布的所有弹幕的文本特征;
构建模块,用于根据所述文本特征,构建逻辑回归模型,得到所述用户当天的特征值;
第二获取模块,用于获取所述用户的历史弹幕数据;
判断模块,用于基于所述用户当天的特征值以及历史弹幕数据,判断所述用户是否为目标用户;所述基于所述用户当天的特征值以及历史弹幕数据,判断所述用户是否为目标用户包括:基于所述用户当天的特征值以及历史弹幕数据,计算所述用户的综合特征值;
判断所述用户的综合特征值是否大于预设阈值;
若所述用户的综合特征值大于所述预设阈值,则所述用户为目标用户;
所述基于所述用户当天的特征值以及历史弹幕数据,计算所述用户的综合特征值包括:获取所述用户的活跃天数N,所述用户历史的所有弹幕集合Ttotal,所述用户历史的目标弹幕集合Tspam,所述用户当天的所有弹幕集合Ctotal,所述用户当天的目标弹幕集合Cspam;
令所述用户的综合特征值为Y,所述用户当天的特征值f(x),所述用户在前一天的特征值为 则:其中,σ为预置参数,1≤σ≤1.5。
7.一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至5中的任一项所述的目标用户识别方法中的各个步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至5中的任一项所述的目标用户识别方法中的各个步骤。