1.一种标题热词自动计量方法,其特征在于,其包括:
获取各个直播间的标题,获取标题中的待计量热词;
设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高;
所述预设的热度值计量算法包括以下步骤:
根据每个时间周期内待计量热词的出现次数和待计量热词总数,获得每个时间周期内待计量热词出现的平均次数;
累加每个时间周期内的平均次数,得到总平均次数,将每个周期的平均出现次数处于总平均次数得到平均占空比;
选定一个待计量热词,将该待计量热词在最晚时间周期出现的次数和占空比相乘得到第一乘积,将最晚时间周期的平均次数和平均占空比相乘得到第二乘积,获取第一乘积与第二乘积的和,并用该和除以该待计量热词在最晚时间周期出现的次数与最晚时间周期对应的平均次数的和,得到热度值。
2.如权利要求1所述的方法,其特征在于,所述预设的热度值计量具体公式为:其中,所述H0(i)为词语i在最晚的时间周期内的热度值,W0(i)为词语i在最晚的时间段内的出现次数,W0为最晚时间的周期内待计量热词出现的平均次数,P0(i)为词语i在最晚的时间周期的占空比,P0为最晚的时间周期内待计量热词出现的平均占空比。
3.如权利要求1所述的方法,其特征在于,所述设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,还包括以下步骤:每次统计一个时间周期,对之前的时间周期进行衰减。
4.如权利要求3所述的方法,其特征在于:所述衰减为线性衰减。
5.如权利要求4所述的方法,其特征在于,所述线性衰减的计算公式为:W′k(i)=Wk(i)*(1‑k/T)
其中W′k(i)为待计量热词i在第k+1个周期内衰减后的出现次数,Wk(i)为待计量热词i在第k+1个周期内的出现次数,T为目前统计的时间周期总数。
6.如权利要求3所述的方法,其特征在于:所述衰减为指数衰减。
7.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至6任一项所述的方法。
8.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至3任一项所述的方法。
9.一种标题热词自动计量系统,其特征在于,其包括:
热词获取模块,用于获取各个直播间的标题,获取标题中的待计量热词;
统计模块,用于设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
第一计算模块,用于累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
第二计算模块,用于根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高;
所述预设的热度值计量算法包括以下步骤:
根据每个时间周期内待计量热词的出现次数和待计量热词总数,获得每个时间周期内待计量热词出现的平均次数;
累加每个时间周期内的平均次数,得到总平均次数,将每个周期的平均出现次数处于总平均次数得到平均占空比;
选定一个待计量热词,将该待计量热词在最晚时间周期出现的次数和占空比相乘得到第一乘积,将最晚时间周期的平均次数和平均占空比相乘得到第二乘积,获取第一乘积与第二乘积的和,并用该和除以该待计量热词在最晚时间周期出现的次数与最晚时间周期对应的平均次数的和,得到热度值。