利索能及
我要发布
收藏
专利号: 2017104333591
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种突发话题检测方法,其特征在于,包括:

持续获取信息分享平台中的话题数据;

在获取到每一所述话题数据时,将所述话题数据与预设词库中的各个词语进行匹配处理,以输出多种分词结果;

将匹配度最高的分词结果所包含的多个分词输出为所述话题数据对应的关键词;

根据所述关键词,更新与所述话题数据关联的摘要信息;

对所述关键词及所述摘要信息进行展示,以使用户获知当前时刻的突发话题。

2.如权利要求1所述的突发话题检测方法,其特征在于,所述根据所述关键词,更新与所述话题数据关联的摘要信息,包括:分别获取每一所述关键词的累计词频,并计算所述累计词频的增长加速度,其中,所述关键词的累计词频表示在当前时刻已获取的所有话题数据中,所述关键词出现的累计次数;

将各个所述关键词所对应的所述增长加速度添加至预先生成的矩阵中;

计算当前时刻所述矩阵的特征值,当所述特征值大于第一阈值时,从所述矩阵中确定出大于第二阈值的增长加速度;

根据确定出的每一增长加速度所对应的分词,从已获取到的所有话题数据中筛选出包含该分词的话题数据;

对包含该分词的话题数据再次进行分词处理,并计算分词处理后得到的各个分词的词频特征值;

将所述词频特征值大于第三阈值的分词输出为高频词,通过预算算法对各个所述高频词进行连接处理,以得到包含各个所述高频词的所述摘要信息。

3.如权利要求2所述的突发话题检测方法,其特征在于,所述计算当前时刻所述矩阵的特征值,当所述特征值大于第一阈值时,从所述矩阵中确定出大于第二阈值的增长加速度,包括:将当前时刻所述矩阵中的各个增长加速度分成N个组别,并将每一组别的增长加速度映射至一个子矩阵中;

计算每一所述子矩阵的特征值,当所述子矩阵的特征值大于第四阈值时,从所述子矩阵中筛选出大于第二阈值的增长加速度;

其中,所述N为大于1的整数。

4.如权利要求2所述的突发话题检测方法,其特征在于,所述对包含该分词的话题数据再次进行分词处理,并计算分词处理后得到的各个分词的词频特征值,包括:对包含该分词的话题数据再次进行分词处理,得到多个分词;

在当前时刻所获取到的所有话题数据中,分别计算分词处理后得到的每个分词对应的统计词频以及逆向文件频率;

对每一分词的所述统计词频以及所述逆向文件频率进行加权处理,以输出该分词的词频特征值。

5.如权利要求1所述的突发话题检测方法,其特征在于,所述将匹配度最高的分词结果所包含的多个分词输出为所述话题数据对应的关键词,包括:根据每一种分词结果中各个分词对应的字符总数以及每一种分词结果对应的分词总数,计算每一种分词结果的分词字符平均数;

对每一种分词结果对应的所述分词字符平均数以及所述分词总数进行加权处理,以输出每一种分词结果的匹配度;

将所述匹配度最高的分词结果所包含的多个分词输出为所述话题数据对应的关键词。

6.一种计算机可读存储介质,所述计算机可读存储介质存储有突发话题检测程序,其特征在于,所述突发话题检测程序被至少一个处理器执行时,实现如权利要求1-5中任一项所述的突发话题检测方法的步骤。

7.一种突发话题检测设备,其特征在于,所述突发话题检测设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的突发话题检测程序,所述处理器执行所述突发话题检测程序时实现如下步骤:持续获取信息分享平台中的话题数据;

在获取到每一所述话题数据时,将所述话题数据与预设词库中的各个词语进行匹配处理,以输出多种分词结果;

将匹配度最高的分词结果所包含的多个分词输出为所述话题数据对应的关键词;

根据所述关键词,更新与所述话题数据关联的摘要信息;

对所述关键词及所述摘要信息进行展示,以使用户获知当前时刻的突发话题。

8.如权利要求7所述的突发话题检测设备,其特征在于,所述根据所述关键词,更新与所述话题数据关联的摘要信息的步骤,具体包括:分别获取每一所述关键词的累计词频,并计算所述累计词频的增长加速度,其中,所述关键词的累计词频表示在当前时刻已获取的所有话题数据中,所述关键词出现的累计次数;

将各个所述关键词所对应的所述增长加速度添加至预先生成的矩阵中;

计算当前时刻所述矩阵的特征值,当所述特征值大于第一阈值时,从所述矩阵中确定出大于第二阈值的增长加速度;

根据确定出的每一增长加速度所对应的分词,从已获取到的所有话题数据中筛选出包含该分词的话题数据;

对包含该分词的话题数据再次进行分词处理,并计算分词处理后得到的各个分词的词频特征值;

将所述词频特征值大于第三阈值的分词输出为高频词,通过预算算法对各个所述高频词进行连接处理,以得到包含各个所述高频词的所述摘要信息。

9.如权利要求8所述的突发话题检测设备,其特征在于,所述计算当前时刻所述矩阵的特征值,当所述特征值大于第一阈值时,从所述矩阵中确定出大于第二阈值的增长加速度的步骤,具体包括:将当前时刻所述矩阵中的各个增长加速度分成N个组别,并将每一组别的增长加速度映射至一个子矩阵中;

计算每一所述子矩阵的特征值,当所述子矩阵的特征值大于第四阈值时,从所述子矩阵中筛选出大于第二阈值的增长加速度;

其中,所述N为大于1的整数。

10.如权利要求8所述的突发话题检测设备,其特征在于,所述对包含该第一分词的话题数据进行分词处理,得到多个第二分词,并计算各个第二分词的词频特征值的步骤,具体包括:对包含该分词的话题数据再次进行分词处理,得到多个分词;

在当前时刻所获取到的所有话题数据中,分别计算分词处理后得到的每个分词对应的统计词频以及逆向文件频率;

对每一分词的所述统计词频以及所述逆向文件频率进行加权处理,以输出该分词的词频特征值。