1.一种微博开心指数分析方法,包括:
调用第三方应用接口,获取微博数据并提取时间要素,根据所述时间要素实时进行时间线跟踪;具体包括:设定表示待获取数据对象名称、待获取数据格式、以及抓取时间戳的数据参数;根据第三方应用提供的权限设定权限参数,进行权限验证;获取并存储微博数据;对当前获取的时间戳进行判定,并将最新的抓取时间戳更新到参数设定上;
所述对当前获取的时间戳进行判定,并将最新的抓取时间戳更新到参数设定上的步骤中包括:进行对比时间计算,如果在参考时间线上的时间戳大于微博数据获取的时间戳,则设定抓取时间戳为最新;反之,则设定抓取时间戳为当前获取的时间戳,并进行翻页抓取;
最后将最新的抓取时间戳更新到参数设定和参考时间线上;
对微博数据进行文本语义分析,所述文本语义分析至少包括话题关联分析,表情关联分析和特殊字符关联分析;
通过构建短文本映射库对微博数据中的短文本进行还原;
引入关联元素参数并根据所述关联元素参数进行微博情感倾向判断,所述关联元素参数至少包括话题关联参数,表情关联参数和特殊字符关联参数;
根据预设微博开心指数公式对所述微博情感倾向判断结果进行统计计算,以及对计算结果进行实时可视化呈现。
2.如权利要求1所述的微博开心指数分析方法,其特征在于,所述文本语义分析进一步包括上下文关联分析。
3.如权利要求1所述的微博开心指数分析方法,其特征在于,所述步骤“通过构建短文本映射库对微博数据中的短文本进行还原”前,进一步包括:筛选并过滤掉微博文本信息中的噪音数据。
4.如权利要求1所述的微博开心指数分析方法,其特征在于,所述步骤“引入关联元素参数并进行微博情感倾向判断”前,进一步包括:对所述微博数据进行分词处理。
5.如权利要求4所述的微博开心指数分析方法,其特征在于,所述引入关联元素参数并进行微博情感倾向判断包括:构建情感词库,根据文本语义分析结果及分词结果进行情感词匹配,所述情感词库包括正向、负向及中性三类。
6.一种微博开心指数分析系统,包括:
微博数据获取单元,用于调用第三方应用接口,获取微博数据并提取时间要素,根据所述时间要素实时进行时间线跟踪;所述微博数据获取单元包括:参数设定模块,用于设定表示待获取数据对象名称、待获取数据格式、以及抓取时间戳的数据参数;权限验证模块,用于根据第三方应用提供的权限设定权限参数,进行权限验证;数据获取模块,用于获取并存储微博数据;以及时间更新单元,用于对当前获取的时间戳进行判定,并将最新的抓取时间戳更新到参数设定上;
所述对当前获取的时间戳进行判定,并将最新的抓取时间戳更新到参数设定上的步骤中包括:进行对比时间计算,如果在参考时间线上的时间戳大于微博数据获取的时间戳,则设定抓取时间戳为最新;反之,则设定抓取时间戳为当前获取的时间戳,并进行翻页抓取;
最后将最新的抓取时间戳更新到参数设定和参考时间线上;
文本语义分析单元,用于对微博数据进行文本语义分析,所述文本语义分析至少包括话题关联分析,表情关联分析和特殊字符关联分析;
短文本还原单元,用于通过构建短文本映射库对微博数据中的短文本进行还原;
情感倾向判断单元,用于引入关联元素参数并根据所述关联元素参数进行微博情感倾向判断,所述关联元素参数至少包括话题关联参数,表情关联参数和特殊字符关联参数;
开心指数计算单元,用于根据预设微博开心指数公式对所述微博情感倾向判断结果进行统计计算,以及结果呈现单元,用于对计算结果进行实时可视化呈现。
7.如权利要求6所述的微博开心指数分析系统,其特征在于,所述文本语义分析单元进一步用于对上下文关联进行分析。
8.如权利要求6所述的微博开心指数分析系统,其特征在于,进一步包括数据预处理单元,用于筛选并过滤掉微博文本信息中的噪音数据。
9.如权利要求6所述的微博开心指数分析系统,其特征在于,进一步包括分词处理单元,用于对所述微博数据进行分词处理。
10.如权利要求9所述的微博开心指数分析系统,其特征在于,所述情感倾向判断单元用于构建情感词库,根据文本语义分析结果及分词结果进行情感词匹配,所述情感词库包括正向、负向及中性三类。