1.一种多视角新闻信息快速检索方法,其特征在于,所述方法包括以下步骤:S1、构建新闻信息库,其中包括每篇新闻文章的新闻编号、新闻题目、新闻时间、新闻内容长度、新闻热点描述信息以及新闻正文内容;
S2、依据用户检索的新闻视角描述信息,进行词汇分割,构建新闻视角词汇向量组B;其中,对新闻视角词汇向量组B中的不同新闻视角词汇向量 设置不同的权值;
S3、从新闻视角词汇向量组B中依次提取每个新闻视角类别构建的新闻视角词汇向量,根据新闻视角词汇向量 的词汇在新闻信息库中对每篇新闻文章内容进行检索,并'根据检索结果构建新闻视角词汇检索向量组B ;其中,根据新闻视角词汇向量 的词汇出现在新闻文章内容的不同位置,标识出该词汇在新闻文章内容中的分布权值;
S4、利用向量相似度计算模型依次计算新闻视角词汇向量 和新闻视角词汇检索向量'组B 中每个向量的相似度;
S5、设定筛选阈值,从S4中计算的相似度中筛选出大于筛选阈值的新闻文章编号;
S6、根据S5中筛选出的新闻文章编号,从所述新闻信息库中提取出对应的新闻文章。
2.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述对新闻视角词汇向量组B中的不同新闻视角词汇向量 设置不同的权值,包括:根据不同新闻视角词汇向量 在新闻信息检索过程中的重要程度,设定不同的权值,权值的等级设定规则依据用户的需求进行动态调整。
3.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述根据新闻视角词汇向量 的词汇出现在新闻文章内容的不同位置,标识出该词汇在新闻文章内容中的分布权值,包括:标记出新闻视角词汇向量 的词汇在每篇新闻文章的新闻编号、新闻题目、新闻时间、新闻内容长度、新闻热点描述信息以及新闻正文内容的分布情况。
4.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述S4具体包括:'
新闻视角词汇向量 和新闻视角词汇检索向量组B 中每个向量的相似度计算模型如下:其中,
; ;
; 是检索新闻信息库的第index篇
新闻文章内容后构建的新闻视角词汇检索向量,j表示新闻视角描述信息的类别,n表示新闻视角词汇向量 的个数也是基于用户检索需求的新闻视角类别个数, 表示新闻视角词汇向量 的权值,p为新闻信息库的新闻文章总篇数, 表示检索第index篇新闻文章后,该词汇在新闻文章内容中的分布权值, 为第j类新闻视角词汇向量和新闻视角词汇检索向量 的夹角。
5.根据权利要求4所述的一种多视角新闻信息快速检索方法,其特征在于,所述越小,则新闻信息库中第index篇新闻文章内容与用户检索的新闻视角描述信息越吻合。
6.根据权利要求4所述的一种多视角新闻信息快速检索方法,其特征在于,所述设定筛选阈值,从S4中计算的相似度中筛选出大于筛选阈值的新闻文章编号,包括:从新闻信息库中筛选出满足条件 的的新闻文章编号index,其中 为第j类新闻视角描述信息检索结果的筛选阈值。
7.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述新闻信息库中的新闻文章多以Word格式文件进行存储。
8.一种多视角新闻信息快速检索系统,其特征在于,所述系统包括:新闻信息库构建模块,用于构建新闻信息库,其中包括每篇新闻文章的新闻编号、新闻题目、新闻时间、新闻内容长度、新闻热点描述信息以及新闻正文内容;
新闻视角词汇向量构建模块,用于依据用户检索的新闻视角描述信息,进行词汇分割,构建新闻视角词汇向量组B;其中,对新闻视角词汇向量组B中的不同新闻视角词汇向量设置不同的权值;
新闻视角词汇检索向量构建模块,用于从新闻视角词汇向量组B中依次提取每个新闻视角类别构建的新闻视角词汇向量 ,根据新闻视角词汇向量 的词汇在新闻信息库中'对每篇新闻文章内容进行检索,并根据检索结果构建新闻视角词汇检索向量组B ;其中,根据新闻视角词汇向量 的词汇出现在新闻文章内容的不同位置,标识出该词汇在新闻文章内容中的分布权值;
相似度计算模块,用于利用向量相似度计算模型依次计算新闻视角词汇向量 和新闻'视角词汇检索向量组B 中每个向量的相似度;
筛选模块,用于设定筛选阈值,从相似度计算模块中筛选出大于筛选阈值的新闻文章编号;
新闻文章提取模块,用于根据筛选模块中筛选出的新闻文章编号,从所述新闻信息库中提取出对应的新闻文章。
9.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1‑7中任意一项所述多视角新闻信息快速检索方法。
10.一种终端,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令,其特征在于,处理器运行计算机指令时执行权利要求1‑7中任意一项所述多视角新闻信息快速检索方法。