1.一种基于大数据的科研项目分析方法,其特征在于:包括如下步骤:S1.采集科研项目信息;所述科研项目信息包括项目类别以及学科类别;
S2.根据项目类别以及学科类别建立层级标签目录;
S3.统计层级标签目录中各级别标签下科研项目的数量和拨款金额,计算得到科研项目数量和拨款金额的分布;
S4.对层级标签目录中各级别标签下的科研项目进行宏观、中观以及微观的预测分析,得到所述科研项目的数量以及拨款金额在时间维度上的估算模型;
S5.对层级标签目录中各级别标签下的科研项目进行宏观、中观以及微观的聚类分析,得到所述科研项目的聚类分析结果;
S6.对所述科研项目数量和拨款金额的分布、所述估算模型以及所述聚类分析结果进行可视化展示。
2.根据权利要求1所述的基于大数据的科研项目分析方法,其特征在于:所述步骤S4,具体包括:
S41.统计目标标签下科研项目在设定时间内的数量以及拨款金额;
S42.将所述科研项目在设定时间内的数量以及拨款金额输入回归模型,得到所述科研项目在设定时间内的数量以及拨款金额的估算模型;
S43.调整所述设定时间,并按照步骤S41‑S42进行类推,得到所述科研项目在不同设定时间内的数量以及拨款金额的估算模型。
3.根据权利要求2所述的基于大数据的科研项目分析方法,其特征在于:所述回归模型采用线性回归。
4.根据权利要求1所述的基于大数据的科研项目分析方法,其特征在于:所述步骤S5,具体包括:
S51.对目标标签下科研项目中的文本描述进行词向量处理,得到所述文本的关键词集合和向量描述;
S52.对所有文本的向量描述进行聚类处理,得到K个聚类;
S53.统计K个聚类中每个聚类的关键词出现的总次数,并对每个聚类中关键词出现的总次数按照由大到小的顺序排列,将排在前两位的关键词作为所述关键词对应聚类的标签;
S54.通过设定不同层级的标签与K值来进行聚类分析,得到聚类结果。
5.根据权利要求4所述的基于大数据的科研项目分析方法,其特征在于:所述聚类处理采用k‑means聚类算法。
6.根据权利要求1所述的基于大数据的科研项目分析方法,其特征在于:所述步骤S6,具体包括:
对所述科研项目数量和拨款金额的分布采用饼状图进行可视化展示;
对所述科研项目的数量以及拨款金额在时间维度上的估算模型采用折线图进行可视化展示;
对所述科研项目的聚类分析结果采用散点图进行可视化展示。