1.一种作文自动评分方法,其特征在于,包括:获取目标文本,对所述目标文本进行预处理,得到词干化文本;
获取所述词干化文本中各个词的词向量数据;
将所有所述词向量数据输入第一模型获取预测分数;其中,所述第一模型是基于训练数据中的词向量数据进行训练得到的;
所述第一模型的训练步骤如下:获取训练数据,所述训练数据包括用于训练预测模型的各个训练文本的训练词向量数据;
输入所述训练词向量数据至初始预测模型进行正向传播训练,得到所述训练文本的第一预测分数;
获取所述训练文本的真实分数,并根据所述第一预测分数获取所述训练文本的训练损失;
根据所述训练损失进行反向传播训练,迭代更新所述初始预测模型的模型参数;
若迭代更新过程所述训练损失收敛,则结束训练所述初始预测模型,并将当前所述初始预测模型作为已训练的第一模型;
若迭代更新过程所述训练损失未收敛,则调整所述初始预测模型的模型参数,并返回执行所述输入所述训练词向量数据至初始预测模型进行正向传播训练,得到所述训练文本的第一预测分数及所述训练文本的训练损失以及后续步骤。
2.如权利要求1所述的作文自动评分方法,其特征在于,所述将所有所述词向量数据输入第一模型获取预测分数,包括:输入所述词向量数据至所述第一模型中的第一隐藏层,得到第一隐藏层状态;
输入所述第一隐藏层状态至所述第一模型中的第二隐藏层,得到第二隐藏层状态;
输入所述第二隐藏层状态至所述第一模型中的注意力层,得到注意力分布值;
根据所述注意力分布值计算所述预测分数。
3.如权利要求1所述的作文自动评分方法,其特征在于,所述获取目标文本,对所述目标文本进行预处理,得到词干化文本,包括:将所述目标文本的文本格式转换为目标格式;
清除所述目标文本中标点、数字和非字母字符;
基于语言库对所述目标文本进行文本分词和词干化,得到词干化文本。
4.如权利要求1所述的作文自动评分方法,其特征在于,所述获取所述词干化文本中各个词的词向量数据,包括:
获取目标向量库,通过所述目标向量库对所述词干化文本进行词嵌入,得到各个词的词向量数据;所述词嵌入用于根据所述目标向量库,获取词干化文本中各个词的词向量数据。
5.如权利要求1所述的作文自动评分方法,所述若迭代更新过程所述训练损失收敛,则结束训练所述初始预测模型,并将当前所述初始预测模型作为已训练的第一模型,包括:判断迭代过程中所述训练损失输出值是否连续发生改变;
若迭代过程中所述训练损失输出值未连续发生改变,则判定所述训练损失收敛,则结束训练所述初始预测模型,并将当前所述初始预测模型作为已训练的第一模型。
6.如权利要求5所述的作文自动评分方法,其特征在于,所述训练数据包括若干个维度的词向量数据;
所述若迭代更新过程所述训练损失收敛,则结束训练所述初始预测模型,并将当前所述初始预测模型作为已训练的第一模型之后,还包括:获取各所述维度的词向量数据进行训练后,得到的各个所述维度的词向量数据对应的第一模型;
获取测试数据,并输入所述测试数据的词向量数据至各个所述第一模型,对应获取基于各个所述第一模型进行预测后的第二预测分数,所述训练数据包括用于测试第一模型的测试文本的词向量数据;
根据各个所述第二预测分数,获取最优的第一模型作为目标第一模型。
7.一种作文自动评分装置,其特征在于,包括:第一获取模块,用于获取目标文本,对所述目标文本进行预处理,得到词干化文本;
第二获取模块,用于获取所述词干化文本中各个词的词向量数据;
第一输入模块,用于将所有所述词向量数据输入第一模型获取预测分数;其中,所述第一模型是基于训练数据中的词向量数据进行训练得到的;
所述第一模型通过以下模块进行训练得到:第三获取模块,用于获取训练数据,所述训练数据包括用于训练预测模型的各个训练文本的训练词向量数据;
第二输入模块,用于输入所述训练词向量数据至初始预测模型进行正向传播训练,得到所述训练文本的第一预测分数;
第四获取模块,用于获取所述训练文本的真实分数,并根据所述第一预测分数获取所述训练文本的训练损失;
训练模块,用于根据所述训练损失进行反向传播训练,迭代更新所述初始预测模型的模型参数;
更新模块,用于若迭代更新过程所述训练损失收敛,则结束训练所述初始预测模型,并将当前所述初始预测模型作为已训练的第一模型;
迭代模块,用于若迭代更新过程所述训练损失未收敛,则调整所述初始预测模型的模型参数,并返回执行所述输入所述训练词向量数据至初始预测模型进行正向传播训练,得到所述训练文本的第一预测分数及所述训练文本的训练损失以及后续步骤。
8.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。