1.一种餐馆回头客预测模型的构建方法,其特征在于,包括:将用户评论文本划分为非回头客文本和回头客文本;基于非回头客文本和回头客文本构建第一数据集;
对第一数据集的非回头客文本和回头客文本进行词嵌入处理和筛除停用词得到第二数据集;
从第二数据集选取数据,得到训练集、测试集和验证集;将训练集、测试集和验证集分别代入LSTM深度学习模型进行预训练,得到初始预测模型;
通过测试集对初始预测模型进行训练,得到训练后的预测模型;若训练后的预测模型的准确率未达到0.7,则调节初始预测模型的参数,再通过测试集对初始预测模型进行训练;若训练后的预测模型的准确率达到0.7,则训练后的预测模型即为餐馆回头客预测模型;
所述词嵌入处理包括以下步骤:
对第一数据集中的用户评论文本分别进行分词操作、筛选停用词、以及忽略中出现在
50%以上文档中的词语和出现在2%以下文档的词语的操作,得到N个不同的单词;
给N个不同的单词分配0至N‑1的数字标签,通过 指代单词,得到存储N个单词以及对应标签的字典,字典格式为: ,其中 至 分别指代N个单词;
将分词后的用户评论文本 转化为向量
;其中M+1为用户评论文本的长度 至 为范
围在0至N‑1之间的随机数,代表该单词 所对应的数字标签;
LSTM深度学习模型包括遗忘门、输入门和输出门;
遗忘门满足: ;其中 为t时刻选择保留的信息, 为神经元的斜率, 表示t时刻的输入内容, 表示t‑1时刻的短期记忆, 表示神经元的偏置;
输入门满足:
其中, 为t时刻的初步长期记忆,为t时刻长期记忆选择保留的信息权重, 和为神经元的斜率, 表示t时刻的输入内容, 表示t‑1时刻的短期记忆, 和 表示神经元的偏置;
输出门满足:
其中 表示t时刻的长期记忆, 为t‑1时刻的长期记忆, 为t时刻输出内容,为神经元的斜率, 表示神经元的偏置;
将训练集、测试集和验证集分别代入LSTM深度学习模型进行预训练,包括以下步骤:将第二数据集中的用户评论文本向量 中的
当前 时刻的输入内容 和 时刻的短期记忆 输入遗忘门中计算得到 时刻选择保留的信息 和 时刻的输入内容 ;其中, 表示用户评论文本向量的长度,;
将 时刻的短期记忆 带入输入门进行计算得到 时刻长期记忆选择保留的信息权重 和 时刻的初步长期记忆 ;
将时刻选择保留的信息 、时刻长期记忆选择保留的信息权重 、时刻的初步长期记忆 、 时刻的长期记忆 、 时刻的短期记忆 、时刻的输入内容 带入输出门得到 时刻的长期记忆 ,时刻输出内容 和 时刻的短期记忆 ;
将输入内容变为 时刻的输入 和 时刻的短期记忆 ,即当前时刻变更为时刻,上一时刻变更为 时刻,通过这种方式对文本向量进行迭代,得到T时刻的短期记忆;
基于T时刻的短期记忆 ,判断用户评论文本向量所对应的评论所属类别;通过全连接层对T时刻的短期记忆 进行处理,得到一个判定数值;判定数值大于0.5,则代表该条评论属于回头客类别,否则属于非回头客类别。
2.根据权利要求1所述的一种餐馆回头客预测模型的构建方法,其特征在于,调节初始预测模型的参数包括步长、循环次数和神经元个数。
3.一种餐馆回头客预测方法,其特征在于,包括以下步骤:获取待预测餐馆的用户评论文本;
将所述待预测餐馆的用户评论文本输入如权利要求1 2任一项所述的餐馆回头客预测~模型的构建方法构建的模型,得到预测结果;
基于所述预测结果确定所述待预测餐馆的回头客数量。
4.一种餐馆回头客预测系统,其特征在于,包括以下模块:获取模块:获取待预测餐馆的用户评论文本;
第一数据集模块:将所述用户评论文本划分为非回头客文本和回头客文本;基于非回头客文本和回头客文本构建第一数据集;
第二数据集模块:将所述第一数据集的非回头客文本和回头客文本进行词嵌入处理和筛除停用词得到第二数据集;
初始预测模型构建模块:从所述第二数据集选取数据,得到训练集、测试集和验证集;
将所述训练集、测试集和验证集分别代入LSTM深度学习模型进行预训练,得到初始预测模型;
训练模块:通过所述测试集对所述初始预测模型进行训练,得到训练后的预测模型;若所述训练后的预测模型的准确率未达到0.7,则调节所述初始预测模型的参数,通过所述测试集对所述初始预测模型进行训练;若所述训练后的预测模型的准确率达到0.7,则所述训练后的预测模型即为餐馆回头客预测模型;
预测模块:基于权利要求1 2任一项所述的餐馆回头客预测模型的构建方法构建的模~型预测回头客的数量。
5.一种终端设备,包括存储器、处理器及存储在存储器中并能够在处理器上运行的计算机程序,其特征在于,所述存储器中存储有能够在处理器上运行的计算机程序,所述处理器加载并执行计算机程序时,采用了如权利要求3所述的一种餐馆回头客预测方法。