1.一种O2O商铺食品安全监测方法,其特征在于,包括以下步骤:S1、采用主动学习算法对某一店铺的用户历史评论文本数据进行标注,得到标注样本集L和未标注样本集U;
S2、根据标注样本集L构建词向量;
S3、将标注样本集L输入ELECTRA模型对模型参数进行微调,得到微调好的ELECTRA模型,将未标注样本集U输入微调好的ELECTRA模型中进行二分类,判别该店铺是否存在食品安全隐患,如果存在食品安全隐患,则执行步骤S4;
S4、将标注样本集L和词向量输入AT‑GRU模型中进行细粒度预测,计算评论中每个词的注意力权重,取权重最大的词作为该店铺具体的食品安全隐患并输出。
2.根据权利要求1所述的一种O2O商铺食品安全监测方法,其特征在于,采用主动学习算法进行人工标注包括:
S11、从网络平台上随机获取用户历史评论文本数据,随机选择获取的部分用户的历史评论文本数据进行人工标注,标注1表明有食品安全隐患,标注0表明没有食品安全隐患,剩下的部分用户的历史评论文本数据为未标注样本集U;
S12、使用标注样本集L训练逻辑回归模型,得到训练好的逻辑回归模型M;
S13、使用训练好的逻辑回归模型M对未标注样本集U进行查询函数计算,得到当前模型* *
M不确定的样本x ,对不确定的样本x进行人工标注,加入标注样本集L中,重复以上步骤,直*
到不确定的样本x对应的表达式 的值大于0.5为止,得到最终的标注样本集L。
3.根据权利要求2所述的一种O2O商铺食品安全监测方法,其特征在于,查询函数的计算表达式如下:
*
其中,x表示模型M对未标注样本集U中最不确定的样本,Q(U)表示查询函数对未标注样本集U进行计算,argmin表示取表达式的值最小时的参数, 表示模型M对U中的样本x的预测值。
4.根据权利要求1所述的一种O2O商铺食品安全监测方法,其特征在于,步骤S2中,所述根据标注样本集L构建词向量包括:S21、将标注样本集L中的文本分词后输入训练好的ALBERT语言模型,ALBERT模型对每个分词进行编码,去掉ALBERT语言模型的输出层,将ALBERT语言模型的最后一层编码状态进行平均池化后作为输入词的初始词向量;
S22、将初始词向量作为Word2Vec模型中隐藏层的初始化权重,再使用Word2Vec算法在用户的历史评论文本语料上进行训练,得到最终的词向量。
5.根据权利要求1所述的一种O2O商铺食品安全监测方法,其特征在于,所述AT‑GRU模型结构包括输入层、嵌入层、GRU网络层、注意力层和输出层,所述输入层用于输入数据;
所述嵌入层将构建的词向量作为初始化的权重矩阵;
所述GRU网络层对输入的词向量序列进行编码,得到隐藏状态序列S;
所述注意力层对GRU网络层所有时间步的隐藏状态序列S做加权平均,得到编码向量h;
所述输出层用于对注意力层的编码向量h进行分类,最终输出店铺是否存在食品安全隐患。
6.根据权利要求5所述的一种O2O商铺食品安全监测方法,其特征在于,注意力层对GRU网络层所有时间步的隐藏状态S做加权平均,得到编码向量h,编码向量h的计算表达式包括:
T
h=Sγ
其中,注意力权重γ的计算方式如下:D=ReLU(S)
其中,h表示注意力层编码的向量,D表示对S的激活处理,S表示GRU层对输入的词向量序列的编码,ReLU()表示修正线性单元函数,d表示隐藏状态的维度,w表示一个d维度的可学习的参数列向量。
7.根据权利要求1所述的一种O2O商铺食品安全监测方法,其特征在于,ELECTRA模型包括判别器,所述判别器为Transformer结构,由24个结构完全相同的层堆叠而成,每一层作用是对输入的序列状态向量进行编码;24个层被平均分为浅层、中间层和高层,浅层主要编码文本表层特征,中间层主要编码句法特征,高层主要编码语义特征。
8.根据权利要求7所述的一种O2O商铺食品安全监测方法,其特征在于,采用ELECTRA模型进行微调的微调方法包括:拼接ELECTRA模型中浅层、中间层和高层的编码状态,综合编码文本表层特征、句法特征、语义特征不同层次的信息,得到微调后的结果。
9.根据权利要求7所述的一种O2O商铺食品安全监测方法,其特征在于,采用ELECTRA模型进行微调的微调方法包括:去掉原判别器的输出层,将判别器的第6、12、18、24层的编码状态连接起来作为句子的向量表示,再输入到一个随机初始化参数的分类输出层,然后将整个网络的所有权重在训练集上进行微调,最终输出微调后的结果,计算表达式如下:其中,表示模型的最终预测结果,即是否存在食品安全隐患,Concat表示连接操作,h6,h12,h18,h24分别是判别器第6、12、18、24层的隐藏状态。