1.一种语音信号处理方法,其特征在于,包括:
获取第一样本语音信号对应的第一样本统计特征向量,所述第一样本统计特征向量用于表示所述第一样本语音信号在M维特征空间中每维特征空间的统计值,所述M为大于1的整数,所述第一样本语音信号为录音重放语音信号或者原始语音信号;
将所述第一样本统计特征向量输入第一模型进行处理,获得第二样本统计特征向量;
根据所述第二样本统计特征向量,计算所述第一模型的第一损失;
根据所述第一损失,训练所述第一模型;
获取第一语音信号,所述第一语音信号为录音重放语音信号;
获取所述第一语音信号的第二特征向量,并将所述第二特征向量输入编码模型进行编码处理,获得第四统计特征向量,所述第四统计特征向量用于表示所述第一语音信号的统计特征;
根据所述第四统计特征向量构建第一隐含向量,并将所述第一隐含向量输入解码模型进行解码处理,获得第三特征向量,其中,由所述第三特征向量生成的第二语音信号与所述第一语音信号之间的相似度满足目标条件;
若所述第一样本语音信号为录音重放语音信号,则所述第一样本语音信号为所述第一语音信号或者所述第二语音信号;
获取待处理语音信号对应的第一统计特征向量,所述第一统计特征向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的统计值,所述M为大于1的整数;
将所述第一统计特征向量输入训练好的第一模型进行处理,获得第二统计特征向量,所述第一模型用于根据所述M维特征空间中每维特征空间的重要程度对所述第一统计特征向量进行处理;
根据所述第二统计特征向量,确定所述待处理语音信号的目标类别,所述目标类别包括原始语音信号或者录音重放语音信号。
2.如权利要求1所述的方法,其特征在于,所述获取待处理语音信号对应的第一统计特征向量,包括:将所述待处理语音信号划分为N个语音帧,所述N为大于或者等于1的整数;
获取所述N个语音帧中每个语音帧的第一特征向量,所述第一特征向量用于表示所述语音帧在M维特征空间中每维特征空间的特征值;
针对所述M维特征空间中的每维特征空间,计算该维特征空间对应的统计值,所述统计值为所述N个语音帧在该维特征空间的统计值;
根据所述M维特征空间中每维特征空间对应的统计值,构建所述待处理语音信号对应的第一统计特征向量。
3.如权利要求1或2所述的方法,其特征在于,所述第一统计特征向量包括第一均值向量和/或第一标准差向量,所述第一均值向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的均值,所述第一标准差向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的标准差。
4.如权利要求3所述的方法,其特征在于,若所述第一统计特征向量包括所述第一均值向量和所述第一标准差向量;所述第二统计特征向量包括第二均值向量和第二标准差向量,所述第二均值向量是根据所述第一均值向量和所述第一模型得到,所述第二标准差向量是根据所述第一标准差向量和所述第一模型得到;
所述根据所述第二统计特征向量,确定所述待处理语音信号的目标类别,包括:根据所述第二均值向量和所述第二标准差向量,构建第三统计特征向量;
根据所述第三统计特征向量,确定所述待处理语音信号的目标类别。
5.如权利要求1所述的方法,其特征在于,所述获取第一语音信号之前,还包括:获取第二样本语音信号对应的第一样本特征向量;
将所述第一样本特征向量输入所述编码模型进行编码处理,获得第三样本统计特征向量,所述第三样本统计特征向量用于表示所述第二样本语音信号的统计特征;
根据所述第三样本统计特征向量和标准正态分布函数,确定第二损失;
根据所述第三样本统计特征向量构建第一样本隐含向量,并将所述第一样本隐含向量输入所述解码模型进行解码处理,获得第二样本特征向量;
根据所述第一样本特征向量和所述第二样本特征向量,确定第三损失;
根据所述第二损失和所述第三损失,训练所述编码模型和所述解码模型。
6.一种语音信号处理装置,其特征在于,包括:
第一模型训练模块,用于获取第一样本语音信号对应的第一样本统计特征向量,所述第一样本统计特征向量用于表示所述第一样本语音信号在M维特征空间中每维特征空间的统计值,所述M为大于1的整数,所述第一样本语音信号为录音重放语音信号或者原始语音信号;
第一模型训练模块,还用于将所述第一样本统计特征向量输入所述第一模型进行处理,获得第二样本统计特征向量;
第一模型训练模块,还用于根据所述第二样本统计特征向量,计算所述第一模型的第一损失;
第一模型训练模块,还用于根据所述第一损失,训练所述第一模型;
语音信号获取模块,用于获取第一语音信号,所述第一语音信号为录音重放语音信号;
语音信号获取模块,还用于获取所述第一语音信号的第二特征向量,并将所述第二特征向量输入编码模型进行编码处理,获得第四统计特征向量,所述第四统计特征向量用于表示所述第一语音信号的统计特征;
语音信号获取模块,还用于根据所述第四统计特征向量构建第一隐含向量,并将所述第一隐含向量输入解码模型进行解码处理,获得第三特征向量,其中,由所述第三特征向量生成的第二语音信号与所述第一语音信号之间的相似度满足目标条件;
若所述第一样本语音信号为录音重放语音信号,则所述第一样本语音信号为所述第一语音信号或者所述第二语音信号;
第一特征获取模块,用于获取待处理语音信号对应的第一统计特征向量,所述第一统计特征向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的统计值,所述M为大于1的整数;
第二特征获取模块,用于将所述第一统计特征向量输入训练好的第一模型进行处理,获得第二统计特征向量,所述第一模型用于根据所述M维特征空间中每维特征空间的重要程度对所述第一统计特征向量进行处理;
目标类别确定模块,用于根据所述第二统计特征向量,确定所述待处理语音信号的目标类别,所述目标类别包括原始语音信号或者录音重放语音信号。
7.一种语音信号处理设备,其特征在于,包括处理器、存储器以及输入输出接口,所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入或输出数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1‑5任一项所述的方法。
8.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1‑
5任一项所述的方法。