欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2019100791778
申请人: 宁波大学
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于比例因子系数差值的AAC双压缩音频检测方法,其特征在于包括以下步骤:步骤一:随机选取No个时长一致而风格不同的原始音频,原始音频的格式为WAV格式;然后使用AAC编码器并采用Nb种比特率,分别对每个原始音频进行压缩,得到Nb类具有不同比特率的共N1个AAC单压缩音频;接着使用AAC解码器,对每个AAC单压缩音频进行解压,得到每个AAC单压缩音频对应的解压音频,解压音频的格式为WAV格式;再使用相同的AAC编码器并采用Nb种比特率中大于或等于获取对应的AAC单压缩音频时所采用的比特率的所有比特率,分别对每个AAC单压缩音频对应的解压音频进行压缩,得到 类共N2个AAC双压缩音频;其中,No为正整数,No≥100,原始音频的时长为大于或等于0.5秒,Nb为正整数,Nb≥1,N1=No×Nb,

步骤二:将步骤一中对每个AAC单压缩音频对应的解压音频进行压缩时所采用的比特率与获取该AAC单压缩音频时所采用的比特率相同时得到的AAC双压缩音频作为该AAC单压缩音频相应的同比特率再次压缩后AAC音频;

使用与步骤一中相同的AAC解码器,对每个AAC双压缩音频进行解压,得到每个AAC双压缩音频对应的解压音频,解压音频的格式为WAV格式;再使用与步骤一中相同的AAC编码器并采用获取对应的AAC双压缩音频时第二次压缩所采用的比特率,对每个AAC双压缩音频对应的解压音频进行压缩,得到每个AAC双压缩音频相应的同比特率再次压缩后AAC音频;

步骤三:提取每个AAC单压缩音频的比例因子系数矩阵,将第n1个AAC单压缩音频的比例因子系数矩阵记为 然后获取每个AAC单压缩音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将 中值在[140,200]范围内的比例因子系数的出现概率记为其中,n1为正整数,n1的初始值为1,1≤n1≤N1, 的维数为M×N,M表示原始音频中包含的帧的总帧数,N表示比例因子子带数, 表示 中下标为(1,1)的比例因子系数,亦表示第n1个AAC单压缩音频中的第1帧中的第1个比例因子带的系数, 表示 中下标为(1,N)的比例因子系数,亦表示第n1个AAC单压缩音频中的第1帧中的第N个比例因子带的系数, 表示 中下标为(M,1)的比例因子系数,亦表示第n1个AAC单压缩音频中的第M帧中的第1个比例因子带的系数, 表示 中下标为(M,N)的比例因子系数,亦表示第n1个AAC单压缩音频中的第M帧中的第N个比例因子带的系数, 的维数为1×61, 表示 中比例因子系数为140的出现概率, 表示 中比例因子系数为200的出现概率;

提取每个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵,将第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵记为然后获取每个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将 中值在[140,200]范围内的比例因子系数的出现概率记为其中, 的维数为M×N, 表示

中下标为(1,1)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第1帧中的第1个比例因子带的系数, 表示 中下标为(1,N)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第

1帧中的第N个比例因子带的系数, 表示 中下标为(M,1)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第M帧中的第1个比例因子带的系数, 表示 中下标为(M,N)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第M帧中的第N个比例因子带的系数,的维数为1×61, 表示 中比例因子系数为140的出现概率, 表示 中比例因子系数为200的出现概率;

同样,提取每个AAC双压缩音频的比例因子系数矩阵,将第n2个AAC双压缩音频的比例因子系数矩阵记为 然后获取每个AAC双压缩音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将 中值在[140,200]范围内的比例因子系数的出现概率记为其中,n2为正整数,n2的初始值为1,1≤n2≤N2, 的维数为M×N, 表示 中下标为(1,1)的比例因子系数,亦表示第n2个AAC双压缩音频中的第1帧中的第1个比例因子带的系数, 表示 中下标为(1,N)的比例因子系数,亦表示第n2个AAC双压缩音频中的第1帧中的第N个比例因子带的系数, 表示中下标为(M,1)的比例因子系数,亦表示第n2个AAC双压缩音频中的第M帧中的第1个比例因子带的系数, 表示 中下标为(M,N)的比例因子系数,亦表示第n2个AAC双压缩音频中的第M帧中的第N个比例因子带的系数, 的维数为1×61, 表示 中比例因子系数为140的出现概率, 表示 中比例因子系数为200的出现概率;

同样,提取每个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵,将第n2个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵记为然后获取每个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将 中值在[140,200]范围内的比例因子系数的出现概率记为其中, 的维数为M×N, 表示

中下标为(1,1)的比例因子系数,亦表示第n2个AAC双压缩音频相应的同比特率再次压缩后AAC音频中的第1帧中的第1个比例因子带的系数, 表示 中下标为(1,N)的比例因子系数,亦表示第n2个AAC双压缩音频相应的同比特率再次压缩后AAC音频中的第1帧中的第N个比例因子带的系数, 表示 中下标为(M,1)的比例因子系数,亦表示第n2个AAC双压缩音频相应的同比特率再次压缩后AAC音频中的第M帧中的第1个比例因子带的系数, 表示 中下标为(M,N)的比例因子系数,亦表示第n2个AAC双压缩音频相应的同比特率再次压缩后AAC音频中的第M帧中的第N个比例因子带的系数,的维数为1×61, 表示 中比例因子系数为140的出现概率, 表示 中比例因子系数为200的出现概率;

步骤四:计算每个AAC单压缩音频的第一特征向量,将第n1个AAC单压缩音频的第一特征向量记为

并计算每个AAC双压缩音频的第一特征向量,将第n2个AAC双压缩音频的第一特征向量记为

其中, 和 的维数为

1×61, 表示 中的第1个元素, 表示 中的第61个元素, 表示中的第1个元素, 表示 中的第61个元素;

计算每个AAC单压缩音频的比例因子系数矩阵与每个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵的绝对差值矩阵,将 与 的绝对差值矩阵记为 并计算每个AAC双压缩音频的比例因子系数矩阵与每个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵的绝对差值矩阵,将 与 的绝对差值矩阵记为然后计算每个AAC单压缩音频的第二特征向量,将第n1个AAC单压缩音频的第二特征向量记为并计算每个AAC双压缩音频的第二特征向量,将第n2个AAC双压缩音频的第二特征向量记为其中, 和 的维数均为M×N, 表示 中下标为(1,1)的元素,表 示 中 下 标为 (1 ,N) 的元 素 ,表示 中下标为(M ,1)的元素,表示 中下标为(M,N)的元素,

符号“||”为取绝对值符号, 表示 中下标为(1,1)的元素, 表示 中下标为(1,N)的元素, 表示 中下标为(M,1)的元素,表示 中下标为(M,N)的元素,

和 的维数均为1×N, 表

示 中的第1个元素, 的值为 中第1列的所有元素的平均值,表示 中的第N个元素, 的值为 中第N列的所有元素的平均值,表示 中的第1个元素, 的值为 中第1列的所有元素的平均值, 表示 中的第N个元素, 的值为 中第N列的所有元素的平均值;

步骤五:获取每个AAC单压缩音频的特征向量,将第n1个AAC单压缩音频的特征向量记为其中, 的维数为1×

(61+N), 表示 中的第1个元素, 表示 中的第61个元素, 表示中的第62个元素, 表示 中的第61+N个元素,符号“*”为卷积符号,ω1和ω2为权重值,ω1+ω2=1;

同样,获取每个AAC双压缩音频的特征向量,将第n2个AAC双压缩音频的特征向量记为其中, 的维数为1×

(61+N), 表示 中的第1个元素, 表示 中的第61个元素, 表示中的第62个元素, 表示 中的第61+N个元素,符号“*”为卷积符号,ω1和ω2为权重值,ω1+ω2=1;

步骤六:从每类所有的AAC单压缩音频中随机选取一部分AAC单压缩音频,并从每类所有的AAC双压缩音频中随机选取一部分AAC双压缩音频;然后将选取的所有AAC单压缩音频和选取的所有AAC双压缩音频构成训练集,将剩余的所有AAC单压缩音频和剩余的所有AAC双压缩音频构成测试集;

步骤七:训练Nb个LIBSVM分类器,训练第nb个LIBSVM分类器的具体过程为:将训练集中的第nb类的所有AAC单压缩音频的特征向量作为输入,输入到LIBSVM分类器中进行训练,得到第nb个LIBSVM分类器模型,其适用于采用第nb种比特率的单压缩AAC音频的测试;其中,nb为正整数,nb的初始值为1,1≤nb≤Nb;

训练 个LIBSVM分类器,训练第n'b个LIBSVM分类器的具体过程为:将训练集中的第n'b类的所有AAC双压缩音频的特征向量作为输入,输入到LIBSVM分类器中进行训练,得到第n'b个LIBSVM分类器,其适用于采用第n'b种比特率的双压缩AAC音频的测试;其中,n'b为正整数,n'b的初始值为1,步骤八:将测试集中的每个单压缩AAC音频或每个双压缩AAC音频作为待检测的AAC音频;然后根据待检测的AAC音频的公开的比特率,将待检测的AAC音频的特征向量输入到适用于采用公开的比特率的单压缩AAC音频的测试的LIBSVM分类器模型中,得到第一判决结果;并根据待检测的AAC音频的公开的比特率,将待检测的AAC音频的特征向量输入到适用于采用公开的比特率的双压缩AAC音频的测试的LIBSVM分类器模型中,得到第二判决结果;

再根据第一判决结果和第二判决结果确定待检测的AAC音频为AAC单压缩音频或AAC双压缩音频,若第一判决结果大于或等于0.5而第二判决结果小于0.5,则确定待检测的AAC音频为AAC单压缩音频;若第一判决结果小于0.5而第二判决结果大于或等于0.5,则确定待检测的AAC音频为AAC双压缩音频;若第一判决结果和第二判决结果均大于或等于0.5且第一判决结果大于第二判决结果,则确定待检测的AAC音频为AAC单压缩音频;若第一判决结果和第二判决结果均大于或等于0.5且第一判决结果小于第二判决结果,则确定待检测的AAC音频为AAC双压缩音频;若第一判决结果和第二判决结果均小于0.5,则认为待检测的AAC音频无法判定。

2.根据权利要求1所述的基于比例因子系数差值的AAC双压缩音频检测方法,其特征在于所述的步骤五中,ω1=0.4,ω2=0.6。