1.一种评估麦克风阵列一致性的方法,其特征在于,包括:获取N个麦克风分别采集的N个音频信号,所述N个麦克风构成麦克风阵列,N≥2;
根据所述N个音频信号,确定所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值,所述参考麦克风为所述N个麦克风中的任意一个麦克风;
根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值,对所述N个麦克风进行一致性评估。
2.根据权利要求1所述的方法,其特征在于,所述根据所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值,对所述N个麦克风进行一致性评估,包括:根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值,评估对应麦克风与所述参考麦克风之间的相位一致性。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:分别测量所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风到声源的距离差;
根据所测量的距离差,分别计算所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差;
根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差,分别校准其对应的相位谱差值。
4.根据权利要求3所述的方法,其特征在于,所述根据所测量的距离,分别计算所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差,包括:根据公式 分别计算所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差,
其中,Yi(ω)表示第i个麦克风的频谱,Y1(ω)表示参考麦克风的频谱,ω表示频率,di表示第i个麦克风与参考麦克风到声源的距离差,c表示声速,2πωdi/c表示第i个麦克风与参考麦克风之间的固定相位差。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值,对所述N个麦克风进行一致性评估,包括:根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值,评估对应麦克风与所述参考麦克风之间的幅度一致性。
6.根据权利要求2至4中任一项所述的方法,其特征在于,所述N个音频信号是在播放扫频信号数据的环境下采集的信号。
7.根据权利要求5所述的方法,其特征在于,所述N个音频信号是在播放高斯白噪声数据或者扫频信号数据的环境下采集的信号。
8.根据权利要求6或7所述的方法,其特征在于,所述扫频信号为线性扫频信号、对数扫频信号、线性步进扫频信号、对数步进扫频信号中的任意一种。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述根据所述N个音频信号,确定所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值,包括:将所述N个音频信号中的每个音频信号进行分帧,得到长度相等的K个信号帧,K≥2;
对所述K个信号帧中的每个信号帧做加窗处理,得到K个加窗信号帧;
对所述K个加窗信号帧中的每个加窗信号帧做FFT变换,得到K个目标信号帧;
根据所述每个音频信号对应的所述K个目标信号帧,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值。
10.根据权利要求9所述的方法,其特征在于,所述K个信号帧中任意两个相邻信号帧重叠R%,R>0。
11.根据权利要求10所述的方法,其特征在于,所述R为25或者50。
12.根据权利要求9至11中任一项所述的方法,其特征在于,将第i个音频信号进行分帧,得到长度相等的K个信号帧写成以下向量形式:xi(t)=[xi,1(t),xi,2(t),…,xi,K(t)]T其中,xi(t)表示第i个音频信号,K表示每个麦克风采集到信号的总帧数,[]T表示向量或者矩阵的转置。
13.根据权利要求9至12中任一项所述的方法,其特征在于,所述根据所述每个音频信号对应的所述K个目标信号帧,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值,包括:根据公式 确定所述N个麦克风中除所述参考麦克风之外
的每个麦克风与所述参考麦克风之间的相位谱差值,
其中,imag()表示取虚部,ln()表示取自然对数, 表示第i个麦克风与参考麦克风之间的相位谱差值, 表示参考麦克风的第j个目标信号帧, 表示第i个麦克风的第j个目标信号帧, 表示主频率。
14.根据权利要求9至13中任一项所述的方法,其特征在于,所述根据所述每个音频信号对应的所述K个目标信号帧,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值,包括:根据所述每个音频信号对应的所述K个目标信号帧,确定所述每个音频信号的功率谱;
根据所述每个音频信号的功率谱,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值。
15.根据权利要求14所述的方法,其特征在于,所述根据所述每个音频信号对应的所述K个目标信号帧,确定所述每个音频信号的功率谱,包括:根据公式 计算所述每个音频信号的功率谱,
其中,Pi(ω)表示第i个音频信号的功率谱,Yi,j(ω)表示第i个音频信号中的第j个目标信号帧,K表示每个麦克风采集到信号的总帧数,ω表示频率。
16.根据权利要求14或15所述的方法,其特征在于,所述根据所述每个音频信号的功率谱,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值,包括:根据公式PDi(ω)=P1(ω)-Pi(ω)计算所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值,其中,PDi(ω)表示第i个麦克风与参考麦克风之间的功率谱差值,P1(ω)表示参考麦克风的功率谱,Pi(ω)表示第i个麦克风的功率谱。
17.根据权利要求1至16中任一项所述的方法,其特征在于,所述获取N个麦克风分别采集的N个音频信号,包括:确定所述N个麦克风在进行音频信号采集时的采样频率Fs和FFT点数Nfft,使用扬声器播放高斯白噪声数据或者扫频信号数据,所述N个麦克风采集所述N个音频信号,其中,若所述扬声器所播放的数据为扫频信号数据,所述扫频信号数据由M+1段长度相等且频率不等的信号构成,
18.根据权利要求17所述的方法,其特征在于,
根据公式 计算所述M+1段信号中每段信号的频率,以及根据公式Si(t)=sin(2πfit)计算所述M+1段信号中的每段信号,其中,fi表示第i段信号的频率,Fs表示采样频率,Nfft表示FFT点数,Si(t)表示第i段信号,且S1(t)的长度为周期T的整数倍,T=1/f1。
19.根据权利要求18所述的方法,其特征在于,所述扬声器所播放的扫频信号数据写成以下向量形式:S(t)=[S0(t),S1(t),…,SM(t)]T其中,S(t)表示扬声器所播放的扫频信号数据,Si(t)表示第i段信号, []T表示向量或者矩阵的转置。
20.根据权利要求1至19中任一项所述的方法,其特征在于,所述N个麦克风分别采集到N个音频信号,其中第i个麦克风采集到的音频信号表示为xi(t),且xi(t)可以写成以下向量形式:T
xi(t)=[xi,1(t),xi,2(t),…,xi,K(t)]其中,xi(t)表示第i个麦克风采集到的音频信号,K表示每个麦克风采集到信号的总帧数,[]T表示向量或者矩阵的转置。
21.根据权利要求1至20中任一项所述的方法,其特征在于,所述获取N个麦克风分别采集的N个音频信号,包括:将所述N个麦克风放置于测试房间内,所述测试房间内配置有扬声器,所述N个麦克风位于所述扬声器的正前方;
控制所述扬声器播放高斯白噪声数据或者扫频信号数据,以及控制所述N个麦克风分别采集所述N个音频信号。
22.根据权利要求21所述的方法,其特征在于,所述测试房间内具有消音室环境,所述扬声器为音频测试专用人工嘴,且所述人工嘴在使用之前用标准麦克风校准。
23.根据权利要求21或22所述的方法,其特征在于,在控制所述扬声器播放高斯白噪声数据或者扫频信号数据之前,所述方法还包括:在安静的环境下,获取所述N个麦克风在第一时长T1内采集的第一音频数据X1(n);
在播放高斯白噪声数据或者扫频信号数据的环境下,获取所述N个麦克风在第二时长T2内采集的第二音频数据X2(n);
根据公式 计算信噪比SNR,且确保所述SNR大于第一阈值。
24.一种评估麦克风阵列一致性的设备,其特征在于,包括:获取单元,用于获取N个麦克风分别采集的N个音频信号,所述N个麦克风构成麦克风阵列,N≥2;
处理单元,用于根据所述N个音频信号,确定所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值,所述参考麦克风为所述N个麦克风中的任意一个麦克风;
所述处理单元,还用于根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值,对所述N个麦克风进行一致性评估。
25.根据权利要求24所述的设备,其特征在于,所述处理单元具体用于:根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值,评估对应麦克风与所述参考麦克风之间的相位一致性。
26.根据权利要求25所述的设备,其特征在于,所述处理单元还用于:分别测量所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风到声源的距离差;
根据所测量的距离差,分别计算所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差;
根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差,分别校准其对应的相位谱差值。
27.根据权利要求26所述的设备,其特征在于,所述处理单元具体用于:根据公式 分别计算所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的固定相位差,
其中,Yi(ω)表示第i个麦克风的频谱,Y1(ω)表示参考麦克风的频谱,ω表示频率,di表示第i个麦克风与参考麦克风到声源的距离差,c表示声速,2πωdi/c表示第i个麦克风与参考麦克风之间的固定相位差。
28.根据权利要求24至27中任一项所述的设备,其特征在于,所述处理单元具体用于:根据所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值,评估对应麦克风与所述参考麦克风之间的幅度一致性。
29.根据权利要求25至27中任一项所述的设备,其特征在于,所述N个音频信号是在播放扫频信号数据的环境下采集的信号。
30.根据权利要求28所述的设备,其特征在于,所述N个音频信号是在播放高斯白噪声数据或者扫频信号数据的环境下采集的信号。
31.根据权利要求29或30所述的设备,其特征在于,所述扫频信号为线性扫频信号、对数扫频信号、线性步进扫频信号、对数步进扫频信号中的任意一种。
32.根据权利要求24至31中任一项所述的设备,其特征在于,所述处理单元具体用于:将所述N个音频信号中的每个音频信号进行分帧,得到长度相等的K个信号帧,K≥2;
对所述K个信号帧中的每个信号帧做加窗处理,得到K个加窗信号帧;
对所述K个加窗信号帧中的每个加窗信号帧做FFT变换,得到K个目标信号帧;
根据所述每个音频信号对应的所述K个目标信号帧,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的相位谱差值和/或功率谱差值。
33.根据权利要求32所述的设备,其特征在于,所述K个信号帧中任意两个相邻信号帧重叠R%,R>0。
34.根据权利要求33所述的设备,其特征在于,所述R为25或者50。
35.根据权利要求32至34中任一项所述的设备,其特征在于,将第i个音频信号进行分帧,得到长度相等的K个信号帧写成以下向量形式:xi(t)=[xi,1(t),xi,2(t),…,xi,K(t)]TT
其中,xi(t)表示第i个音频信号,K表示每个麦克风采集到信号的总帧数,[]表示向量或者矩阵的转置。
36.根据权利要求32至35中任一项所述的设备,其特征在于,所述处理单元具体用于:根据公式 确定所述N个麦克风中除所述参考麦克风之外
的每个麦克风与所述参考麦克风之间的相位谱差值,
其中,imag()表示取虚部,ln()表示取自然对数, 表示第i个麦克风与参考麦克风之间的相位谱差值, 表示参考麦克风的第j个目标信号帧, 表示第i个麦克风的第j个目标信号帧, 表示主频率。
37.根据权利要求32至36中任一项所述的设备,其特征在于,所述处理单元具体用于:根据所述每个音频信号对应的所述K个目标信号帧,确定所述每个音频信号的功率谱;
根据所述每个音频信号的功率谱,确定所述N个麦克风中除所述参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值。
38.根据权利要求37所述的设备,其特征在于,所述处理单元具体用于:根据公式 计算所述每个音频信号的功率谱,
其中,Pi(ω)表示第i个音频信号的功率谱,Yi,j(ω)表示第i个音频信号中的第j个目标信号帧,K表示每个麦克风采集到信号的总帧数,ω表示频率。
39.根据权利要求37或38所述的设备,其特征在于,所述处理单元具体用于:根据公式PDi(ω)=P1(ω)-Pi(ω)计算所述N个麦克风中除参考麦克风之外的每个麦克风与所述参考麦克风之间的功率谱差值,其中,PDi(ω)表示第i个麦克风与参考麦克风之间的功率谱差值,P1(ω)表示参考麦克风的功率谱,Pi(ω)表示第i个麦克风的功率谱。
40.根据权利要求24至39中任一项所述的设备,其特征在于,所述处理单元具体用于:确定所述N个麦克风在进行音频信号采集时的采样频率Fs和FFT点数Nfft,使用扬声器播放高斯白噪声数据或者扫频信号数据,控制所述N个麦克风采集所述N个音频信号,其中,若所述扬声器所播放的数据为扫频信号数据,所述扫频信号数据由M+1段长度相等且频率不等的信号构成,
41.根据权利要求40所述的设备,其特征在于,所述处理单元还用于:根据公式 计算所述M+1段信号中每段信号的频率,以及根据公式Si(t)=sin(2πfit)计算所述M+1段信号中的每段信号,其中,fi表示第i段信号的频率,Fs表示采样频率,Nfft表示FFT点数,Si(t)表示第i段信号,且S1(t)的长度为周期T的整数倍,T=1/f1。
42.根据权利要求41所述的设备,其特征在于,所述扬声器所播放的扫频信号数据写成以下向量形式:S(t)=[S0(t),S1(t),…,SM(t)]T其中,S(t)表示扬声器所播放的扫频信号数据,Si(t)表示第i段信号, []T表示向量或者矩阵的转置。
43.根据权利要求24至42中任一项所述的设备,其特征在于,所述N个麦克风分别采集到N个音频信号,其中第i个麦克风采集到的音频信号表示为xi(t),且xi(t)可以写成以下向量形式:T
xi(t)=[xi,1(t),xi,2(t),…,xi,K(t)]其中,xi(t)表示第i个麦克风采集到的音频信号,K表示每个麦克风采集到信号的总帧数,[]T表示向量或者矩阵的转置。
44.根据权利要求24至43中任一项所述的设备,其特征在于,所述获取单元具体用于:将所述N个麦克风放置于测试房间内,所述测试房间内配置有扬声器,所述N个麦克风位于所述扬声器的正前方;
控制所述扬声器播放高斯白噪声数据或者扫频信号数据,以及控制所述N个麦克风分别采集所述N个音频信号。
45.根据权利要求44所述的设备,其特征在于,所述测试房间内具有消音室环境,所述扬声器为音频测试专用人工嘴,且所述人工嘴在使用之前用标准麦克风校准。
46.根据权利要求44或45所述的设备,其特征在于,在所述处理单元控制所述扬声器播放高斯白噪声数据或者扫频信号数据之前,所述获取单元还用于:在安静的环境下,获取所述N个麦克风在第一时长T1内采集的第一音频数据X1(n);
在播放高斯白噪声数据或者扫频信号数据的环境下,获取所述N个麦克风在第二时长T2内采集的第二音频数据X2(n);
触发所述处理单元根据公式 计算信噪比SNR,且确保所述SNR大于第一阈值。
47.一种评估麦克风阵列一致性的装置,其特征在于,包括:存储器,用于存储程序和数据;以及
处理器,用于调用并运行所述存储器中存储的程序和数据;
所述装置被配置为:执行如权利要求1至23中任一项所述的方法。
48.一种评估麦克风阵列一致性的系统,其特征在于,包括:构成麦克风阵列的N个麦克风,N≥2;
至少一个音频源;
装置,包括用于存储程序和数据的存储器和用于调用并运行所述存储器中存储的程序和数据的处理器,所述装置被配置为:执行如权利要求1至23中任一项所述的方法。