利索能及
我要发布
收藏
专利号: 2023101150880
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于声音特征优化选择的鸟声识别方法,其特征在于,包括以下步骤:步骤1、先对鸟声信号d(n)做傅里叶变换并加权,加权得到DQ(k);

步骤2、计算DQ(k)的功率谱P(k),设计两组滤波器对鸟声的功率谱P(k)滤波,并分别提取滤波后的滤波信号S1(m)、S2(m)的系数C1(n)、C2(n),对每组滤波后的信号的系数求协方差矩阵C和F,对协方差矩阵求特征值和特征向量,按从大到小排列,选择最大的前L1个,得到优化后的鸟声特征,最后将两组优化后的鸟声特征x1、x2组成鸟声的特征向量x,x=[x1,x2];

步骤3、构造非线性分类模型f(x),并采用改进的优化方法寻找到非线性分类模型中的最优核函数γi+1,j,其中,寻找过程中位置的适应度为以当前位置为核参数的核函数进行鸟声识别的识别结果与实际结果相同的数量;

步骤4、将提取的鸟声特征向量输入非线性分类模型进行学习;

步骤5、提取待识别鸟声的特征向量,并将特征向量输入已学习好的非线性分类模型中,识别鸟的种类。

2.根据权利要求1所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所述步骤1中设鸟声信号为d(n),n=0,1,2,…,N‑1,N为鸟声长度;

傅里叶变换如下式:

式中,r为虚数单位, D(k)表示鸟声信号的频谱中第k个数据,0≤k≤N‑1;

鸟声的零能比Q通过下式计算:

式中,d(n)表示鸟声信号的第n个数据,sgn[]是符号函数,num为一个极小的数,d(n‑1)表示鸟声信号的第n‑1个数据,对D(k)加权得到DQ(k)=D(k)·Q。

3.根据权利要求1所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所2

述步骤2中功率谱P(k)=|DQ(k)|,P(k)表示鸟声信号的功率谱中第k个数据,0≤k≤N‑1,滤波信号S1(m)计算公式如下:式中,

m代表滤波器序号,M代表使用的滤波器的个数,H1m(k)代表第一组滤波器中第m个滤波器,f1(m)、f1(m‑1)、f1(m+1)代表第一组滤波器中第m、m‑1、m+1个滤波器的中心频率,fs代表采样频率,fh代表鸟声频率范围内的最高频率,fl代表鸟声频率范围内的最低频率,F(*)‑1 */1125=1127*ln(1+*/700),F (*)=700(e ‑1);

滤波信号S1(m)的系数C1(n)通过下式计算:式中,L表示阶数。

4.根据权利要求3所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,根据C1(n)计算A段鸟声的系数,记作B1(s,t),s=1,2…A,t=1,2…L,对B1去均值化得到B:求协方差矩阵C如下所示:

求C的特征值λ1和特征向量u1:

Cu1=λ1u1

特征值有L个,设第n个特征值λ1(n)对应的特征向量为u1(n),n=1,2…L,将特征值从大到小排列,选择最大的前L1个,L1的典型值等于L/2取整数,并将其对应的特征向量选出,按下式计算优化后的第一组特征x1:T T

x1(p)=u1(p) [C1(1),……C1(L)] p=1,2…L1。

5.根据权利要求1所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所述步骤2中滤波信号S2(m)计算公式如下:‑1 ‑1

式中,当fs·k

‑1 ‑1

当N·G (f2(m‑1))≤fs·k≤N·G (f2(m))时,H2m(k)如下:‑1 ‑1

当N·G (f2(m))≤fs·k≤N·G (f2(m+1))时,H2m(k)如下:上述三式中,H2m(k)代表第二组滤波器中第m个滤波器,f2(m)、f2(m‑1)、f2(m+1)代表第二组滤波器中第m、m‑1、m+1个滤波器的中心频率,G(*)=2195‑2595*log(1+(4031‑*)/‑1 */2595

700),G (*)=700(10 ‑1);

滤波信号S2(m)的系数C2(n)通过下式计算:

6.根据权利要求5所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,根据C2(n)计算A段鸟声的系数,记作E1(s,t),s=1,2…A,t=1,2…L,对E1去均值化得到E:求协方差矩阵F如下所示:

按下式求F的特征值λ2和特征向量u2:

Fu2=λ2u2

特征值有L个,第n个特征值λ2(n)对应的特征向量为u2(n),n=1,2…L,将特征值从大到小排列,选择最大的前L1个,并将其对应的特征向量选出,按下式计算优化后的第二组特征x2:T T

x2(p)=u2(p) [C2(1),……C2(L)] p=1,2…L1。

7.根据权利要求1所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所述步骤3中构造的非线性分类模型f(x)如下:式中,x为鸟声的特征向量,Q为用于训练分类模型的鸟声的总段数,xq为用于训练分类模型的鸟声中第q段鸟声的特征向量,yq为第q段鸟声的分类标签,具体为‑1或1,‑1表示非此类鸟,1表示是此类鸟,aq为权系数,b为预设偏置参数,aq、b为待学习参数,为核函数,d1是核参数。

8.根据权利要求7所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所述步骤3中最优核函数寻优过程如下:先将核参数作为乌鸦,初始化种群数P1、最大迭代次数maxi、目标空间上下界,乌鸦和食物初始位置设置如下:γ0=rand(1,g)*(ub‑lb)+lb其中,γ0是乌鸦和食物始位置,lb是目标空间最小值,ub是目标空间最大值,g是变量的数量,rand(1,g)生成一行g列的0‑1之间的随机数矩阵;

然后更新位置,如下式:

D=|C·wzi+1,j‑X(i,t)|

A=2a·r1

C=2·r2

式中,X(i+1,j)是第i+1次迭代时第j个乌鸦和食物的位置,X(i,j)是第i次迭代时第j个乌鸦和食物的位置,wzi,j是第i次迭代时第j个食物位置,Z是自适应参数,X(r1,j)是第j个乌鸦第i+1次迭代之前的一个随机位置,a是从2等差递减到0的变量,r1和r2是模小于1的随机向量,rd、ri和rj为(0,1)中均匀分布的随机数, 为乌鸦j在第t+1次迭代的飞行长度, 为乌鸦j的在第i+1次迭代的感知概率,i,j∈P;

接着计算位置的适应度,如下式:

shf(γi,j)=curi,j

shf(γi+1,j)=curi+1,j

式中,shf(γi,j)、shf(γi+1,j)分别表示位置γi,j和γi+1,j的适应度,curi,j和curi+1,j分别是以γi,j和γi+1,j为核参数的核函数进行鸟种类识别的识别结果与实际结果相同的数量;

最后基于适应度更新食物位置wzi+1,j:

判断迭代次数i是否小于maxi,若是,返回执行更新位置,若否,则将此时的γi+1,j作为最优核参数输出。

9.根据权利要求1所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所述步骤4具体包括以下步骤:步骤4.1、将A段鸟声特征向量按照8:2比例随机划分为训练集和测试集;

步骤4.2、将训练集输入到非线性分类模型f(x)中,求出最优的aq和b,其中:求解aq时,aq应满足:

求解b时,任意选择一个鸟声特征向量x*及其对应标签y*,按下式计算b:步骤4.3、采用测试集评价将训练后的非线性分类模型,达到预设评价标准则判定模型训练完成。

10.根据权利要求1所述的一种基于声音特征优化选择的鸟声识别方法,其特征在于,所述步骤5中通过综合指标F1score对模型进行评估,如下式:式中,SE为灵敏度,SP为特异性。