利索能及
我要发布
收藏
专利号: 2007100750084
申请人: 深圳先进技术研究院
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1、一种智能音频辨识方法,包括以下步骤:

A、采集各种样本音频数据,对采集到的样本音频数据进行标注;

B、逐一从所述样本音频数据中提取出反映其本质特征的特征向量;

C、根据所述特征向量划分所属类别区域,使得划分后的各个不同 类别区域中包含尽量多的该类样本的特征向量,建立从特征向量到所属 类别之间映射关系的分类器;

D、对待辨识音频数据进行处理,提取其特征向量;

E、将待辨识音频数据的特征向量输入到所述分类器,分类器根据 其特征向量进行判别,得到对该待辨识音频数据的辨识结果。

2、根据权利要求1所述的方法,其特征在于:所述的步骤B包括 如下步骤:B1、对所述样本音频数据进行预处理,得到训练数据;

B2、从训练数据中提取反映训练数据本质特征的特征成分;

B3、将所述特征成分进行组合,得到所述特征向量。

3、根据权利要求1所述的方法,其特征在于:所述的步骤D包括 如下步骤:D1、对所述待辨识音频数据进行预处理,得到辨识数据;

D2、从辨识数据中提取反映辨识数据本质特征的特征成分;

D3、将所述特征成分进行组合,得到所述特征向量。

4、根据权利要求2或3所述的方法,其特征在于:所述步骤B2或 D2所述的特征成分包括:音频的中心频率、一些特定频率段内音频的能 量特征或多个时段内音频的能量分布特征。

5、根据权利要求4所述的方法,其特征在于:所述步骤B3或D3 所述的特征向量为音频的中心频率与一些特定频率段内音频能量谱之 和的矢量和。

6、根据权利要求5所述的方法,其特征在于:步骤C所述的所属 类别区域根据所述特征向量的数值来划分,并由曲线或曲面来限定。

7、根据权利要求6所述的方法,其特征在于:所述步骤E包括如 下处理:E1、将待辨识音频数据的特征向量输入到所述分类器,分类器根据 其特征向量进行判别,得到待辨识音频数据划分到所属类别的分类结果 以及拒判指数,所述拒判指数是用来衡量分类结果可信度的参数;

E2、根据拒判指数判断分类结果的可信度,当类别指数高于预设门 限时,判定所述分类结果可信,分类器给出待辨识音频数据所属类别; 当拒判指数低于预设门限时,分类器给出待辨识音频数据所属类别的同 时,提示该分类结果不可信。

8、根据权利要求7所述的方法,其特征在于:所述步骤A包括对 采集到的样本音频数据进行辨识,确定并注明该样本音频数据是什么声 音。

9、一种智能音频辨识系统,其特征在于:包括一用于采集并存储 各类样本音频数据的音频数据集、一训练单元、以及辨识单元;所述训 练单元用于提取样本音频数据的特征向量,并寻找和建立从样本音频数 据特征向量到所属类别之间的映射关系;所述辨识单元用于存放已建立 的音频数据特征向量与所属类别之间映射关系的数据,以及提取待辨识 音频数据特征向量,并根据待辨识音频数据的特征向量,给出辨识结果。

10、根据权利要求9所述的系统,其特征在于:训练单元包括第一 预处理模块、第一特征提取模块以及训练模块,所述预处理模块用于对 样本音频数据进行去噪处理,得到训练数据;所述特征提取模块用于从 训练数据中提取样本音频数据的特征向量,所述训练模块用于寻找和建 立从样本音频数据特征向量到所属类别之间的映射关系。

11、根据权利要求9或10所述的系统,其特征在于:所述辨识单元 包括第二预处理模块、第二特征提取模块以及分类器,所述第二预处理 模块用于对待辨识音频数据进行去噪处理,得到辨识数据;所述第二特 征提取模块用于从辨识数据中提取待辨识音频数据的特征向量,所述分 类器用于存放所述训练模块输出的音频数据特征向量与所属类别之间 映射关系的数据,并根据输入的待辨识音频数据的特征向量,输出辨识 结果。