1.一种自动语音开关控制系统,包括控制器、用户端、语音模块、驱动机构和通信协议,其特征在于,所述用户端通过所述通信协议与所述控制器控制连接,所述语音模块与所述控制器控制连接,所述控制器与所述驱动机构驱动连接;
所述语音模块包括语音识别装置、语音存储装置、验证装置和通信装置,所述语音存储装置存储所述语音识别装置的记录的各条语音记录,各个所述存储装置连接并形成语音存储库,所述验证装置负责验证所述语音存储装置内的语音记录,所述通信装置与所述控制器通信连接;
所述语音识别装置还包括语音识别方法,所述语音识别方法包括:计算出存储在所述语音存储库中的语音特征以及基于所述语音特征训练好的区别模型确定所述语音记录中的身份特征;
其中,区别模型的训练包括以下步骤:
收集一组包含音素的录音片段,对于每一帧音素片段进行标注,标注标签指明其中的语音记录的音素,构建一个音素数据库;
对于音素数据库中的每一帧音素I,计算每一帧音素I的特征x;
将所有语音的特征和标签汇总,得到一个训练集,所述训练集表示为:S={xi,yi},i=
1,2,...N,其中N为音素数据库中音素的数目,xi为音素I i的特征向量,yi为音素I i的标签,该标签指明音素I i中的音素的音高和特征;
采用随机森林算法,在训练集S上训练一个区别模型;
其中,区别模型的训练中:计算语音数据库中的每个语音记录的语音特征包括:将每个语音记录的音高归一化;在音高归一化后的每个语音记录中采集第一预定数目的不同尺寸的音素块;以及计算每个音素块的语音特征,基于所述标签和所计算的每个语音记录的语音特征构建训练集包括:基于每个音素块的标签和所计算的每个音素块的语音特征构建训练集,其中,每个音素块的标签为其所源自的语音的标签;
所述基于所计算的音素特征利用训练好的区别模型确定给定语音记录中的语音中的音素包括:将所计算的第二预定数目的音素块的语音特征分别输入到所述区别模型以得到多个识别结果;以及对所述多个识别结果取平均值作为所述给定语音记录中的语音的最终识别结果。
2.如权利要求1所述的一种自动语音开关控制系统,其特征在于,所述区别模型的训练包括:构建语音数据库,所述语音数据库包括多个语音以及每个语音对应的标志,所述标志指示所述身份的特征信息。
3.如权利要求2所述的一种自动语音开关控制系统,其特征在于,计算给定每个音素块的语音特征包括:将每个语音记录的音高归一化;在音高归一化后的每个语音记录中采集第二预定数目的不同尺寸的音素块以及计算每个音素块的语音特征。
4.如权利要求3所述的一种自动语音开关控制系统,其特征在于,所述基于所计算的音素特征利用训练好的区别模型确定所述给定语音记录中的语音中的音素包括:将所计算的所述第二预定数目的音素块的语音特征分别输入到所述区别模型以得到多个识别结果;以及对所述多个识别结果取平均值作为所述给定语音记录中的语音的最终识别结果。