1.一种基于连续波声音信号情绪识别的方法,其特征在于,包括以下步骤:
S1、采用智能手机的扬声器发射19KHz的连续波信号,并由人的胸腔反射后通过智能手机的麦克风接收信号;
S2、对接收信号预处理获得呼吸信号;
S21、通过带通滤波去除接收信号中19KHz频率以外的接收信号;
S22、去除发射信号与接收信号之间未知的时间延迟;
S23、去除发射信号与接收信号延迟后,再将接收信号下转换为基带信号,获取接收信号的振幅信息;
S24、对接收信号进行下采样,然后进行分窗采样,窗口大小设置为5s,获得若干包括一次完整的呼吸周期的呼吸信号;
所述S22中,采用互相关函数将发射信号与呼吸信号对齐以去除发射信号与接收信号之间未知的时间延迟,具体步骤如下:对于周期性的发射信号,使用发射信号和接收信号主峰值的互相关函数来测量从目标反射的T/2内的延迟,互相关函数的定义为:其中,N是一个周期T内发射信号的样本数,n=‑N+1,‑N+2,...,N‑1;R(n)测量Vtx和n个样本偏移的Vrx之间的相似性;假设R(n)达到了Lag个样本偏移后的主峰值,因为Vrx是Vtx伴随着振幅衰减的时间偏移,可以测量Vrx是重叠了Lag个样本偏移的Vtx;
假设接收信号被设置为Lag为1032个采样移位后的发射信号,根据R(n)的定义,主峰值则为1032;因此,延迟τ的计算公式表示为:S3、将呼吸信号分割成的等长的时序信号,手动加上标签,作为神经网络的输入,输入到由两层双向的LSTM和一个线性层的结构组成的MO‑LSTM网络中进行训练,提取呼吸特征,根据呼吸特征识别出喜悦、冷静、恐惧和愤怒四种基本情绪,通过机器学习最终获得训练好的MO‑LSTM网络模型;
所述S3中,MO‑LSTM网络结构包括前向传播LSTM、后向传播LSTM、输出层、线性层,从一维信号的输入开始,进入包含记忆单元和相关门控制信息是否被记忆、输出、或遗忘的前向传播LSTM和后向传播LSTM,更新前向传播LSTM的3个时间步的多维隐藏输出作为后向传播LSTM的3个时间步的输入,然后,进入具有学习偏执功能的线性层,平铺展示,最后输出喜悦、冷静、恐惧和愤怒四种基本情绪的概率值,选取最高的概率为该类情绪;所述MO‑LSTM网络的学习率为0.001;
S4、将呼吸信号分割成的等长的时序信号训练好的MO‑LSTM网络模型,自动识别出喜悦、冷静、恐惧和愤怒四种基本情绪中的一种。
2.根据权利要求1所述的基于连续波声音信号情绪识别的方法,其特征在于,所述S1中,智能手机底部对准人的胸部,且智能手机距离人的胸部8‑12cm。
3.根据权利要求1所述的基于连续波声音信号情绪识别的方法,其特征在于,所述S21中,带通滤波的通带设置为18.5‑19.5KHz。