利索能及
我要发布
收藏
专利号: 2017108462040
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种驾驶模型训练方法,其特征在于,包括:

获取同一时刻且在同一驾驶场景下车辆的当前车速,判断所述当前车速是否达到预设车速阈值;

若所述当前车速达到所述预设车速阈值,则采集所述同一时刻且在同一驾驶场景下的当前图像数据和当前音频数据,所述当前图像数据和所述当前音频数据与用户标识相关联;

将所述当前图像数据和所述当前音频数据存储在数据库中;

获取用户输入的模型训练指令,所述模型训练指令包括用户标识;

基于所述用户标识查询所述数据库,获取所述同一时刻且在同一驾驶场景下的训练图像数据和训练音频数据;

采用所述训练图像数据对卷积神经网络模型进行训练,获取人脸识别模型;

采用所述训练音频数据对所述卷积神经网络模型进行训练,获取音频识别模型;

采用所述训练图像数据和所述训练音频数据对所述人脸识别模型和所述音频识别模型进行一致性验证,统计符合一致性的数量和不符合一致性的数量,根据统计的验证结果计算符合一致性的验证概率;判断该验证概率是否大于预设概率,若验证概率大于预设概率,则认定该人脸识别模型和音频识别模型通过验证,将通过验证的所述人脸识别模型和所述音频识别模型与所述用户标识关联存储。

2.根据权利要求1所述的驾驶模型训练方法,其特征在于,所述将所述当前图像数据和所述当前音频数据存储在数据库中之后,所述驾驶模型训练方法还包括:在所述数据库中创建驾驶数据信息表,所述驾驶数据信息表包括至少一条驾驶数据信息;每一所述驾驶数据信息包括用户标识、所述当前图像数据在所述数据库中的存储地址和所述当前音频数据在所述数据库中的存储地址;

所述基于所述用户标识查询所述数据库,获取同一驾驶场景的所述训练图像数据和所述训练音频数据,包括:基于所述用户标识查询所述驾驶数据信息表,判断所述驾驶数据信息的数量是否大于预设数量;

若所述驾驶数据的数量大于所述预设数量,则获取同一驾驶场景的所述训练图像数据和所述训练音频数据。

3.根据权利要求1所述的驾驶模型训练方法,其特征在于,所述采用所述训练图像数据对卷积神经网络模型进行训练,获取人脸识别模型,包括:初始化所述卷积神经网络模型;

在所述卷积神经网络模型中输入所述训练图像数据,计算所述卷积神经网络模型各层的输出;其中,卷积层的每一种输出的特征图xj为 其中,l是当前层,Mj表示选择的输入特征图组合, 是输入的第i种特征图, 是l层输入的第i种特征图和输出的第j种特征图之间连接所用的卷积核, 是第j种特征图l层对应的加性偏置,f是激活函数;池化层的每一种输出的特征图xj为 其中,down表示下采样计算,这里的 第j种特征图l层对应的乘性偏置, 是第j种特征图l层对应的加性偏置;

根据所述各层的输出对所述卷积神经网络模型各层进行误差反传更新,获取更新后的所述各层的权值;

基于更新后的所述各层的权值,获取人脸识别模型。

4.根据权利要求1所述的驾驶模型训练方法,其特征在于,所述采用所述训练音频数据对卷积神经网络模型进行训练,获取音频识别模型,包括:初始化所述卷积神经网络模型;

基于所述训练音频数据获取对应的训练声谱图;

在所述卷积神经网络模型输入所述训练声谱图,计算所述卷积神经网络模型各层的输j出;其中,卷积层的每一种输出的特征图x为 其中,l是当前层,Mj表示选择的输入特征图组合, 是输入的第i种特征图l-1层的输出, 是l层输入的第i种特征图和输出的第j种特征图之间连接所用的卷积核, 是第j种特征图l层对应的加性偏置,f是激活函数;池化层的每一种输出的特征图xj为 其中,down表示下采样计算,这里的 第j种特征图l层对应的乘性偏置, 是第j种特征图l层对应的加性偏置;

根据所述各层的输出对所述卷积神经网络模型各层进行误差反传更新,获取更新后的所述各层的权值;

基于更新后的所述各层的权值,获取音频识别模型。

5.一种驾驶人识别方法,其特征在于,包括:

获取用户同一驾驶场景的待识别图像数据和待识别音频数据,所述待识别图像数据和所述待识别音频数据与用户标识相关联;

基于所述用户标识查询数据库,调用与所述用户标识相对应的人脸识别模型和音频识别模型,所述人脸识别模型和所述音频识别模型是采用权利要求1-4任一项所述驾驶模型训练方法获取的模型;

基于所述待识别图像数据和所述人脸识别模型获取第一概率;

基于所述待识别音频数据和所述音频识别模型获取第二概率;

基于所述第一概率和所述第二概率确定所述用户本人开车的最终概率;

若所述最终概率大于第二预设阈值,则确定为所述用户本人开车。

6.根据权利要求5所述的驾驶人识别方法,其特征在于,所述基于所述第一概率和所述第二概率确定所述驾驶人本人开车的最终概率,包括:获取所述第一概率和所述第二概率的概率差值;

判断所述概率差值是否大于第一预设阈值;

若所述概率差值大于所述第一预设阈值,则选取所述第一概率和所述第二概率中较大值作为所述最终概率输出;

若所述概率差值不大于所述第一预设阈值,则选取所述第一概率和所述第二概率的均值作为所述最终概率输出。

7.一种驾驶模型训练装置,其特征在于,包括:

车速阈值判断模块,用于获取同一时刻且在同一驾驶场景下车辆的当前车速,判断所述当前车速是否达到预设车速阈值;

数据采集模块,用于若所述当前车速达到所述预设车速阈值,则采集所述同一时刻且在同一驾驶场景下的当前图像数据和当前音频数据,所述当前图像数据和所述当前音频数据与用户标识相关联;

数据存储模块,用于将所述当前图像数据和所述当前音频数据存储在数据库中;

训练指令模块,用于获取获取用户输入的模型训练指令,所述模型训练指令包括用户标识;

查询模块,用于基于所述用户标识查询所述数据库,获取同一时刻且在同一驾驶场景下的训练图像数据和训练音频数据;

人脸识别模型获取模块,用于采用所述训练图像数据对卷积神经网络模型进行训练,获取人脸识别模型;

音频识别模型获取模块,用于基于所述训练音频数据对所述卷积神经网络模型进行训练,获取音频识别模型;

关联存储模块,用于采用所述训练图像数据和所述训练音频数据对所述人脸识别模型和所述音频识别模型进行一致性验证,统计符合一致性的数量和不符合一致性的数量,根据统计的验证结果计算符合一致性的验证概率;判断该验证概率是否大于预设概率,若验证概率大于预设概率,则认定该人脸识别模型和音频识别模型通过验证,将通过验证的所述人脸识别模型和所述音频识别模型与所述用户标识关联存储。

8.一种驾驶人识别装置,其特征在于,包括:

待识别数据获取模块,用于获取用户同一驾驶场景的待识别图像数据和待识别音频数据,所述待识别图像数据和所述待识别音频数据与用户标识相关联;

识别模型调用模块,用于基于所述用户标识查询数据库,调用与所述用户标识相对应的人脸识别模型和音频识别模型,所述人脸识别模型和所述音频识别模型是采用权利要求

1-4任一项所述驾驶模型训练方法获取的模型;

第一概率获取模块,用于基于所述待识别图像数据和所述人脸识别模型获取第一概率;

第二概率获取模块,用于基于所述待识别音频数据和所述音频识别模型获取第二概率;

最终概率获取模块,用于基于所述第一概率和所述第二概率确定所述用户本人开车的最终概率;

确认结果获取模块,用于若所述最终概率大于第二预设阈值,则确定为所述用户本人开车。

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述驾驶模型训练方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求5或6所述驾驶人识别方法的步骤。

10.一种计算机可读介质,所述计算机可读介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述驾驶模型训练方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求5或6所述驾驶人识别方法的步骤。