利索能及
我要发布
收藏
专利号: 201810842962X
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种飞行器控制方法,其特征在于,所述方法应用在飞行器中,所述飞行器包括语音采集阵列,所述语音采集阵列包括多个语音采集单元,所述方法包括:分别通过所述多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;

确定单位向量函数,所述单位向量函数为包括方位角参数和俯仰角参数的函数;

确定所述单位向量函数的转置函数;确定所述转置函数与任意两个语音采集单元中第一语音采集单元的第一坐标向量的乘积,得到所述第一语音采集单元距离坐标系中心的第一距离,确定所述转置函数与所述任意两个语音采集单元中第二语音采集单元的第二坐标向量的乘积,得到所述第二语音采集单元距离坐标系中心的第二距离;确定所述第一距离与所述第二距离的差值得到第一语音采集单元和第二语音采集单元在声源方向上的距离;

将所述距离与空气中的声速的比值作为所述任意两个语音采集单元中理论时间差;

确定所述任意两个语音采集单元采集到音频信号的实际时间差;

在所述任意两个语音采集单元采集到音频信号的理论时间差和实际时间差相同时,确定所述单位向量函数中的方位角参数的取值和俯仰角的取值,得到所述声源方向的方位角和俯仰角;

根据所述声源方向,将所述多路音频信号进行波束形成,得到语音指令;

将所述语音指令转换为控制指令,根据所述控制指令对所述飞行器进行控制。

2.根据权利要求1所述的方法,其特征在于,所述确定所述任意两个语音采集单元采集到音频信号的实际时间差,包括:对于第一音频信号和第二音频信号,确定所述第一音频信号和所述第二音频信号之间的互相关函数;

确定在所述互相关函数取最大值时,所述第一音频信号和所述第二音频信号在时域上的时间差作为所述第一音频信号和所述第二音频信号之间的时间差。

3.根据权利要求1所述的方法,其特征在于,所述根据所述声源方向,将所述多路音频信号进行波束形成,得到语音指令,包括:根据所述声源方向,确定每路音频信号在所述声源方向上的音频分量,得到多路音频分量;

将所述多路音频分量进行波束合成,得到所述语音指令。

4.根据权利要求3所述的方法,其特征在于,所述根据所述声源方向,确定每路音频信号在所述声源方向上的音频分量,得到多路音频分量,包括:对于任一路音频信号,将所述任一路音频信号转换为时频信号;

确定所述时频信号中的每个频点在所述声源的方向上的波束形成系数;

将所述任一路信号的每个频点的频谱值与对应的波束形成系数相乘得到所述任一路信号在所述声源方向上的音频分量。

5.根据权利要求1所述的方法,其特征在于,所述将所述语音指令转换为控制指令之前,所述方法还包括:根据所述飞行器的噪声类型,确定与所述噪声类型对应的降噪方法;

通过所述降噪方法对所述语音指令进行降噪处理。

6.根据权利要求1‑5任一所述的方法,其特征在于,所述得到所述声源方向的方位角和俯仰角之前,所述方法还包括:根据所述多路音频信号,确定发出所述语音信号的用户的参考音色信息;

根据所述参考音色信息和基准音色信息,确定所述用户是否具有控制所述飞行器的权限,所述基准音色信息为具有控制所述飞行器权限的用户的音色信息;

当所述用户具有控制所述飞行器的权限时,执行所述根据所述多路音频信号和每个语音采集单元在所述飞行器中的位置,确定所述语音信号的声源方向的步骤。

7.一种飞行器控制装置,其特征在于,所述装置应用在飞行器中,所述飞行器包括语音采集阵列,所述语音采集阵列包括多个语音采集单元,所述装置包括:采集模块,用于分别通过所述多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;

确定模块包括第一确定单元、第二确定单元、第三确定单元以及第四确定单元,所述第一确定单元,用于确定单位向量函数,所述单位向量函数为包括方位角参数和俯仰角参数的函数;

所述第二确定单元,用于确定所述单位向量函数的转置函数;确定所述转置函数与任意两个语音采集单元中第一语音采集单元的第一坐标向量的乘积,得到所述第一语音采集单元距离坐标系中心的第一距离,确定所述转置函数与所述任意两个语音采集单元中第二语音采集单元的第二坐标向量的乘积,得到所述第二语音采集单元距离坐标系中心的第二距离;确定所述第一距离与所述第二距离的差值得到第一语音采集单元和第二语音采集单元在声源方向上的距离;将所述距离与空气中的声速的比值作为所述任意两个语音采集单元中理论时间差;

所述第三确定单元,用于确定所述任意两个语音采集单元采集到音频信号的实际时间差;

所述第四确定单元,用于在所述任意两个语音采集单元采集到音频信号的理论时间差和实际时间差相同时,确定所述单位向量函数中的方位角参数的取值和俯仰角的取值,得到所述声源方向的方位角和俯仰角;

合成模块,用于根据所述声源方向,将所述多路音频信号进行波束形成,得到语音指令;

控制模块,用于将所述语音指令转换为控制指令,根据所述控制指令对所述飞行器进行控制。

8.根据权利要求7所述的装置,其特征在于,

所述第三确定单元,还用于对于第一音频信号和第二音频信号,确定所述第一音频信号和所述第二音频信号之间的互相关函数;确定在所述互相关函数取最大值时,所述第一音频信号和所述第二音频信号在时域上的时间差作为所述第一音频信号和所述第二音频信号之间的时间差。

9.根据权利要求7所述的装置,其特征在于,所述合成模块,包括:第五确定单元,用于根据所述声源方向,确定每路音频信号在所述声源方向上的音频分量,得到多路音频分量;

合成单元,用于将所述多路音频分量进行波束合成,得到所述语音指令。

10.根据权利要求9所述的装置,其特征在于,

所述第五确定单元,还用于对于任一路音频信号,将所述任一路音频信号转换为时频信号;确定所述时频信号中的每个频点在所述声源的方向上的波束形成系数;将所述任一路信号的每个频点的频谱值与对应的波束形成系数相乘,得到所述任一路信号在所述声源方向上的音频分量。

11.根据权利要求7所述的装置,其特征在于,所述装置还包括:

降噪模块,用于根据所述飞行器的噪声类型,确定与所述噪声类型对应的降噪方法;通过所述降噪方法对所述语音指令进行降噪处理。

12.根据权利要求7‑11任一所述的装置,其特征在于,

所述确定模块,还用于根据所述多路音频信号,确定发出所述语音信号的用户的参考音色信息;根据所述参考音色信息和基准音色信息,确定所述用户是否具有控制所述飞行器的权限,所述基准音色信息为具有控制所述飞行器权限的用户的音色信息;

所述确定模块,还用于当所述用户具有控制所述飞行器的权限时,根据所述多路音频信号和每个语音采集单元在所述飞行器中的位置,确定所述语音信号的声源方向。

13.一种飞行器,其特征在于,所述飞行器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至6任一权利要求所述的飞行器控制方法中所执行的操作。

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至6任一权利要求所述的飞行器控制方法中所执行的操作。