利索能及
我要发布
收藏
专利号: 202310607478X
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于语音控制的图像处理系统,其特征在于,包括:

图像处理平台,用于输入唤醒文字,并将唤醒文字与图像处理指令进行一一对应,并将唤醒文字发送至语音识别模块;还用于根据安全参数获得安全系数,并根据安全系数生成显示调节指令,并将显示调节指令发送至图像展示模块;

语音调节模块,用于根据车内语音和车外语音获得唤醒语音,并将唤醒语音发送至语音识别模块;

所述语音调节模块获得唤醒语音的具体过程如下所示:

实时采集车内语音和车外语音,并将车内语音标记为分析语音,将车外语音标记为影响语音;

获取分析语音与影响语音的声音强度,并将其分别标记为分音值FY和影音值YY,获取分音值FY和影音值YY之间的差值,并将其标记为音差值YC;

将分音值FY、音差值YC代入公式 得到语音值YZ,其

中,a1、a2分别为分音值FY、音差值YC的预设比例系数,且a1+a2=1,0<a1<a2<1,取a1=0,

37,a2=0.53;

将语音值YZ与放大区间FDi(Fi,Fi+1]进行匹配,其中,Fi+1>Fi,i=1、……、n,n为自然数,每个放大区间FDi分别与一个预设的放大倍数对应;

若语音值YZ∈放大区间FDi(Fi,Fi+1],则将放大区间FDi所对应的放大倍数标记为放大值FD;

获取分音值FY、放大值FD的乘积,并将乘积标记为扩音值KY,将分析语音的声音强度调节至扩音值KY,并将调节后的分析语音标记为唤醒语音,并将唤醒语音发送至语音识别模块;

语音识别模块,用于根据唤醒语音后获得识别文字,将识别文字与唤醒文字进行对比,生成图像处理指令,并将图像处理指令发送至图像采集模块;

图像采集模块,接收到图像处理指令后并根据图像处理指令生成展示图像,并将展示图像发送至图像展示模块;还用于接收到图像采集指令后根据展示图像获得安全参数,并将安全参数发送至图像处理平台;其中,安全参数包括均距值、障距值以及障速值;

所述图像采集模块获得安全参数的具体过程如下所示:

接收到图像采集指令后获取展示图像中的所有障碍物,障碍物包括车辆、行人、动物以及建筑和对应的位置,获取障碍物的数量并将其标记为障数值ZS,获取展示图像中的所有障碍物的位置,并将其依次标记为分析点j,j=1、……、m,m为自然数,获取驾驶汽车的位置与分析点j之间的距离,并将其标记为点距值Dj,获取所有点距值Dj的平均值并将其标记为均距值JJ;

获取驾驶汽车所处的行驶车道,并将其标记为驾车道,将驾车道相邻的行驶车道标记为分析车道,获取分析车道中距离驾驶汽车最近的两个障碍物之间的距离,并将其标记为障距值ZJ;

获取分析车道中位于驾驶汽车后侧方距离驾驶汽车最近的障碍物的移动速度,并将其标记为障速值ZS;

将均距值JJ、障距值ZJ以及障速值ZS发送至图像处理平台;

图像展示模块,用于接收到展示图像后利用车机进行图像展示,同时生成图像采集指令,并将图像采集指令发送至图像采集模块;还用于接收到显示调节指令后将展示图像增加边框,且边框的颜色随着显示调节指令对应变化。

2.根据权利要求1所述的一种基于语音控制的图像处理系统,其特征在于,所述图像处理平台获得安全系数的具体过程为:将均距值、障距值以及障速值经过分析得到安全系数;

将安全系数与安全分级进行比较并生成显示调节指令,并将显示调节指令发送至图像展示模块。

3.根据权利要求1所述的一种基于语音控制的图像处理系统,其特征在于,所述图像处理平台还用于向服务器发送危险指令或较危险指令以及对应的展示图像和位置;服务器接收到危险指令或较危险指令以及对应的展示图像和位置后并进行发送。

4.根据权利要求3所述的一种基于语音控制的图像处理系统,其特征在于,所述图像处理平台还用于监测图像采集模块接收到图像处理指令至反馈安全参数之间的时间差得到图像分析时长并生成图像辅助指令,将图像辅助指令反馈至服务器,服务器进行辅助处理。