利索能及
我要发布
收藏
专利号: 2023107203129
申请人: 济南幼儿师范高等专科学校
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于虚拟声乐教学的面部图像分析方法,其特征在于,包括:

采集使用者使用虚拟声乐教学辅助系统练习的实时图像;

根据所述实时图像中像素点的运动速度与运动方向,确定所述实时图像的重点区域;

根据所述重点区域中各条线段中像素点的数量以及运动速度,确定重点区域中每条线段的特征点;

根据所述特征点,以及对所述实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,获得增强后的实时图像;

所述根据所述实时图像中像素点的运动速度与运动方向,确定所述实时图像的重点区域,包括:根据所述实时图像中两个像素点分别对应的运动速度与运动方向,确定在所述运动方向上所述两个像素点对应的运动速度的差值与第一像素点对应的运动速度之间的比值,获得第一运动速度差异,所述两个像素点包括第一像素点和第二像素点;

在所述第一运动速度差异小于预设运动速度差异时,则执行根据第三像素点与所述第一像素点确定的第二运动速度差异,依此类推,直至第N运动速度差异大于或等于预设运动速度差异时,则确认第一像素点、第二像素点至第N像素点属于所述实时图像中人脸区域中的运动区域,所述N为大于2的整数,所述第N运动速度差异包括根据第N像素点与所述第一像素点分别对应的运动速度与运动方向,确定在所述运动方向上所述第N像素点与所述第一像素点对应的运动速度的差值与第一像素点对应的运动速度之间的比值;

所述确认第一像素点、第二像素点至第N像素点属于所述实时图像中人脸区域中的运动区域之后,还包括:对所述运动区域中各像素点对应的灰度值进行平均计算,确定平均灰度值;

根据所述平均灰度值,通过聚类方法将所述运动区域进行聚类,获得第一运动区域;

所述根据所述平均灰度值,通过聚类方法将所述运动区域进行聚类,获得第一运动区域之后,还包括:将所述第一运动区域中第i像素点和第i+1像素点分别对应的灰度值进行相减处理,获得第一灰度差异值,i为大于0的整数;

若所述灰度差异值小于预设灰度差异值时,执行根据第i+2像素点与所述第i像素点确定的第二灰度差异值,依此类推,直至第i+N运动速度差异大于或等于预设运动速度差异时,则确认第i像素点、第i+1像素点至第i+N像素点属于所述实时图像中人脸区域中的重点区域,所述N为大于2的整数,所述第i+N运动速度差异包括将所述第一运动区域中第i像素点和第i+N像素点分别对应的灰度值进行相减处理,获得的差值;

所述根据所述重点区域中各条线段中像素点的数量以及运动速度,确定重点区域中每条线段的特征点,包括:根据所述重点区域中一线段上的像素点Z,将所述线段分为第一部分和第二部分;

将所述第一部分上各像素点的灰度值、所述第二部分上各像素点的灰度值、所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度,确定第一函数值A;

将第一像素点个数、第二像素点个数和预设正数,确定第二函数值B,所述第一像素点个数包括所述第一部分上各像素点的个数,所述第二像素点个数包括所述第二部分上各像素点的个数;

将所述第一函数值A和所述第二函数值B的乘积,确定为特征点优选值YX;

根据所述线段上各像素点Z点对应的特征点优选值YX,确定最大的特征点优选值YX为所述条线段中的特征点。

2.根据权利要求1所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述将所述第一部分上各像素点的灰度值、所述第二部分上各像素点的灰度值、所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度,确定第一函数值A,包括:将所述第一部分上各像素点的灰度值和所述第二部分上各像素点的灰度值相减,获得第一灰度差值;

将所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度相减,获得第一运动速度差值;

将所述第一灰度差值与所述第一运动速度差值通过指数函数处理,确定第一函数值A。

3.根据权利要求2所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述将所述第一灰度差值与所述第一运动速度差值通过指数函数处理,确定第一函数值A,包括:根据第一函数值

,确

定第一函数值A,其中, 中为所述线段的第一部分中第i个像素点的灰度值, 中为第i个像素点在第二部分中的灰度值, 为第一部分中第i个像素点的运动速度, 为第i个像素点在第二部分中对应像素点的运动速度, 为像素点z点将水平线段分割成两部分后第一部分的像素点个数, 为第二部分的像素点个数。

4.根据权利要求1所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述将第一像素点个数、第二像素点个数和预设正数,确定第二函数值B,包括:根据第二函数值 ,确定第二函数值B,其中, 为像素点z点将

水平线段分割成两部分后第一部分的像素点个数, 为第二部分的像素点个数,为预设正数。

5.根据权利要求3或4所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述根据所述特征点,以及对所述实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,获得增强后的实时图像,包括:根据第q像素点的 邻域中第i个像素点的灰度值,和像素点q点的灰度值,确定q点为噪声点的概率P,所述第q像素点为所述特征点;

根据第q像素点所对应的信息丰富度Y、拉普拉斯Laplacian值L、概率P,和/或最大值,确定权重因子C,所述概率P包括第q像素点为噪声的概率,所述最大值 包括所述实时图像中各像素值进行拉普拉斯Laplacian处理后最大的拉普拉斯Laplacian值,所述第q像素点所对应的信息丰富度Y包括根据第q像素点的运动速度、第q像素点与所述特征点之间的距离及第q像素点所在第一运动区域的像素点数量确定的;

根据所述权重因子C以及所述第q像素点所对应的Laplacian值,确定像素点q增强后的像素点灰度值 。

6.根据权利要求5所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述根据所述权重因子以及所述实时图像中各像素点所对应的Laplacian值,确定增强后的灰度值 ,包括:通过 ,确定像素点q增强后的像素点灰度

值 ,其中, 为像素点q点的像素值,c为权重因子, 为像素点q点的Laplacian值。