利索能及
我要发布
收藏
专利号: 2021108319049
申请人: 东华理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种屏幕内容图像质量评估方法,其特征在于,包括以下步骤:

(1)构建屏幕内容图像数据库;

(2)对屏幕内容图像执行文本分割函数,将屏幕内容图像分割为文本区域和图像区域;

(3)对图像区域执行图像区域质量评估函数,提取图像区域的纹理特征和图像结构特征;

(4)对文本区域执行文本区域质量评估函数,提取文本区域的清晰度和文本结构特征;

(5)随机选取一千个屏幕内容图像数据库的屏幕内容图像,将一千个屏幕内容图像的纹理特征、图像结构特征、清晰度、文本结构特征和主观质量分数输入LIBSVM软件中进行训练,获取质量评估模型;

(6)输入待评估的屏幕内容图像,经过步骤(2)、(3)和(4)处理后,将所述待评估的屏幕内容图像的纹理特征、图像结构特征、清晰度、文本结构特征和主观质量分数输入质量评估模型中,获取质量分数;

其中,所述步骤(2)具体包括以下步骤:首先,动态的设置第一阈值,通过

找出所有最大稳定极值区域,其中,Qi表示第一阈值为i时的某一连通区

域,Δ表示微小的第一阈值变化,v(i)为第一阈值是i时的区域Qi的变化率,当v(i)小于给定第一阈值时认为该区域Qi为最大稳定极值区域;其次,设定与区域具有相同标准二阶中心矩的椭圆的离心率的第二阈值、欧拉数的第三阈值、区域中像素数与边界框中总像素的比率的第四阈值和第五阈值、凸包中区域内像素所占的比例的第六阈值,计算最大稳定极值区域的与区域具有相同标准二阶中心矩的椭圆的离心率、欧拉数、区域中像素数与边界框中总像素的比率、凸包中区域内像素所占的比例,当计算得出的与区域具有相同标准二阶中心矩的椭圆的离心率大于第二与之、欧拉数小于第三阈值、区域中像素数与边界框中总像素的比率在下于第四阈值或大于第五阈值、凸包中区域内像素所占的比例限于第六阈值时,可确定第一文本区域;然后,设定笔画宽度变化率的第七阈值,计算第一文本区域的笔画宽度变化率,当变化率大于第七阈值时,可确认第二文本区域,最后,提取并合并所有最大稳定极值区域的第二文本区域作为文本区域,将屏幕内容图像的剩余区域合并作为图像区域;

所述步骤(3)具体包括以下步骤:

S1:提取图像区域的纹理特征,首先,通过Scharr算子计算出图像区域的梯度图,并对梯度图进行归一化: 其中[]为取整运算,gmax为原梯度值的最大值,L为归一化后的最大灰度级数;接着,对图像区域的灰度图进行归一化:

fmax是原灰度图中的灰度最大值;然后,构建灰度‑梯度共生矩阵

M,水平递增为梯度值,垂直递增为灰度值,原点位于矩阵的坐上顶点处;M定义为M(i,j)=#{(m,n)|g(m,n)=i,f(m,n)=j,m=0,1,2...M‑1,n=0,1,2...N‑1},其中M×N为梯度和灰度图的大小,#{}表示为集合中元素的个数,最后,提取灰度‑梯度共生矩阵的统计特征包括:梯度熵 灰度熵能量 灰度均值

梯度均值 梯度标准差

灰度标准差 作为图像区域的纹理特

征,其中,(i,j)出现的总次数归一化为出现的概率P(i,j);

S2:提取图像区域的图像结构特征,首先,对图像区域进行分块,分为大小相等的n×n个局部图像块,并对每个图像块进行局部二维离散余弦变换,以得到DCT系数,接着使用广义高斯分布模型对DCT系数进行拟合,拟合后会得到图像块的形状参数γ,将最低的10%的γ值的平均值作为第一结构特征,所有γ值的均值作为第二结构特征,然后,计算频率变化系数 其中σ|X|是块的方差,μ|X|是块的均值,取 的最大的10%的均值作为第三结构特征,以及将 的均值作为第四结构特征,之后,为从局部图像块中获取方向信息,将DCT系数块分为低、中、高3个频带,然后计算每个频带中的平均能量: 其中n为正整数,σn为频带n的方差,计算子带能量之比: 取Rn的最高的10%的均值作为第五结构特征,取Rn的均值作为第六结构特征,最后,为了提取方向信息,根据径向频率变化的垂直方向沿3个方向将DCT系数分为3个部分,接着计算在3个方向的频率变化系数 计算 的方差,取方差最高的10%均值作为第七结构特征,以及将 的方差的均值作为第八结构特征。

2.根据权利要求1所述的一种屏幕内容图像质量评估方法,其特征在于,所述步骤(4)具体包括以下步骤:S1:提取文本区域的清晰度,首先,在x和y方向进行滤波,并对滤波后的图像比上滤波图像中的最大值进行归一化操作,归一化后的像素点值大于预先设定的阈值时,则该像素点作为可能的边缘像素,接着分别在水平方向和垂直方向计算中值滤波图像差的差ΔDoM,水平方向:ΔDoMx(i,j)=[IM(i+2,j)‑IM(i,j)]‑[IM(i,j)‑IM(i‑2,j)],垂直方向:ΔDoMy(i,j)=[IM(i,j+2)‑IM(i,j)]‑[IM(i,j)‑IM(i,j‑2)],其中,IM(i,j)是中值滤波图像在像素(i,j)处的灰度值,使用偏差为2的差异,在像素(i,j)处的x方向的清晰度定义为:在y方向的清晰度计算方式同理,其中,∑i‑w≤k≤i‑w|

ΔDoMx(k,j)|表明在大小为2w+1的窗口上求和ΔDoM,对边缘处的对比度进行归一化,∑i‑w≤k≤i+w|I(k,j)‑I(k‑1,j)|为在窗口大小为2w+1上的对比度,当Sx(i,j)大于预设阈值时则(i,j)处的像素点为清晰的,最后,该区域的图像的清晰度定义为: 其中:#sharpPixels为清晰的像素点数,#edgePixels为边缘像素点数;

S2:提取文本区域的文本结构特征,首先,计算文本区域的梯度图GM,图像像素点(i,j)处的梯度计算如下: 其中h代表梯度算

子, 代表卷积运算;接着在梯度图上计算旋转不变均匀的局部二值模式LBP,

其中,Δ表示统一

度量 ,U 代表 相邻 像素 数 ,S代 表领 域的 半径 值 ,ρ定 义为阈 值 函数 ,Gk,GC表示为中心坐标及其邻域的GM值,接着计算GMLBP直方图,观察到GMLBP可以包含U+2个不同的模式,这些模式可以组合到直方图的一个bin中,将U设置为8,因此直方图共有10个bin,并在三个尺度下分别计算,所述三个尺度为原始图像,下采样因子为2采样后的图像,下采样因子为4采样后的图像,因此共提取30个文本结构特征。