利索能及
我要发布
收藏
专利号: 2022101276121
申请人: 辽宁师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种混合高斯分布和二项分布的两阶段甲骨文字分割方法,其特征在于按照如下步骤进行:步骤1.输入待分割的甲骨卜辞拓片图像I,令其高度为hI像素,宽度为wI像素;

步骤2.将I的颜色空间从RGB转换到HSV,并提取其亮度分量IV;

步骤3.统计IV中所有像素值的归一化直方图hV;

步骤4.利用混合高斯分布模型和相对熵测度对IV进行粗分割;

步骤4.1根据公式(1)和公式(2),建立混合高斯分布模型f(xi|Π,Θ);

所述xi表示IV的第i个像素且i∈{1,2,3,…,hI×wI},C表示混合高斯分布模型中的成分分布数量,j∈{1,2,…,C},πij表示像素xi属于混合高斯分布模型中第j个高斯分布的先验概率,0≤πij≤1且 Pj(xi|Θj)表示混合高斯分布模型中第j个高斯分布的概率密度函数, 表示第j个高斯分布的概率密度函数的参数集,μj和 分别表示第j个高斯分布的数学期望和方差,Π={πij},Θ={Θ1,Θ2,…,ΘC};

步骤4.2将IV的全部hI×wI个像素值作为观测值,采用K‑均值算法进行聚类,令C等于聚类过程所得到的聚类数量,并令Cj表示第j个聚类中心且j∈{1,2,…,C};

步骤4.3利用C个聚类中心对μj进行初始化,令μj=Cj;

步骤4.4根据公式(3),对 进行初始化;

步骤4.5根据公式(4),计算像素xi属于第j个聚类的权重θ(xi,j);

所述Ni表示以像素xi为中心、大小为5×5的邻域,xm表示邻域Ni中的任意像素;

步骤4.6根据公式(5),计算像素xi属于各个聚类的权重之和Γi;

步骤4.7根据公式(6),对πij进行初始化;

步骤4.8利用期望最大化算法求解混合高斯分布模型f(xi|Π,Θ),得到其最优参数集Π和Θ;

* B

步骤4.9令t←1, D←+∞,TZ←1,所述t是一个循环计数器,P表示O

反映背景区域像素值分布的高斯概率密度函数集合,P表示反映甲骨文字区域像素值分布*的高斯概率密度函数集合,D表示最佳的相对熵测度,TZ表示最佳的粗分割阈值;

步骤4.10根据公式(7)和公式(8),建立背景区域的累积直方图pB(t)和甲骨文字区域的累积直方图pO(t);

所述hV(v)表示在直方图hV中亮度值等于v的像素出现的归一化频率;

步骤4.11对于任意的j∈{1,2,…,C},若f(xi|Π,Θ)中第j个高斯分布的概率密度函数B B O OPj(xi|Θj)的数学期望μj小于t,则令P←P∪Pj(xi|Θj),否则,令P←P∪Pj(xi|Θj),从而B利用t将f(xi|Π,Θ)中的C个成分分布划分为两个集合,并设P集合包含NB个高斯概率密度O函数,P集合包含NO个高斯概率密度函数;

步骤4.12根据公式(9),建立反映背景区域像素值分布的混合高斯概率密度函数B所述x表示像素值且x∈{0,1,2,…,255}, 表示P集合的第n个高斯概率密度函数, 表示 在f(xi|Π,Θ)中对应的最优的先验概率, 表示 在f(xi|Π,Θ)中对应的最优的参数集且 μBn表示 的数学期望, 表示的方差;

步骤4.13根据公式(10),建立反映甲骨文字区域像素值分布的混合高斯概率密度函数O所述 表示P 集合的第n个高斯概率密度函数, 表示 在f(xi|Π,Θ)中对应的最优的先验概率, 表示 在f(xi|Π,Θ)中对应的最优的参数集且μOn表示 的数学期望, 表示 的方差;

步骤4.14根据公式(11),计算由多个高斯概率密度函数拟合的归一化先验概率分布pV(v);

所述v表示像素值且v∈{0,1,2,…,255}, 表示当x=v时混合高斯概率密度函数的值, 表示当x=v时混合高斯概率密度函数 的值;

步骤4.15根据公式(12),计算pV(v)与hV(v)之间的相对熵测度D(hV|pV);

* * *

步骤4.16若D(hV|pV)<D,则令TZ←t,D←D(hV|pV),否则,保持D和TZ不变;

步骤4.17令t←t+1,若t≥255,则转入步骤4.18,否则,令 返回步骤

4.10;

步骤4.18将IV中像素值不小于TZ的像素判定为甲骨文字区域,将像素值小于TZ的像素判定为背景区域,从而获得粗分割结果I′V,所述I′V是一幅二值图像;

步骤5.采用半径为r个像素的圆盘型结构元素,对I′V进行形态学顶帽运算,从而去除I′V中与甲骨文字相互粘连的、较大面积的片状斑纹、盾纹和齿缝,得到二值图像I″V,所述r是一个预设常量;

步骤6.对I″V中的每个8‑连通区域进行标记,并将连通面积小于Aconn的8‑连通区域填充为背景,从而去除I″V中残留的离散分布的小面积片状斑纹,得到二值图像I″′V,所述Aconn是一个预设常量;

步骤7.利用基于最大类间方差和二项分布的填充方法对二值图像I″′V进行处理,得到填充后的二值图像步骤7.1对I″′V中的每个8‑连通区域进行标记,令8‑连通区域的总数为Ncon;

步骤7.2计算I″′V中每个8‑连通区域的面积和外接矩形,并令Aα表示第α个8‑连通区域的面积,令Amax表示I″′V中所有8‑连通区域的最大面积,所述1≤α≤Ncon;

步骤7.3统计I″′V中所有8‑连通区域的面积直方图,并令 表示面积为p的8‑连通区域出现的频率,所述p为正整数且1≤p≤Amax;

步骤7.4根据公式(13)‑公式(17),计算出一个自适应的面积阈值AT;

+

mean(p)=Average{Aα|Aα≥p,1≤α≤Ncon}    (14)‑

mean(p)=Average{Aα|Aα

所述count (p)表示面积不小于p的8‑连通区域出现的频率之和,count (p)表示面积小+于p的8‑连通区域出现的频率之和,mean (p)表示面积不小于p的8‑连通区域的平均面积,‑mean (p)表示面积小于p的8‑连通区域的平均面积,Average{·}表示求平均值的函数,表示面积为a的8‑连通区域出现的频率;

步骤7.5遍历I″′V中的每个8‑连通区域,根据公式(18)计算出面积小于AT的所有8‑连通区域的平均面积Aavg;

Aavg=Average{Aα|Aα

步骤7.6.2若当前遍历的8‑连通区域的面积小于AT并且大于Aavg,则将该8‑连通区域判定为甲骨卜辞文字并保持不变;

步骤7.6.3若当前遍历的8‑连通区域的面积小于AT并且小于Aavg,则进一步计算其外接矩形的高宽比Rw_h,若Rw_h≤RT,则将该8‑连通区域判定为甲骨卜辞文字的孤立笔划并保持不变,否则将其判定为残留的兆纹和刻痕,将其填充为背景,所述RT是一个预设常量;

步骤8.输出二值图像