利索能及
我要发布
收藏
专利号: 2018104804630
申请人: 徐庆
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像文本及形音义特征识别方法,其特征在于,包括以下步骤:

对待处理图像的图像特征描述符进行分割,得到各最小单元;所述最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串;

按照预设最小单元组合规则对各所述最小单元进行组合,得到各组合单元数据;

基于所述组合单元数据检索样本图像数据库,得到匹配所述组合单元数据的样本图像,并获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率;所述样本图像数据库包含所述样本图像的各最小单元、所述样本图像的各组合单元数据和所述样本图像已记录的文本及形音义特征;

选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像,并将所述选取出的样本图像已记录的文本及形音义特征作为所述待处理图像的文本及形音义特征。

2.根据权利要求1所述的图像文本及形音义特征识别方法,其特征在于,所述图像特征描述符为采用相同或高度相似的字符串、对所述待处理图像中具有相同感知内容或特征进行记录,而采用不同的字符串、对所述待处理图像中具有不同感知内容或特征进行记录的图像特征表示形式;所述图像特征表示形式为描述所述待处理图像的图像特征的一组或多组字符串的集合;

所述预设最小单元组合规则包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则;

所述组合单元数据为根据所述预设最小单元组合规则对各所述最小单元进行组合得到的、用于存储以及作为所述检索的关键词的字符串数据;

所述样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像;所述样本图像数据库包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;所述形音义特征包括形状特征、读音特征以及含义特征;

对待处理图像的图像特征描述符进行分割,得到各最小单元的步骤之前还包括步骤:提取所述待处理图像的所述图像特征描述符;

和/或

建立所述样本图像数据库。

3.根据权利要求2所述的图像文本及形音义特征识别方法,其特征在于,建立所述样本图像数据库的步骤包括:记录所述样本图像的可认读的文字内容、读音、文字组合的含义,商标图形要素编码,图像信息编码以及所述形音义特征;

对所述样本图像进行图像特征描述符分割以及最小单元组合处理,得到所述样本图像的各最小单元以及所述样本图像的各组合单元数据。

4.根据权利要求2所述的图像文本及形音义特征识别方法,其特征在于,所述图像轮廓线的图像特征描述符的最小单元组合规则包括:将任一图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,所述第一预设定长的取值范围为大于或等于所述图像轮廓线上的线段总长的20%;

所述图像骨架线的图像特征描述符的最小单元组合规则包括:将任一图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,所述第二预设定长的取值范围为大于或等于所述图像骨架线上的线段总长的20%。

5.根据权利要求2所述的图像文本及形音义特征识别方法,其特征在于,所述图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;

所述最小单元为所述任一规格的标准坐标系的任一坐标区域所对应所述图像轮廓线或所述图像骨架线的一个或多个像素点的位置数据。

6.根据权利要求1至5任意一项所述的图像文本及形音义特征识别方法,其特征在于,获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率的步骤包括:获取所述待处理图像的最小单元的总数,所述样本图像匹配所述待处理图像的最小单元合计数,所述样本图像不匹配所述待处理图像的最小单元合计数;

基于以下公式得到所述最小单元匹配率:

Ma=(Ua÷U0)×100%

其中,Ma表示所述最小单元匹配率,U0表示所述待处理图像的最小单元的总数,Ua表示所述样本图像匹配所述待处理图像的最小单元合计数;

基于以下公式得到所述最小单元不匹配率:

Mi=(Uc÷U0)×100%+(n-1)×ω

其中,Mi表示所述最小单元不匹配率,U0表示所述待处理图像的最小单元的总数,Uc表示所述样本图像不匹配所述待处理图像的最小单元合计数,n表示所述样本图像与所述待处理图像在图像特征线上所不相匹配的处数,ω表示所述处数的权数;其中,ω的取值范围为小于或等于50%。

7.根据权利要求1至5任意一项所述的图像文本及形音义特征识别方法,其特征在于,选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像的步骤包括:选取出所述最小单元匹配率大于或等于预设最小单元匹配率,且所述最小单元不匹配率小于或等于预设最小单元不匹配率的各初步匹配样本图像;

对各所述初步匹配样本图像的所述最小单元匹配率进行排序,对各所述初步匹配样本图像的所述最小单元不匹配率进行排序,将所述最小单元匹配率和所述最小单元不匹配率的排序名次符合预设排序名次的初步匹配样本图像作为所述满足预设应用需求的样本图像。

8.根据权利要求7所述的图像文本及形音义特征识别方法,其特征在于,所述预设应用需求包括所述预设最小单元匹配率的取值范围、所述预设最小单元不匹配率的取值范围以及所述预设排序名次的取值范围;

其中,所述预设最小单元匹配率的取值范围为大于30%;所述预设最小单元不匹配率的取值范围为小于70%;所述预设排序名次的取值范围为前100名以内;

对各所述初步匹配样本图像的所述最小单元匹配率进行排序,对各所述初步匹配样本图像的所述最小单元不匹配率进行排序的步骤包括:对各所述最小单元匹配率由大至小进行排序,对所述最小单元不匹配率由小至大进行排序,将排序名次符合预设排序名次的初步匹配样本图像作为所述满足预设应用需求的样本图像。

9.一种图像文本及形音义特征识别装置,其特征在于,所述装置包括:

分割模块,用于对待处理图像的图像特征描述符进行分割,得到各最小单元;所述最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串;

组合模块,用于按照预设最小单元组合规则对各所述最小单元进行组合,得到各组合单元数据;

检索模块,用于基于所述组合单元数据检索样本图像数据库,得到匹配所述组合单元数据的样本图像,并获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率;所述样本图像数据库包含所述样本图像的各最小单元、所述样本图像的各组合单元数据和所述样本图像已记录的文本及形音义特征;

筛选模块,用于选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像,并将所述选取出的样本图像已记录的文本及形音义特征作为所述待处理图像的文本及形音义特征。

10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。