买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于扩展的sLDA模型对图像进行标题注释的方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于扩展的sLDA模型对图像进行标题注释的方法

￥8000

专利号： 2018107598442

申请人：黑龙江大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-07-12

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于扩展的sLDA模型对图像进行标题注释的方法，其特征在于，包括：步骤一、对于输入的图像，提取图像的局部特征，并利用K‑means算法得到图像的N个视觉词汇wn，其中n∈{1,2...,N}，N为正整数；

所述K‑means算法的聚类中心获取方式为：已知初始的k个均值点m1,...,mk，按照下面两个步骤交替进行：步骤一一、将每个观测点分配到聚类中，使得组内平方和达到最小，即将观测点分配到离它最近的均值点；

步骤一二、对于上一步得到的每一个聚类，以聚类中观测值的图心作为新的均值点；

步骤二、使用LDA模型表示给定文档隐藏变量的后验分布：其中α和β是模型参数，z和θ分别是主题变量和主题比例；

步骤三、在步骤二中引入响应变量y以及响应变量的参数η和δ，同时将并将响应变量分布定义成多变量伯努利分布，即将公式(3)表示为：步骤四、根据基于凸性的LDA推理变分算法将式(5)近似成其中狄利克雷参数γ和多项参数(φ1,φ2,...,φN)均为自由的变分参数；zn为第n个词的主题变量；将log p(θ,z,w|α,β,η,δ)和q(θ,z|γ,φ)期望的差值记作L；

步骤五、求取能够使L的下界达到最大值的变分参数γ和φ；

步骤五具体为：

步骤五一、利用φni最大化L的下界，φni表示第n个视觉词汇由隐藏主题i生成的概率，因此并通过分离包含φni的项并添加适当的拉格朗日乘子来形成拉格朗日函数：ψ(x)是双伽马函数；

计算关于φni的导数：

其中βiv表示对于合适的v的 v为词典的第v个词；

进一步得到在响应变量服从伯努利分布条件下，参数φn的更新公式步骤五二利用γi最大化L的下界，γi表示后验狄利克雷参数的第i个组成部分；包含γi的项：对γi求导：

令导数为零：

迭代方程(16)至(19)直到边界收敛，进而得到能够使L的下界达到最大值的变分参数γ和φ；

步骤六、估计模型参数ψ＝{α,β,η,δ}；

步骤六具体为：

步骤六一、求得参数β的公式为：步骤六二、求得参数α的过程为：对于公式(22)，进行求导得

对公式(23)通过牛顿迭代法求取α的值；其中M表示训练集的文档数目；角标d表示第d篇文档；