利索能及
我要发布
收藏
专利号: 2016112548073
申请人: 中南大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于众包的语义提取方法,其特征在于,包括以下步骤:

1)输入用户集合US和任务集合TS,计算用户的历史主题tpc(U)和任务的历史主题tpc(t),定义一个阈值ε1;

2)遍历用户集合US中的每一个用户U,进行步骤3)的操作,遍历结束后跳到步骤5);

3)遍历任务集合TS中的每一个任务t,进行步骤4)的操作,遍历结束跳转到步骤2);

4)如果任务t的历史主题tpc(t)在用户U的历史主题tpc(U)的前ε1个范围之内,则将该任务t推荐给用户U,否则不推荐;

5)遍历所有没有被推荐分配出去的任务,将这些任务随机推荐给用户集合US中的用户,用户集合US中的用户在完成任务后提交语义信息;

6)动态监控用户提交上来的语义信息,将所有用户提交的语义信息放入语义信息集合中,并对语义信息集合质量进行评估,根据质量评估的结果精炼所述语义信息集合,得到最终的语义信息集合。

2.根据权利要求1所述的基于众包的异构媒体语义融合方法,其特征在于,步骤1)中,用户的历史主题tpc(U)的具体计算过程包括:

1)输入用户U的历史标注集合Sha和分类图G;

2)使用广度优先算法遍历搜索G;

3)对于G中的每一个节点h,计算h在Sha中的出现频率tf(h/Sha),并且将计算结果添加到动态数组tpc(U)*中;

4)将tpc(U)*中的tf(h/Sha)进行降序排序,得到用户的历史主题tpc(U)。

3.根据权利要求1所述的语义提取方法,其特征在于,0≤ε1≤1。

4.根据权利要求1所述的语义提取方法,其特征在于,对语义信息集合质量进行评估,根据质量评估的结果精炼用户集合US中的用户提交的语义信息集合的具体实现过程包括:

1)令M为任务集合TS中需要进行语义提取的媒体文档,集合Sm为M的语义信息集合,满足Sm={s1,s2,…,sn},n为M的语义对象个数;si为Sm中的语义对象;i=1,2,…,n;

2)为Sm中每个语义对象si赋权值wi,并设定wi的初始值;

3)在语义检索过程中,如果语义信息集合Sm中的某一语义对象的内容被检索过程使用,或者被用户确定为能够表达该次检索的意图,则将该语义对象的权值wi加1;

4)若某个语义对象的权值小于设定值,则将该语义对象从Sm中去除;

5)重复步骤2)~步骤4),直至遍历完所有Sm中的所有语义对象,得到最终的语义信息集合。

5.根据权利要求4所述的语义提取方法,其特征在于,所述设定值取值为(0,1)。