1.一种基于众包的异构媒体语义融合方法,其特征在于,包括以下步骤:
1)输入用户集合US和任务集合TS;
2)定义一个阈值ε1,0≤ε1≤1;
3)计算用户的历史主题tpc(U)和任务的历史主题tpc(t);
4)遍历US集合中的每一个用户U,进行步骤5)的操作,遍历结束后跳到步骤7);
5)遍历TS集合中的每一个任务t,进行步骤6)的操作,遍历结束跳转到步骤4);
6)如果该任务t的历史主题tpc(t)在用户U的历史主题tpc(U)的前ε1个范围之内,则将该任务t推荐给用户U,否则不推荐;
7)遍历所有没有被推荐分配出去的任务t,将这些任务随机推荐给US中的用户;
8)输入媒体文件M,并定义它的语义实体为SO;
9)获取M的一个标注Ai并且将Ai存储到SO中;
10)分配SO的重要性wi;
11)遍历US中的每一个用户,进行步骤12);
12)如果M可以通过Ai获取,那么ki=1,否则ki=0,然后累加ωi*=wi+ki/|U|;|U|是提供标注的众包用户数量;
13)加载媒体文件M的语义实体SO,定义一个阈值ε2,0≤ε2≤1;
14)加载媒体文件M的标注集合SetM,并且计算其标注重要性的均值
15)遍历每一个用户,进行步骤16);
16)如果编号为j的用户的标注的重要性 那么从SetM中删除该用户的标注Aj。
2.根据权利要求1所述的基于众包的异构媒体语义融合方法,其特征在于,步骤3)中,用户的历史主题tpc(U)的具体计算过程包括:
1)输入用户U的历史标注集合Sha和分类图G;
2)使用广度优先算法遍历搜索G;
3)对于G中的每一个节点h,计算h在Sha中的出现频率tf(h/Sha),并且将计算结果添加到动态数组tpc(U)*中;
4)将tpc(U)*中的tf(h/Sha)进行降序排序,得到用户的历史主题tpc(U)。
3.根据权利要求1所述的基于众包的异构媒体语义融合方法,其特征在于,语义实体SO通过两种方式和其相对应的媒体文件M合并:第一种:在线方式,SO通过软件提交并隐藏在新的媒体文件中;第二种:离线方式,SO保存在一个文件中,用户在软件中选择一个媒体文件与SO合并。
4.根据权利要求3所述的基于众包的异构媒体语义融合方法,其特征在于,将媒体文件M与用户标注的语义实体SO合并之后,以如下方式进行存储:定义一个S_MFILE类,该类中包含一个byte型指针SemanticData指向语义实体SO和一个MFILE型结构体指针media,该指针的结构体MFILE包含一个byte型指针MediaData指向该媒体文件的二进制数据。