利索能及
我要发布
收藏
专利号: 2016103807469
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-11-12
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于用户间相似关系的广告点击率预测方法,其特征在于,包括如下步骤:

步骤001.根据服务器中的广告点击日志,分别针对各个用户,获得用户在预设筛选周期内其所有的搜索关键词,以及该用户在预设筛选周期内分别针对向其展示的各支广告的点击率,然后进入步骤002;

步骤002.针对所有用户,获得所有两两用户之间在预设筛选周期内搜索关键词上的相似度值,再选取大于预设相似度阈值的各个相似度值所分别对应的两两用户,分别构成各组具有直接相似关系的两个用户,并获得该各组两个用户之间的依赖关系,根据各组两个用户之间的依赖关系,确定各个用户的直接相似用户,然后进入步骤003;

步骤003.针对各组具有直接相似关系的两个用户,以及各组两个用户之间的依赖关系建立贝叶斯网络模型,其中,各个用户分别采用各个用户节点表示,各组具有直接相似关系的两个用户之间的依赖关系采用用户节点之间的有向箭头表示,然后进入步骤004;

步骤004.分别针对贝叶斯网络模型中的各个用户节点,若用户节点存在用户父节点,则获得该用户节点分别在其各个用户父节点点击广告和不点击广告两种状态的不同组合下,其对应点击广告状态的后验概率,即获得该用户节点以其各个用户父节点分别作为各个直接相似用户,在各个直接相似用户点击广告和不点击广告两种状态的不同组合下,该用户节点对应点击广告状态的后验概率;若用户节点不存在用户父节点,则获得该用户节点对应点击广告状态和不点击广告状态的概率;然后进入步骤005;

步骤005.根据贝叶斯网络模型的结构,以及不存在用户父节点的各个用户节点,对应点击广告状态和不点击广告状态的概率,分别针对贝叶斯网络模型中的各个用户节点,获得用户节点分别相对与其间接联系的其它各个用户节点在点击广告状态下,该用户节点对应点击广告状态的后验概率,并选取大于预设概率阈值的各个后验概率所分别对应的两个间接联系的用户节点,即分别构成各组具有间接相似关系的两个用户,然后进入步骤006;

步骤006.获得对应于目标预测用户的各个直接相似用户、各个间接相似用户,并进一步获得目标预测用户分别相对各个直接相似用户点击广告和不点击广告两种状态的不同组合下,目标预测用户对应点击广告状态的后验概率;以及目标预测用户分别相对各个间接相似用户在点击广告状态下,目标预测用户对应点击广告状态的后验概率,即将目标预测用户的直接相似用户、间接相似用户统称为相似用户,获得目标预测用户相对其各位相似用户、分别对应其点击广告状态的后验概率;然后进入步骤007;

步骤007.根据各个用户在预设筛选周期内分别针对向其展示的各支广告的点击率,获得目标预测用户相对各位相似用户、分别对应其点击广告状态的后验概率分别与对应各个相似用户针对目标广告的点击率的乘积,最后将各个乘积相加后乘以归一化因子所得值,即为目标预测用户针对目标广告的预测点击率。

2.根据权利要求1所述一种基于用户间相似关系的广告点击率预测方法,其特征在于:

所述步骤001具体包括如下步骤:

步骤001-1.根据服务器中的广告点击日志,分别针对各个用户,获得用户在预设筛选周期内其所有的搜索关键词、各支广告分别在预设筛选周期内向该用户的展示次数,以及该用户在预设筛选周期内分别针对向其展示的各支广告的点击次数,然后进入步骤001-2;

步骤001-2.分别针对各个用户,根据各支广告分别在预设筛选周期内向用户的展示次数,以及该用户在预设筛选周期内分别针对向其展示的各支广告的点击次数,获得该用户在预设筛选周期内分别针对向其展示的各支广告的点击率,然后进入步骤002。

3.根据权利要求1所述一种基于用户间相似关系的广告点击率预测方法,其特征在于:

所述步骤002具体包括如下步骤:

步骤002-1.针对所有用户,获得所有对两两用户,分别针对各对两两用户,根据用户在预设筛选周期内其所有的搜索关键词,获得两个用户在预设筛选周期内共同搜索关键词的个数占该两个用户在预设筛选周期内所有搜索关键词的个数的比值,作为该对两两用户之间在预设筛选周期内搜索关键词上的相似度值,由此获得所有用户中各对两两用户之间在预设筛选周期内搜索关键词上的相似度值,然后进入步骤002-2;

步骤00202.选取大于预设相似度阈值的各个相似度值所分别对应的两两用户,分别构成各组具有直接相似关系的两个用户,并进入步骤002-3;

步骤002-3.分别针对各组具有直接相似关系的两个用户A和B,在预设筛选周期内做如下判断,然后进入步骤003;

判断若A、B两个用户共同搜索关键词的个数占A用户所有搜索关键词个数的比值,大于A、B两个用户共同搜索关键词的个数占B用户所有搜索关键词个数的比值,则A、B两个用户之间的依赖关系为用户A指向用户B,即用户A为用户B的用户父节点,用户B为用户A的用户子节点,即用户A为用户B的直接相似用户;

判断若A、B两个用户共同搜索关键词的个数占B用户所有搜索关键词个数的比值,大于A、B两个用户共同搜索关键词的个数占A用户所有搜索关键词个数的比值,则A、B两个用户之间的依赖关系为用户B指向用户A,即用户B为用户A的用户父节点,用户A为用户B的用户子节点,即用户B为用户A的直接相似用户;

判断若A、B两个用户共同搜索关键词的个数占B用户所有搜索关键词个数的比值,等于A、B两个用户共同搜索关键词的个数占A用户所有搜索关键词个数的比值,则进一步查看A、B两个用户之间是否已存依赖关系,是则针对A、B两个用户不做进一步操作;否则针对A、B两个用户之间随机设定依赖关系。

4.根据权利要求1所述一种基于用户间相似关系的广告点击率预测方法,其特征在于:

所述步骤004具体包括如下步骤:

分别针对贝叶斯网络模型中的各个用户节点,将用户节点作为当前用户节点,按如下步骤进行操作:

步骤004-1.判断当前用户节点是否存在用户父节点,是则进入步骤004-2;否则进入步骤004-5;

步骤004-2.获得当前用户节点所对应用户父节点的个数N,根据各个用户节点分别对应点击广告和不点击广告的两种状态,将点击广告状态定义为1,不点击广告状态定义为0,进而获得当前用户节点不同状态与其所有用户父节点不同状态之间组合所构成的2的N+1次方个状态,然后进入步骤004-3;

步骤004-3.分别针对当前用户节点与其所有用户父节点之间组合所构成的各个状态,进一步分别针对状态中的各个用户节点,若用户节点状态为1,则取该用户节点在预设筛选周期内其所有的搜索关键词作为该用户节点的临时关键词;若用户节点状态为0,则在预设筛选周期内,取贝叶斯网络模型中所有用户节点的所有搜索关键词与该用户节点的所有的搜索关键词的差集,作为该用户节点的临时关键词,然后进入步骤004-4;

步骤004-4.分别针对当前用户节点与其所有用户父节点之间组合所构成的各个状态,获得状态中所有用户节点临时关键词的交集的关键词个数与状态中当前用户节点的所有用户父节点临时关键词的交集的关键词个数的比值,作为当前用户节点在该状态中的后验概率;由此获得当前用户节点在其各个用户父节点点击广告和不点击广告两种状态的不同组合下,当前用户节点对应点击广告状态的后验概率,即获得当前用户节点以其各个用户父节点分别作为各个直接相似用户,在各个直接相似用户点击广告和不点击广告两种状态的不同组合下,当前用户节点对应点击广告状态的后验概率;

步骤004-5.针对当前用户节点对应点击广告的状态,则在预设筛选周期内,取当前用户节点所有搜索关键词个数与贝叶斯网络模型中所有用户节点的所有搜索关键词个数的比值作为当前用户节点对应点击广告状态的概率;同时,针对当前用户节点对应不点击广告的状态,则在预设筛选周期内,取贝叶斯网络模型中所有用户节点的所有搜索关键词与当前用户节点所有搜索关键词的差集的搜索关键词的个数与贝叶斯网络模型中所有用户节点的所有搜索关键词的个数的比值,作为当前用户节点对应不点击广告状态的概率;由此获得当前用户节点对应点击广告状态和不点击广告状态的概率。

5.根据权利要求1所述一种基于用户间相似关系的广告点击率预测方法,其特征在于:

所述步骤005中,采用吉布斯采样方法,根据贝叶斯网络模型的结构,以及不存在用户父节点的各个用户节点,对应点击广告状态和不点击广告状态的概率,分别针对贝叶斯网络模型中的各个用户节点,获得用户节点分别相对与其间接联系的其它各个用户节点在点击广告状态下,该用户节点对应点击广告状态的后验概率。

6.根据权利要求5所述一种基于用户间相似关系的广告点击率预测方法,其特征在于:

所述步骤005中,采用吉布斯采样方法,分别针对贝叶斯网络模型中的各个用户节点,将用户节点作为当前用户节点,获得当前用户节点分别相对与其间接联系的其它各个用户节点在点击广告状态下,当前用户节点对应点击广告状态的后验概率,具体包括如下步骤:步骤005-1.在与当前用户节点间接联系的其它各个用户节点当中,将对应点击广告状态的用户节点作为证据变量e,当前用户节点作为目标变量t,将贝叶斯网络模型中除证据变量、目标变量以外的其它用户节点作为非证据变量q,分别针对贝叶斯网络模型中的各个用户节点,将用户节点的用户父节点、用户子节点,以及用户子节点的用户父节点作为该用户节点的马尔可夫覆盖;然后进入步骤005-2;

步骤005-2.初始化所有用户节点的状态作为第一个样本,将证据变量状态赋值为1,非证据变量随机赋予状态0或1,并进入步骤005-3;

步骤005-3.循环非证据变量,对每一个非证据变量q,利用步骤004中后验概率的计算,计算当前非证据变量q在其马尔可夫覆盖中每个用户节点状态条件下的其分别为0和1的后验概率,然后进入步骤005-4;

步骤005-4.随机产生一个在0至当前非证据变量q为0和1的条件概率之和的随机数,若该随机数小于等于其为0的条件概率,则将当前非证据变量的状态改为0,若该随机数大于其为0的条件概率,且小于其为0和1的条件概率之和,则将当前非证据变量的状态改为1,由此更新每一个非证据变量的状态作为新的样本,然后进入步骤005-5;

步骤005-5.重复步骤005-2至步骤005-4步骤,不断抽样产生新的样本,统计所有样本中目标变量状态为1的样本数n,计算目标变量状态为1的样本数n与抽样次数s的比值,即为当前用户节点在已确定某一用户节点状态为1的条件下其本身也为1的后验概率。

7.根据权利要求1所述一种基于用户间相似关系的广告点击率预测方法,其特征在于:

所述步骤007中归一化因子的获得通过如下方法:

首先在预设筛选周期内,获得目标预测用户的各个相似用户分别针对向其展示的各支广告的点击率之和,再计算1与该点击率之和的比值,即作为归一化因子。