1.一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,包括如下步骤:
步骤1)采集移动用户上网行为数据,对时间序列进行填充,统计移动用户每秒的上网行为数据频次,并构建出时间序列与数据频次之间的时间-频次矩阵;
步骤2)将时间-频次矩阵按照基于事件驱动的用户上网行为时间序列自动分割方法划分出用户的各个上网行为事件;
步骤3)利用划分出的上网行为事件,提取移动支付事件的相关特征,构建基于数据驱动的移动支付事件识别模型,从而识别出时间-频次矩阵中的移动支付事件;
步骤4)根据词频-逆文档频率算法构建基于知识驱动的移动支付方式主题词提取模型,从所述时间-频次矩阵中提取出移动支付方式中的主题词;
步骤5)融合移动支付事件识别模型和移动支付方式主题词提取模型,构建基于知识与数据共同驱动的移动支付方式识别方法,从而在时间-频次矩阵中识别用户移动支付方式。
2.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,步骤1)所述用户上网行为数据包括用户上网日志数据和用户短信话单数据。
3.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,步骤2)中用户的各个上网行为事件的划分方法具体包括利用用户上网日志数据频次的突变点确定行为事件发生的分割点,且相邻分割点满足最小事件的时间限制,选取前k个距离值最大的分割点,利用用户短信话单数据进一步确定分割点,并依次连接分割点构成用户上网行为事件。
4.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,步骤3)所述的基于数据驱动的移动支付事件识别模型具体包括从划分的用户上网行为事件中提取支付事件相关特征;将打上标签的支付事件特征数据集分为训练集和测试集,并将训练集送入机器学习模型进行训练;将测试集送入训练好的机器学习模型中进行测试,根据测试性能调整机器学习模型相关参数以达到性能标准,从而识别移动支付事件。
5.根据权利要求4所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,所述机器学习模型包括向量支持机、决策树模型,集成模型中任意一个或者多个。
6.根据权利要求4所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,所述的支付事件相关特征包括行为事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次。
7.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,所述移动支付方式主题词提取模型包括将上网日志数据进行规范化,去掉其冗余信息,提取关键字;对所提取的每个关键字计算其词频-逆文档频率值,并进行排序;取前k个词频-逆文档频率值最大的关键字构成移动支付方式主题词;其中,若上网日志数据为URL类型数据,关键字为其HOST值。
8.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,步骤5)中移动支付事件识别模型和移动支付方式主题词提取模型的融合方式包括设置融合函数,将内函数作为数据驱动的移动支付事件识别模型函数fd(x,θd),外函数作为知识驱动的移动支付方式主题词提取模型函数fk(x,θk)的复合方式,即基于知识与数据共同驱动的移动支付方式识别方法函数为fk(fd(x,θd),θk);其中,x表示输入的数据;fk和fd分别为知识驱动子模型和数据驱动子模型函数,θk和θd分别对应知识驱动子模型和数据驱动子模型参数,即θk表示为移动支付方式主题词模型中选取的k个关键字,即θd表示为移动支付事件识别模型中机器学习模型的训练参数。