利索能及
我要发布
收藏
专利号: 2024113120715
申请人: 威海双子星软件科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于大数据的业务订单分析预测系统,其特征在于,包括:分类模块,用于根据文本分析方法对业务订单进行分类,具体步骤如下:首先获取业务订单文本信息,对业务订单文本信息进行数据预处理除噪声并标准化数据格式;

再从预处理后的业务订单文本信息中提取关键词或短语作为特征:词频统计:统计每个词或短语在文本中出现的频率;

词频‑逆文档频率:使用词频‑逆文档频率方法来评估单词对于一个文本集合中的其中一份文档的重要性;

N元模型:提取N个连续单词的组合,更好捕捉词序信息;

然后使用朴素贝叶斯、支持向量机及深度学习三种机器学习算法训练分类模型;

再将训练好的模型应用于经由预处理后业务订单文本信息中,根据业务订单文本信息中的关键词对订单进行分类:通过设置一个阈值,当模型的预测概率超过这个阈值时,订单被分到相应的类别;当订单属于多个类别,使用多标签分类方法;

再对分类模型的性能进行评估,并根据反馈进行优化;

确定模块,用于对用户的分析需求业务订单类型进行确定,具体过程如下:在完成对业务订单的分类后获取用户的业务订单查询需求,并根据用户的查询需求提取关键特征,并从每个已完成分类的业务订单中提取相对应的特征;

然后通过词频、词频‑逆文档频率或其他文本向量化方法将用户需求的特征和每个分类的业务订单特征转换为数值型特征向量,并将用户需求的特征和分类后的业务订单特征分别标定为A和B;

再使用三种相似度计算方法计算用户需求特征向量与每个分类业务订单特征向量之间的相似度;

然后对以上三种相似度计算方法进行综合分析,具体的:将每种相似度得分标准化到[0, 1]范围内,再根据业务需求或特征的重要性,为每种相似度方法分配不同的权重,使用加权平均或简单平均来计算最终的综合相似度得分,将三种相似度计算方法的权重分别设为w1、w2、w3,得分分别为S1、S2、S3,综合相似度得分通过以下公式计算:  ;

将用户需求的特征和分类后不同的业务订单特征分别进行相似度计算得到不同的综合相似度得分,并将得到的不同的综合相似度得分按照大小进行排序,选取最大的综合相似度得分,并以此对应的分类后的业务订单类型作为用户业务订单查询需求的类型;

分析模块,用于对用户需要查询的业务订单趋势进行分析。

2.根据权利要求1所述的基于大数据的业务订单分析预测系统,其特征在于,所述分类模块对分类模型进行评估的具体过程如下:对分类模型评估通过获取分类模型完成分类后的准确率、召回率、精确率及F1分数进行综合评估;

其中准确率为衡量模型正确分类订单的比例,是模型性能评估指标,表示模型正确分类的订单数占总订单数的比例,计算公式为: ,式中Z为准确率,q和s分别为正确分类的订单数量及总订单数量;

召回率为衡量模型正确识别所有订单的能力,为衡量的是模型正确识别的正类占所有实际正类的比例,计算公式为: ,式中H为召回率,tp和fn分别为真正例和假负例;

精确率为衡量的是被模型识别为正类的订单中,实际为正类的比例,计算公式为:,式中J为精确率,fp为假正例;

F1分数为调和准确率和召回率的指标,用于衡量模型的整体性能,计算公式为:,式中F1为F1分数,当计算得到的F1分数越大时,则对应分类模型的性能越好;

再将得到的准确率、召回率、精确率及F1分数归一化处理后代入以下公式:以得到综评值ZPZ,式

中 分别为准确率、召回率、精确率及F1分数的预设权重系数;

再将计算得到的综评值ZPZ与预设的综评阈值进行比对,当综评值低于预设的综评阈值时,则判断分类模型效果未达标,并根据反馈对模型进行优化。

3.根据权利要求2所述的基于大数据的业务订单分析预测系统,其特征在于,所述分类模块根据反馈对模型进行优化的具体操作步骤如下:反馈来源包括:

用户反馈:从使用分类模型的业务团队和最终用户收集反馈,收集关于模型预测准确性、用户体验和实际业务影响的反馈;

业务指标:监控业务指标,包括客户满意度、订单处理时间及库存周转率;

错误分析:分析模型预测错误的案例;

市场变化:关注市场趋势和客户需求的变化;

具体的优化项如下:

调整模型参数:根据性能指标和用户反馈,调整模型的超参数,包括学习率、树的深度及正则化强度;

特征工程:根据错误分析和用户反馈,改进特征提取和选择过程,包括添加新的特征、修改特征转换方法或删除不相关特征;

模型选择和集成:当确定单一模型无法满足性能要求,使用备用分类模型或采用集成学习方法,包括随机森林、梯度提升机或神经网络的集成;

数据集更新和扩充:根据市场变化和新收集的用户反馈,更新和扩充训练数据集,包括添加新的样本、重新平衡类别分布或引入新的数据源;

持续监控和评估:建立持续的监控和评估机制,定期检查分类模型的性能,并根据最新的数据和反馈进行调整。

4.根据权利要求1所述的基于大数据的业务订单分析预测系统,其特征在于,所述确定模块使用三种相似度计算方法计算用户需求特征向量与每个分类业务订单特征向量之间的相似度的具体操作步骤如下:相似度计算方法包括:

余弦相似度:对于向量A和B,通过测量两个向量的夹角的余弦值来确定它们之间的相似性,公式为:,A·

B为向量点积,‖A‖和‖B‖分别是向量的欧几里得范数即长度;

欧几里得距离;对于向量A和B,欧几里得距离是A和B之间的直线距离,公式为:,

当欧几里得距离越小时,则相似度越高;

Jaccard相似度:对两个集合A和B,Jaccard相似度是两个集合交集的大小除以并集的大小,公式为:,|A ∩ B|是集合A和B的交集的元素

数量,|A ∪ B|是集合A和B的并集的元素数量。

5.根据权利要求1所述的基于大数据的业务订单分析预测系统,其特征在于,所述分析模块对用户需要查询的业务订单趋势进行分析的具体操作步骤如下:首先对大数据中确定的业务订单类型的数据进行预处理,包括数据清洗、整合、归一化及处理缺失值;对预处理后的数据使用统计测试、相关性分析及特征选择算法识别有预测价值的特征,从而确定对趋势预测有影响的特征;

再建立时间序列分析模型来预测未来的趋势,其中时间序列模型包括自回归、移动平均、自回归移动平均和自回归积分滑动平均模型,配合使用随机森林、支持向量机、梯度提升机及神经网络机器学习算法进行趋势预测;

然后对模型进行训练及验证,具体的使用历史订单数据训练选定的模型,并通过交叉验证或保留一部分数据作为测试集来验证模型的预测性能,评估指标包括均方误差、均方根误差及平均绝对误差;

使用训练好的模型对未来的订单趋势进行预测,并根据业务需求预测短期或长期的趋势;

再依据该模型的预测结果建立修正模型,并通过修正模型对预测结果进行修正。

6.根据权利要求5所述的基于大数据的业务订单分析预测系统,其特征在于,所述分析模块通过修正模型对预测结果进行修正的具体操作步骤如下:首先识别和采集影响订单量的关键特征,关键特征包括:季节性因素、促销活动、经济指标、竞争对手行为、市场趋势、客户行为变化及产品更新或库存水平;

再使用爬虫技术、应用程序编程接口调用及第三方数据服务对上述关键特征收集相关数据,并进行初步分析,得到这些特征与订单量之间的关系;

然后对采集到的数据进行特征工程,包括特征提取、转换和选择,使用时间序列分析方法来提取季节性成分,或者使用统计方法来确定哪些特征与订单量的相关性最强;

建立修正模型,通过修正模型根据关键特征的变化来调整基础预测模型的输出,再使用同类型业务订单数据和关键特征数据来训练修正模型;

最后以基础预测模型的输出作为输入,结合关键特征数据,使用修正模型来调整预测结果。