利索能及
我要发布
收藏
专利号: 2020110927480
申请人: 华北科技学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于特征选择与支持向量机模型的矿井突水水源判别方法,其特征在于,包括:步骤S1:确定参与建模的含水层,在所述含水层采集水样,所述水样的数量为至少60组;

步骤S2:测试每组所述水样的水质信息,所述水质信息包括常量元素含量、微量元素含量、pH值、总可溶性固体、硬度和同位素的δ值;

步骤S3:利用多组所述水质信息建立Excel表,将所述Excel表导入R语言,利用所述R语言将多组所述水质信息按照7:3的比例分为训练数据集和测试数据集;

步骤S4:对所述训练数据集采用随机森林的方法进行特征选择,选取3‑6个参数,并得到第一数据集;

步骤S5:将支持向量机模型框架应用于所述第一数据集,建立第一支持向量机模型;

步骤S6:将所述第一支持向量机模型应用于所述第一数据集,删除所述第一数据集中明显错判的样本以形成第二数据集,将支持向量机模型框架应用于所述第二数据集,建立第二支持向量机模型;

在所述步骤S2之后,且在所述步骤S3之前,所述方法还包括:将所述常量元素含量换算成当量浓度百分数,将所述微量元素含量换算成当量浓度;

在步骤S4中,所述采用随机森林的方法进行特征选择的步骤如下:(1)、设数据集X共包含N个样本,使用Bootstrap自助法从数据集中随机放回式抽取N个样本装入袋中,作为训练数据集;

(2)、共进行k次抽取,故可获得k个训练数据集;

(3)、用k个数据集共可得到k个决策树,形成一个随机森林的模型;

(4)、使用平均不纯度减少值来选择重要的预测特征;

在所述步骤S6后,所述方法还包括:利用所述测试数据集的数据对所述第二支持向量机模型的准确性进行评价;

在所述步骤S6后,所述方法还包括:将所述第二支持向量机模型应用于实际的预测判别环境进行验证;

所述含水层包括地表水、第四系含水层、煤系砂岩含水层、老空水和灰岩含水层中的至少两个,且应同时包含煤系砂岩含水层和灰岩含水层;

所述建立第一支持向量机模型和所述建立第二支持向量机模型应用所述R语言的e1071包完成。