1.一种基于自适应最近邻模型的瓦斯浓度预测方法,其特征在于,包括以下步骤:S1.在矿井下设置监测点,获取监测点的初始瓦斯数据,对初始瓦斯数据进行预处理得到瓦斯训练数据,并用该瓦斯训练数据作为最近邻模型的训练集进行训练;
S2.实时采集监测点一小时内的瓦斯数据,并将其构造为包括特征值和浓度值的二元组样本集,所述瓦斯数据包括监测点的瓦斯记录时间和瓦斯浓度值;
S3.获取最新一小时的二元组样本集,并对最新一小时的二元组样本集进行归一化得到最新一小时的瓦斯样本集,并将该最新一小时的瓦斯样本集加入到最近邻模型的训练集中;
S4.采用样本去噪方法处理最近邻模型的训练集,处理后的最近邻模型的训练集中包括最新一小时的瓦斯样本集;
步骤S4中采用样本去噪方法处理最近邻模型的训练集的过程包括:S41.初始化旧样本集,使旧样本集为空集;并将训练集中最新一小时的瓦斯样本集作为新样本集;
S42.新样本集中的每个瓦斯样本与训练集中最新一小时前的全部瓦斯样本逐个计算特征间欧式距离值,并将小于预设值d的欧式距离值所对应的最新一小时前的瓦斯样本加入旧样本集;
S43.计算新样本集与旧样本集的累计经验分布最大差值;
S44.给定预设置信度α,若累计经验分布最大差值大于预设置信度α,则将训练集中最新一小时前的全部瓦斯样本删除;若累计经验分布最大差值不大于预设置信度α,则维持当前训练集;
累积经验分布最大差值Dlabel的计算公式为:
Dlabel=sup|YN(y)‑Y(y)|
其中,YN(y)表示最新一小时瓦斯浓度值的累计经验分布,Y(y)表示最新一小时前瓦斯浓度值的累计经验分布,sup表示上界;
S5.根据训练集中的最新一小时的瓦斯样本集查找已删除数据,并使用样本重用策略对查找到的已删除数据进行判定,将判定结果为有效的已删除数据重新放入最近邻模型的训练集,并根据当前的训练集重新训练当前的最近邻模型;
步骤S5的具体过程包括:
S51.根据最新一小时的瓦斯样本集查找N个最邻近的已删除数据,其中已删除数据为被样本去噪方法删除的全部数据;
S52.设置权重阈值,并计算每一个最邻近的已删除数据的权重,将权重大于权重阈值的最邻近的已删除数据重新放入最近邻模型的训练集;
每一个最邻近的已删除数据s=(x,y)的权重计算公式为:其中,x为已删除数据的特征值,y为已删除数据的浓度值,Nc(s)表示旧样本集,yi表示Nc(s)中第i个旧样本的浓度值,w(s,t)表示已删除数据s在t时刻的权重,Δ表示指示函数;
S6.根据最新一小时的瓦斯样本集的特征,在最近邻模型的训练集中查找K个最邻近瓦斯数据并加权求和预测得到待预测一小时的瓦斯浓度。
2.根据权利要求1所述的一种基于自适应最近邻模型的瓦斯浓度预测方法,其特征在于,步骤S6中根据K个最邻近瓦斯数据的距离进行加权求和的公式为:其中,表示预测值,zt表示最新一小时的瓦斯样本的特征,zi表示第i个最邻近瓦斯样*本的特征,K表示预设的最邻近瓦斯样本个数,yi表示第i个最邻近瓦斯样本的浓度值。
3.一种实现权利要求1‑2任意一项所述的一种基于自适应最近邻模型的瓦斯浓度预测方法的瓦斯浓度预测装置,其特征在于,包括:数据存储模块,用于存储最近邻模型的训练集;
数据实时获取模块,用于实时获取一小时内的待处理瓦斯数据,并将其构造为包括特征值和浓度值的二元组样本集,所述瓦斯数据包括监测点的瓦斯记录时间和瓦斯浓度值;
预处理模块,用于对待处理瓦斯数据的二元组样本集进行最大值最小值归一化得到待处理瓦斯数据的瓦斯样本集,并将该瓦斯样本集加入数据存储模块;
去噪模块,用于根据样本去噪方法对加入了待处理瓦斯数据的瓦斯样本集的数据存储模块进行数据删除处理;
旧数据重用模块,用于根据待处理瓦斯数据的瓦斯样本集查找已删除数据,并使用样本重用策略对查找到的已删除数据进行判定,将判定结果为有效的已删除数据重新放入数据存储模块;
预测模块,用于根据待处理瓦斯数据的瓦斯样本集的特征,在数据存储模块中查找K个最邻近瓦斯数据并加权求和预测得到待预测一小时的瓦斯浓度。