1.一种基于大数据云服务的工业互联网数据处理方法,其特征在于,所述方法包括:边缘计算设备通过布置在目标工业设备上的传感器模组获取光电数据、振动数据以及温度数据,并构建原始数据序列,所述原始数据序列包括移动速度序列、坐标序列、位移距离序列、振动幅度序列以及温度序列;
根据预设的时间窗口,将所述移动速度序列、坐标序列、位移距离序列、振动幅度序列以及温度序列分别进行划分为多个子序列,每个子序列中均包含有若干数量的观测值;
分别通过NumPy和SciPy的函数计算各个子序列的统计学特征,提取得到各个子序列的特征值,并将各个子序列的特征值进行组合得到对应的特征向量;
基于所述原始数据序列、各个子序列以及各个子序列对应的特征向量构建序列链表,所述序列链表中记录有特征向量与各个序列之间的映射关系,以及各个子序列的唯一编码;
将所述原始数据序列以及所述序列链表打包为第一数据集;
将所述唯一编码串接至对应子序列的头部,形成串接字段,并将所有串接字段打包为第二数据集;
分别将所述第一数据集和所述第二数据集执行哈希加密,得到对应的第一哈希值和第二哈希值,并将所述第一哈希值串接至所述第一数据集尾部,并将所述第二哈希值串接至所述第二数据集的尾部;
将串接后的第一数据集和第二数据集打包为第三数据集,并基于MQTT协议将所述第三数据集发送至工业互联网云平台进行分析。
2.根据权利要求1中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,在所述边缘计算设备通过布置在目标工业设备上的传感器模组获取光电数据、振动数据以及温度数据之前,还包括:在目标工业设备上部署边缘计算设备以及传感器模组,并使用UART接口将所述传感器模组连接至所述边缘计算设备上,所述传感器模组至少包括光电传感器、振动传感器和温度传感器;
通过所述传感器模组实时监控所述目标工业设备,并将采集到的设备实时信息发送至所述边缘计算设备,所述设备实时信息包括光电数据、振动数据和温度数据。
3.根据权利要求2中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,在所述将采集到的设备实时信息发送至所述边缘计算设备之后,所述方法还包括:所述边缘计算设备通过执行标准差算法检测出所述设备实时信息中的异常值并进行移除;
所述边缘计算设备对所述设备实时信息执行Z‑score算法。
4.根据权利要求1中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,还包括:所述工业互联网云平台对所述第三数据集进行解析和校验后,通过Apache Spark组件进行分析。
5.根据权利要求1中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,所述时间窗口通过使用NumPy函数中的as_strided方法进行划分。
6.根据权利要求1中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,所述分别通过NumPy和SciPy的函数计算各个子序列的统计学特征,提取得到各个子序列的特征值,并将各个子序列的特征值进行组合得到对应的特征向量包括:定义split_into_subsequences函数,并根据所述时间窗口的大小将所述原始数据序列划分为多个子序列;
定义calculate_features函数,并使用NumPy和SciPy计算每个子序列的统计学特征;
定义extract_feature_vectors函数,并提取处每个子序列的特征向量;
所述统计学特征包括均值、标准差、最小值、最大值、偏度和峰度。
7.根据权利要求4中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,所述工业互联网云平台对所述第三数据集进行解析和校验后,通过Apache Spark组件进行分析包括:从存储位置读取所述第三数据集;
使用json库将所述第三数据集解析为JSON数据;
对所述JSON数据计算哈希值,基于所述第一哈希值和所述第二哈希值进行哈希校验;
将解析后的数据保存到HDFS中;
读取存储在HDFS中的数据;
使用Spark中的DataFrame API和SQL进行数据分析。
8.根据权利要求1中所述的基于大数据云服务的工业互联网数据处理方法,其特征在于,所述基于所述原始数据序列、各个子序列以及各个子序列对应的特征向量构建序列链表,所述序列链表中记录有特征向量与各个序列之间的映射关系,以及各个子序列的唯一编码包括:基于UUID库为每个子序列生成对应的唯一编码;
创建一个字典数据结构来存储原始数据序列、子序列及其特征向量,以及唯一编码之间的映射关系。
9.一种基于大数据云服务的工业互联网数据处理装置,其特征在于,所述装置包括:数据获取单元,用于通过布置在目标工业设备上的传感器模组获取光电数据、振动数据以及温度数据,并构建原始数据序列,所述原始数据序列包括移动速度序列、坐标序列、位移距离序列、振动幅度序列以及温度序列;
子序列划分单元,用于根据预设的时间窗口,将所述移动速度序列、坐标序列、位移距离序列、振动幅度序列以及温度序列分别进行划分为多个子序列,每个子序列中均包含有若干数量的观测值;
特征提取单元,用于分别通过NumPy和SciPy的函数计算各个子序列的统计学特征,提取得到各个子序列的特征值,并将各个子序列的特征值进行组合得到对应的特征向量;
链表构建单元,用于基于所述原始数据序列、各个子序列以及各个子序列对应的特征向量构建序列链表,所述序列链表中记录有特征向量与各个序列之间的映射关系,以及各个子序列的唯一编码;
第一数据打包单元,用于将所述原始数据序列以及所述序列链表打包为第一数据集;
第二数据打包单元,用于将所述唯一编码串接至对应子序列的头部,形成串接字段,并将所有串接字段打包为第二数据集;
数据串接单元,用于分别将所述第一数据集和所述第二数据集执行哈希加密,得到对应的第一哈希值和第二哈希值,并将所述第一哈希值串接至所述第一数据集尾部,并将所述第二哈希值串接至所述第二数据集的尾部;
第三数据打包单元,用于将串接后的第一数据集和第二数据集打包为第三数据集,并基于MQTT协议将所述第三数据集发送至工业互联网云平台进行分析。
10.一种基于大数据云服务的工业互联网数据处理装置,其特征在于,所述装置包括:处理器、存储器、输入输出单元以及总线;
所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
所述存储器保存有程序,所述处理器调用所述程序以执行如权利要求1至8任一项所述方法。