1.一种网络数字虚拟资产的分类和识别方法,其特征在于,包括步骤:数据处理模块检测获取网络虚拟资产数据建立结构体数据库,并创建一个与结构体数据库关联的数据源;
对关联的数据源进行滤波去噪处理后进行系统聚类,获得聚类数K;使用Ward聚类法对数据源进行聚类,利用自组织特征映射神经网络对聚类数据进行分类,得到聚类数K对应网络隐藏层的输出概率矩阵,根据输出概率矩阵,获得最佳分类数K*;根据最佳分类数K*和样本数据构建自组织特征映射神经网络分类器,并确定每类别的质心,构建Hausdorff距离矩阵H,根据距离矩阵确定虚拟资产类别标签。
2.根据权利要求1所述的方法,其特征在于,获得聚类数K进一步包括,当得到聚类数范围[Kmin,Kmax]后,选取范围[Kmin,Kmax]内的K个整数作为聚类数。
3.根据权利要求1所述的方法,其特征在于,将每个类别的质心对应的二进制字符串依次分组获得类中心特征向量,利用词库模型把网络虚拟资产类别转化成特征向量,计算上述特征向量之间的Hausdorff距离,用Hausdorff距离度量两个网络虚拟资产类别间的最大不匹配程度。
4.根据权利要求1或2所述的方法,其特征在于,根据输出概率矩阵,调用公式计算聚类数K对应的最佳分类数评价指标D(K,P,N),选取最佳分类数评价指标的最大值对应的聚类数作为最佳分类数K*。
5.根据权利要求3所述的方法,其特征在于,计算特征向量之间的Hausdorff距离具体包括:根据公式H(A,B)=max{h(A,B),h(B,A)}确定特征向量集合A与特征向量集合B之间的双向Hausdorff距离H(A,B),其中,A=(a1,a2…,ap)为类别A的样本集合,B=(b1,b2…,bq)为类
别B的样本集合,h(A,B)是从集合A到集合B的单向Hausdorff距离,h(B,A)是从集合B到集合A的单向Hausdorff距离。
6.根据权利要求5所述的方法,其特征在于,根据Hausdorff距离,建立Hausdorff距离矩阵H, 距离矩阵H中每行的最小元素对应的类别为匹配类别,获得从自组织映射神经网络得到的类别标签,当出现多重匹配时,以矩阵中元素最小者对应的类别确定类别标签,其中,dij表示第i个已知虚拟资产类与自组织映射神经网络得到的第j个类间的Hausdorff距离。
7.根据权利要求1-6其中之一所述的方法,其特征在于,设定自组织神经网络分类器的输出神经元个数为K*,训练集中每个样本数据由一个Q维向量表示,用一维线阵结构表示输出节点的排列形式,对权值进行训练以获得自组织神经网络分类器。
8.一种网络数字虚拟资产的分类和识别系统,包括:数据处理模块,预分类模块,精确分类模块,评价模块,数据处理模块检测获得的网络虚拟资产数据建立结构体数据库,并创建一个与结构体数据库关联的数据源,对关联数据进行滤波去噪处理;预分类模块对滤波去噪处理后的数据源进行系统聚类,获得聚类数K,得到聚类数K对应的网络隐藏层的输出概率矩阵,使用Ward聚类法对数据源进行聚类,利用自组织特征映射神经网络对聚类数据进行分类,得到聚类数K对应网络隐藏层的输出概率矩阵,精确分类模块根据输出概率矩阵获得最佳分类数K*,根据最佳分类数K*和样本数据构建自组织特征映射神经网络分类器,并确定每类别的质心,构建Hausdorff距离矩阵H,根据距离矩阵确定虚拟资产类别标签;评价模块利用最佳聚类数评价指标针对每个类别选择样本训练概率神经网络,在每个类别中构建概率矩阵,并计算分类有效性指标D。
9.根据权利要求8所述的系统,其特征在于,获得聚类数K进一步包括,当得到聚类数范围[Kmin,Kmax]后,选取范围[Kmin,Kmax]内的K个整数作为聚类数。
10.根据权利要求8所述的系统,其特征在于,将每个类别的质心对应的二进制字符串依次分组获得类中心特征向量,利用词库模型把网络虚拟资产类别转化成特征向量,计算上述特征向量之间的Hausdorff距离,用Hausdorff距离度量两个网络虚拟资产类别间的最大不匹配程度。
11.根据权利要求8或9所述的系统,其特征在于,根据输出概率矩阵,调用公式计算聚类数K对应的最佳分类数评价指标D(K,P,N),*
选取最佳分类数评价指标的最大值对应的聚类数作为最佳分类数K。
12.根据权利要求10所述的系统,其特征在于,计算特征向量之间的Hausdorff距离具体包括:根据公式H(A,B)=max{h(A,B),h(B,A)}确定特征向量集合A与特征向量集合B之间的双向Hausdorff距离H(A,B),其中,A=(a1,a2…,ap)为类别A的样本集合,B=(b1,b2…,bq)为类别B的样本集合,h(A,B)是从集合A到集合B的单向Hausdorff距离,h(B,A)是从集合B到集合A的单向Hausdorff距离。
13.根据权利要求12所述的系统,其特征在于,根据Hausdorff距离,建立Hausdorff距离矩阵H, 距离矩阵H中每行的最小元素对应的类别为匹配类别,获得从自组织映射神经网络得到的类别标签,当出现多重匹配时,以矩阵中元素最小者对应的类别确定类别标签,其中,dij表示第i个已知虚拟资产类与自组织映射神经网络得到的第j个类间的Hausdorff距离。
14.根据权利要求8-13其中之一所述的系统,其特征在于,设定自组织神经网络分类器的输出神经元个数为K*,训练集中每个样本数据由一个Q维向量表示,Q表示维数,用一维线阵结构表示输出节点的排列形式,对权值进行训练以获得自组织神经网络分类器。