1.一种基于数据分析的工程施工材料供应链管理系统,其特征在于,包括:工程施工材料供应链表单采集子系统、文字识别子系统、实体提取子系统、实体关系提取子系统、知识图谱构建子系统和知识图谱加密子系统;
所述工程施工材料供应链表单采集子系统用于采集工程施工材料供应链表单的图像;
所述文字识别子系统用于对图像上的文字进行识别,得到文字信息;所述实体提取子系统用于提取文字信息中的实体;所述实体关系提取子系统用于提取文字信息中的实体关系;
所述知识图谱构建子系统用于根据实体和实体关系,构建供应链知识图谱;所述知识图谱加密子系统用于对供应链知识图谱进行加密,得到加密图谱数据;
所述实体提取子系统包括:第一分段单元、第一特征提取单元、第一特征融合单元和第一CRF神经网络;
所述第一分段单元用于对文字信息进行分段处理,得到多个文字子段信息;
所述第一特征提取单元用于对文字子段信息进行特征提取,得到文字子段特征;
所述第一特征融合单元用于对各文字子段特征进行加权,并对加权后的特征进行拼接操作,得到融合特征;
所述第一CRF神经网络对融合特征进行分类,得到文字信息中的实体;
所述实体关系提取子系统包括:第二分段单元、第二特征提取单元、第二特征融合单元、第一LSTM单元、第二LSTM单元、Concat单元和第二CRF神经网络;
所述第二分段单元用于对文字信息进行分段处理,得到文字子段信息;
所述第二特征提取单元用于对文字子段信息进行特征提取,得到文字子段特征;
所述第二特征融合单元用于对各文字子段特征进行加权,并对加权后的特征进行拼接操作,得到融合特征;
所述第一LSTM单元用于对融合特征提取第一时间特征;
所述第二LSTM单元用于对融合特征提取第二时间特征;
所述Concat单元用于将第一时间特征和第二时间特征进行拼接,得到拼接时间特征;
所述第二CRF神经网络用于对拼接时间特征进行分类,得到文字信息中的实体关系;
所述第一特征提取单元或第二特征提取单元包括:第一特征提取子单元和第二特征提取子单元;
所述第一特征提取子单元用于将文字子段信息分成多个向量,并对每个向量加权处理,得到特征值;
所述第二特征提取子单元用于对所有特征值取平均值和最大特征值,并与特征值进行拼接,得到文字子段特征;
所述第一特征提取子单元的表达式为:
,
其中, 为第 个特征值, 为文字子段信息中第 个向量, 为第 个权重向量;
所述第二特征提取子单元的表达式为:
,
其中,为文字子段特征,为所有特征值的平均值, 为最大特征值, 为将 、 和所有 进行拼接;
所述第一特征融合单元或第二特征融合单元的表达式为:,
其中,为融合特征, 为将 个
进行拼接, 为双曲正切函数, 为对数函数, 为以自然常数为底的指数函数, 为取 的平均值, 为第 个文字子段特征, 为文字子段特征的数量;
所述实体提取子系统和实体关系提取子系统在应用时,采用是训练完成后的实体提取子系统和实体关系提取子系统,训练实体提取子系统和实体关系提取子系统的损失函数为:,
,
,
,
其中, 为损失值, 为最大差值,为第一比例系数,为第二比例系数, 为差值阈值,为自然常数, 为第 次训练时的标签, 为第 次训练时实体提取子系统或实体关系提取子系统的输出,用于表示当前的第 次训练, 用于表示在第次训练邻域的第 次训练, 为训练次数,为在取最大差值 时对应的标签,为在取最大差值 时对应的实体提取子系统或实体关系提取子系统的输出, 为对数函数,为取最大值。
2.根据权利要求1所述的基于数据分析的工程施工材料供应链管理系统,其特征在于,所述知识图谱加密子系统包括:密钥生成单元、第一加密单元和第二加密单元;
将密钥生成单元用于将私人密钥矩阵与系统密钥矩阵进行按位异或操作,得到图谱加密密钥矩阵;
所述第一加密单元用于图谱加密密钥矩阵与供应链知识图谱中每个实体关系或实体的数据进行按位异或操作,得到加密数据;
所述第二加密单元用于对加密数据进行多次取反操作,根据取反次数移动位置,得到加密图谱数据。
3.根据权利要求2所述的基于数据分析的工程施工材料供应链管理系统,其特征在于,所述第二加密单元的表达式为:,
其中, 为加密图谱数据上第 位的数据值, 为对加密数据上第位进行 次取反操作, 为移动的位数, 为 的二进制码的第 位, 为异或操作。