利索能及
我要发布
收藏
专利号: 2022102663403
申请人: 苏州极光无限信息技术有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-04-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种神经网络的创建方法,其特征在于,包括以下步骤:

获取多个网页对应的网页内容,对每个网页内容进行以下处理:基于所述网页内容中的全部第一单词生成所述网页对应的二进制编码C1,获取所述网页中的所有下级路径对应的二进制编码C2,之后,基于全链接神经网络和sigmoid函数将所述二进制编码C1映射到所述网页内容中的每个第一单词出现的概率;

创建BERT神经网络,对每个网页进行以下处理:将所述网页的二进制编码C1和二进制编码C2输入到所述BERT神经网络,对所述BERT神经网络进行训练;

所述“获取所述网页中的所有下级路径对应的二进制编码C2”具体包括:对所述网页内容中的每个下级路径均进行以下处理:使用字符“/”将所述下级路径分割为若干第二单词,生成若干第二单词对应的二进制编码C3,二进制编码C3的长度是固定的;

对所述网页内容中的所有下级路径对应的二进制编码C3进行逐位或操作,从而得到二进制编码C2;

所述“基于所述网页内容中的全部第一单词生成所述网页对应的二进制编码C1”具体包括:获取预设词表W1,W2,...,WN,创建长度为N的二进制数B=b1b2...bN,当Wi为所述所有第一单词中的一个时,bi=1,否则,bi=0;其中,N和i为自然数,1≤i≤N;二进数B=b1 b2...bN为所述网页对应的二进制编码C1;

所述“生成若干第二单词对应的二进制编码C3”具体包括:

获取预设词表W1,W2,...,WN,创建长度为N的二进制数C=c1c2...cN,当Wi为所述若干第二单词中的一个时,ci=1,否则,ci=0;其中,N和i为自然数,1≤i≤N;二进数C=c1 c2...cN为所述二进制编码C3。

2.根据权利要求1所述的创建方法,其特征在于,所述BERT神经网络的损失函数为:L=∑i‑[yi·log(pi)+(1‑yi)yi·log(1‑pi)];其中,i为索引,yi为标签该索引的位置,pi为模型输出向量该索引的位置。

3.一种神经网络的创建装置,其特征在于,包括以下模块:

第一内容获取模块,用于获取多个网页对应的网页内容,对每个网页内容进行以下处理:基于所述网页内容中的全部第一单词生成所述网页对应的二进制编码C1,获取所述网页中的所有下级路径对应的二进制编码C2,之后,基于全链接神经网络和sigmoid函数将所述二进制编码C1映射到所述网页内容中的每个第一单词出现的概率;

网络训练模块,用于创建BERT神经网络,对每个网页进行以下处理:将所述网页的二进制编码C1和二进制编码C2输入到所述BERT神经网络,对所述BERT神经网络进行训练;

所述“获取所述网页中的所有下级路径对应的二进制编码C2”具体包括:对所述网页内容中的每个下级路径均进行以下处理:使用字符“/”将所述下级路径分割为若干第二单词,生成若干第二单词对应的二进制编码C3,二进制编码C3的长度是固定的;

对所述网页内容中的所有下级路径对应的二进制编码C3进行逐位或操作,从而得到二进制编码C2;

所述“基于所述网页内容中的全部第一单词生成所述网页对应的二进制编码C1”具体包括:获取预设词表W1,W2,...,WN,创建长度为N的二进制数B=b1b2...bN,当Wi为所述所有第一单词中的一个时,bi=1,否则,bi=0;其中,N和i为自然数,1≤i≤N;二进数B=b1 b2...bN为所述网页对应的二进制编码C1;

所述“生成若干第二单词对应的二进制编码C3”具体包括:

获取预设词表W1,W2,...,WN,创建长度为N的二进制数C=c1c2...cN,当Wi为所述若干第二单词中的一个时,ci=1,否则,ci=0;其中,N和i为自然数,1≤i≤N;二进数C=c1 c2...cN为所述二进制编码C3。

4.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序运行时执行如权利要求1所述的创建方法。

5.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1所述的创建方法。

6.一种Web路径探测方法,其特征在于,包括以下步骤:

获取网页对应的网页内容,基于所述网页内容中的全部单词生成所述网页对应的二进制编码C4;

执行权利要求1的创建方法生成BERT神经网络,将二进制编码C4输入所述BERT神经网络得到若干下级路径。

7.一种Web路径探测装置,其特征在于,包括以下模块:

第二内容获取模块,用于获取网页对应的网页内容,基于所述网页内容中的全部单词生成所述网页对应的二进制编码C4;

执行模块,用于执行权利要求1的创建方法生成BERT神经网络,将二进制编码C4输入所述BERT神经网络得到若干下级路径。