利索能及
我要发布
收藏
专利号: 2024104181283
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于多种群机制及代理模型的多目标演化神经架构搜索方法,其特征在于,包括:构建搜索空间,包括:设置搜索参数,根据搜索参数对卷积神经网络的主干部分进行搜索,得到符合条件的卷积神经网络,所有符合条件的卷积神经网络构成搜索空间;

所述卷积神经网络的主干部分包括五个依次连接的MBConvBlocks模块,所述MBConvBlocks模块由多个层组成,每一层均采用倒置瓶颈结构;所述搜索参数包括每个MBConvBlocks模块的层数、每一层的卷积核大小、扩展率和分辨率,所述分辨率即为输入图像大小;

对搜索空间中的神经网络架构进行编码;

确定两个优化目标,所述优化目标分别为网络复杂度和分类精度;

根据网络复杂度对搜索空间中的神经网络架构进行种群初始化,得到用于演化搜索的初始种群;

通过初始种群来初始化演化搜索过程,并结合预训练的代理模型和多种群机制在搜索空间内进行多目标演化搜索,得到候选神经网络架构,包括:S1、对初始种群中的神经网络架构进行非支配排序和拥挤度计算,得到主种群和副种群,包括:对初始种群中的神经网络架构进行非支配排序,将非支配排序中的第一层级作为主种群;

除去主种群,对剩余神经网络架构进行拥挤度计算,选择拥挤度排名最高的 个神经网络架构作为副种群;

S2、计算本轮演化的阈值,其表达式如下:

其中, 表示阈值,为随机产生的 之间的数,表示演化次数,为总演化次数;

S3、将阈值与预设的超参数进行比较,若阈值大于超参数,则将主种群、副种群共同作为父代个体,若阈值小于超参数,则将主种群作为父代个体;对父代个体进行交叉、变异操作生成一系列子代个体;

S4、通过预训练的代理模型处理得到子代个体的分类精度排名,并计算子代个体的复杂度;根据子代个体的分类精度排名和复杂度对其进行非支配排序和拥挤度计算,保留个子代个体,包括:根据子代个体的分类精度排名和复杂度大小利用快速非支配算法进行非支配排序,得到子代个体的非支配排序结果;

选择非支配排序结果处于第一层级的子代个体计算拥挤度,得到拥挤度计算结果,保留拥挤度计算结果靠前的 个子代个体;

S5、将 个子代个体与初始种群合并,重复S1 S5,直至达到总演化次数,得到候选神经~网络架构;

从候选神经网络架构中筛选出兼顾网络复杂度和分类精度两个优化目标的神经网络架构。

2.根据权利要求1所述的基于多种群机制及代理模型的多目标演化神经架构搜索方法,其特征在于,对搜索空间中的神经网络架构进行编码,包括:利用固定长度的整数字符串对搜索空间中的神经网络架构进行编码,编码内容包括分辨率、模块层数、卷积核大小和扩展率;

当神经网络架构的编码长度小于固定长度时,则通过填充零以达到固定长度。

3.根据权利要求1所述的基于多种群机制及代理模型的多目标演化神经架构搜索方法,其特征在于,根据网络复杂度对搜索空间中的神经网络架构进行种群初始化,得到初始种群,包括:从搜索空间中随机采样 个神经网络架构;

计算各个神经网络架构的复杂度;

根据每个神经网络架构的复杂度大小将所有神经网络架构划分为 个种群,其中,每个种群中包括 个神经网络架构;

从每个种群中随机采样 个神经网络架构,并对其进行合并得到初始种群,所述初始种群包括 个神经网络架构,其中, 。

4.根据权利要求1所述的基于多种群机制及代理模型的多目标演化神经架构搜索方法,其特征在于,在根据网络复杂度对搜索空间中的神经网络架构进行种群初始化,得到用于演化搜索的初始种群之后,所述方法还包括:构建代理模型;

利用初始种群对代理模型进行训练,以初始种群中的神经网络架构作为输入,神经网络架构的优劣比较结果作为输出,得到预训练的代理模型;

所述代理模型的训练过程包括:

利用随机梯度下降算法对初始种群中的神经网络架构进行训练,得到神经网络架构的分类精度,每个神经网络架构及其对应的分类精度作为一个样本,组成原始训练样本集;

对原始训练样本集按顺序进行两两配对,即第 个样本与后方剩余的 个样本分别进行配对,若第 个样本的分类精度优于配对样本,则标签记为1,否则标签记为0,得到1标签数多的样本即为优样本,0标签数多的样本即为劣样本。

5.根据权利要求1所述的基于多种群机制及代理模型的多目标演化神经架构搜索方法,其特征在于,从候选神经网络架构中筛选出兼顾网络复杂度和分类精度两个优化目标的神经网络架构,包括:对候选神经网络架构进行非支配排序,得到非支配排序结果;

选择非支配排序结果位于前部的多个神经网络架构,利用随机梯度下降算法对其进行训练,得到兼顾两个优化目标的神经网络架构。

6.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1 5中任一项所述的基于多种群机制及代理模型的多目标演化神经架构搜索~方法的步骤。