1.一种基于seq2seq模型的Java方法名推荐方法,其特征在于包括:
1)建立Java方法名词库阶段:将采集的Java方法名切分为标记流,并通过人工标注的方式,为出现高频率标记进行标注中文语义,进而建立Java方法名词库;
2)建立中文同义词库阶段:对于已经标注中文的Java方法名标记,由经验丰富的开发者为中文语义的标记标注其在真实开发中的同义词;
3)创建数据样本阶段:采用人工标注的方式来为Java方法名标注中文语义;
4)模型训练阶段:该阶段人工标注好的Java方法名标记序列以及对应的中文语义序列输入到seq2seq模型中训练;
5)方法名推荐阶段:开发者在实际开发中用中文描述Java方法的功能,模型将开发者对Java方法的中文描述转化成为对应的Java方法名。
2.如权利要求1所述的方法,其特征在于,步骤1)中采用驼峰命名法将采集的Java方法名切分为标记序列。
3.如权利要求1所述的方法,其特征在于,步骤4)中seq2seq模型中采用了attention机制。
4.如权利要求1所述的方法,其特征在于,步骤5)中,首先将开发者输入的中文方法名进行中文分词进而得到中文方法名标记序列,对于标记序列中的每一个中文标记通过同义词替换,转换成为标准的中文同义词;随后将中文方法名标记序列输入seq2seq模型中并生成相应的英文Java方法名。