1.基于相似基因比例的基因家族关系判定方法,其特征在于:
确定一个待分析的基因家族作为指定基因家族;
选择参考物种,获取其所述指定基因家族所包含的基因,作为参考基因;
确定第一考察物种,获取其所述指定基因家族所包含的基因作为第一考察基因;
确定第二考察物种,获取其所述指定基因家族所包含的基因作为第二考察基因;
将参考基因与第一考察基因进行两两序列比对,从该序列比对结果中获取大于阈值条件的第一考察物种的非冗余基因个数及该个数占第一考察基因总数的比例,将该比例作为参考物种的第一考察物种非冗余基因比例,所述阈值条件为匹配序列长度和匹配序列相似性值的组合,所述大于阈值条件为大于匹配序列长度且大于匹配序列相似性值,所述阈值条件的数量大于等于2个;
将参考基因与第二考察基因进行两两序列比对,从该序列比对结果中获取大于所述阈值条件的第二考察物种的非冗余基因个数及该个数占第二考察基因总数的比例,将该比例作为参考物种的第二考察物种非冗余基因比例;
计算相同阈值条件时参考物种的第一考察物种非冗余基因比例与参考物种的第二考察物种非冗余基因比例的差值,确定差值的绝对值最大且非冗余基因比例较大的考察物种为与参考物种指定基因家族的关系更密切。
2.如权利要求1所述的基于相似基因比例的基因家族关系判定方法,其特征在于,参考物种和考察物种均已被全基因组测序。
3.如权利要求1所述的基于相似基因比例的基因家族关系判定方法,其特征在于,所述序列为氨基酸序列。
4.如权利要求1所述的基于相似基因比例的基因家族关系判定方法,其特征在于,所述阈值条件中的匹配序列长度为所述指定基因家族的结构域序列长度的三分之二。
5.如权利要求1所述的基于相似基因比例的基因家族关系判定方法,其特征在于,所述阈值条件中的匹配序列相似性值为至少30%以上。
6.如权利要求5所述的基于相似基因比例的基因家族关系判定方法,其特征在于,所述匹配序列相似性值为至少30%以上包括30%,40%,50%,60%,70%,80%和90%。
7.如权利要求1所述的基于相似基因比例的基因家族关系判定方法,其特征在于,所述阈值条件的数量大于等于2个为7个阈值条件,所述7个阈值条件的匹配序列相似性值分别为30%,40%,50%,60%,70%,80%和90%,匹配序列长度均为所述指定基因家族的结构域序列长度的三分之二。