1.基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,包括:设定第一基因序列和第二基因序列共享的公开随机字符串;
采用独热编码对第一基因序列和第二基因序列分别进行编码;
对第一基因序列碱基编码中的有效位选取第一随机字符串和第二随机字符串,以构成第一随机有序对,且所有有效位的第一随机字符串满足公开随机字符串,对非有效位选取第二随机有序对,以此得到碱基编码有序对;
根据第二基因序列碱基编码中每个比特位,以及第一基因序列的碱基编码有序对,执行茫然传输协议,得到每个比特位的匹配结果;
根据第二基因序列碱基编码中所有有效位所在比特位的匹配结果,判断是否满足公开随机字符串,以此得到第一基因序列和第二基因序列是否相等的比对结果。
2.如权利要求1所述的基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,第一随机字符串ri满足 其中,r为公开随机字符串,i为第一基因序列碱基编码中第i个有效位,D为第一基因序列碱基编码中有效位所在的集合。
3.如权利要求2所述的基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,对第二基因序列碱基编码中有效位j所在的比特位的匹配结果 判断是否满足公开随机字符串的过程中,计算 其中,J为第二基因序列碱基编码中有效位所在的集合;
若 则第一基因序列和第二基因序列不相等;
若 则第一基因序列和第二基因序列相等。
4.如权利要求2所述的基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,κ所述公开随机字符串r←{0,1},κ为安全参数。
5.如权利要求1所述的基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,采用独热编码对第一基因序列和第二基因序列中的碱基A、G、C、T依次编码为00001、00010、
00100、01000,对于碱基缺失的情况编码为10000。
6.如权利要求5所述的基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,编码后有效位的个数与基因序列中碱基个数一致。
7.如权利要求1所述的基于茫然传输协议的隐私保护基因序列比对方法,其特征在于,所述茫然传输协议采用茫然传输扩展技术。
8.基于茫然传输协议的隐私保护基因序列比对系统,其特征在于,包括:初始化模块,被配置为设定第一基因序列和第二基因序列共享的公开随机字符串;
独热编码模块,被配置为采用独热编码对第一基因序列和第二基因序列分别进行编码;
随机编码模块,被配置为对第一基因序列碱基编码中的有效位选取第一随机字符串和第二随机字符串,以构成第一随机有序对,且所有有效位的第一随机字符串满足公开随机字符串,对非有效位选取第二随机有序对,以此得到碱基编码有序对;
协议执行模块,被配置为根据第二基因序列碱基编码中每个比特位,以及第一基因序列的碱基编码有序对,执行茫然传输协议,得到每个比特位的匹配结果;
比对模块,被配置为根据第二基因序列碱基编码中所有有效位所在比特位的匹配结果,判断是否满足公开随机字符串,以此得到第一基因序列和第二基因序列是否相等的比对结果。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1‑7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1‑7任一项所述的方法。