利索能及
我要发布
收藏
专利号: 2024115459108
申请人: 烟台大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种双序列比对工具评测方法,其特征在于,包括如下操作:

S1、判断是否存在真实查询序列;若不存在,执行S2;若存在,执行S3;

S2、基于参考基因组、对数正态分布参数和序列信息错误率,得到若干个测序序列,以及仿真对比结果;得到若干个测序序列的操作为:根据预设的位置参数和数据分布离散程度,控制参考基因组生成服从对数正态分布读长特征的若干个初始测序序列;对于每个初始测序序列中的每一个碱基位置,根据对应碱基错误类型偏好和碱基错误期望概率,分配插入、或缺失、或替换的错误,得到若干个测序序列;

分别提取若干个测序序列的碱基信息,得到若干个仿真查询序列;基于若干个仿真查询序列在参考基因组上的位置和偏移量,分别提取在参考基因组上的对应序列信息,得到若干个参考序列;

所述若干个仿真查询序列与对应参考序列,形成了双序列数据,执行S4;

S3、将真实查询序列与参考基因组进行位置、长度和序列信息的比对处理,得到比对结果;基于比对结果,从参考基因组上提取相应序列作为参考序列;所述真实查询序列与参考序列,形成了双序列数据,执行S4;

S4、将双序列数据输入至双序列比对工具中进行处理,得到目标比对结果;

基于双序列比对工具处理过程中的运行时间、或/和峰值内存占用、或/和准确度,得到测评结果;

准确度为目标比对结果与仿真对比结果的序列得分相似度。

2.根据权利要求1所述的双序列比对工具评测方法,其特征在于,所述S4中,准确度为目标比对结果与仿真对比结果的序列得分相似度,为比值A、或比值B、或比值C,或是基于比值A、比值B和比值C得到的;

比值A为,目标比对结果中序列比对得分与仿真对比结果中对应序列的序列比对得分相同的仿真查询序列数,与仿真查询序列总数的比值;

比值B为,目标比对结果中序列比对得分总和大于仿真对比结果中对应序列的序列比对得分总和的仿真查询序列数,与仿真查询序列总数的比值;

比值C为,目标比对结果中序列比对得分总和小于仿真对比结果中对应序列的序列比对得分总和的仿真查询序列数,与仿真查询序列总数的比值。

3.根据权利要求2所述的双序列比对工具评测方法,其特征在于,所述序列比对得分包括:序列编辑距离得分、序列线性间隙罚分得分、序列仿射间隙罚分得分、序列两段式仿射间隙罚分得分。

4.根据权利要求1所述的双序列比对工具评测方法,其特征在于,所述S2中仿真对比结果为测序序列与参考基因组在位置、长度和序列信息的比对处理结果。

5.一种双序列比对工具评测系统,用于实现权利要求1所述的双序列比对工具评测方法,其特征在于,包括:真实查询序列存在判断模块,用于判断是否存在真实查询序列;若不存在,执行第一双序列数据生成模块;若存在,执行第二双序列数据生成模块;

第一双序列数据生成模块,用于基于参考基因组、对数正态分布参数和序列信息错误率,得到若干个测序序列,以及仿真对比结果;分别提取若干个测序序列的序列信息,得到若干个仿真查询序列;基于若干个仿真查询序列在参考基因组上的位置和偏移量,分别提取在参考基因组上的对应序列信息,得到若干个参考序列;所述若干个仿真查询序列与对应参考序列,形成了双序列数据,执行测评结果生成模块;

第二双序列数据生成模块,用于将真实查询序列与参考基因组进行位置、长度和序列信息的比对处理,得到比对结果;基于比对结果,从参考基因组上提取相应序列作为参考序列;所述真实查询序列与参考序列,形成了双序列数据,执行测评结果生成模块;

测评结果生成模块,用于将双序列数据输入至双序列比对工具中进行处理,得到目标比对结果;基于双序列比对工具处理过程中的运行时间、或/和峰值内存占用、或/和准确度,得到测评结果。

6.一种双序列比对工具评测设备,其特征在于,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1‑4任一项所述的双序列比对工具评测方法。

7.一种计算机可读存储介质,其特征在于,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1‑4中任一项所述的双序列比对工具评测方法。