利索能及
我要发布
收藏
专利号: 2018113743744
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述系统基于ACMG指南为理论依据构建,所述系统包括依次连接的变异位点发现模块、变异位点注释模块、数据及资源加载模块、致病性判别与分类模块和结果解释与验证模块,其中:变异位点发现模块,用于找寻编码区域内遗传变异致病性变异位点的具体位置;所述变异位点包括SNPs和小片段的INDELs;

变异位点注释模块,用于对变异位点进行信息注释,并生成与每个所述变异位点对应的数据文件;所述信息注释包括所述变异位点所在染色体、参考等位基因、替换等位基因、所在外显子位置、罕见性、所在基因、氨基酸变化、各类可计算工具对变异有害性计算得分及预测结果、不同人群中变异频率信息的注释;

数据及资源加载模块,用于读取致病性判别的外部资源文件和所述数据文件;所述外部资源文件包括所述致病性判别的基因列表、Clinvar、OMIM、dbscSNV和dbNSFP数据库;

致病性判断与分类模块,用于计算所述数据文件中每一所述变异位点中所有判别项的取值,并对遗传变异的所述致病性进行分类操作;所述判别项包括PVS1、PS1、PS4、PM1、PM2、PM4、PM5、PP2、PP3、PP5、BS1、BS2、BP1、BP3、BP4、BP6、BP7和BA1;

结果解释和验证模块,用于将所述分类进行结果解释和人工验证。

2.根据权利要求1所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述变异位点发现模块包括序列比对与映射单元、序列数据预处理单元和SNPs与小片段INDELs变异发现单元;所述序列比对与映射单元用于接收由序列数据构成的原始测序数据,并将序列数据映射到参考基因组上;所述序列数据预处理单元用于对映射到参考基因组上的序列数据做预处理操作;所述SNPs与小片段INDELs变异发现单元用于识别预处理后的序列数据相对参考基因组的变异位点,并计算每一所述变异位点的基因型。

3.根据权利要求2所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述变异位点发现模块输入为fastq格式的原始测序数据文件,所述变异位点发现模块输出为包含所有变异位点的vcf格式文件。

4.根据权利要求3所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述变异位点发现模块使用BWA-MEM算法完成所述原始测序数据的映射操作;所述变异位点发现模块使用GATK工具实现对所述变异位点的寻找操作。

5.根据权利要求1所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述变异位点注释模块包括位点注释单元,所述位点注释单元对所述SNPs和所述小片段INDELs进行注释,并能够选择指定所述变异位点进行信息注释。

6.根据权利要求1所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述数据及资源加载模块包括注释数据加载单元和外部资源加载单元,所述注释数据加载单元用于读取所述数据文件并存储;所述外部资源加载单元用于读取所述外部资源文件。

7.根据权利要求1所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述致病性判别与分类模块包括致病性判别单元和致病性分类单元,所述致病性判别单元用于计算每一所述变异位点中所有所述判别项的取值;所述致病性分类单元根据响应于所述致病性判别单元的计算结果对所有所述变异位点进行分类。

8.根据权利要求7所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述结果解释与验证模块包括结果解释单元和验证单元,所述结果解释单元用于给出所述致病性判别与分类模块的判别结果和分类结果的分类依据;所述验证单元用于对所述分类进行比对,并根据比对结果提交至人工进行进一步审核和确认。

9.一种编码区域遗传变异致病性分类的数据处理方法,应用于权利要求1~8任一项所述的一种编码区域遗传变异致病性分类的数据处理系统,其特征在于,所述方法包括步骤:S1、输入由序列数据组成的原始测序数据至所述变异位点发现模块,利用BWA-MEM算法将序列数据映射到参考基因组,使用Picard工具对映射后的序列数据做预处理,采用GATK工具找出序列数据的变异位点;

S2、使用所述变异位点注释模块对所有所述变异位点进行信息注释,生成与每一所述变异位点对应的数据文件;

S3、使用所述数据及资源加载模块读取所述数据文件,并同时读取用于致病性判别的外部资源文件;

S4、基于ACMG指南计算每一所述变异位点的所有判别项的取值,并对所述判别项打分,并根据打分进行汇总操作,基于所述汇总对致病性进行分类操作;

S5、对所述致病性的分类作出解释,并将所述解释作为分类的依据,将分类结果与Clinvar、InterVar遗传变异数据库解读工具的解读结果做比对,基于比对结果提交至人工进行进一步审核和确认。

10.根据权利要求9所述的一种编码区域遗传变异致病性分类的数据处理方法,其特征在于,在所述步骤S5中,若干所述分类结果与Clinvar、InterVar遗传变异数据库解读工具的解读结果不一致,则将所述分类结果提交至人工进行审核和确认,否则,完成对应所述致病性的分类。