1.一种用于临床试验过程中多数据源采集转换的方法,其特征在于:包括:
建立标准化的SDTM数据库步骤,根据SDTM标准在临床试验系统中建立标准化的SDTM数据库;
多数据源采集步骤,实时采集多数据源的试验数据;
数据转换步骤,在临床试验系统中建立所述试验数据和SDTM数据的映射关系,所述映射关系通过模糊匹配算法方式建立;根据映射关系将试验数据转换成SDTM数据。
2.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述SDTM是临床数据交换标准协会CDISC规定的研究数据表格模型。
3.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述多数据源包括原始数据、电子数据采集系统EDC、随机化与试验药物管理系统RTSM、医学编码系统MedCoding、临床试验全文档管理系统eTMF、临床试验项目管理系统CTMS、药物安全管理系统PV、患者报告结局系统PRO。
4.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述的试验数据含有变量和变量标签,所述的变量标签是由字符串组成,所述字符串与模糊匹配算法中的目标字符串相对应。
5.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述建立标准化的SDTM数据库步骤中包括设置项目环境、项目信息、各类文件保存位置和试验数据读取周期,所述项目环境和项目信息是依据临床试验项目来设置。
6.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述建立标准化的SDTM数据库中设有SDTM的域和每个域变量及其SDTM受控术语;其中所述的域变量包括:标识变量、主题变量、时间变量和修饰语变量;域变量和SDTM受控术语由字符串组成,所述字符串与模糊匹配算法中的模式字符串相对应。
7.根据权利要求6所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述的域包括不良事件域、生命体征数据域、人口学数据域、实验室检查数据域、受试者访视域、心电图数据域、既往疾病数据域、合并用药数据域、药物暴露域、生活质量量表评分域;每个所述的域采用唯一的两个字符代码来表示,每个所述的域包含不同的域变量。
8.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述模糊匹配算法包括步骤为:将模式字符串集合转换为树状有限状态自动机;
将树状有限状态自动机构成的字符串树中最短模式字符串的最后端字符与目标字符串最后端字符对齐;
字符串树从前至后与目标字符串中对位的字符比较,失配时计算按坏字符跳转方法字符串树向前跳转长度和按好前缀跳转方法字符串树向前跳转长度,取其中较大的跳转长度进行跳转;
任一模式字符串与目标字符串中至少部分连续字符串完全匹配则判断该模式字符串与目标字符串匹配。
9.根据权利要求8所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述坏字符跳转方法为:若字符串树的失配字符后端存在与目标字符串的失配字符匹配的字符,则将字符串树向前跳转至最接近的匹配字符与目标字符串的失配字符对齐的位置;若字符串树的失配字符后端不存在与目标字符串的失配字符匹配的字符,则将字符串树向前跳转至最短模式字符串的最后端字符与目标字符串的失配字符前方第一个字符对齐的位置。
10.根据权利要求8所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述好前缀跳转方法为:若字符串树的失配字符后端存在子串与目标字符串中的好前缀匹配,则将字符串树向前跳转至最接近的匹配子串与目标字符串中的好前缀对齐的位置;若字符串树的失配字符后端不存在子串与目标字符串中的好前缀匹配,则在字符串树的失配字符后端中寻找与好前缀的前缀匹配的最长后缀,将字符串树向前跳转至该最长后缀与好前缀的前缀对齐的位置;若字符串树的失配字符后端不存在子串与目标字符串中的好前缀匹配或最长后缀与好前缀的前缀匹配,则将字符串树向前跳转至最短模式字符串的最后端字符与好前缀前方第一个字符对齐的位置。
11.根据权利要求1所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述多数据源采集转换的方法具体步骤包括:S01:在临床试验系统中建立SDTM数据库;
S02:将多数据源的试验数据实时的导入到临床试验系统中;
S03:通过模糊匹配算法将试验数据的变量标签与SDTM数据库中的域变量和SDTM受控术语进行模糊匹配,建立映射关系;
S04:根据映射关系将试验数据转换为SDTM数据,并对每个域变量进行标识。
12.根据权利要求11所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:还包括S05:对生成的SDTM格式数据进行验证并生成验证报告。
13.根据权利要求11所述的一种用于临床试验过程中多数据源采集转换的方法,其特征在于:所述S03中还包括S031:根据映射关系自动生成注释受试者病历报告表aCRF和编程规范说明。
14.一种用于临床试验系统中多数据源采集转换的装置,其特征在于:包括:
SDTM数据库建立模块,用于建立SDTM数据库;
多数据源采集模块,用于采集各种数据源的试验数据;
映射匹配模块,通过模糊匹配算法建立试验数据与SDTM数据之间的映射关系;
数据转换模块,用于将试验数据转换成SDTM格式数据。
15.一种电子设备,其包括:
处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-13中任一项所述的方法。
16.一种计算机可读存储介质,其中所述计算机刻度存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-13中任一项所述的方法。