利索能及
我要发布
收藏
专利号: 202411441072X
申请人: 大连智驱科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-20
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于机器学习的糖尿病数据处理分析系统,其特征在于,该系统包括:糖尿病数据获取模块,用于获取糖尿病患者的病历样本数据,所述病历样本数据中包含多项参数以及血糖时序数据;

正常指标分析模块,用于从每个血糖时序数据中分解出对应的趋势项时序数据和季节项时序数据;综合分析每个血糖时序数据对应的趋势项时序数据的整体变化趋势以及季节项时序数据的变化情况,确定每个病历样本数据对应的初始正常指标;基于每个趋势项时序数据中的局部数据波动情况以及数据值的数值特征,对所述初始正常指标进行修正,从而确定每个病历样本数据的最终正常指标;

参考数据库构建模块,用于基于病历样本数据中各项参数对所有病历样本数据进行分类,得到分类结果;在各个类别中,基于最终正常指标从病历样本数据中筛选参考数据,并基于参考数据构建参考数据库;

所述初始正常指标的获取方法包括:

在每个血糖时序数据对应的趋势项时序数据中,对所有的数据值进行直线拟合,并获取拟合直线的斜率值,对所述斜率值进行归一化并负相关映射处理,得到第一正常因子;

在每个血糖时序数据对应的季节项时序数据中,获取所有的极小值点,将相邻两个极小值点之间的数据作为一个变化数据段;

在所有变化数据段中,根据变化数据段中数据值之间的变化情况,确定第二正常因子;

根据每个血糖时序数据对应的所述第一正常因子以及第二正常因子,计算每个病历样本数据对应的初始正常指标,且所述第一正常因子与第二正常因子均与所述初始正常指标呈正相关;

所述第二正常因子的获取方法包括:

在每个变化数据段中,将最大数据值与最小数据值之间的差值作为每个变化数据段的波动幅度;

将所有变化数据段的波动幅度按照变化数据段的时序进行排列,得到排序序列,并对所述排序序列中的数值进行向后差分,得到一阶差分序列,将所述一阶差分序列中正数的数量占比作为第二正常因子。

2.根据权利要求1所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述最终正常指标的获取方法包括:基于每个血糖时序数据的趋势项时序数据中的局部数据波动情况,对初始正常指标进行初步修正,得到每个病历样本数据对应的修正正常指标;

基于每个血糖时序数据的趋势项时序数据中数据值的数值特征,确定每个病历样本数据对应的异常因子;

将每个病历样本数据对应的异常因子进行负相关映射并归一化后的值,与对应的修正正常指标的乘积,进行归一化处理,从而得到每个病历样本数据的最终正常指标。

3.根据权利要求2所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述修正正常指标的获取方法包括:在每个趋势项时序数据中,将相邻两个极小值点之间的数据作为一个波动数据段;

分析所有波动数据段之间的波动连续情况,确定波动连续值;

在每个波动数据段中,将最大值与最小值之间的差值与每个波动数据段的长度的乘积,作为波动因子;将所有波动数据段的波动因子进行均值化处理,得到波动特征值;

根据所述波动连续值以及波动特征值,计算每个病历样本数据对应的修正因子,且所述波动连续值与波动特征值均与所述修正因子呈负相关;

将每个病历样本数据对应的所述修正因子与初始正常指标的乘积进行归一化后的值,作为每个病历样本数据的修正正常指标。

4.根据权利要求3所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述波动连续值的获取方法包括:将相邻两个波动数据段的最大值对应时刻之间的差异,作为时间差异因子,在所有波动数据段中,将所有时间差异因子的均值进行负相关映射后的值,作为波动连续值。

5.根据权利要求2所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述异常因子的获取方法包括:在每个血糖时序数据的趋势项时序数据中,将大于预设阈值的数据值作为目标值,并将时序上连续的目标值筛选出来,得到所有的子序列;

将每个趋势项时序数据中目标值的数量占比作为数量因子,将所有目标值的最大值与预设阈值的差值作为偏差因子;将所有子序列的最大长度与所有目标值的最小时刻数值的比值,作为时间因子;

将所述数量因子、偏差因子以及时间因子三者的乘积进行归一化后的值,作为所述异常因子。

6.根据权利要求1所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述分类结果的获取方法包括:所述参数至少包括年龄段、性别、有无并发症、糖尿病类型;

在所有病历样本数据中,将各项参数均相同的病历样本数据作为一类,从而得到所有病历样本数据的分类结果。

7.根据权利要求1所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述参考数据的获取方法包括:在各个类别中,将所有的病历样本数据按照最终正常指标进行降序排列,得到降序序列;

在各个类别对应的降序序列中,将前预设数量个病历样本数据作为参考数据。

8.根据权利要求1所述的一种基于机器学习的糖尿病数据处理分析系统,其特征在于,所述从每个血糖时序数据中分解出对应的趋势项时序数据和季节项时序数据,包括:基于STL时序分解算法对每个血糖时序数据进行分解,从而得到每个血糖时序数据对应的趋势项时序数据以及季节项时序数据。