1.本文件涉及计算机技术领域,尤其涉及一种基于孕妇特征的妊娠期糖尿病预测方法及装置。
背景技术:2.妊娠期糖尿病(gestational diabetes mellitus,gdm)是妊娠期出现或首次确诊的不同程度的糖耐量异常,是最为常见的妊娠并发症之一。gdm对母亲和子代健康均有较大危害。
3.证据表明,gdm可以通过对妊娠早期生活方式进行干预来预防。有研究证实妊娠24周诊断出gdm之前,高血糖对胎儿的不利影响就已经出现。因此,在孕早期筛查gdm高危孕妇,并及时进行干预,可以降低gdm发生率,预防并发症,改善妊娠结局,对母儿健康有重大意义。
4.目前识别处于妊娠早期gdm高风险的孕妇的最佳方法尚不清楚,对于首选的筛查或检测方法也没有国际共识。从现有的研究看,大部分相关研究聚焦于依靠母体风险因素构建预测模型。但是这些模型仅有少数进行了外部验证,也尚未应用于临床。不少研究在外部验证中出现了判别能力下降的问题,敏感度和特异度无法令人满意。而且,目前适用于中国人群的gdm风险模型较少。
技术实现要素:5.本发明的目的在于提供一种基于孕妇特征的妊娠期糖尿病预测方法及装置,旨在解决现有技术中的上述问题。
6.本发明提供一种基于孕妇特征的妊娠期糖尿病预测方法,包括:
7.获取患者母体特征和患者临床资料相关数据;
8.以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;
9.将所述单因素分析结果中具有统计学差异的自变量因素纳入进行多因素logistic回归分析,根据赤池信息准则aic值大小、roc曲线以及hosmer-lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用nomogram列线图表示所述预测模型;
10.根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。
11.本发明提供一种基于孕妇特征的妊娠期糖尿病预测装置,包括:
12.数据获取模块,用于获取患者母体特征和患者临床资料相关数据;
13.数据分析模块,用于以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;
14.模型建立模块,用于将所述单因素分析结果中具有统计学差异的自变量因素纳入进行多因素logistic回归分析,根据赤池信息准则aic值大小、roc曲线以及hosmer-lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用nomogram列线图表示所述预测模型;
15.结果预测模块,用于根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。
16.本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于孕妇特征的妊娠期糖尿病预测方法的步骤。
17.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述基于孕妇特征的妊娠期糖尿病预测方法的步骤。
18.采用本发明实施例,能够通过收集患者简单基本信息及无创、可重复测量的孕妇特征分析仪监测数据预测患者妊娠期糖尿病的风险,进行妊娠期糖尿病早期无创筛查,具有容易操作,实施性强,低成本、高效率等优势。
附图说明
19.为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
20.图1是本发明实施例的基于孕妇特征的妊娠期糖尿病预测方法的流程图;
21.图2是本发明实施例的列线图预测模型的示意图;
22.图3是本发明实施例的进行妊娠期糖尿病的发病风险预测的示意图;
23.图4是本发明实施例的计算出各组的妊娠期糖尿病发生率和预测妊娠期糖尿病发生率的折线图;
24.图5是本发明实施例的基于孕妇特征的妊娠期糖尿病预测装置的示意图;
25.图6是本发明实施例的电子设备的示意图。
具体实施方式
26.为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
27.方法实施例
28.根据本发明实施例,提供了一种基于孕妇特征的妊娠期糖尿病预测方法,图1是本发明实施例的基于孕妇特征的妊娠期糖尿病预测方法的流程图,如图1所示,根据本发明实施例的基于孕妇特征的妊娠期糖尿病预测方法具体包括:
29.步骤s101,获取患者母体特征和患者临床资料相关数据;其中,患者基本资料包括:年龄、糖尿病家族史和既往史,所述孕妇特征相关数据通过孕妇孕期产检记录获得,主要包括:孕期生化指标、身高、体重。
30.步骤s102,以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;
31.步骤s102具体包括:根据患者是否发生妊娠期糖尿病将患者分成妊娠期糖尿病组和非妊娠期糖尿病组;
32.对获取的所述患者母体特征和所述患者临床资料相关数据两个因素的因素值进行单因素分析,各因素中符合正态分布或近似正态分布计量资料采用t检验或anova法进行组间比较,对不符合正态分布计量资料使用kolmogorov-smirnov非参数性t检验进行组间比较,计数资料采用卡方检验或fisher精确检验进行组间比较,确定各因素p值;
33.根据各因素p值筛选出具有统计学差异的因素。
34.步骤s103,将所述单因素分析结果中具有统计学差异的自变量因素纳入进行多因素logistic回归分析,根据赤池信息准则aic值大小、roc曲线以及hosmer-lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用nomogram列线图表示所述预测模型;
35.步骤s104,根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。步骤s104具体包括:根据约登指数确定所述nomogram列线图的预测截断值,并根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。
36.以下结合附图,对本发明实施例的上述技术方案进行详细说明。
37.s1.获取患者基本资料、孕妇特征相关数据;
38.具体的,收集患者相关资料,包括母体基本特征:年龄、身高、孕早期血压、孕产史、一级亲属t2dm家族史、受孕方式、孕前体重、孕早期体重、孕早期体重增长速度、宫高、腹围、分娩前体重、妊娠结局。临床资料:总胆固醇(total cholesterol,tc)、甘油三酯(triglycerides,tg)、高密度脂蛋白胆固醇(high density lipoprotein cholesterol,hdl-c)、低密度脂蛋白胆固醇(low density lipoprotein cholesterol,ldl-c)、口服葡萄糖耐量测试(oral glucose tolerance test,ogtt)结果。
39.s2.以患者是否发生妊娠期糖尿病为因变量,以步骤s1获取的因素为自变量进行单因素分析,根据各因素p值筛选出具有统计学差异的因素;
40.具体的,首先根据的患者是否发生妊娠期糖尿病将患者分成妊娠期糖尿病组和非妊娠期糖尿病组,对步骤s1中获取的两组患者的各因素进行单因素分析,各因素中符合正态分布或近似正态分布计量资料采用t检验或anova法进行组间比较,对不符合正态分布计量资料使用kolmogorov-smirnov非参数性t检验进行组间比较,计数资料采用卡方检验或fisher精确检验进行组间比较,计算各因素p值,筛选出p值《0.05的变量。
41.s3.将单因素分析结果中有统计学差异的自变量纳入进行多因素logistic回归分析,据赤池信息准则aic值大小、受试者工作特征曲线(receiver operating characteristic,roc)、hosmer-lemeshow拟合优度检验选出判别能力和拟合效果最好的模型,确定最终纳入自变量回归系数,并采用nomogram列线图可视化预测模型;
42.具体的,将单因素分析中p《0.05的变量纳入多因素二元logistic回归分析,据赤
池信息准则aic值大小、受试者工作特征曲线(receiver operating characteristic,roc)、hosmer-lemeshow拟合优度检验选出判别能力和拟合效果最好的模型,并将最终纳入logistic回归方程中的变量引入r软件,绘制出nomogram列线图预测模型。
43.s4.根据所述列线图预测模型的预测截断值对患者进行妊娠期糖尿病的发病风险预测;
44.具体的,列线图预测模型的预测截断值根据约登指数确定。
45.进一步地,对列线图预测模型进行区分度和校准度评价:抽取20%患者(n=149)组成验证组,对模型进行内部验证该模型的区分度和校准度;将该模型预测的发病结果和实际是否患病结果进行比较,得出相应的roc曲线和calibration校正曲线,使用roc曲线下方面积的大小auc评价列线图预测模型的区分度,使用calibration校正曲线评价列线图预测模型的校准度。
46.具体实施例:
47.选取2017年1月至2017年7月上海交通大学附属第六人民医院产科门诊建立档案,定期来医院产检,并最终于上海交通大学附属第六人民医院产科住院生产的孕妇。排除:
⑴
孕前确诊糖尿病患者;
⑵
合并有内分泌病史患者(如甲状腺功能亢进、甲状腺功能减退、库欣病等);
⑶
多胎妊娠;
⑷
孕期或孕前3月内曾服用过影响糖、脂代谢药物患者(如呋塞米、苯妥英钠、氢化可的松等)。最终获得745例孕妇的孕产期详细数据,其中健康孕妇585例,gdm孕妇160例。进行数据整理时剔除数据缺失的数据信息得到最终供分析的数据。
48.对研究人群按照步骤s1和步骤s2进行初步分析比较后,根据步骤s3中p值的要求对变量进行筛选,得到的结果如表1所示:
49.表1
[0050][0051]
由表1可知,与非妊娠期糖尿病组相比,妊娠期糖尿病组的年龄较大,孕前体质指数(bmi)较大,孕早期体重增加速度较快,孕早期甘油三酯较高,糖尿病家族史比例高。通过logistic回归分析的结果,患者根据年龄、孕前bmi、孕早期体重增加速度、孕早期甘油三酯、糖尿病家族史计算预测为妊娠期糖尿病患者或高危人群p值的概率的回归方程为:
[0052]
logit p=-7.783+1.095
×
年龄+1.126
×
孕前bmi+1.048
×
第一次产检时体重增加速度+1.833
×
孕早期tg+2.197
×
糖尿病家族史。
[0053]
根据以上回归方程,建立回归模型。
[0054]
将以上logistic回归方程中的变量引入r软件中,绘制出的列线图预测模型如图2所示。
[0055]
根据所述列线图预测模型的预测截断值对患者进行妊娠期糖尿病的发病风险预
测,如图3所示,采用roc曲线研究中的灵敏度和特异度图判断列线图预测模型的预测截断值,灵敏度和特异度曲线相交点所对应的概率值为截断值,约登指数截断值为0.405,因此患者根据年龄、孕前bmi、孕早期体重增加速度、孕早期甘油三酯、糖尿病家族史计算预测p值超过截断值分时或各变量赋值的综合大于156分时(结合图2),则被识别为妊娠期糖尿病患者或高危人群。
[0056]
对列线图预测模型进行区分度和校准度评价,使用roc曲线下方面积的大小(area under the curve,auc)评价列线图预测模型的区分度,auc的数值范围为0.5~1.0,数值越大表明其预测的真实性越高,预测模型鉴别能力越强;使用校正曲线评价列线图预测模型的校准度,计算出各组的妊娠期糖尿病发生率(实际妊娠期糖尿病/总例数)和预测妊娠期糖尿病发生率(预测妊娠期糖尿病/总例数),绘制如图4所示折线图,折线与参考线(y=x)拟合较好表示模型的校准能力好。
[0057]
本发明实施例构建的gdm风险预测模型具有较好区分度和校准度,模型纳入的预测指标为年龄、孕早期tg、糖尿病家族史、孕早期体重增加速度。绝大多数临床资料为无创性,临床实践中仅通过问诊即可收集,成本低廉,流程简单,非常适合在社区开展。
[0058]
装置实施例一
[0059]
根据本发明实施例,提供了一种基于孕妇特征的妊娠期糖尿病预测装置,图5是本发明实施例的基于孕妇特征的妊娠期糖尿病预测装置的示意图,如图5所示,根据本发明实施例的基于孕妇特征的妊娠期糖尿病预测装置具体包括:
[0060]
数据获取模块50,用于获取患者母体特征和患者临床资料相关数据;
[0061]
数据分析模块52,用于以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;所述数据分析模块52具体用于:
[0062]
根据患者是否发生妊娠期糖尿病将患者分成妊娠期糖尿病组和非妊娠期糖尿病组;对获取的所述患者母体特征和所述患者临床资料相关数据两个因素的因素值进行单因素分析,各因素中符合正态分布或近似正态分布计量资料采用t检验或anova法进行组间比较,对不符合正态分布计量资料使用kolmogorov-smirnov非参数性t检验进行组间比较,计数资料采用卡方检验或fisher精确检验进行组间比较,确定各因素p值;根据各因素p值筛选出具有统计学差异的因素。例如,筛选出p值《0.05的因素。
[0063]
模型建立模块54,用于将所述单因素分析结果中具有统计学差异的自变量因素纳入进行多因素logistic回归分析,根据赤池信息准则aic值大小、roc曲线以及hosmer-lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用nomogram列线图表示所述预测模型;
[0064]
结果预测模块56,用于根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。所述结果预测模块56具体用于:
[0065]
根据约登指数确定所述nomogram列线图的预测截断值,并根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。
[0066]
上述装置进一步包括:
[0067]
验证优化模块,用于将所述nomogram列线图预测的发病风险和实际患病结果进行比较,得出相应的roc曲线和calibration校正曲线,对所述nomogram列线图的区分度和校
准度进行验证,并对所述nomogram列线图进行优化。
[0068]
本发明实施例是与上述方法实施例对应的装置实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。
[0069]
装置实施例二
[0070]
本发明实施例提供一种电子设备,如图6所示,包括:存储器60、处理器62及存储在所述存储器60上并可在所述处理62上运行的计算机程序,所述计算机程序被所述处理器62执行时实现如方法实施例中所述的步骤。
[0071]
装置实施例三
[0072]
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器62执行时实现如方法实施例中所述的步骤。
[0073]
本实施例所述计算机可读存储介质包括但不限于为:rom、ram、磁盘或光盘等。
[0074]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
技术特征:1.一种基于孕妇特征的妊娠期糖尿病预测方法,其特征在于,包括:获取患者母体特征和患者临床资料相关数据;以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;将所述单因素分析结果中具有统计学差异的自变量因素纳入进行多因素logistic回归分析,基于回归分析,根据赤池信息准则aic值大小、roc曲线以及hosmer-lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用nomogram列线图表示所述预测模型;根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。2.根据权利要求1所述的方法,其特征在于,以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果具体包括:根据患者是否发生妊娠期糖尿病将患者分成妊娠期糖尿病组和非妊娠期糖尿病组;对获取的所述患者母体特征和所述患者临床资料相关数据两个因素的因素值进行单因素分析,各因素中符合正态分布或近似正态分布计量资料采用t检验或anova法进行组间比较,对不符合正态分布计量资料使用kolmogorov-smirnov非参数性t检验进行组间比较,计数资料采用卡方检验或fisher精确检验进行组间比较,确定各因素p值;根据各因素p值筛选出具有统计学差异的因素。3.根据权利要求1所述的方法,其特征在于,根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测具体包括:根据约登指数确定所述nomogram列线图的预测截断值,并根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。4.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:将所述nomogram列线图预测的发病风险和实际患病结果进行比较,得出相应的roc曲线和calibration校正曲线,对所述nomogram列线图的区分度和校准度进行验证,并对所述nomogram列线图进行优化。5.一种基于孕妇特征的妊娠期糖尿病预测装置,其特征在于,包括:数据获取模块,用于获取患者母体特征和患者临床资料相关数据;数据分析模块,用于以患者是否发生妊娠期糖尿病为因变量因素,以所述患者母体特征和所述患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;模型建立模块,用于将所述单因素分析结果中具有统计学差异的自变量因素纳入进行多因素logistic回归分析,根据赤池信息准则aic值大小、roc曲线以及hosmer-lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用nomogram列线图表示所述预测模型;结果预测模块,用于根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。6.根据权利要求5所述的装置,其特征在于,所述数据分析模块具体用于:根据患者是否发生妊娠期糖尿病将患者分成妊娠期糖尿病组和非妊娠期糖尿病组;对获取的所述患者母体特征和所述患者临床资料相关数据两个因素的因素值进行单
因素分析,各因素中符合正态分布或近似正态分布计量资料采用t检验或anova法进行组间比较,对不符合正态分布计量资料使用kolmogorov-smirnov非参数性t检验进行组间比较,计数资料采用卡方检验或fisher精确检验进行组间比较,确定各因素p值;根据各因素p值筛选出具有统计学差异的因素。7.根据权利要求5所述的装置,其特征在于,所述结果预测模块具体用于:根据约登指数确定所述nomogram列线图的预测截断值,并根据所述nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。8.根据权利要求5所述的装置,其特征在于,所装置进一步包括:验证优化模块,用于将所述nomogram列线图预测的发病风险和实际患病结果进行比较,得出相应的roc曲线和calibration校正曲线,对所述nomogram列线图的区分度和校准度进行验证,并对所述nomogram列线图进行优化。9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的基于孕妇特征的妊娠期糖尿病预测方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至4中任一项所述的基于孕妇特征的妊娠期糖尿病预测方法的步骤。
技术总结本说明书实施例提供了一种基于孕妇特征的妊娠期糖尿病预测方法及装置,其中,方法包括:获取患者母体特征和患者临床资料相关数据;以患者是否发生妊娠期糖尿病为因变量因素,以患者母体特征和患者临床资料相关数据为自变量因素进行单因素分析,获取单因素分析结果;将单因素分析结果中具有统计学差异的自变量因素纳入进行多因素Logistic回归分析,根据赤池信息准则AIC值大小、ROC曲线以及Hosmer-Lemeshow拟合优度检验选择判别能力和拟合效果最好的预测模型,确定最终纳入自变量回归系数,并采用Nomogram列线图表示预测模型;根据Nomogram列线图的预测截断值对患者进行妊娠期糖尿病的发病风险预测。期糖尿病的发病风险预测。期糖尿病的发病风险预测。
技术研发人员:葛声 吕绍淦
受保护的技术使用者:上海市第六人民医院
技术研发日:2022.09.26
技术公布日:2023/1/6