北京治疗白癜风到哪里好 https://wapjbk.39.net/yiyuanfengcai/zn_bjzkbdfyy/
预测脓毒症诱发凝血功能障碍患者28天死亡率的列线图的开发:基于MIMIC-III数据库的分析
汇报人:刘洁
指导教授:石秦东
摘要背景:脓毒症诱导的凝血功能障碍(SIC)是在ICU导致危重症患者预后不良的常见原因。然而,目前还没有专门设计的工具用来评估SIC患者的短期死亡率。本研究旨在开发一种实用的列线图来预测SIC患者28天死亡的风险。
方法:在本回顾性队列研究中,我们从MIMIC-III数据库中提取患者。脓毒症的定义基于脓毒症3.0标准,SIC基于ToshiakiIba’s标准。绘制Kaplan-Meier曲线,比较SIC和非SIC患者的短期生存时间。之后,只将SIC队列随机分为训练组或验证组。我们采用单因素逻辑回归和逐步多变量分析来选择预测特征。基于多元logistic回归模型建立了列线图,并通过内部验证进行判别和校准。然后,我们将模型识别与其他传统的严重程度评分和机器学习模型进行了比较。
结果:我们纳入了例MIMIC-III脓毒症患者,其中例(34.8%)患者在第一次入ICU时即被诊断为SIC。SIC与ICU患者的7天和28天死亡率独立相关。K-M曲线显示,无论倾向评分匹配(PSM)是否平衡,7天和28天生存率均有显著性差异。在列线图的制定中,共纳入了名SIC患者的13个变量。当预测28天死亡率的风险时,列线图在训练和验证集上表现出良好的区分(AUROC:0.78和0.81)。随机森林、支持向量机、序贯器官功能障碍评估(SOFA)评分、逻辑器官功能障碍评估(LODS)评分、简化急性生理II评分(SAPSII)、SIC评分在验证集的AUROC值分别为0.80、0.81、0.71、0.70、0.74和0.60。列线图校准斜率为0.91,Brier值为0.15。从决策曲线分析中可以看出,与其他严重程度评分相比,列线图总是能获得更多的净效益。
结论:SIC与ICU患者的短期死亡率独立相关。列线图实现了对SIC患者28天死亡率的最佳预测,这可以进行更好的预后评估。然而,列线图的鉴别能力需要在外部队列中进行验证,以进一步提高通用性。
背景脓毒症,年拯救脓毒症指南定义为宿主对感染的反应失调,仍然是ICU中危及生命的器官功能障碍的主要原因。脓毒症正迅速成为一个重要的全球卫生健康负担。世界卫生组织宣布,医院治疗的成人脓毒症患者的死亡率为每年每10万人例,根据患者的严重程度,ICU患者的死亡率高达42%甚至更高。凝血异常,作为一种严重的并发症,几乎发生在所有的脓毒症患者中。这种异常的临床表现从初期血小板减少到晚期弥散性血管内凝血,而后者往往导致多器官功能障碍综合征(MODS),死亡率较高。在国际标准化比值(INR)增加和血小板计数减少的脓毒症患者中,凝血异常被称为脓毒症诱导的凝血功能障碍(SIC)。先前的多中心回顾性观察试验表明,SIC与不良预后显著相关。由于SIC是一个动态过程,根据死亡风险对SIC患者进行分层,应用特定的干预措施将为预防MODS提供改进的策略。然而,在临床应用中,死亡率的计算方法却很少。
最近,利用logistic回归模型,一项对日本全国性研究的回顾性分析开发了一个SIC评分系统,其中血小板计数,PT-INR和SOFA评分与脓毒症患者28天死亡率水平相关。随后的临床研究显示了SIC评分系统(见下图)的价值,例如:与国际血栓和止血学会(ISTH)评分系统相比,在预测SIC患者28天死亡率方面具有更高的敏感性。相反,另一项已发表的研究表明,与SOFA、SAPSII和ISTH评分相比,SIC系统预测ICU死亡率的曲线下面积(AUC)更小。因此,SIC评分系统在预测SIC患者预后方面的表现并不一致。此外,由于SIC评分系统的最高总分是6分,这些分与危重患者预后之间的相关性可能是模糊的。由于现有方法的性能不够理想,有必要开发一种新的结合SIC的子群预测模型。
列线图作为一种可视化工具,已广泛应用于危重患者和癌症患者生存研究的临床预后研究。本研究的主要目的是开发一种新的预测SIC患者28天死亡风险的预测列线图。次要目的是探讨SIC患者与非SIC患者之间临床特征的差异,并验证SIC是否对ICU患者构成短期死亡风险。方法数据来源
我们检索了一个开放且免费的重症监护数据库,该数据库包含了年6月至年10月期间在马萨诸塞州波士顿的贝斯以色列女执事医疗中心收治的患者的全面临床数据,称为MIMIC-IIIv1.4。该数据库于年9月2日发布,其中包含了4万多名患者的广泛和去识别的住院信息。所有数据被分为26个表,包括人口统计学特征、生命体征、实验室检测结果、影像学检查和一个数据字典。医院和ICU住院时都被分配了一个特殊的代码,因此我们可以使用这些代码将每个表联系起来,以获得完整的住院记录。当患者出院时,医院工作人员根据国际疾病分类第9版代码输入最终的精确诊断。本研究纳入的数据集由陆先生提取,他已经完成了合作机构培训计划课程。由于本研究使用的是一个满足审查委员会协议的匿名公共数据库,因此没有必要要求伦理同意。相反,TRIPOD声明在本研究中被应用。
研究人群和数据提取
脓毒症
从MIMIC-III数据库中提取以下数据:(1)人口统计数据;(2)第一护理单位;(3)结果,包括ICU住院时间、7天死亡率、28天死亡率、住院死亡率;(4)严重程度评分,包括SOFA和逻辑器官功能障碍(LODS)评分;(5)ICU入院后第一天生命体征平均值及实验室检测结果最差值;(6)使用PgAdmin软件确定感染位点(版本4.1,Bedford,MA,USA)。我们检索了成人脓毒症患者(≥18年),根据脓毒症-3.0标准:(1)现有疑似或确诊感染的证据;(2)SOFA评分≥2。排除标准为:(1)年龄18岁;(2)孕妇;(3)合并先天性凝血功能障碍的患者;(4)凝血功能异常受肿瘤的病理状态和所使用的化疗药物的影响,因此排除了各种癌症类型的患者;(5)入院后24小时内死亡或出院的患者。
SIC
在所有符合条件的脓毒症患者的基础上,SIC患者被定义为符合ToshiakiIba的标准,也被称为SIC评分系统。在ICU入院的第一天,患者的SIC总评分大于等于4分,PT-INR总分和血小板计数大于2分,则认为患者存在SIC。然后,将符合条件的SIC患者的参数进行logistic回归,构建所提出的预测模型。研究设计和数据提取的流程图见补充图1。
补充图1
统计分析
通过达戈斯蒂诺检验证实了正态分布。连续变量以参数变量的平均值(标准差)表示,以非参数变量的中位数(四分位数范围)表示。连续变量的比较采用非配对的学生检验(T检验)或Mann-Whitneyu检验。分类变量的比较使用χ2-检验或Fisher精确检验。
7天和28天的生存曲线均使用Kaplan-Meier方法,采用log-rank检验。为了解决基线失衡问题,我们使用倾向评分匹配(PSM)进行样本分析,并进一步探讨SIC和非SIC患者短期生存时间的差异。
在构建列线图之前,只有SIC患者根据7:3的比例被随机分配到训练或验证队列中。在训练队列中,所有通过单变量logistic回归分析与28天死亡率相关的显著变量都是逐步多变量分析的候选变量。尽管这些变量与28天死亡率有临床相关性,但它们没有统计学意义;然而,它们仍然被包括在内。此外,其中还包括了那些存在一组有意义的值的分类变量。通过计算方差膨胀因子(VIF)来检测连续变量之间的潜在共线性。当VIF的算术平方根2时,共线性被认为是存在的,它将通过正则化来解决。根据Akaike信息准则(AIC)进行逐步反向回归,最佳模型应达到最小的AIC值。随后,基于多元逻辑回归的结果,使用R软件的“rms”包绘制列线图。最后,使用个自助重采样的校准来评估列线图的预测性能,并使用C指数进行测量。
对于该模型的临床应用,我们采用受试者工作特征(ROC)和决策曲线分析(DCA)来比较SOFA、LODS、SAPSII和SIC评分与列线图的表现。同时计算各临床严重程度评分系统的综合鉴别改善(IDI)和净重分类改善(NRI)指标。此外,我们还构建了其他常见的机器学习模型,包括随机森林(RF)和支持向量机(SVM),以比较每个模型的可推广性和准确性。
所有的统计分析均使用STATA15.1和R3.6.2软件进行。缺失值采用RF方法,基于随机森林R的“随机”包处理。然而,当这些变量缺少值30%时,则被忽略。P0.05,视为差异有统计学意义。
结果被纳入的脓毒症患者的特征共纳入例脓毒症患者,其中SIC患者占34.8%。表1列出了基线特征。中位年龄为67岁的SIC患者比72岁的非SIC患者更年轻。在共病方面,我们意外地发现,与非SIC患者相比,SIC患者患高血压、慢性阻塞性肺病(COPD)、糖尿病和心肌梗死的可能性较小,但不包括肝病。然而,SIC患者在入院后24h内出现乳酸最高值、肌酐和血尿素氮最大值、INR最高值、PT最高值、平均红细胞体积最小值(MCV-min)、红细胞分布宽度最大值(RDW-max)和血小板计数最低值、PO2和PH最低值。此外,SIC和非SIC患者在ICU的住院时间、7天死亡率、28医院死亡率方面存在统计学差异,SIC患者的危重评分较高,包括SOFA、LODS和SAPSII。最后,SIC患者表现出更高频次的肾上腺素和/或去甲肾上腺素的使用。
表1患者首次入院时的特点
SIC与脓毒症患者7天和28天的死亡率独立相关
多因素logistic回归结果显示,SIC是纳入患者7天和28天死亡率的独立危险因素,校正比值比为1.52(95%CI:1.35、1.71]和1.52(95%CI:1.39、1.67)。在校正了基线特征、生命体征、危重疾病评分、感染部位和治疗措施后。随后,我们根据ICU入院后前24小时内生命体征、危重疾病评分、感染部位、治疗措施和共病的差异,在SIC和非SIC队列之间进行了PSM。Kaplan-Meier的生存分析发现,无论是否进行PSM,SIC患者和非SIC患者的7天和28天生存率均存在显著差异。
预测列线图的研制
只有名SIC患者被随机分配到训练组(名患者)或验证组(名患者)。非SIC患者的数据不适合后续的模型开发,因为该模型被设计用于预测SIC患者的短期死亡风险。除肌酐最大值外,训练集和验证集之间的所有变量均未发现统计学差异。使用训练队列进行单变量逻辑分析的结果如表2所示。
表2在训练队列中,通过单因素logistic回归分析,与SIC患者28天死亡率独立相关的因素。
随后,使用单变量logistic分析中p0.05的变量,或具有临床意义的变量,或存在一组有意义值的分类变量,进行多变量logistic回归分析。但考虑到ICU入院早期感染源难以确定,且PH值受多种因素影响,在模型中忽略了感染部位和PH-min。最后,我们根据AIC共选择了13个变量。通过多变量分析确定的与SIC28天死亡率独立相关的风险因素如表3所示。关于共线性,表3中所有连续变量的VIF均2,表明回归分析中不存在共线性。接下来,使用训练集建立一个综合年龄、肝病、平均动脉压(MAP)、平均心率、平均呼吸频率、平均体温、去甲肾上腺素用量、乳酸最大值、PT最大值、RDW最大值、MCV最小值、肌酐最大值和最低血小板水平的模型。在该模型的基础上,绘制了列线图来预测SIC患者28天死亡率的概率(图1)。
表3在训练队列中,通过多因素logistic回归分析,SIC患者28天死亡率独立相关的因素。
预测列线图的验证
列线图显示了预测SIC患者28天死亡率的良好准确性,未经调整的C指数为0.78(95%可信区间:0.76,0.80)。在验证集中,列线图显示未经调整的C指数为0.81(95%可信区间:0.78,0.84)。与SOFA、LODS、SAPSII和SIC分数相比,列线图显示的受试者操作特征(AUROC)下的区域在两组中均显著增高。此外,RF和SVM模型显示出很好的能力来区分在训练队列中入院后28天内死亡的SIC患者,但在验证队列中它急剧下降(图2)。
图1预测SIC患者28天死亡风险的列线图。使用它时,从每个变量到点轴画一条垂直线,然后添加所有参数的点,最后从总点轴画一条线,对应底部的28天死亡风险。
图2列线图、RF模型、SVM模型、SOFA、LODS、SAPSII和SIC的ROC曲线。(A)训练集;(B)验证集。在列线图、RF模型和SVM模型中输入的变量相同。
对训练集和验证集都使用bootstrap方法描述了校准曲线(图3)。表观线和偏差修正线仅与理想线略有偏差,表明预测结果与实际情况吻合较好。在训练集和验证集,列线图的Brier得分分别为0.17和0.15。如表4所示,列线图的IDI和NRI指数也显著高于SOFA、LODS、SAPSII和SIC评分,这表明该列线图在预测28天死亡率方面具有更好的预测概率。
图3列线图的校准曲线。(A)训练集;(B)验证集。
表4预测SIC患者28天死亡率的模型比较。
列线图的临床应用
绘制DCA曲线,将其应用于临床,并与其他临床严重程度评分系统进行比较。在训练集中,当阈值概率在0.1和0.9以内时,由该列线图指导的临床干预提供了更大的净效益(图4A)。在验证集中,分析表明,当阈值概率大于0.15时,使用该列线图预测SIC患者的28天死亡率可以提供比SOFA、LODS和SAPSII更大的净效益(图4B)。然而,我们发现SIC分数表现最差。当阈值概率0.45时,SIC评分的DCA曲线与水平线重叠。
在DCA的基础上,给出了该列线图的临床影响曲线(补充图2)。在这两组数据中,红色实心曲线(高危个体数量)表示在名患者的每个风险阈值下,根据该列线图分类为高危的患者数量。蓝色虚线曲线(有结果的高危个体数量)表示每个风险阈值下的真阳性患者数量。
图4列线图、SOFA、LODS、SAPSII和SIC的决策曲线分析。(A)训练集;(B)验证集。
补充图2
基于列线图评分的28天死亡率风险
结果显示,该列线图是一个良好的预测模型,在识别ICU入院28天后患者是否存活或死亡方面具有较高的敏感性、特异性、阳性预测值和阴性预测值,在训练集中分别有0.70(95%CI:0.67、0.73)、0.74(95%CI:0.71、0.76)、0.58(95%CI:0.55、0.62)和0.83(95%CI:0.80、0.84),在验证集中分别有0.78(95%CI:0.74、0.83)、0.69(95%CI:0.65、0.72)、0.56(95%CI0.52、0.63)和0.86(95%CI:0.83、0.88)。
讨论在这项大型开源数据库的回顾性队列研究中,先后应用单变量和多变量逻辑回归分析,以确定与ICUSIC患者28天死亡率相关的独立风险因素。最后,共识别出13个临床变量,并将其纳入最佳拟合模型,即年龄、平均心率、MAP、平均呼吸频率、平均体温、乳酸最高值、PT最高值、RDW最高值、MCV最低值、肌酐最高值、血小板计数最低值、去甲肾上腺素用量和是否合并肝病。
结果显示SIC发病率为34.8%,28天死亡率为34.0%。这些比率高于以前的报告。本研究仅包括ICU收治的败血症患者;因此,种群多样性可以解释这些差异。大多数SIC患者为男性,通常在内科ICU中发现。此外,通过Kaplan-Meier生存分析,与非SIC患者相比,患有SIC的患者短期生存率显著降低,住院时间延长。这些发现与Lyons等人的发现相似。有趣的是,一些相关的共病,包括糖尿病和COPD,在SIC队列中的发病率较低。另一项研究也显示了这种趋势。
在纳入的13个变量中,RDW是一个主要因素。事实上,就相对贡献而言RDW是28天死亡率的最强预测因子。RDW是反映红细胞大小异质性和鉴别贫血类型的常规参数。最近的许多研究表明,RDW值与脓毒症患者死亡率增加之间存在显著相关性。一项包含名脓毒症患者的大型队列研究表明,入院后24小时内的初始RDW是28天死亡率的独立危险因素。RDW值每增加一个单位,28天死亡率就增加6.86%。在住院的前72小时内,RDW值升高的程度也与脓毒症患者或脓毒症休克患者的预后较差有关。尽管其潜在的机制尚不清楚,有几个可能的原因可以解释RDW与脓毒症患者死亡率之间的相关性。全身炎症反应可影响造血器官的状态。在FDG-PET扫描中发现RDW与脾脏和腰椎骨髓激活之间存在关联。此外,以前的研究证明炎症可以抑制红细胞成熟,加速网织红细胞转移到外周循环。另一种解释可能与高氧化应激有关。在脓毒症患者中,活性氧的过度表达会导致严重的细胞功能障碍甚至MODS。
列线图中的其他一些参数与脓毒症或凝血异常相关。流行病学数据显示,年龄是血栓形成的独立危险因素,并与脓毒症患者的90天和1年的死亡率相关。在脓毒症期间,肝功能障碍的发生率接近34-46%。当脓毒症患者也患有肝病,包括肝硬化和肿瘤时,发生MODS和死亡率的风险明显高于无肝病患者。生命体征被广泛用于开发脓毒症的预测模型,也包括在列线图中。此外,SIC通常表现为血小板减少和PT或INR延长。值得注意的是,当PT值在16到18s之间时,本研究发现SIC患者的死亡率降低。我们认为,轻度延长的PT可能比正常PT更容易引起医生的注意,这反过来会导致早期干预。乳酸水平的变化反映了微循环灌注的情况。当乳酸水平2.5mmol/L时,死亡率随着乳酸浓度的增加而增加,这种相关性与血管升压药的使用无关。
目前,还没有专门的预测模型来评估SIC患者28天死亡风险。正如年拯救脓毒症运动指南所定义的那样,脓毒症是由感染引起的,并最终导致全身多器官功能障碍。因此,几种用于评估器官功能状态的评分系统对预测脓毒症患者的预后是有用的。SOFA和LODS在ICU广泛应用,可能更适合反映脓毒症患者器官功能的急性变化。然而,这些评分系统在预测SIC患者28天死亡风险方面的有效性仍不清楚。因此,我们将提出的列线图与一些常见的临床评分表的预测能力,包括SOFA、LODS、SAPSII和SIC评分进行对比。我们发现列线图表现最好。此外,DCA曲线、IDI和NRI指数也支持这一结论。此外,列线图可以有效地在训练和验证集中区分28天死亡率较高的真正阳性患者。在本研究中,我们试图开发其他的机器学习模型,包括RF和SVM,以提高预测的准确性。然而,这些模型的AUROC在验证过程中显著下降,表明效果较差。基于预测能力和临床可解释性,我们选择多元逻辑回归作为最终模型来构建所提出的列线图。然而,我们目前正在使用一个新的外部数据库开发XGBoost模型。
这里开发的列线图在鉴别28天死亡风险方面表现良好,这反映在高C指数为0.81和一个可接受的校准上。在获取列线图时,医生只需要根据第一行计算出每个指标对应的得分,然后将每个点相加,得到最终的总分值。最后,28天的死亡率可以根据最后一行来确定。在计算过程中,需要检测SIC患者在入院后的前24小时内的生命体征和实验室检测值。
目前的研究也有一些局限性。首先,根据脓毒症3.0标准,感染和疑似感染诊断需要准确的取样培养和抗生素使用的时间。这些数据很难从MIMIC-III数据库中获得。因此,我们参考Angus标准来提取感染性患者的。第二,在PT中存在反映促凝剂和抗凝剂过程的固有缺陷。一些新的凝血标志物和检查,包括凝血酶-抗凝血酶-III复合物,纤溶蛋白-α2-抗纤溶蛋白复合物和血栓弹力图,正在成为凝血病诊断的有力工具。将这些参数与当前的优化模型相结合,可以进一步优化SIC患者28天死亡率的预测能力;然而,它们并没有被记录在MIMIC-III数据库中。第三,列线图作为一种可视化工具,可以使分析更加直观和方便,但它已经被使用了多年了。除列线图外,还使用临床评分量表和网络风险计算器。对于一些难以解释的模型,如集成树模型和神经网络模型,Shap算法可能是有用的。近年来,人们越来越努力提高黑盒人工智能的可解释性,设计临床预测的可解释模型。这将是我们未来的发展方向。
综上所述,在逻辑回归分析的基础上,进行了包含13个常规临床变量的列线图。该模型通过内部验证提供了SIC患者28天死亡风险的最佳预测。使用该模型,可以确定单个SIC患者的28天死亡风险,这可以产生更好的预后评估。然而,为了进一步实现该列线图的泛化性改进,还需要进行外部验证。
END编辑郭秦乐审核
石秦东预览时标签不可点收录于合集#个上一篇下一篇