文章发表 | 基于实验室指标和临床特征构建桥本甲状腺炎风险预测模型
5 December 2022[宝藤生物]
宝藤生物与许昌市中心医院、开封市中心医院、晋城市人民医院等开展合作,研究基于临床特征和实验室指标的桥本甲状腺炎预测模型的建立。研究中,我们筛选了与甲状腺疾病高度相关的实验室指标和临床特征,基于这些指标构建的机器学习模型能够有效的进行桥本甲状腺炎的预测。
该研究成果《Prediction models constructed for Hashimoto’s thyroiditis risk based on clinical and laboratory factors》于2022年发表于《Frontiers in Endocrinology》杂志。
研究背景
桥本甲状腺炎(HT)是常见的自身免疫性疾病,常常继发甲状腺癌。目前HT的早期诊断在临床上仍是比较困难的,尽管有很多的临床和实验室指标,但仍缺乏较为全面的整合。随着计算机辅助诊断技术的发展,HT的诊断也迎来了新的转机。
研究方法
本研究纳入了正常对照866例和HT患者437例,其中HT组包括HT不伴有癌症(HT-C组)393例和HT伴有癌症(HT+C组)44例。收集的特征包括:年龄、BMI、性别、糖尿病史、甲状腺肿大分度、尿碘浓度(urinary iodine concentration,UIC)、25羟维生素D(25-(OH)D)、游离三碘甲状腺原氨酸(FT3)、血清游离甲状腺素(FT4)、促甲状腺激素(TSH)、甘油三酯(TAG)、总胆固醇(TC)、空腹血糖(FPG)、低密度脂蛋白胆固醇(LDL-C)和高密度脂蛋白胆固醇(HDL-C)。基于以上特征,对275例对照和361例HT患者进行了机器学习模型的建立,6个机器学习模型被应用到这些数据中(图1)。
图1 研究设计
研究结果
1受试者临床指标
本研究收集了入组患者的甲状腺肿大资料并进行了分析,相比对照组,HT组的甲状腺肿大比例有显著的升高,其中HT+C组比例又比HT-C组比例要高。对于其他临床指标,年龄、性别、BMI、是否患有糖尿病都表现出了显著的组间差异,统计结果表明女性和糖尿病患者可能更容易罹患HT。另外,仅有BMI表现出了HT+C组和HT-C组间的差异,HT-C组的平均BMI要显著低于HT+C组和对照组。
2受试者实验室指标
我们比较了所有收集的实验室指标,最终发现除了HDL-C,大多数指标对于HT都具有诊断价值,具体表现为这些指标在组间具有统计学差异。然而,仅有TSH在HT+C组间表现出了显著的统计学差异,可以认为大多数这些指标对于HT伴发癌症都没有很好的参考价值(图2)。
图2 各实验室指标的组间分布
3HT危险因素的逻辑回归分析
为了分析HT发生的危险因素,我们对各指标进行了逻辑回归分析。最终得到了如下几个HT的重要危险因素:UIC、FT3、糖尿病史和TSH。这些指标的升高都被认为会增加罹患HT的风险(表1)。
表1 HT危险因素的逻辑回归分析
4构建HT风险预测机器学习模型
本研究建立了6种机器学习模型来进行HT风险的评估。通过ROC曲线AUC值比较,XGBoost模型表现出了6种模型中最好的预测性能,进一步使用XGBoost模型对各指标评估后,我们发现25-(OH)D在HT风险评估模型中扮演了最重要的作用(图3)。
另外,我们也希望探索影响HT发展为甲状腺癌的危险因素。尽管也建立了机器学习模型,但是几乎所有模型的预测效果都不够理想,可能这些指标并不适合甲状腺恶性肿瘤的机器学习模型。
图3 6种机器学习模型的ROC曲线
结论
本研究收集并分析了HT组和对照组间多个临床特征和实验室指标,其中甲状腺肿大的人数构成在对照组、HT人群以及HT伴癌症人群间都有显著的不同。我们收集的大多数指标都被证明和HT的发生有相关性,其中糖尿病史、UIC、FT3和TSH被认为是HT发生与发展的重要危险因素。在六种机器学习模型中XGBoost模型表现出了最好的预测效果,而25-(OH)D指标在模型建立中起着最大的作用。总的来说,我们全面论证了各种临床检查检验结果结合机器学习模型对于甲状腺疾病诊断的巨大价值,为甲状腺疾病的预防和治疗策略提供支撑。
作为精准医学大数据领域的领先企业,宝藤生物一直致力于用先进的技术为大众提供优质的精准医学服务,利用创新的研究成果,形成多组学的特色检测项目,可为临床提供肿瘤、慢病、妇幼健康、感染、肠道微生态等各类疾病分子诊断的系统解决方案,覆盖疾病的早期风险评估、遗传易感性筛查、疾病精确分型、个体化用药指导和疾病实时监控等逾2000项专业的临床分子诊断项目。
宝藤肿瘤个体化系统解决方案:
肿瘤早期风险评估
知源TM——明确根源 洞悉风险
- 肿瘤(超)早期筛查
- 肿瘤家族遗传性分析
肿瘤个体化用药指导
知安TM——精准基因检测 最佳用药指导
- 化疗药物敏感及毒副作用检测
- 肿瘤靶向药物伴随检测
- 肿瘤用药综合指导(NGS)
- 肿瘤继发性耐药监测
肿瘤负荷实时监控
知康TM——安全无创 实时监控
- 循环肿瘤细胞(CTC)监测
- 循环肿瘤DNA(ctDNA)监测
- 肿瘤蛋白标志物综合监测
参考文献:Prediction models constructed for Hashimoto's thyroiditis risk based on clinical and laboratory factors. Front Endocrinol (Lausanne). 2022 Aug 8;13:886953.