EMethylNET解锁癌症早筛新姿势!
EMethylNET解锁癌症早筛新姿势!
近日,来自伦敦帝国理工学院和剑桥大学的研究团队开发了一种名为EMethylNET的人工智能模型,该模型通过观察DNA甲基化模式,能够识别出13种不同类型的癌症,包括乳腺癌、肝癌、肺癌和前列腺癌等,准确率高达98.2%。这一突破性研究成果为癌症早期筛查提供了新的可能性,有望在未来显著提高癌症患者的生存率和治疗效果。
DNA甲基化:癌症检测的新型生物标志物
DNA甲基化是表观遗传学中一种重要的修饰方式,它通过在DNA碱基上添加甲基基团来调控基因表达。在癌症发生发展过程中,DNA甲基化模式会发生异常变化,这些变化可以作为癌症早期诊断的重要生物标志物。
研究团队利用机器学习方法,从正常组织特异性甲基化中识别出癌症特异性变化,使用了来自13种癌症类型和相应正常组织的DNA甲基化微阵列数据。通过分析这些数据,研究人员训练并评估了四种不同的模型类型:逻辑回归、支持向量机(SVM)、梯度提升决策树(XGBoost)和深度神经网络(DNN)。
EMethylNET的技术优势
在测试中,EMethylNET表现出色,平均准确率为98.7%,平均马修斯相关系数(MCC)为91.9%。研究团队还对多类基因进行了功能富集分析,发现其富含与致癌作用和转录调控特征相关的基因,并在癌症相关通路和网络中富集。
与相关研究相比,EMethylNET实现了具有竞争力的测试集性能。更重要的是,该研究首次提供了深入的特征分析,其中CpG位点由模型自由选择,没有事先的特征选择会给特征分析结果增加潜在偏差。
临床应用前景与挑战
尽管EMethylNET展现出巨大的潜力,但研究团队也指出,该模型目前还处于实验阶段,需要对更多样化的活检样本进行额外的训练和测试,方可进一步用于临床。此外,该模型依赖于组织样本,而非血液中的DNA片段,这在一定程度上限制了其应用范围。
然而,研究团队对这项技术的未来充满信心。通讯作者Shamith A Samarajiwa表示:“通过在更多样化的数据上更好的训练以及在临床上的严格测试,像这样的计算方法最终将提供可以帮助医生进行癌症早期检测和筛查的AI模型。”
未来展望
这项研究为癌症早期检测和诊断开辟了新的途径。根据训练数据的可用性,该方法可以扩展到检测数百种癌症类型。未来的应用包括将这种方法扩展到游离DNA的DNA甲基化数据,最终目标是通过液体活检方法早期检测多种类型的癌症。
此外,这种方法的一个明确的临床应用是筛查特定癌症类型或来源不明的癌症,尽管目前的模型并未为此目的进行优化,但已具备这方面的拓展研究空间。
随着人工智能技术的不断发展,我们离实现癌症早期精准诊断的目标越来越近,这无疑为患者带来了新的希望。