问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

精准前沿丨肺癌早筛Olink平台血浆蛋白生物标志物研究

创作时间:
作者:
@小白创作中心

精准前沿丨肺癌早筛Olink平台血浆蛋白生物标志物研究

引用
1
来源
1.
https://www.cn-healthcare.com/articlewm/20230819/content-1594485.html

肺癌是全球范围内最常见的癌症之一,也是导致死亡的主要原因之一。目前,利物浦大学研究团队在EBioMedicine期刊上发表了一项重要研究,通过Olink蛋白检测技术,结合机器学习方法,成功开发出一种新型肺癌早期筛查模型,能够在诊断前5年预测肺癌风险,为肺癌的早期诊断和治疗提供了新的希望。

研究背景

肺癌是全球范围内最常见的癌症之一,也是导致死亡的主要原因之一。据世界卫生组织(WHO)统计,全球每年死于肺癌的人数超过150万人。肺癌通常在疾病早期没有明显的症状,这意味着在大多数情况下,肺癌往往被发现时已经到了晚期,这使得治疗更加困难,而治疗效果和预后也更加差。因此开展肺癌早期筛查非常重要,有助于及早诊断肺癌并开始治疗,提高患者的治疗成功率和生存率,目前,肺癌早期筛查的常用方法包括低剂量CT检查(LDCT)、血清标志物检测等。肺癌的筛查和诊断仍需要多种标志物的组合使用以提高准确性,因此需要进一步研究更加精准的肺癌早筛方法。

在复杂的遗传学背景下,蛋白质组学技术的应用可以提高肺癌的早期检测率。此项研究通过Olink高通量超灵敏蛋白质平台,寻找差异的血浆蛋白,用于肺癌诊断和风险提示,在诊断前1-3年、3-5 年内对更全面的血浆蛋白谱进行了分析。

研究设计

研究训练队列采用利物浦肺项目(Liverpool Lung Project, LLP)人群队列的数据,LLP项目从1996年开始,是欧洲最大的肺癌病例对照和前瞻性队列(超过11500例肺癌)。研究采用巢式病例对照队列设计,研究对象在招募时未患肺癌,但在5年内被诊断为原发性肺癌,通过年龄、性别和吸烟史1:2匹配得到对照组。病例组中一二期患者占比45%,三四期患者占比52%。

另有42例患者形成了纵向队列,包括多个不同时间的样本,诊断时(n = 23)、诊断前1 ~ 3年(n = 21)、诊断前3 ~ 5年(n = 30)或诊断前5 ~ 10年(n = 33),以及来自48例对照的相同时间点的110个纵向样本。对于每个病例,使用性别、年龄和吸烟状况1:1匹配对照。

验证队列使用UKB队列中Olink首批数据。纳入肺癌样本392例。对照组定义为无癌症史,如果死亡,癌症不是死亡原因的人群。匹配年龄、性别、吸烟状况和种族因素,采用两种患者与对照组对比:一种是平衡比例,即癌症与对照组的比例为1:1,另一种是将患肺癌风险作为1种癌症:14个对照(392例病例和5500例对照)。

LLP项目中使用Olink Explore 3072平台检测,同时也使用Olink Target 96 平台13个panel进行重复检测。UKB队列使用Olink Explore 1536平台检测。

研究结果

患者基线信息

在1-3年和1-5年的病例和对照组中,匹配因素,性别,年龄,吸烟史组间检验无差异,研究纳入患者男性占比近70%,平均年龄70岁。


图1. 用于1-3年和1-5年模型训练的LLP队列基线特征

差异蛋白寻找

用所有蛋白和样本生成PCA,过滤6个超出平均值5个标准差的样本;每个Panel中再次过滤,过滤5个超出平均值5个标准差的样本;发现队列中:使用以年龄、性别、吸烟史为协变量的线性模型,在50%的数据集中进行1000次bootstrap,显著蛋白质定义为病例和对照组之间至少100次的差异表达(方差分析P<0.05)。去掉溶血相关的蛋白,1-3年有240个蛋白,1-5年有270个蛋白,重叠的有117个蛋白。

Olink Explore 3027 和 Target 96一致性

所发现的蛋白组进一步在Olink Target 96平台上进行检测,结果表明Target 96与Explore平台有良好的一致性。


图2. Olink Explore 3027 和 Target 96蛋白的一致性

模型性能评价

通过使用 Elastic Net, Random Forest,Support Vector Machine,XGBoos Net,四种不同的机器学习算法进行训练,AUC为5折模型中的中位数AUC,1-3Y和1-5Y蛋白均能在诊断前5年预测肺癌(1-3Y模型的AUC为0.76 ~ 0.90,1-5Y模型的AUC为0.73 ~ 0.83)。

在LLP和UKB中重叠的蛋白进行模型构建,107个蛋白用于1-3Y模型拟合,129个蛋白用于1-5Y模型拟合,这两组蛋白质在诊断前12年能够以相同的程度(AUC = 0.7)预测肺癌。

研究者还用建立的肺癌模型预测了UKB队列中的其他癌症,性能不佳,表明该模型是肺癌特异的,肺癌的易感因素和肿瘤释放蛋白质组对于其他癌症可能是不同的。


图3. 模型性能展示

富集分析

117种蛋白标志物在1-3年和1-5年模型中重合。基因集富集分析映射到通路时,从1-3Y和1-5Y的通路之间重叠21/290,表明不同的生物通路驱动信号的长期和短期风险。


图4. 基因富集分析

结语

肺癌早筛早诊领域的标志物探索研究仍在进行中,蛋白组学作为一种强大的研究工具,对于揭示肺癌的发生发展机制以及寻找新的标志物具有重要的意义。通过进一步深入的蛋白组学研究,我们有望取得更多关于肺癌的重要突破,为肺癌的早期筛查和早期诊断提供更加准确、精准的支持。

参考文献:
[1] Plasma protein biomarkers for early prediction of lung cancer. eBioMedicine. 2023;93: 1046863

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号