问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Nature Communications:Olink在肿瘤精准诊断中的研究进展

创作时间:
作者:
@小白创作中心

Nature Communications:Olink在肿瘤精准诊断中的研究进展

引用
1
来源
1.
https://bydrug.pharmcube.com/news/detail/ad5e10edb037bf0be737f176dbc576ec

下一代血液检测技术Next Generation Blood Profiling方法众多,从不同层面对血液进行分析。其中Olink技术对外周血蛋白开展高通量检测,具有较高的灵敏度和通量。本文以Olink作为检测方法,研究癌症和健康人血液蛋白特征谱,希望能够准确预测癌种的分类器模型以及肿瘤早筛预测模型,为低成本的泛癌症人群筛查提供了可能。本研究实际收集1400多名癌症患者,分析结果发布在Disease Blood Atlas数据库中,研究人员可下载数据开展进一步分析。

研究背景与方法

下一代血液检测技术Next Generation Blood Profiling方法众多,从不同层面对血液进行分析。其中Olink技术对外周血蛋白开展高通量检测,具有较高的灵敏度和通量。本文以Olink作为检测方法,研究癌症和健康人血液蛋白特征谱,希望能够准确预测癌种的分类器模型以及肿瘤早筛预测模型,为低成本的泛癌症人群筛查提供了可能。本研究实际收集1400多名癌症患者,分析结果发布在Disease Blood Atlas数据库中,研究人员可下载数据开展进一步分析。

研究结果

人类疾病血液图谱资源

人类疾病血液图谱包含了超过200万个数据点,展示了1477名癌症患者血液中的个别蛋白质水平,该图谱使用Olink Explore 1536 Proximity Extension Assay (PEA)技术量化了1463种蛋白质,为研究人员提供了一个无限制访问的资源,以探索癌症患者的血液蛋白质组文件。

利用差异表达鉴定癌症特异性蛋白

为了研究癌症特异性蛋白质组图谱,研究团队对每种癌症与所有其他癌症在相同性别的样本中进行了差异表达分析,并通过火山图总结了12种癌症中上调和下调的蛋白质(图1a和图2a)。例如在胶质瘤中,显著上调的蛋白质包括星形胶质酸性蛋白(GFAP);在急性髓系白血病中,最显著的蛋白质是FLT3;在结直肠癌中,显著上调的蛋白质包括FKBP脯酰异构酶1B;在卵巢癌中显著上调的蛋白质包括孕酮相关子宫内膜蛋白(PAEP)。所有12种癌症类型的研究结果都可以在人类疾病血液图谱资源中找到,该资源还提供了所有分析蛋白质的基础血液水平链接。


图1:p值的计算采用双侧t检验,并采用Benjamini-Hochberg多重假设校正。图1b和图1c分别显示了12种癌症中上调和下调的蛋白质的数量以及在超过一种不同癌症类型中上调的蛋白质之间的重叠。

研究发现四种免疫细胞相关癌症共有大量上调的蛋白质,其中很多是与免疫相关功能有关的蛋白质。研究通过对GO功能富集分析发现免疫细胞相关癌症中的上调蛋白与免疫过程有关,而乳腺癌、子宫内膜癌和前列腺癌中细胞粘附蛋白的比例过高,肺癌和结直肠癌中细胞凋亡相关蛋白的比例过高(图2b)。

机器学习模型预测癌症类型及蛋白质重要性分析

研究团队通过glmnet算法构建了癌症分类模型。通过对机器学习模型,可以估算出每个蛋白质对模型的总体重要性,从而揭示有多少蛋白质与特定的分类问题相关以及相关程度如何。研究发现许多蛋白质对于某些癌症(包括结直肠癌和肺癌)具有相对较高的重要性得分,而对于其他癌症(例如血液癌症和神经胶质瘤),对分类模型有贡献的蛋白质相对较少(图3a),这表明某些癌症需要在模型中包含更多数量的蛋白质才能将癌症样本与对照样本进行分类。


图3:基于上述结果,研究团队使用机器学习模型来分类不同类型的癌症,结果发现,这些模型能够将测试集中来自特定癌症类型的血浆样本区分开来,并且在所有癌症类型中表现出较高的准确性和特异性。此外,研究还分析了使用不同数量的蛋白质作为输入数据时,模型的分类能力。结果显示,在大多数癌症类型中,使用50个或更多的蛋白质作为输入可以显著提高AUC值,尽管某些癌症(如AML、骨髓瘤和胶质瘤)只需要少量蛋白质就能获得高AUC分数。

基于蛋白质组学的癌症分类研究及结果分析

研究团队在分析癌症患者血浆蛋白质组的过程中,根据 glmnet 模型的排名以及显著差异分析结果,基于3个标准:(i) 癌症分类模型表明总体重要性超过 50% 的蛋白质,(ii) 差异表达分析确定为上调的蛋白质,以及 (iii) 每种癌症至少有 3 个蛋白质,构建了一组包括83个蛋白的多分类器预测模型panel(图4a)。此外,这些选定的蛋白质在不同类型的癌症中的表达水平也有所不同。大多数选定的蛋白质只在一个癌症类型中表现出较高的水平,但也有一些蛋白质在多种癌症类型中都表现出较高的水平。其中有两个蛋白质被分类模型赋予了高重要性分数,并且在多个癌症类型中都有表现。它们分别是FKB酰胺异构酶1B(FKBP1B)和过氧化物还原酶5(PRDX5),这两种蛋白质都在肺癌和结直肠癌中表现出比其他癌症更高的水平,并且独立地被模型选为这两个癌症类型的标志物。但目前只发现FKBP1B与结直肠癌相关联,尚未发现其与肺癌的关系。而PRDX5在正常和炎症条件下具有抗氧化作用,而在癌症细胞系的转录组学分析中,该家族的其他蛋白质已被证明与肺癌和结直肠癌有关。

研究团队为评估基于选定蛋白质面板的多类分类模型是否能够准确地将不同癌症类型的样本分类。研究团队为了探索包含不同数量蛋白质的影响,根据不同的蛋白质选择方式,构建了四种不同的分类模型进行性能比较:(i) 所有蛋白质 (n = 1463),(ii) 83panel中选择的蛋白质,(iii)每种癌症的三种最重要的蛋白质(n = 36)和(iv)每种癌症的单一最重要的蛋白质(n = 12)。结果显示,使用蛋白质组(n = 83)的预测性能与使用全部蛋白的性能相当,显著优于仅使用每种癌症最显著的蛋白质标记物(图4c)。

癌症患者与健康人蛋白质标志物区分研究

研究团队通过对不同类型的癌症患者和健康人的蛋白质水平进行比较分析,发现一些特定的蛋白质可以用来区分癌症患者和健康人,并且这些蛋白质也可以用于区分不同阶段的癌症患者。例如用于识别CLL患者的CD22和结直肠癌患者中的LGALS4(图5e)。在和结直肠癌上,观察到血浆蛋白质组区分I期结直肠癌患者和健康对照的AUC为0.8;区分I期肺癌患者和健康个体的AUC为0.79,早期和晚期癌症患者的模型表现没有显着差异。虽然需要更多的独立样本验证,但这项研究表明该蛋白质面板可能成为一种有效的癌症早期诊断工具。

研究讨论

该研究基于Olink平台通过比较不同类型癌症患者的血浆蛋白组人类疾病血液图谱,找到每种类型癌症的特异性标记,构建预测模型用以区分不同癌症类型,并且该模型还能够检测肿瘤早期患者,这种方法有望为癌症精准医学提供更准确、非侵入性的诊断工具,帮助提高治疗效果并改善患者生存率。

Olink新一代蛋白组学平台可实现高通量、高特异性、高灵敏度、高动态范围的靶向蛋白质组定量检测,已在基础科研、医药研发及临床试验中研究得到广泛认可和应用。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号