问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

KGE-UNIT:基于知识图谱的药物相互作用预测模型

创作时间:
作者:
@小白创作中心

KGE-UNIT:基于知识图谱的药物相互作用预测模型

引用
1
来源
1.
https://www.bilibili.com/opus/908722128169205765

药物相互作用研究是确保药物疗效和安全性的重要环节。近年来,基于知识图谱的方法在药物相互作用预测中展现出巨大潜力。本文介绍了一种名为KGE-UNIT的模型,该模型结合了知识图谱嵌入(KGE)和多任务学习方法,能够同时预测药物靶点相互作用(DTIs)和药物相互作用(DDIs),从而提高预测性能。

药物相互作用研究背景

为了确保药物在治疗目标疾病方面具有良好的疗效,设计与特定靶点和疾病之间的相互作用化合物是主要目标之一。目前,药物相互作用(DDIs)、药物-靶点相互作用(DTIs)和蛋白质相互作用(PPIs)等研究都有助于理解分子相互作用机制,优化药物治疗方案,避免药物之间的相互干扰,提高治疗效果,并提供发现新的药物靶点和治疗靶点相关疾病的新药物的线索。

现有一些基于网络的方法已经成为下游链路预测的主流方法。GCN-DTI模型首次将图神经网络应用于DTI预测任务。此外,网络中的节点不一定仅仅是药物或者蛋白,这些网络也可以由多种类型的节点(如药物、蛋白质和疾病)以及边(如相互作用指标和节点的相似性分数)组成。如DTINet方法首次构建异质网络来整合药物和蛋白质相关信息。Mohamed等人提出了一种利用知识图谱的模型Trimodel,它采用知识图嵌入(KGE)技术来学习药物和蛋白质的特征,以此来发现未知的药物靶标相互作用。

然而现有的方法主要专注于单个任务,而没有考虑不同分子相互作用预测任务之间的潜在相关信息。

KGE-UNIT模型设计

模型框架

基于知识图谱的方法可以整合多种数据源的数据,有助于让模型更精确地捕获分子之间的复杂联系。整体框架如图1所示,作者首先整合了来自基因组学、蛋白质组学和代谢组学的异构数据构建生物学知识图谱,其中药物、疾病等视为节点,药物药物、药物靶标等相互作用视为边,并通过KGE模型来学习所有实体和关系的拓扑结构和语义关系。此外,还引入了ConvE的卷积模块来增强其异构特征的提取能力。

第二部分是一个结构特征提取器模块。首先用主成分分析方法以降低特征维度,同时保留相关实体特征中包含的基本信息。然后,通过CNN模块分别从药物分子的SMILES和蛋白质序列中提取药物和蛋白质实体的结构特征。

最后,作者设计了一个任务感知的CNN编码器用于融合异构数据的特征及相应的结构特征。


图1 模型设计流程

多任务预测模块

如图2所示,该模块首先融合了异构数据的特征及相应的结构特征,公式为:

,CNN包括卷积层、批归一化层,激活层。在融合了二者特征之后,还使用针对于特定任务的预测头部通过全连接层来对分子相互作用进行预测(即是否有相互作用的二分类问题)。损失函数为交叉熵损失函数,总的损失为各个任务的加权和,公式表示为:

,其中T为任务数量。


图2 多任务预测模块

实验结果

知识图谱方法对预测效果的影响

Luo及BioKG数据集为作者选择的两个基准数据集。这两个数据集的边类型的分布并不平衡,且DDIs对的数量比DTIs更多。如图3所示,与仅使用KGE方法相比,KGE-unit始终表现优异。具体而言,ConvE-UNIT显著超过了排名第二的DistMult-UNIT方法。与排名第三的RotatE-UNIT方法相比,在DTI任务中,ConvE-UNIT的分类指标AUROC和AUPR分别有0.85和0.97的提升。这表明KGE- unit的性能并不仅仅与KGE方法有关,还与多模态特征的集成及KGE-UNIT框架中联合多任务预测器的特征提取能力强弱有关。

图3 在2个药物相互作用任务上模型性能评估表现

消融实验评估

为了评估模型各个结构对预测性能的贡献,作者设计了五种不同的结构(即移除结构特征提取模块并保留联合多任务预测(KGE-UNIT(w/o SF+MP),移除异构特征提取模块(KGE-UNIT(w/o HF),移除结构特征提取模块(KGE-UNIT(w/o SF), 移除DTI预测模块(KGE-UNIT(w/o DTI) 移除DDI预测模块(KGE-UNIT(w/o DDI)进行实验。如图4所示,显然包含所有模块的KGE-UNIT取得了最佳性能。异构特征和结构特征都对分子相互作用的预测起到了一定的贡献。然而,与异构特征相比,结构特征对于预测结果的提升较为显著。此外,与使用多任务学习的预测效果相较于仅使用DDIs任务或者DTIs任务模块有更显著的提升。为了进一步阐明每个模块的作用,作者从训练好的KGE-UNIT模型中提取每个模块的表征,并使用t-SNE方法将其投影到二维空间中(图5)。可以发现由于在KGE-unit中加入了CNN模块以及任务感知的注意力解码模块之后,使得KGE-UNIT模型可以有效区分相互作用与非相互作用对。

图4 消融实验评估
图5 t-SNE投影可视化

结论

DTI和DDI预测等任务在药物发现的各个方面起着至关重要的作用。虽然已经提出了几种深度学习方法来揭示特定的分子相互作用的机制,但大多数现有方法倾向于预测单个任务,而对不同任务特征的考虑有限。

实验结果表明,KGE-UNIT在两个基准数据集上的表现优于现有的最先进的DTIs和DDIs预测算法。在此基础上,在发现未知的DTIs和DDIs能力上得到了相关文献的验证,证明了该方法的有效性。未来可以将药物和蛋白质的3D结构作为特征纳入模型中,并且可以通过引入预训练模型提取化合物及蛋白的表征,从而减少训练时间。

参考文献

  1. Cheng Z, Zhao Q, Li Y, Wang J. Iifdti: predicting drug–target interactions through interactive and independent features based on attention mechanism. Bioinformatics 2022;38(17):4153–61.
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号