问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Nat. Rev. Drug Discov. | 基于图像的药物发现

创作时间:
作者:
@小白创作中心

Nat. Rev. Drug Discov. | 基于图像的药物发现

引用
1
来源
1.
https://cloud.tencent.com/developer/article/1796865

基于图像的画像分析(Image-based profiling)是药物发现领域的一项重要技术,它通过分析生物图像中的丰富信息,为药物筛选和作用机制研究提供新的视角。本文将介绍基于图像的画像分析的基本原理及其在药物发现中的具体应用。

背景

筛选(Screening)是现代药物发现的主要方法,通过检测对某种疾病的影响来测试一些潜在药物。设计可筛选试验包括:(1)设计模拟疾病状况的模型系统;(2)刺激以产生与疾病相关的反应;(3)读取反映疾病功能相关的最接近可量化特征。

画像分析(profiling)是筛选的替代策略,用画像(特征的集合)表示样本,并根据这种表示对样本进行预测。目的是捕获大多没有验证出与疾病相关的特征。因此,它可能揭示未知的生物学作用。画像分析通常依赖与筛选试验相似的模型系统,但能够用更全面的特征表示这些模型系统。

构建画像分析有多种方式,其中基于图像的分析可以更好地捕获更多生物学信息。基于图像的画像分析可能得出化合物的作用机制(MOA)和未知的脱靶活动。而这要求大量从表型特征中得出可行见解的解释工作,传统的分析方法非常繁琐,难以筛选完整的库。机器学习模型的参与可以简化这些工作。

基于图像的画像分析

基于图像的画像分析需要的不是专门的设备或试剂,而是代表不同病例(例如患者的类别)或治疗条件(例如化学系统、遗传系统、时间点或生物系统的其他扰动)的生物样本图像(图1)。从本质上讲,任何图像集都可以用于基于图像的画像分析,图1的工作流程需要根据所使用的样本、干扰、染色和成像方式进行调整。有两种方法可以选择染色条件和生物学模型系统:

(1)自定义的(customized):使用被认为与某疾病属性相关的模型系统和荧光标记,具有可靠性。

(2)无偏差的(unbiased):使用无关所研究疾病的更通用的模型系统(如特定的培养细胞系)和染色集,可以检测很大部分的生物通路变化。


图1 基于图像的画像分析流程

画像分析的表型发现和筛选中,首先通过准备一些代表疾病状态和健康状态的生物样本集的策略(识别疾病相关的表型)(表1),然后捕获基于图像的画像分析,并识别患病样本与健康样本之间的可重现的表型差异,用机器学习和辅助信息滤除混淆的信号和噪声;以此发现与疾病相关的新表型以及产生对某疾病新机制的见解。最后用已识别处理的表型来(a)测试大量化学药品以逆转疾病,或(b)从健康状态的化学扰动中虚拟查询现有的基于图像的特征数据集细胞以识别那些其干扰产生负相关的细胞表型。

先导物(lead)生成

前导物生成是筛选的下一步,将数百个筛选命中结构(hits)缩小到几个潜在候选对象。生成过程中分别进行命中结构扩展和前导物优化以实现化合物的分类和修饰。基于图像的画像分析快速、灵敏并且涵盖了广泛(尽管不全面)的生物学范围。通过采取机器学习策略,在活性预测实验、预测毒性上都是可行且经济高效的。这样可以大大减少初筛的工作,从而从根本上改变典型的药物发现过程。

作用机制(MOA)的识别

阐明药物的MOA可以更深入地了解其生物学活性,增加其临床批准的机会,并可以设计新药,驱动通过不同目标区分不利影响与有利影响。

扩展的基于图像的画像分析包含许多可立即记录各种疾病和作用机制(MOA)信息的功能组合(重叠或不重叠)。用差分加权可以更好地提取目标特征,随着画像分析的扩展会产生“维数诅咒”,可以通过加权聚合和/或由机器学习产生的更强大的表示的组合特征来解决,这些特征可以具有不同级别的监督(图2)。


图2 在表型空间改善基于图像的画像分析判别能力的计算策略

图2显示了鉴定一组化合物作用机理(MOA)例子。每个测试样品(化合物)在表型空间中表示为一个点,其中点之间的距离反映了用该化合物处理过的细胞图像的相似性。采用最近邻居策略无法区分许多MOA类别。图2 a-c所示的策略可用于快速查看给定数据集中的聚类样本,如果将这些策略用于为每个样品分配MOA类,则该方法将被称为“半监督”,因为在创建此共享空间之后,将使用与已知MOA化合物(如果有)非常接近的化合物进行MOA分配。

除“维数诅咒”外,画像分析还有一系列内在挑战:如批次效应和板布局效应之类的技术伪像、与疾病无关的各种遗传或样本偏差以及化合物的多药理学。

可以使用特征调整、变换和归一化技术来增加信噪比,从而减轻维数诅咒(图2 b)。但是,这些技术仅影响放置样本的共享表示空间,而不能弥补无监督方法混淆样本偏差信号的脆弱性或共享表示空间中的多药理学。

机器学习领域尤其是深度学习推动了基于图像的画像分析的新潮流。不同于简单的权重学习,自监督的方法侧重于从同一对象的不同文档(扰动、样本或细胞类型)中学习信息(图2 c);自监督将所有样本定位在更单一的共享表示空间中;包含的样本越多,该共享表示空间将同时捕获更多的机制和生物学过程,从而增加表示的判别能力。高级监督方法的输出层产生每个预定义任务的表示形式(图2 d)。

参考资料

Chandrasekaran, S.N., Ceulemans, H., Boyd, J.D. et al. Image-based profiling for drug discovery: due for a machine-learning upgrade?. Nat Rev Drug Discov 20, 145–159 (2021).
https://doi.org/10.1038/s41573-020-00117-w

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号