miRNASNP v4:涵盖17个物种的miRNA关联SNP综合数据库
miRNASNP v4:涵盖17个物种的miRNA关联SNP综合数据库
miRNASNP v4数据库最新版本已发布,该数据库涵盖了17个物种的miRNA相关SNP信息,为研究人员提供了一个全面的资源平台,以研究miRNA相关的遗传变异及其功能影响。
MicroRNA(miRNA)是一类小内源性非编码RNA分子。作为一类重要的转录后调控因子,miRNA可以结合到3’端非翻译区,导致mRNA降解或翻译抑制。在动物中,miRNA对靶基因的识别主要依赖于种子区,种子区由miRNA的5’端的7个核苷酸组成。越来越多的证据表明,miRNA或miRNA靶标结合位点的遗传变异可以影响miRNA的生物发生或靶标结合,从而调节基因调控。例如,先前的一项研究表明,位于BET1L的3’端非翻译区的SNP rs11245997通过破坏miR-140-3p的结合来促进BET1L的表达。此外,越来越多的与miRNA相关的SNP被报道与人类疾病有关。位于mir-1304的茎环区域的SNP rs2155248影响miR-1304-3p的生物发生,可能是非裔美国人乳腺癌的潜在危险因素。此外,对于免疫系统,有研究表明miR-146a基因区域的SNP rs2431697与类风湿关节炎(一种常见的自身免疫性疾病)的易感性相关。因此,全面调查和注释这些miRNA相关变异对于理解miRNA调控和功能变异选择至关重要。
为了鉴定和分析miRNA相关SNP的功能,人们开发了多种资源,如MicroSNiPer、miRdSNP、MirSNP、PolymiRTS、MSDD和miRNASNP。然而,大多数这些资源主要集中在人类物种,很少有数据库提供跨多种物种的miRNA相关SNP功能的全面视图。人类miRNA相关SNP的成功验证引发了对其他动物中这些变异的兴趣。例如,Wang等人发现猪miRNA ssc-miR-7134-3p靶向的MARK4基因的SNP(g.2581A > G)与中国和欧洲猪群体的背膘性状显著相关。此外,随着测序技术的广泛应用,在过去几年中,已鉴定的SNP数量大幅增加,尤其是动物。与2020年开发的基于dbSNP151的miRNASNP-v3相比,人类SNP的数量增加到原来的1.66倍,并且开发了各种动物SNP资源。因此,一个包含miRNA相关SNP及其在多个物种功能谱的更全面数据库已成为迫切需要。
图1 miRNASNP-v4数据库的输入、内容和页面设计
miRNASNP数据库致力于识别miRNA和可能影响miRNA生物发生和结合的基因中的SNP和DRV。基于miRNASNP,已经确定了几个功能性SNP并进行了实验验证,突出了miRNASNP数据库的有用性。例如,Liu等人利用miRNASNP筛选潜在的功能性SNP,然后通过病例对照研究证实了它们与糖尿病视网膜病变的关联,并发现miR-449b中的rs10061133与糖尿病视网膜病变风险降低显著相关。又如STIM1是肺动脉血管收缩和肺动脉平滑肌细胞增殖的重要基因。Liu等人参考miRNASNP的预测,通过影响hsa-miR-3140-5p和hsa-miR-4766-5p的转录调节功能,验证了STIM1中的rs1561876-G比野生型rs1561876-A具有明显更强的转录活性,为肺动脉高压的发病机制提供了新的见解。然而,前三个版本只关注人类。自2020年miRNASNP-v3发布以来,人类和其他动物物种中的SNP和miRNA数量显著增加,这为miRNASNP的更新提供了有利条件。通过对17个物种的最新数据进行miRNA相关SNP的鉴定,miRNASNP-v4在miRNA中共发现82,580个SNP,在3’端非翻译区发现24,836,179个SNP,这些SNP对miRNA二级结构或靶标结合有潜在影响。这些结果将极大地扩展数据库在科学界的应用范围。此外,17个物种的miRNA相关变异及其对miRNA功能的影响,从进化角度全面了解了miRNA和相关SNP的研究。“如何优先考虑候选SNP用于生物实验”是miRNASNP用户反馈的一个常见问题。在更新过程中,不断整合信息以协助miRNA相关snp的选择。在miRNASNP-v4中,用最新的数据更新了不同组织的miRNA表达、GWAS和DRV信息。此外,还增加了更多关于人类的信息,例如实验验证的免疫相关miRNA,以及与药物反应和免疫浸润相关的miRNA相关SNP。此外,在web界面上,提供了多种物种miRNA相关变异的在线预测工具,允许用户预测用户自定义变异对miRNA-靶标结合或pre-miRNA二级结构的影响。这些改进将增强数据库在假设生成和实验设计方面的效用。
总之,更新后的miRNASNP-v4具有丰富的数据、新颖功能和分析工具,有望成为miRNA相关变异研究的重要资源。但是,miRNASNP-v4数据库仍然存在一定的局限性。来自TCGA样本的免疫浸润和药物反应数据是计算得到的,而不是直接实验生成的,这可能会带来一定程度的不确定性。此外,miRNA的靶结合位点是通过计算方法预测的,虽然有帮助,但有时可能会导致假阳性。因此,SNP对miRNA功能的影响仍需通过生物学实验来证实。在miRNASNP-v4中,虽然在其他16种动物中收集了大量的动物SNP和miRNA,但在miRNA中鉴定的SNP数量仍然相对较少。随着测序技术的不断进步,预计将发现更多跨物种的miRNA和SNP信息。此外,随着人工智能的发展,新的算法可能有助于确定功能性SNP的优先级。
参考文献
[1] Cao W, He J, Feng J, Wu X, Wu T, Wang D, Min C, Niu X, Gao Z, Guo AY, Gong J. miRNASNP-v4: a comprehensive database for miRNA-related SNPs across 17 species. Nucleic Acids Res. 2024 Oct 16:gkae888. doi: 10.1093/nar/gkae888.
本文原文来自科学网