问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

NCBI数据库检索技巧:从入门到精通

创作时间:
作者:
@小白创作中心

NCBI数据库检索技巧:从入门到精通

引用
nature
15
来源
1.
https://www.nature.com/articles/s41597-024-03571-y
2.
https://blog.csdn.net/ZaoJewin/article/details/136545295
3.
https://pubchem.ncbi.nlm.nih.gov/source/MMDB
4.
https://www.ncbi.nlm.nih.gov/datasets/docs/v2/reference-docs/data-reports/
5.
https://researchguides.ben.edu/c.php?g=978382&p=8239248
6.
https://hpc.nih.gov/apps/edirect.html
7.
https://www.greenfafa.com/tools/blast
8.
https://www.agrisearch.cn/user/docDetail_show.htm?sourceUrl=similarResource&language=en&paperid=EE330302-CAEF-CD62-3CAF-8A62E0999089&orderType=W&csrftoken=f620651b176e408e90547f603148a794
9.
https://www.aimieditor.com.cn/sci_writing_article/411
10.
https://fastercapital.com/content/Discovering-the-World-of-Life-Sciences--A-Guide-to-Entrez-in-NCBI.html
11.
https://guides.lib.uiowa.edu/c.php?g=132076&p=863918
12.
https://www.iivd.net/article-36173-1.html
13.
https://www.agrisearch.cn/user/docDetail_show.htm?sourceUrl=similarResource&language=en&paperid=DA2359CB-99A3-D453-0B68-C4C614E214F3&orderType=W&csrftoken=743621798a2c43d48b7b610c54db9d41
14.
https://www.nlm.nih.gov/bsd/pubmed_subsets/sysreviews_strategy.html
15.
https://www.nlm.nih.gov/mesh/meshhome.html

美国国家生物技术信息中心(NCBI)数据库是生物信息学研究中最重要的资源之一,它不仅存储了海量的生物学数据,还提供了强大的检索和分析工具。本文将详细介绍如何高效使用NCBI数据库,重点介绍Entrez系统、BLAST工具和PubMed的高级检索技巧。

01

Entrez系统:NCBI的核心检索工具

Entrez系统是NCBI的核心数据检索系统,它将所有数据库(包括基因、蛋白质、文献等)连接在一起,提供了一个统一的检索界面。Entrez系统支持关键词搜索,并提供了多种过滤和排序选项,使用户能够快速找到所需的数据。

基本使用方法

在NCBI主页的搜索框中输入关键词,Entrez系统会自动在所有数据库中进行搜索。例如,搜索“human insulin”会返回与人类胰岛素相关的基因、蛋白质、文献等信息。

高级检索技巧

  • 字段限定:通过指定搜索字段可以提高检索的准确性。例如,使用“human insulin [Gene Name]”仅搜索基因名称为“human insulin”的记录。
  • 布尔逻辑运算:使用AND、OR、NOT等逻辑运算符可以构建复杂的查询语句。例如,“human insulin AND diabetes”将返回同时包含“human insulin”和“diabetes”的记录。
  • 过滤和排序:在搜索结果页面,可以使用左侧的过滤器按数据库、物种、发表时间等条件进行筛选。此外,还可以根据相关性、发表时间等对结果进行排序。

02

BLAST工具:序列比对的核心工具

BLAST(Basic Local Alignment Search Tool)是NCBI提供的最常用的序列比对工具,用于在数据库中搜索与给定查询序列相似的序列。BLAST广泛应用于基因识别、功能注释和进化分析等领域。

使用场景

  • 基因序列比对:将新测序的基因与已知基因库进行比对,以确定其功能和同源性。
  • 蛋白质序列分析:通过比对蛋白质序列,预测其结构和功能。
  • 病毒变异监测:比对病毒基因组序列,监测其变异情况。

参数设置

  • 数据库选择:根据查询序列的类型选择合适的数据库(如nt、nr、refseq等)。
  • 算法选择:根据序列类型和长度选择合适的BLAST程序(如blastn、blastp、blastx等)。
  • E值设置:E值(期望值)用于衡量比对结果的显著性,值越小表示比对结果越可靠。

03

PubMed:文献检索的利器

PubMed是NCBI提供的生物医学文献数据库,收录了数千万篇期刊文章的摘要和引用信息。PubMed提供了强大的检索功能,支持关键词搜索、主题词检索和高级检索。

基本检索

在PubMed主页的搜索框中输入关键词,系统会返回与关键词相关的文献列表。例如,搜索“cancer immunotherapy”会返回与癌症免疫治疗相关的文献。

高级检索技巧

  • 布尔逻辑运算:使用AND、OR、NOT等逻辑运算符构建复杂查询。例如,“cancer AND immunotherapy NOT review”将返回关于癌症免疫治疗的非综述性文章。
  • 主题词检索:通过MeSH(Medical Subject Headings)数据库使用主题词进行检索,可以提高查全率和查准率。例如,使用主题词“Neoplasms”和“Immunotherapy”进行检索。
  • 字段限定:通过限定作者、期刊、发表时间等字段,可以进一步缩小搜索范围。例如,“cancer immunotherapy [Title/Abstract]”仅搜索标题或摘要中包含相关关键词的文献。

04

实际应用案例

基因序列检索和分析

假设我们需要查找人类胰岛素基因的序列信息:

  1. 在Entrez系统中搜索“human insulin [Gene Name]”
  2. 选择正确的基因记录,查看其详细信息
  3. 使用BLAST工具将该基因序列与其他物种的胰岛素基因进行比对,分析其保守性

文献检索和数据提取

假设我们需要查找近年来关于癌症免疫治疗的最新研究:

  1. 在PubMed中搜索“cancer immunotherapy”
  2. 使用过滤器选择最近5年的文献
  3. 通过主题词检索提高查准率
  4. 使用EDirect工具批量下载相关文献的摘要信息
05

总结与展望

掌握NCBI数据库的检索技巧对于生物信息学研究至关重要。通过熟练使用Entrez系统、BLAST工具和PubMed,研究人员可以更高效地获取和分析数据,推动科学研究的发展。未来,随着生物数据的持续增长,NCBI将继续优化其数据管理和检索系统,为科研人员提供更强大的支持。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号