DeepSeek文献检索实战教程:CherryStudio+Zotero
DeepSeek文献检索实战教程:CherryStudio+Zotero
本文以博主的研究课题为例,实战记录基于DeepSeek的文献检索过程。对话过程使用“CherryStudio”平台,调用“硅基流动”部署的Deepseek-R1模型。相关的基本操作详见【DeepSeek应用】DeepSeek搭建个人知识库(Ollama+CherryStudio)。
1. Deepseek文献检索的实现方法
1.1 使用Deepseek进行文献检索的步骤
- 明确检索目标与关键词
- 提取核心概念:分解研究课题为关键词(如“深度学习”、“图像分割”、“医学影像”)。
- 扩展关键词形式:涵盖缩写(如CNN、MRI)、近义词(如“神经网络”)、中英文术语(双语检索更全面)。
- 示例公式:(深度学习 OR 深度神经网络) AND (医学图像分割 OR 肿瘤检测)
- 利用Deepseek的AI智能检索
- 自然语言提问:直接向Deepseek描述需求,例如:“请推荐近3年基于Transformer的医学图像分割算法相关的高被引论文。”
- 文献关联挖掘:根据已有文献反向拓展,例如:“已知《Attention U-Net》这篇论文,请推荐其关键引文和后续改进研究。”
- 学科交叉建议:询问相关领域可能交叉的方向,例如:“将扩散模型用于遥感图像分割的可行性分析及相关文献推荐。”
- 深度筛选与验证
- 质量评价指标:通过AI快速提取文献的H指数、期刊影响因子、被引量等数据。
- 方法论对比:让Deepseek总结某技术方向(如“弱监督医学分割”)不同论文的优缺点。
- 可视化分析:生成研究领域的演进脉络图或关键词共现网络(需结合其他工具如VOSviewer)。
1.2 推荐的学术增强工具链
- 文献发现工具
- Connected Papers (https://www.connectedpapers.com/)
- 输入种子论文自动生成文献图谱
- 识别该领域的奠基性论文和最新突破
- ResearchRabbit (https://www.researchrabbit.ai/)
- 可视化文献网络探索
- 支持协同共享文献集
- 全文获取渠道
- Unpaywall (浏览器插件):自动探测合法开放获取版本
- Sci-Hub:应急使用(注意版权)
- ResearchGate:直接向作者索取文献
- AI文献分析工具
- Elicit (https://elicit.org)
- 用自然语言提问自动汇总多个研究结论
- 提取不同论文的实验设计对比表
- Consensus (https://consensus.app)
- 基于AI的文献证据评估
- 快速回答"X方法是否比Y方法更有效?"
- 文献管理组合
- Zotero + AI插件:
- ChatZotero:用对话方式管理文献库
- Zotero GPT:自动生成文献综述草稿
- Scite (https://scite.ai)
- 智能分析文献被引上下文
- 识别某观点是否被后续研究支持/反驳
1.3 高效检索策略
- 迭代检索法
- 初步检索 → 阅读摘要 → 提炼新关键词 → 二次检索
- 目标:达到"文献饱和"(反复出现相同核心文献)
- 引文珠形增长策略
- 找到1篇高相关论文 → 追踪其参考文献(回溯经典)→ 查找后续引用该文的论文(跟踪发展)
- 多数据库校验
- 同时检索中文数据库(CNKI、万方)和英文库
- 防止地域性偏倚(某些技术可能在特定地区优先发展)
2. 文献检索设计
2.1 分析核心概念
根据课题背景,分析核心概念。核心概念 具体含义 关联技术/领域
- ROP:早产儿视网膜病变(Retinopathy of Prematurity) 新生儿眼病、视网膜成像、眼底照相筛查
- AI技术:人工智能算法(如分类、分割、检测任务) 深度学习、卷积神经网络、迁移学习
- 医疗应用:自动化筛查、辅助诊断、病变分级 敏感度/特异性分析、临床决策支持系统
2.2 关键词扩展
- 基础关键词(人工定义):
- Retinopathy of Prematurity
- ROP screening
- infant retinal imaging
- 核心术语扩展(通过DeepSeek生成):
概念 关键词形式
- ROP
- 英文:ROP, Retinopathy of Prematurity, Retinal disease in preterm infants
- 中文:早产儿视网膜病变, ROP筛查, 新生儿视网膜病变
- AI技术
- 英文:Artificial Intelligence, Deep Learning, CNN, Medical Image Analysis, Computer-Aided Diagnosis (CAD)
- 中文:人工智能, 深度学习, 医学影像分析, 计算机辅助诊断
- 应用目标
- 英文:Screening, Diagnosis, Classification, Severity Grading
- 中文:筛查, 诊断, 病变分级, 自动评估
- 补充控制词(通过DeepSeek生成):
概念 控制词形式
- 技术相关:segmentation, transfer learning, attention mechanism
- 数据相关:fundus images, retinal photography, neonatal screening
- 评价指标:sensitivity, specificity, AUC
2.3 检索表达式设计
- PubMed
检索逻辑:结合自由词(标题/摘要)与MeSH主题词,限制近10年文献:
(("Retinopathy of Prematurity"[MeSH] OR ROP OR "retinal disease in preterm")
AND
("Artificial Intelligence"[MeSH] OR "Deep Learning"[MeSH] OR "Neural Networks, Computer"[MeSH]
OR "computer-aided diagnosis" OR "image analysis")
AND
(screen* OR diagnos* OR classif*))
FILTER: 2014/01/01 - 2024/12/31
- Web of Science
检索式(TS=主题,时间限制近10年):
TS= (
( "Retinopathy of Prematurity" OR ROP OR "preterm retinopathy" )
AND
( "artificial intelligence" OR "deep learning" OR "convolutional neural network" )
AND
( screen* OR diagnos* OR "severity grading" )
)
Timespan: 2014-2024, English Articles
- IEEE/IEL(工程技术类文献)
检索式:
("Retinopathy of Prematurity" OR ROP)
AND
("deep learning" OR "convolutional neural network" OR "medical imaging")
AND
(screening OR diagnosis)
AND
("fundus image" OR "retinal image")
- 中国知网(CNKI)
检索式(专业检索模式,时间限制近10年):
SU=(早产儿视网膜病变 + ROP) * (人工智能 + 深度学习 + 卷积神经网络) * (筛查 + 诊断 + 分级)
AND
(FT=医学影像 OR FT=眼底照相)
时间:2014-2024 年
2.4 优化建议
- 查全策略:
- 在英文检索式末尾添加通配符(如diagnos*涵盖 diagnosis/diagnostic)
- 使用OR连接同义词(例:(“fundus images” OR “retinal photography”))
- 查准策略:
- 添加排除词:NOT animal NOT mouse(避免动物实验文献)
- 限定字段(如TI=标题)过滤低相关文献
- 领域适配调整:
- 医学数据库(如PubMed):侧重临床验证结果(敏感度/特异性)
- 工程数据库(如IEEE):关注算法创新(新网络结构、数据增强方法)
- 初步检索后校验策略:
- 检查前20篇文献的标题/摘要的匹配度
- 若噪音过多,在检索式中添加限制(如仅保留“婴儿/新生儿”关键词)
- 关键文献溯源:
- 对于高相关论文,可以通过查看“引文网络”,追踪相关文献
3. 基于Deepseek检索式进行手动检索
3.1 PubMed检索
访问PubMed网站。
打开浏览器进入 https://pubmed.ncbi.nlm.nih.gov/,登录PubMed。输入表达式检索。
将以下表达式粘贴到搜索框,点击 “Search” 进行检索。如下图所示,检索到113篇文献。("Retinopathy of Prematurity"[MeSH] OR ROP OR "retinal disease in preterm") AND ("Artificial Intelligence"[MeSH] OR "Deep Learning"[MeSH] OR "Neural Networks, Computer"[MeSH] OR "computer-aided diagnosis" OR "image analysis") AND (screen* OR diagnos* OR classif*)) AND (2014:2024[pdat])
抓取文献导入到Zotero。
(1)点击浏览器右上角的Zotero Connector图标(上图中红色方框),弹出Zotero Item Selector窗口,点击“Select All”按钮,选择将其保存到指定的“ROP_AI”文件夹中。
(2)Zotero会自动识别文献信息(如标题、作者、期刊等),导入Zotero客户端。如果页面包含PDF文件,Zotero会同时下载并关联到文献条目。
(3)打开Zotero客户端程序,在“ROP_AI”文件夹中已经导入检索到的113篇文献。
说明:
(1)Zotero自动翻译了导入文献的标题和摘要,需要通过AT动作插件自定义工作流实现,详见博文【文献阅读】Zotero新手完全教程:安装、使用与插件。
(2)有些文献后带有PDF图标,说明已经下载了文献的PDF全文。
3.2 知网(CNKI)检索
访问中国知网。
打开浏览器进入CNKI官网,登录知网。点击“高级检索”。输入表达式检索。
将以下表达式粘贴到搜索框,点击“检索”进行检索。如下图所示,检索到40篇文献。SU=('早产儿视网膜病变' OR 'ROP') AND SU=('人工智能' OR '深度学习' OR '神经网络') AND SU=('筛查' OR '诊断' OR '分级')
抓取知网检索文献导入到Zotero。
(1)点击浏览器右上角的Zotero Connector图标(上图中红色方框),弹出Zotero Item Selector窗口,点击“Select All”按钮,选择将其保存到指定的“ROP_中文期刊”文件夹中。
(2)Zotero会自动识别文献信息(如标题、作者、期刊等),导入Zotero客户端。如果页面包含PDF文件,Zotero会同时下载并关联到文献条目。
(3)打开Zotero客户端程序,在“ROP_中文期刊”文件夹中已经导入检索到的40篇文献。
说明:
(1)抓取知网中文文献,需要“茉莉花(Jasminum)插件”支持,详见博文【文献阅读】Zotero新手完全教程:安装、使用与插件。
3.3 补充检索
根据之前的检索结果,发现对于早期使用传统图像处理方法而不是深度学习、神经网络方法的文献可能有遗漏。于是要求Deepseek生成补充搜索的表达式,然后再根据该表达式进行补充搜索。
用户:针对早期使用传统图像处理方法而不是深度学习、神经网络方法,例如形态学、特征提取、分形等方法,进行ROP计算机辅助诊断,请给出的PubMed优化检索表达式
DeepSeek-R1:以下是针对使用传统图像处理方法(如形态学、特征提取、分形)进行ROP计算机辅助诊断的PubMed优化检索表达式,结合MeSH词与自由词策略,同时排除深度学习与神经网络相关文献:
PubMed检索式
……
用户:类似的,生成采用传统方法计算机辅助在ROP应用的中国知网的检索式
DeepSeek-R1:以下是针对中国知网(CNKI)中关于使用传统图像处理方法(形态学、特征提取、分形分析等)的ROP计算机辅助应用的优化检索式及策略:
……
4. 文献阅读与分析
目前,我们已经检索获取了189篇英文文献和40篇中文文献。如何分析、阅读和综述这些大量的专业文献呢?对此,本文只做简单示例,下文进行详细介绍。
在Zotero安装AwesomeGPT插件,并接入硅基流动平台Deepseek模型,不仅可以对单篇文献进行阅读,还可以对一组(40)篇文献进行分析,结果如下:
本文主要探讨了人工智能(AI)在早产儿视网膜病变(ROP)诊断和治疗中的应用进展。ROP是早产儿和低体重儿常见的视网膜血管增生性疾病,若不及时诊断和治疗,可能导致失明。近年来,AI技术在医学领域的应用取得了显著进展,尤其在ROP的诊断、筛查、病情监测和远程医疗等方面展现出巨大潜力。
1. **AI在ROP诊断中的应用**:AI通过深度学习算法,特别是卷积神经网络(CNN),能够从眼底图像中自动识别和定位ROP病变,辅助医生进行精准诊断。例如,基于深度学习的ROP智能分析系统能够对ROP病变进行分类,并提供血管迂曲度、宽度等量化指标,辅助医生判断病情严重程度 [25]。此外,AI模型在ROP的自动筛查和诊断中表现出高准确率,部分模型的准确率超过95% [14][29]。
2. **AI在ROP筛查中的应用**:AI技术能够通过远程医疗平台实现ROP的自动化筛查,减少对专业眼科医生的依赖,特别是在医疗资源匮乏的地区。例如,基于深度学习的ROP筛查系统能够快速分析眼底图像,筛选出需要进一步诊断的病例,显著提高了筛查效率 [13][17]。
3. **AI在ROP病情监测和预测中的应用**:AI不仅可以用于ROP的诊断,还可以通过分析眼底图像预测ROP的发病风险和病情进展。例如,基于深度学习的ROP预测模型能够通过早产儿的首次筛查眼底照片预测ROP的发病风险,并评估其严重程度 [27][31]。此外,AI还能够预测与ROP相关的早产儿并发症,如支气管肺发育不良、动脉导管未闭等 [27]。
4. **AI在ROP治疗中的应用**:AI技术还可以辅助医生制定治疗方案。例如,基于深度学习的ROP辅助治疗决策系统能够根据眼底图像判断是否需要治疗,并推荐合适的治疗方法,如视网膜激光光凝或玻璃体腔注射抗血管内皮生长因子药物 [14]。
尽管AI在ROP的诊断和治疗中展现出巨大潜力,但其在临床实践中仍面临一些挑战,如数据质量、模型鲁棒性、数据安全性等问题 [5][13]。未来,随着技术的不断进步和数据的积累,AI有望在ROP的筛查、诊断和治疗中发挥更大作用,进一步降低ROP的致盲率 [5][10]。
总结来说,AI技术在ROP领域的应用不仅提高了诊断的准确性和效率,还为远程医疗和自动化筛查提供了新的可能性,具有广阔的应用前景。