GraphRAG如何构建知识图谱(Knowledge Graph)
创作时间:
作者:
@小白创作中心
GraphRAG如何构建知识图谱(Knowledge Graph)
引用
1
来源
1.
https://www.cnblogs.com/tgltt/p/18516035
GraphRAG是一种基于大模型的few shot能力来构建知识图谱的技术。它通过将输入的文档集合拆分成chunks,然后解析每个chunk中的实体和关系,最终构建出知识图谱。本文将详细介绍GraphRAG的具体实现方法和prompt模板的设计。
GraphRAG构建知识图谱的第一步是将输入的文档集合按照一定的策略拆分成一个个chunks,然后解析每个chunk中的实体(entity)和关系(relation),以此构建知识图谱。
那么,GraphRAG是如何抽取文本中的实体及其间的关系的呢?与传统的NLP任务不同,GraphRAG并没有采用标注词性并训练LSTM/GRU网络的方法,而是借助大模型的few shot能力来提取输入文档中的实体关系。
GraphRAG默认使用OpenAI的ChatGPT,并基于默认的prompt模板来提取关系实体。考虑到不同文本所属领域和语言的差异,对于不同的输入文本,需要对prompt模板进行微调(tune)。
GraphRAG的prompt模板主要有三种类型:
- Entity/Relation提取
- 作用:指示LLM如何提取实体关系
- 源码路径:http://github.com/microsoft/graphrag/blob/main/graphrag/index/graph/extractors/graph/prompts.py
- 总结Entity/Relation描述
- 作用:指示LLM如何对每个Entity/Relation的功能进行总结
- 源码路径:http://github.com/microsoft/graphrag/blob/main/graphrag/index/graph/extractors/summarize/prompts.py
- Claim提取
- 作用:指示LLM如何提取每个Entity的Claim(可以理解为Entity或Relation的属性)
- 源码路径:http://github.com/microsoft/graphrag/blob/main/graphrag/index/graph/extractors/claims/prompts.py
以提取Entity/Relation为例,prompt包含Goal、Steps、Examples等几个部分,用于告诉LLM本次任务的目标、达成目标的方法,并通过Examples部分提供具体示例。微调prompt以适应当前任务的主要方法是修改Examples部分,将本次任务领域的实体关系举例写进并替换Examples部分的例子,从而帮助LLM识别并提取本次任务关注的实体关系类型。
热门推荐
豆腐保存全攻略:从1天到30天,5种实用保存方法让你吃上新鲜豆腐
个人借款协议如何书写:法律要点解析及实务指南
代码注释的最佳实践
咳嗽有哪些忌口的食物
未来五年职场趋势:你具备最需要的技能吗?
健身前不能吃什么
中药的疗效与应用
栗子胡椒牛肉汤:善用干煸黑白胡椒的香气,带出牛肉的鲜甜滋味,喝来暖胃护心
浅析艺人合同中道德条款的适用
2025F1中国大奖赛门票开售,新赛季第二站看点十足
颈椎生理曲度变直可以做这八个运动!内含GIF动图!
糖尿病患者能吃桑葚干吗?医生给出专业解答
定制衣柜:5个细节让美观与实用兼得!
喉咙出现这3个异常,哪怕只有1个也要及时检查!可能是疾病
各国驻华大使馆/签证申请中心查询指南
皮下囊肿病变症状及治疗建议
图像与视频SEO优化提升用户体验与搜索引擎排名的关键策略
网易雷火游戏校招面试真题汇总及其解答
个体工商户年报申报的法律要求与合规流程
盘点连云港八大特色美食,当地人都爱吃,你尝试过几种?
几乎未与沙俄交锋,为何清朝总是要给沙俄割地赔款?清廷畏俄如虎
如何回应别人的道歉?有效的回应技巧与实例
央媒起底“开盒挂人” :把网暴变成生意,赚流量博眼球
新车保养的正确周期与重要性
银行理财产品的投资策略选择?
岭城交警全力开展城区交通秩序整治行动
旧房产证换新房产证的流程
Transformer为什么使用多头注意力机制?
从小城青年到商业大佬,35年他掌舵四大央企
第四代半导体重大突破!国内6英寸氧化镓实现产业化【附功率半导体技术赛道观察图谱】