问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

GWAS分析后的单倍型图分析:目的、方法与实例

创作时间:
作者:
@小白创作中心

GWAS分析后的单倍型图分析:目的、方法与实例

引用
1
来源
1.
https://cloud.tencent.com.cn/developer/article/2498288

GWAS(全基因组关联分析)是遗传学研究中常用的一种方法,用于识别与特定性状或疾病相关的基因位点。然而,GWAS分析结果可能存在假阳性问题,因此需要进一步验证和分析。单倍型图分析是验证GWAS结果可靠性的重要手段之一,其核心目的是验证显著性位点的可靠性并深入理解其遗传背景。

单倍型图分析的目的

  1. 排除假阳性结果:GWAS发现的显著性位点可能因多重检验或群体结构干扰产生假阳性。单倍型图通过分析显著性位点上下游区域的连锁不平衡(LD)结构,判断这些位点是否处于高度连锁的区块(Block)中。若基因位于Block内且被高LD区域覆盖,则说明该基因的关联性更稳定,假阳性风险显著降低。

  2. 识别连锁区域与单倍型结构:单倍型图可直观展示SNP之间的LD关系,划分Block(如通过D’或r²阈值)。Block内的SNP组合形成少数单倍型,这些单倍型代表共同遗传的DNA片段。若目标基因或标记位于Block内,其功能或调控作用更可能因连锁效应而真实存在。

  3. 辅助基因定位与功能验证:当GWAS位点位于非编码区时,单倍型图可帮助锁定候选基因的调控区域。例如,若Block覆盖某基因的启动子区,可推测该基因通过调控表达水平影响表型,从而指导后续实验验证方向。

  4. 优化分子标记选择:在分子育种或医学遗传学中,单倍型图可筛选出Block内代表性SNP(如标签SNP),减少冗余检测成本,同时保留遗传信息完整性。

单倍型图分析方法

1. 常见的单倍型图展示方式

  • Block + GWAS pvalue + LD result
  • 最下方的热图是两两SNP之间的LD值,越高越红,比较红的区域构成一个Block(用黑线连起来)
  • 如果提供gff文件,可以显示基因的上游、下游、外显子、内含子区域
  • 上面是位点的曼哈顿图,是区域性的曼哈顿图
  • 位点之间,也可以根据LD值进行可视化,以最显著的位点为四方形,其它位点与其LD值的大小呈现不同的颜色

参考代码:

LDBlockShow -InVCF Test.vcf.gz -OutPut re2 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1

结果:

re2.blocks.gz  re2.png  re2.site.gz  re2.svg  re2.TriangleV.gz

命令:

ShowLDSVG -InPreFix re2 -OutPut temp -InGWAS gwas.pvalue -Cutline 7 -ShowNum -PointSize 3

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff

也可以增加SNP的名称:

$ cat Spe.snp
chr11 24142660
chr11 24142669 SpeA
chr11 24142760 SpeB

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff -SpeSNPName Spe.snp

2. 进一步的单倍型分析

进一步分析单倍型block在不同样本中的分布,统计不同单倍型和表型数据的关系,并进行显著性检验,可以增强结果的说服力。具体步骤包括:

  1. 划分单倍型,给出单倍型的类型
  2. 统计单倍型的频率,每个单倍型有多少样本
  3. 对单倍型和表型数据进行显著性检验(如T检验或方差分析)
  4. 结果可视化(箱线图、小提琴图等)

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号