易混淆亲缘关系统计量(血缘系数、亲缘系数、近交系数)介绍
易混淆亲缘关系统计量(血缘系数、亲缘系数、近交系数)介绍
在遗传学中,血缘系数、亲缘系数和近交系数是衡量个体间亲缘关系的重要统计量。这些概念虽然容易混淆,但各自有着明确的定义和计算方法。本文将详细介绍这三个概念的区别和应用场景。
背景
血缘系数、亲缘系数、近交系数等表征亲缘关系的统计量,在遗传学中经常使用。然而,这些概念很容易混淆。下面是几个概念的区别。注意的是,这些名词大多由英文翻译而来,而不同地方的中文翻译可能会有所差异,以英文名词为准。
介绍之前简单说一下同源性(Identity by Descent, IBD)的概念,它指两个等位基因来源于同一祖先。
Kinship coefficient / Coefficient of kinship
血缘系数的定义
血缘系数/近亲系数(Coefficient of Kinship,简称(\phi))是遗传学中的一个重要概念,表示两个个体之间共享等位基因的概率。具体来说,它表示从两个个体中随机选择的两个等位基因在一个基因座上同源(即从共同祖先继承)的概率(Probability that an allele at a locus for two individuals was inherited from the same genome)。
血缘系数的计算
血缘系数的计算涉及到追踪两个个体的家谱,并根据他们的共同祖先的数量和每代的遗传贡献来估算。例如,兄弟姐妹之间的系谱系数为0.25,因为他们有50%的概率从同一对父母继承相同的等位基因,而每个父母贡献了50%的遗传物质。
血缘系数(\phi_{XY})可以通过以下公式计算:
[\phi_{XY} = \sum (0.5)^{n_1 + n_2} ]
其中(n_1)和(n_2)分别是从共同祖先到个体(X)和(Y)的代数。
常见亲属关系的血缘系数
以下是一些常见亲属关系的亲属系数:
- 自我:(\phi = 0.5)(每个人与自己共享50%的等位基因)
- 父母与子女:(\phi = 0.25)(父母与子女共享25%的等位基因)
- 全同胞(兄弟姐妹):(\phi = 0.25)(兄弟姐妹共享25%的等位基因,因为他们有50%的概率从同一对父母继承相同的等位基因。)
- 半同胞(同母异父或同父异母的兄弟姐妹):(\phi = 0.125)(半同胞共享12.5%的等位基因)
- 祖父母与孙子女:(\phi = 0.125)(祖父母与孙子女共享12.5%的等位基因)
- 叔侄、姨甥关系:(\phi = 0.125)
- 堂表亲(第一代表亲):(\phi = 0.0625)(堂表亲共享6.25%的等位基因)
Coefficient of relationship / coefficient of relatedness
亲缘系数的定义
亲缘系数(Coefficient of Relationship,简称(r))是指两个个体之间的遗传关系程度。它表示两个个体共享的基因的比例,通常用百分比或小数表示。亲缘系数是遗传学中的一个重要概念,用于估计亲属之间共享等位基因的概率。亲缘系数由 Sewall Wright 定义。亲缘系数数值上是血缘系数(\phi)的两倍。
亲缘系数的计算方法
亲缘系数基于家谱信息,可以通过追溯共同祖先来计算。假设两个个体(X)和(Y)通过多个路径可以追溯到他们的共同祖先,那么可以通过以下步骤计算他们的亲缘系数:
- 确定所有共同祖先。
- 计算每条路径的概率。对于每条路径,通过各代分支处的传递概率(每代为0.5)计算。
- 将所有路径的概率相加。
公式表示如下:
[r_{XY} = \sum (0.5)^n ]
其中,(n)是从共同祖先到(X)和(Y)的路径中间的代数。
常见亲属关系的亲缘系数
以下是一些常见亲属关系的亲缘系数:
- 自我:(r = 1)(每个人与自己共享100%的基因)
- 父母与子女:(r = 0.5)(父母与子女共享50%的基因)
- 全同胞(兄弟姐妹):(r = 0.5)(兄弟姐妹共享50%的基因)
- 半同胞(同母异父或同父异母的兄弟姐妹):(r = 0.25)(半同胞共享25%的基因)
- 祖父母与孙子女:(r = 0.25)(祖父母与孙子女共享25%的基因)
- 叔侄、姨甥关系:(r = 0.25)
- 堂表亲(第一代表亲):(r = 0.125)(堂表亲共享12.5%的基因)
Coefficient of inbreeding
近交系数的定义
近交系数(Coefficient of Inbreeding,简称(F))是衡量一个个体在某基因座位上从父母双方继承的等位基因是同源(即从共同祖先继承)的概率。简单来说,近交系数表示个体的父母是否有血缘关系及其程度,反映的是近亲交配的程度。 近交系数由 Sewall Wright 最早定义,有时也称为固定系数 Fixation index。
近交系数的计算
近交系数(F)的计算通常涉及家族谱系图,并且需要知道个体的祖先及其关系。以下是计算近交系数的一般步骤:
- 识别共同祖先:确定个体的共同祖先(即个体的父母双方都从这些祖先继承了基因)。
- 确定路径:找到从共同祖先通过父母到个体的所有可能路径。
- 计算每条路径的概率:对于每条路径,从共同祖先到个体的每一步都有 50% 的概率传递一个等位基因。
- 累加所有路径的概率:将所有路径的概率累加起来。
对于一个个体来说,假设(A)是父母(X)和(Y)的共同祖先,近交系数(F)可以通过以下公式计算:
[F = \sum_{A} \frac{1}{2^{n_1 + n_2 + 1}} (1 + F_A) ]
其中:
- (n_1)是从共同祖先(A)到个体(X)的代数。
- (n_2)是从共同祖先(A)到个体(Y)的代数。
- (F_A)是共同祖先(A)的近交系数。如果(A)是非近交个体,(F_A = 0)。
具体例子
假设一个个体(Z)的父母(X)和(Y)是全同胞(兄弟姐妹),那么个体(Z)的近交系数(F_Z)的计算如下:
- 识别共同祖先:假设(X)和(Y)的共同祖先是(A)和(B)。
- 确定路径:从(A)到(X)和(Y),以及从(B)到(X)和(Y)的路径。
- 计算每条路径的概率:每条路径有两代(从(A)到(X),从(A)到(Y)),所以((0.5)^{2 + 2 + 1} = (0.5)^5 = 0.03125)。
- 累加所有路径的概率:有两条路径(通过(A)和通过(B)),所以(2 \times 0.03125 = 0.0625)。
因此,个体(Z)的近交系数(F_Z = 0.0625)。
常见的近交系数
- 自我:(F = 1)(完全同质化)
- 父母与子女:(F = 0.5)
- 全同胞(兄弟姐妹):(F = 0.25)
- 半同胞(同母异父或同父异母的兄弟姐妹):(F = 0.125)
- 叔侄、姨甥关系:(F = 0.125)
- 堂表亲(第一代表亲):(F = 0.0625)
换算
对于个体(r)和(j),同一亲属关系的亲缘系数(r_{ij})数值上是血缘系数(\phi)的两倍。
亲缘系数(r_{ij})与近交系数(F_i)和(F_j)的换算关系为:
[r_{ij} = \frac{2F_{ij}}{\sqrt{1+F_i} \sqrt{1+F_j}} ]
对于二倍体生物:
血缘系数(\phi) 近交系数(F) 亲缘系数(r) 亲属关系例子
1/2 1/2 1 同卵双胞胎、克隆体、自交
1/4 1/4 1/2 父母和孩子
1/4 1/4 1/2 亲兄弟姐妹
1/8 1/8 1/4 同母异父或同父异母的兄弟姐妹
1/8 1/8 1/4 祖父母和孙
1/8 1/8 1/4 叔/舅和侄女、姑/姨和侄子
1/16 1/16 1/8 曾祖父母和曾孙
1/16 1/16 1/8 伯/叔祖父和大侄、伯/叔祖母和大甥
1/16 1/16 1/8 表/堂兄弟姐妹
1/32 1/32 1/16 高祖父母和玄孙
1/32 1/32 1/16 父母的表/堂兄弟姐妹
1/64 1/64 1/32 从表兄弟姐妹
~0 ~0 ~0 陌生人
注意:
- 表中列出的近交系数(F)为对应亲属关系近交后子代的近交系数。
- 在给定的例子中,血缘系数(\phi)与 近交系数(F)数值相等,但含义不一样。以母子关系为例,母(i)和子(j)的血缘系数(\phi_{ij})为 1/4。表中列出的近交系数(F)在这里的值为虽然也为1/4,但其表达的意思是如果个体(i)与 亲属(j)近交后,子代随机一个基因座的两个等位基因同源的概率为 1/4。