Hi,这里是有朴的第二大脑。
很高兴与你相遇
Homepage Archives Tags About Me Links

「GWAS那些事儿」incomplete LD对heritability估计的影响

有一个前提假设:

  • 一个SNPjSNP_{j}的效应往往是周围SNP效应之和,而这部分效应则自然由连锁不平衡决定

我的理解,

  • casual variants和SNP对phenotypic variation的贡献程度往往是不一样的,且casual variants本身的特点也与common variants不同,比如casual variants由于具有更高的effect,在群体中的frequecny不会太高,这是由于纯化选择的作用。

  • 而不完全的连锁,则会导致所使用的SNP set对heritability的低估。这部分是考虑到了casual variants和周围具有effect但不是casual的SNPs之间的linkage disequilibrium对SNP effect的影响

  • 出处:番茄泛基因组文章

    “Incomplete LD between molecular markers and causal variants leads to the underestimation of heritability9” (Zhou et al., 2022, p. 529) (pdf)

举个例子

在2010年这篇文章中,Yang Jian老师对于casual variants与周围SNP的incomplete LD所产生的effect是这样描述以及做了如下的simulation的,

  • 将casual variants和common SNPs之间存在的incomplete LD导致的SNP effect bias estimation,记做GjkG_{jk}AjkA_{jk}之间的差异,

    • GjkG_{jk}:基于casual variants所估计出来的effect
    • AjkA_{jk}:基于SNPs所估计出来的effect

    “Lack of complete LD is manifested as a difference between the genomic relationship between each pair of subjects j and k at the causal variants (Gjk) and the relationship between the same individuals calculated from the SNPs (Ajk).” (Yang et al., 2010, p. 2) (pdf)

  • 将SNP set划分为common variants set以及casual variants set
    casual variants数据集中包含的variants,其频率θ\theta在0.1~05之间,作者构建的emprical β\beta(用于矫正AjkA_{jk})的计算公式为:1c+1/Nvar(Ajk)1-\frac{c+1/N}{var(A_{jk})}

    c这个参数比较关键,通过不同的MAF casual variants set,估计出来的数值是不同的,其代表了对SNP effect的低估程度

  • casual variants到底对common SNP的估计到底有怎么样的影响?

    当casual variants的allele frequency threshold被设置为0.1时,矫正后的heritability为0.8(非常接近familial studies的研究结果)

写在后面

  • 在考虑associative SNP的真实effect时,需要考虑到的假设即,一个SNP的effect是周围SNP effect与自身effect的总和,因此就受到LD的影响。
  • “当casual variants的allele frequency threshold被设置为0.1时”,并不就代表casual variants的allele frequency就为0.1

参考资料

  • Common SNPs explain a large proportion of the heritability for human height