有一个前提假设: 我的理解, casual variants和SNP对phenotypic variation的贡献程度往往是不一样的,且casual variants本身的特点也与common variants不同,比如casual variants由于具有更高的effect,在群体中的frequecny不会太高,这是由于纯化选择的作用。 而不完全的连锁,则会导致所使用的SNP set对heritability的低估。这部分是考虑到了casual variants和周围具有effect但不是casual的SNPs之间的linkage disequilibrium对SNP effect的影响 出处:番茄泛基因组文章 “Incomplete LD between molecular markers and causal variants leads to the underestimation of heritability9” (Zhou et al., 2022, p. 529) (pdf) 在2010年这篇文章中,Yang Jian老师对于casual variants与周围SNP的incomplete LD所产生的effect是这样描述以及做了如下的simulation的, 将casual variants和common SNPs之间存在的incomplete LD导致的SNP effect bias estimation,记做和之间的差异, “Lack of complete LD is manifested as a difference between the genomic relationship between each pair of subjects j and k at the causal variants (Gjk) and the relationship between the same individuals calculated from the SNPs (Ajk).” (Yang et al., 2010, p. 2) (pdf) 将SNP set划分为common variants set以及casual variants set。 c这个参数比较关键,通过不同的MAF casual variants set,估计出来的数值是不同的,其代表了对SNP effect的低估程度 casual variants到底对common SNP的估计到底有怎么样的影响? 当casual variants的allele frequency threshold被设置为0.1时,矫正后的heritability为0.8(非常接近familial studies的研究结果)
举个例子
casual variants数据集中包含的variants,其频率在0.1~05之间,作者构建的emprical (用于矫正)的计算公式为:
写在后面
参考资料
Hi,这里是有朴的第二大脑。
很高兴与你相遇
很高兴与你相遇