DNA混合图谱分型技术谈—图谱中峰的信号,究竟受到哪些因素的影响?
DNA混合图谱拆分是个复杂的工作,我们今天将其中一部分做个简单的解释,供大家理解混合图谱拆分的原理。简单理解的话,影响图谱的因素可以有如下几个:
1. PCR扩增效率(Amplification efficiency);
2. 模板量(Template);
3. 降解系数(Degradation);
4. 扩增子的分子量(Molecular weight);
5. 等位基因类型(Heterozygote or Homozygote);
6. 位点特异性(Locus)。
假设有如下图谱,贡献者为2,实际分型如下表:
如果不考虑其他因素,分型的图谱应该如下:
如果我们将上面提到的几个因素考虑进来,那么图谱应该是这样的:
1. 模板量:contributor 1 > contributor 2
2. 降解因素:contributor 1 > contributor 2
3. 扩增效率:Locus 2 > Locus 1
4. Stutter
5. 模拟结果
将以上信息综合考虑,并研究他们对图谱影响的分布,建立了生物学模型如下:
如何将生物模型应用在图谱的拆分中?
MCMC(马尔科夫链·蒙特卡罗算法)产生于19世纪50年代早期,是在贝叶斯理论框架下,通过计算机进行模拟的蒙特卡洛方法。
蒙特卡洛方法的实质是通过大量随机试验,利用概率论解决问题的一种数值方法。马尔科夫链是指生成随机数列的一种方法。
MCMC是一种简单有效的计算方法,在很多领域到广泛的应用,如统计生物学、贝叶斯(Bayes)问题、计算机问题等。
MCMC通过将随机生成的数值与之前的数值进行比较,通过检测是否与正确值更接近,来判断下一步是接受还是重新生成一个随机值,循环往复,最终找到最接近正确值的区域。STRmix将这个过程分为两个部分,pre-burn in和post-burn in分别计算10万次和5万次,最终找到正确的解释。
我们以云算GPM混合图谱拆分系统为例,介绍下具体的工作方式:
目前DNA混合图谱拆分系统,已经在美国,澳大利亚,新西兰以及欧洲等国家广泛使用,并且已经作为法庭示证的一部分,在庭审中为审判提供证据支持。