(七)分子标记相关
分子标记:是遗传标记的一种,直接在 DNA 分子上检测遗传变异。分子标记能对不同发育时期的个体、组织器官甚至细胞作检测,数量极多,遍及整个基因组,多态性高,遗传稳定,不受环境及基因表达与否的影响。目前常见分子标记主要有 SNP 、InDel、SSR 等。
限制性长度多态性(RFLP,RestrictionFragment Length Polymorphism)是第一个DNA标记(1974),用来探究同源DNA序列的变异。
后来又出现了很多其他的DNA标记,大体分为两类:
1)共显性标记:能够区分杂合体和纯合体,包括SSR(simple sequence repeat)、RFLP(restriction fragment length)、SNP(single nucleotide polymorphism)
2)显性标记:同时产生多个位点的数据,但是不能够区分杂合体和纯合体。
包括AFLP(amplified fragment length),RAPD(random amplified polymorphic DNA)和ISSR(Inter simple sequence repeata)
SNP:(Single Nucleotide Polymorphisms) 单核苷酸多态性,是指在基因组上由单个核苷酸变异形成的遗传标记,其数量众多,多态性丰富。从理论上来看每一个 SNP 位点都可以有 4 种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为 1:2。SNP 在CG 序列上出现最为频繁,而且多是 C 转换为 T,原因是 CG 中的 C常为甲基化的,自发地脱氨后即成为胸腺嘧啶。一般而言,SNP 是指变异频率大于 1%的单核苷酸变异。SNP calling:我们通过 samtools 和 picard-tools 等工具对比对结果进行染色体坐标排序、去掉重复的 reads 等处理,最后通过变异检测软件 GATK2 分别进行 SNP Calling,并对原始结果进行过滤,得到分析结果。
SNP标记是美国学者Lander E于1996年提出的第三代DNA遗传标记。SNP是指同一位点的不同等位基因之间仅有个别核苷酸的差异或只有小的插入、缺失等。从分子水平上对单个核苷酸的差异进行检测,SNP 标记可帮助区分两个个体遗传物质的差异。人类基因组大约每 1250 bp SNP 出现一次,已有2000多个标记定位于人类染色体,对人类基因组学研究具有重要意义。检测 SNP 的最佳方法是 DNA 芯片技术。SNP 被称为第三代 DNA 分子标记技术,随着 DNA 芯片技术的发展,其有望成为最重要最有效的分子标记技术。
Indel:(insertion-deletion),插入缺失。是指相对于参考基因组,样本中发生的小片段的插入缺失,该插入缺失可能含一个或多个碱基。
SSR:Simple Sequence Repeat,简单重复序列。指的是基因组中由 1-6个核苷酸组成的基本单位重复多次构成的一段 DNA,广泛分布于基因组的不同位置,长度一般在 200 bp 以下。
简单重复序(SSR)也称微卫星DNA,其串联重复的核心序列为1一6 bp,其中最常见是双核苷酸重复,即(CA) n和(TG) n每个微卫星DNA的核心序列结构相同,重复单位数目10一60个,其高度多态性主要来源于串联数目的不同。SSR标记的基本原理:根据微卫星序列两端互补序列设计引物,通过PCR反应扩增微卫星片段,由于核心序列串联重复数目不同,因而能够用PCR的方法扩增出不同长度的PCR产物,将扩增产物进行凝胶电泳,根据分离片段的大小决定基因型并计算等位基因频率。
SSR具有以下一些优点:(l)一般检测到的是一个单一的多等位基因位点;⑵微卫星呈共显性遗传,故可鉴别杂合子和纯合子;⑶所需DNA量少。显然,在采用SSR技术分析微卫星DNA多态性时必须知道重复序列两端的DNA序列的信息。如不能直接从DNA数据库查寻则首先必须对其进行测序。
参考链接:
分子标记_百度百科 (baidu.com)