Abstract
DNA甲基化是非常保守的表观修饰,对于基因调控及基因组稳定性十分重要
异常的DNA甲基化模式会导致植物的发育缺陷。一个特定的DNA甲基化状态是由从头甲基化、甲基化维持以及主动去甲基化的动态调控所实现的,这些过程受到多个酶的催化,并且受到不同调控通路的调控。本综述主要讨论了植物中的DNA甲基化,包括甲基化和去甲基化酶以及调控因子,还有一个甲基化和去甲基化共同协作的机制(甲基化稳态调控);DNA甲基化对于转座沉默、基因表达及染色体互作的作用;DNA甲基化在植物发育中所扮演的角色;以及DNA甲基化参与植物对生物及非生物胁迫的响应。
Introduction
5号位置胞嘧啶的DNA甲基化作用于核基因表达的表观调控及基因组稳定性。包括DNA甲基化、组蛋白修饰、组蛋白变异及一些非编码RNA改变在内的表观变化会影响染色质结构,进而影响遗传信息的可接近性。因此,DNA甲基化对于许多生物学过程是非常重要的,破坏DNA甲基化能够导致动植物发育不正常,比如西红柿果实成熟、老鼠胚胎致死等。
DNA甲基化在动植物中十分保守,基因组DNA甲基化精细模式对于发育是非常重要的。在动植物中,DNA甲基化由保守的DNA甲基化转移酶利用S-腺苷甲硫氨酸作为甲基供体进行催化,而主动DNA去甲基化则涉及到一个碱基切除修复机制。一个由RNA指导的DNA甲基化通路对于植物中的从头甲基化至关重要,但在哺乳动物中却不是很重要。与哺乳动物相反,哺乳动物中的主动DNA去甲基化由5-甲基胞嘧啶(5-mC)的氧化作用和脱氨作用起始,而植物则利用5-mC DNA糖基酶直接切除5-mC碱基。
一个特异性DNA甲基化状态反映了甲基化建立、维持和主动去除的动态调控的结果。这些过程受到多个酶的催化,并且由不同通路靶向到特异性基因组区域。植物DNA甲基化发生在所有的胞嘧啶序列上,包括三种类型,即CG、CHG和CHH,其中H代表了A、T或C。在拟南芥中,全基因组范围的DNA甲基化特征主要是异染色质中的高度甲基化,主要富集在转座子元件和其他类型的DNA重复序列上。散在分布转座子相关的DNA甲基化同样在真核生物染色体臂上存在。
在植物中,从头DNA甲基化是由RNA指导的DNA甲基化通路(RdDM)所介导的,除了一系列的蛋白还涉及到了小干扰RNA(siRNA)和支架RNA(图1)。根据目前对于拟南芥中经典的RdDM通路理解,24核苷酸siRNA的产生是由RNA聚合酶POL IV通过转录起始的,起始后由RNA依赖性的RNA聚合酶RDRP2(也叫RDR2)进行转录本拷贝以形成双链的RNA(dsRNA),再由类DICER蛋白DCL3将dsRNA剪切成siRNA。这些siRNA会装载到AGO蛋白上,主要是AGO4和AGO6,然后通过与支架RNA互补配对,这些支架RNA是由POL V. AGO4与DNA甲基转移酶DRM2互作产生的,进而通过一种不依赖于序列的方式催化从头甲基化。该反应可能由RDM1所协助,该蛋白可同时关联AGO4和DRM2,还可能能够结合单链的被甲基化的DNA(图1)。
ReDM
除了siRNA和支架RNA之间序列特异性的配对外,AGO4和NRPE1及RDM之间的蛋白互作对于RdDM也是非常重要的。NRPE1是POL V最大的亚基,而RDM3是POL V相关的转录延伸因子。POL V转录的ncRNA肯定保留在染色质上,作为支架RNA发挥功能,这个过程可能受到了RRP6L1的促进,RRP6L1蛋白是酵母和哺乳动物核糖体RNA加工RRP6蛋白的同源物,主要作用于RNA保留。另外,IDP复合物能够稳定siRNA与支架RNA之间的配对,IDP结合RNA,并与SWI/SNF染色质重塑复合物互作,该复合物主要包含SWI/SNF复合物亚基SWI3B,并参与POL V介导的核小体位置改变引起的转录沉默。
预先存在的染色质修饰可以促进招募POL IV和POL V到RdDM的靶向位点。POL IV由SHH1蛋白招募,该蛋白通过本身的Tudor结构域结合二甲基化的组蛋白H3赖氨酸9(H3K9me2)。SHH1还能够与CLSY1互作,而CLSY1蛋白是与POL IV相关的染色质重塑蛋白,并且对于POL IV-依赖性的siRNA合成是必要的(图1)。POL V与染色质之间的关联生成支架RNA这个过程需要染色质重塑DDR复合物,主要由染色质重塑蛋白DRD1、染色体结构维持蛋白DMS3和RDM1构成(图1)。DDR复合物物理上能够与SUVH2和SUVH9互作,这两个蛋白是属于SU(VAR)3-9组蛋白甲基转移酶家族蛋白的成员,但缺失足蛋白甲基转移酶活性(图1)。SUVH2和SUVH9通SRA结构域识别甲基化的胞嘧啶,对于POL V在全基因组范围染色质上的正确分布是必需的,因此被认为通过预先存在的DNA甲基化来招募POL V。然而,通过锌指将SUVH9栓到未甲基化的DNA上已经能够招募POL V,并建立起DNA甲基化和基因沉默。
既然POL V能够在同一位点产生带有不同5?端的ncRNA,貌似起始转录的过程并不依赖于启动子。全基因范围的POL V或POL IV染色质分布图谱并未发现一致的启动子基序。一些POL V转录的ncRNA在5?端具有7-甲基鸟苷的帽子,显示POL V产生的转录本可以适用于一些已知的用于修饰POL II转录的mRNA加工过程。然而,POL V产生的转录本在3?端缺少多聚腺苷酸,因此与mRNA不同。与POL V转录本足够长能够被常规的PCR检测到不一样,POL IV转录的ncRNA(P4 RNA)大多只有46-50个核苷酸,因此只有近期对拟南芥的dcl三突和四突植株采用小RNA深度测序检测到了这一类ncRNA,这两个突变体植株中POL IV依赖性和RDR2依赖性的dsRNA剪切成24核苷酸siRNA可能失效了。P4 RNA在dcl三突植株中积累,而且可以被外源的DCL3处理成24核苷酸siRNA。因为P4 RNA非常小,每一个24核苷酸siRNA都可能来自于一个P4 RNA前体的切割。
除了经典的POL IV–RDR2–DCL3通路产生24核苷酸siRNA,这些蛋白的旁系同源物同样可以通过非典型RdDM通路产生siRNA(图1)。POL II介导的转录不仅可以产生24核苷酸siRN和支架RNA,同时还能在某些RdDM靶向位点招募POL IV和POL V促进siRNA的产生。POL II与POL V相比,能够与不同的AGO蛋白有空间上不同的联系。在反式激活siRNA基因和一些转录激活转座子区域中,相比于POL IV和RDR2,RdDM更加依赖于POL II和RDR6。由DCL2和DCL4产生的21核苷酸或22核苷酸或者由DCL2产生的24核苷酸可以影响RDR6依赖性RdDM。
拟南芥中的siRNA大多数是24核苷酸的,在dcl四突变体植株中几乎完全消失;然而,RdDM靶区域大约三分之二的DNA甲基化仍然保留,表明存在不依赖于DCL的RdDM存在,可能由一些不依赖于DCL的siRNA或直接由P4 RNA所介导(图1)。除了DCL蛋白外的RNase III酶能够切割dsRNA,并且在野生型植株中,RNase III酶可能与DCL蛋白一同发挥作用,将POL II、POL IV或POL V转录本加工成siRNA。
遗传筛选已经鉴定了一些mRNA前体剪切因子,这些因子突变掉会不同程度地降低POL IV依赖性siRNA的水平,而这些剪切因子是如何影响siRNA的水平暂时还不清楚。比如说,STABILIZED 1和RDM16这两个剪切因子的突变会降低POL V依赖性支架RNA的积累。据推测,一些能够结合mRNA前体的剪切因子可能会跟由POL IV和POL V产生的非编码转录本结合,并影响它们的加工或是稳定性,进而影响siRNA或支架RNA的丰度。
Maintenance of DNA methylation
植物甲基化的维持取决于胞嘧啶序列的组成,由受到不同机制调控的DNA甲基化转移酶催化(图2)。CG胞嘧啶甲基化由MET1维持(图2a)。MET1是哺乳动物DNA胞嘧啶-5-甲基转移酶DNMT1的同源物,主要在DNA复制后识别半甲基化的CG二核苷酸,并且甲基化子链上未被修饰的胞嘧啶。与人类和老鼠的DNMT1相比,拟南芥的MET1缺少富含半胱氨酸的CXXC结构域,该结构域被认为有助于帮助DNMT1区分半甲基化CG和未甲基化CG。哺乳动物中,DNMT1由E3泛素蛋白连接酶UHRF1所招募,与此类似,植物中的MET1由VARIANT IN METHYLATION蛋白招募到DNA上,该蛋白是UHRF1的同源物,对于维持CG甲基化是必需的。
拟南芥中CHG甲基化的维持由DNA甲基转移酶CMT3所催化,另还有少部分由CMT2所催化(Fig2a)。玉米CMT3同源物MET2A的蛋白结构显示其bromo毗邻同源域(BAH)及chromo域结合到H3K9me2。阻止CMT3-H3K9me2之间的互作不仅能破坏CMT3结合到核小体上,还能导致CMT3活性的完全缺失。拟南芥H3K9特异性甲基转移酶SUVH4及其SUVH5、SUVH6的突变会基本废除H3K9me2,并大幅降低CHG甲基化水平。甲基化的CHG由SUVH4的SRA结构域所结合,并招募它进行H3K9甲基化。因此,甲基化的CHG和H3K9me2修饰通过反馈调节通路相互增强(图2a)。
CHH甲基化由DRM2或者CMT2所维持,取决于所处的基因组区域。DRM2维持RdDM靶向区域的CHH甲基化,这些区域主要集中在演化上比较年轻的转座子、短转座子以及一些常染色体臂上的其他重复序列,同时还有通常出现在异染色质区域的长转座子的边缘区域。相反,由CMT2催化的CHH甲基化主要在含组蛋白H1异染色质区域,而这些区域不存在RdDM。DDM1的突变会破坏由CMT2催化的CHH甲基化,DDM1是一种染色质重塑蛋白,该蛋白同时对于维持对称胞嘧啶序列处的DNA甲基化也是必需的。非对称甲基化的维持可能也会受到MET1和CMT3的影响,因为MET1依赖性的甲基化同样可以被SUVH2和SUVH9所识别以在某些RdDM位点招募POL V,另外CMT3依赖性的CHG甲基化增加了H3K9me2的水平,进而促进了CMT2催化的非CG类型甲基化。尽管CHH胞嘧啶仅仅可以被DRM2和CMT2所甲基化,但这两个酶也可以在其他序列类型上甲基化胞嘧啶。
Active DNA demethylation
缺少甲基化转移酶活性或者DNA复制后缺少甲基供体会导致未能持续维持甲基化,也就是所谓的被动DNA去甲基化。DNA甲基化也可以通过酶的方式来擦除,也就是主动DNA去甲基化。与DNA甲基化反应受到单个DNA甲基化转移酶所催化相反,主动DNA去甲基化需要一系列的酶来实现,而起始这个过程的酶就叫做DNA去甲基化酶。在植物中,一类具有双功能的5-mC DNA糖基化酶-脱嘌呤/脱嘧啶裂解酶家族通过碱基切除修复途径来起始主动DNA去甲基化(图3a)。哺乳动物中的主动DNA去甲基化也涉及到一个DNA糖基化酶,同时也有剪辑切除修复机制参与其中。然而,植物DNA糖基化酶可以识别并直接移除5-mC碱基,而在哺乳动物中,5-mC必须先经过氧化,然后才能被DNA糖基化酶所催化、移除。
拟南芥双功能5-mC糖基化酶基因家族有4个基因,分别是沉默抑制子ROS1、转录激活子DME、类DME蛋白DML2以及DML3,这些酶能够识别所有序列类型的胞嘧啶并切除5-mC。ROS1、DML2和DML3在所有的营养器官中均有表达,而DME优先在雌雄配子的伴细胞中表达,也就是雌配子体的中央细胞和雄配子体的营养细胞。
在DNA去甲基化过程中,这些双功能酶起先作为DNA糖基化酶水解碱基和脱氧核糖之间的糖基键,然后作为脱嘌呤或脱嘧啶裂解酶去切段DNA链,产生一个无碱基位点(图3a)。5-mC碱基的切除跟随着β-消除或β,δ-消除反应,会形成一个以3-磷-α,β-不饱和醛或3磷酸为结尾的缺口。随后,脱嘌呤/脱嘧啶核酸内切酶DNA-(无嘌呤或无嘧啶位点)裂解酶APE1L和DNA磷酸酶多聚核苷酸3?-磷酸酶ZDP在β-消除或β,δ-消除反应的下游发挥作用以生成一个3? OH基团,进而缺口能够被DNA聚合酶和连接酶所填充(图3a)。拟南芥DNA连接酶LIG1的亚细胞共定位与ROS1、ZDP和APE1L一致,且对于胚乳组织中母本印?;騀WA和MEA的去甲基化和激活是必需的,这些证据显示LIG1可能是主动DNA去甲基化通路中发挥作用的连接酶。
ROS1在体外能够在特异性的靶位点上随机滑动,但在细胞内,DNA去甲基化酶存在靶标特异性,主要取决于不同的染色质特性和招募的蛋白。由DME介导的去甲基化则偏爱常染色质区域小的、富含AT的转座子,继而导致邻近基因表达量的改变。ROS1同样靶向转座子,进而倾向于在基因附近。这说明由ROS1介导的去甲基化有助于在转座子和基因之间建立边界,预防来自转座子的DNA甲基化和转录沉默扩散。ROS1也部分作用于抵消由RdDM通路建立的DNA甲基化,尽管ROS1也去甲基化非RdDM依赖性的区域(图3b)。对于RdDM中控制靶位点特异性的小RNA是否在ROS1靶向特定位点的过程中发挥作用还不清楚,尽管RNA结合蛋白ROS3对于一些ROS1依赖性基因组区域的去甲基化非常重要。ROS1靶向转座子和其他一些富含乙酰化的H3K18和H3K27me3的基因组区域和一些没有H3K27me和H3K9me2的基因组区域。
ROS1靶向某些基因组区域是由抗沉默蛋白复合物IDM所介导的,该复合物包含IDM1、IDM2、IDM3、MBD7、HDP1和HDP2(图3a)。IDM2是一个含α-晶状体结构域的蛋白,其能够与IDM1发生互作,同时对于植物中IDM1依赖性的H3K18乙?;切枰?。MBD7优先结合到高度甲基化的CG致密区域,物理上能够与IDM2互作,同时也能够与IDM2的同源物IDM3互作,而IDM3也能够与IDM1发生互作,MBD7作用于防止基因被抑制和DNA超甲基化。尽管IDM复合物被认为能够保证IDM1靶向甲基化的DNA位点,而IDM1催化的组蛋白乙?;侨绾握心糝OS1来进行DNA去甲基化的仍然还不是很清楚。