综述

所有的自然植物物种都起源于古老的多倍体。多倍化在植物基因组进化、物种分化和作物驯化中起着重要作用。我们回顾了植物分类树内多倍体模式如何引发了大灭绝、多倍体后滞后时间和无性时期的假设。多倍化在植物进化中反复发生,我们得出结论,它对于作物驯化非常重要。一旦发生复制,对任何一个复制基因的净化选择效应都会放松,允许复制基因和调控元素的丢失(分数化)。我们回顾了分数化的一般主题以及某些基因类别相对于其他基因类别保留更多的情况。多个解释,包括新功能化、亚功能化和基因产物剂量平衡,已经被证明会影响基因内容随时间的变化。对于异源多倍体来说,亲本间的遗传差异立即表现为广义杂交体中的亚基因组优势,并持续传播数千万年。虽然表观遗传修饰肯定参与了基因组优势,但很难确定哪个是首先出现的,被测量的染色质标记还是基因表达。数据支持这样一个结论,即基因组优势和杂种优势是对立的,机械上纠缠在一起;两者都会立即发生在合成广义交杂种中。在这个杂交中还有“同源基因干扰”的机制。我们提出了一个基础模型,来解释广义杂交/新异源四倍体中的基因表达和活力。这篇综述认为,在广义杂交中有一些机制会立即发挥作用,而其他机制则会稍后开始运作。使用高分辨率染色质构像捕获直接相互作用的新同源基因,加上单细胞转录组测序有助于实现研究基因亚功能化和新功能化的特异性。

结果

多倍化是所有自然植物物种历史的一部分,并促进了栽培作物物种的驯化。根据核型分析,25-35%的植物物种是最近的多倍体。在植物王国的进化过程中发生了几次古老的多倍体事件。这些古老的事件不再伴随着染色体组数的倍数关系。到目前为止,通过整个基因组测序和比较基因组分析,已经确定了49个整个基因组多倍化(WGD)事件在植物系统发育树的分支中(图1)。其中,有38个事件是整个基因组加倍(四倍体化),而有六个事件是整个基因组三倍化(六倍体化)。我们使用两个标准对四倍体进行分类。首先,根据新四倍体的同源性程度(父本之间的分化程度至少达到“亚种”产生了很大的杂合度),将WGD分为自异四倍体或异异四倍体,而所有的六倍体化事件则被任意称为“异-”。如图1所示,根据以前的研究,已经确认了五个WGD事件为自异四倍体化,而其中15个是异异四倍体化,包括六个六倍体化事件。其次,我们根据自WGD事件以来经过的时间对多倍化进行分类。通常,发生在<5、5-30或>30百万年前(Ma)的被区分为新近、中古和古代多倍体。最近的自然或人工(合成)多倍体被称为“最近的”;这些多倍体总是具有加倍或三倍染色体组的核型。作为实验系统的植物提供了许多特征多种自异和/或异异多倍体化组合以及不同时间经过的谱系。

分数化可能是古老多倍体的最明显的特征之一,它是新复制的基因或顺式调控位点的一个副本的丧失。已经证明,在中古四倍体玉米中,基因的分数化是由于染色单体间重组引起的删除,并且在中古六倍体芸薹中,顺式位点的分数化是通过删除而不是伪基因途径实现的。然而,分数化机制并不能预测在不同基因功能类别或随时间的变化下分数化结果的差异,或者选择如何利用复制基因进行适应性进化。在这里,我们关注解决这些问题的最新研究。

宽松的纯化选择促进适应性变异

环境、种群、生物体、基因组或基因的任何方面,只要减少了纯化选择对任何基因或顺式作用位点的影响,仅通过这种放松,就能增强遗传多样性和新颖性,促进突变等位基因的保留,否则在更严格的选择条件下将会灭绝。无论是单个基因还是整个基因组,复制都会减弱对任何一个保留复制的基因或基因组成分的选择。因此,这些冗余的基因或组成部分中的一个可能发生突变或重组成为不同的东西(一种新型突变体),其灭绝风险较低。近十年来,Conant和Wolfe以其卓越的专业知识讨论了可解释后多倍体时期副本基因潜在命运的突变机制,并仍然引用了来自酿酒酵母的相关例子。

图1 | 植物系统发育方案,显示了位于大规模进化时间中的多倍体化事件。分支上的矩形框表示多倍体化事件。T和H分别代表四倍体化和六倍体化。红色或红蓝相间的圆圈位于红色矩形前面,分别表示自体多倍化或异种多倍化。星号表示添加的基因组或多倍体化事件。白色竖线周围的方框表示白垩纪-第三纪(K-Pg)界线。对三叠纪及更早时期的古老被子植物多倍体的证据质量已受到质疑。该图基于Van de Peer实验室以前发表的信息,并补充了来自Phytozome125和CoGePedia的信息。

多倍体可能有助于在压力下生存。植物多倍体研究的最新综述都支持这样一个结论,即多倍体倾向于促进植物的进化。《美国植物学杂志》的一期特别感兴趣,题为“经过一个世纪的研究,多倍体的进化重要性”;这本总汇详细地讨论了植物进化,特别是使用从研究现存植物群体获得的数据。在本综述中,我们将讨论关于古多倍体后重复基因命运的最新论文。

J·Ross-Ibarra实验室的Renny-Byfield等人进行的一项重要研究对玉米单核苷酸多态性(SNP)的多个遗传和表观遗传位点进行了映射,并发现这些位点与表型相关联;玉米是一个古老的(约15 Ma,中间)同源四倍体。表型多样性优先映射到主导亚基因组(Zm1),其中基因分段较少,因此驻留在那里的基因对表型更为重要。在类似的案例研究中,棉花中人工选择纤维长度的历史,其中亚基因组相隔1-2百万年,涉及一个亚基因组优于另一个。因此,古老的完全二倍体多倍体影响了作物育种所使用的特征多样性,并被认为在驯化中已经使用。

有一种特殊的后多倍体过程词汇试图综合分子突变机制和选择类型:X功能化词汇。这个词汇表的创始术语是“亚功能化”,其中重复基因通过两个突变过程保存-每个重复中的一个失去功能的突变,但在不同的顺式作用亚功能中-因此,必须保留两个重复以保持祖先功能。其他X功能化术语,尤其是“新功能化”(新出现或非祖先功能的出现)令人困惑。这种困惑涉及稍有不同的术语定义。例如,突变表型需要多新才能称为“neo”?表1显示了现象,思想和提出的分子模型的时间线,以及它们的定义和基石参考资料。这个时间轴是按照第一次参与进化的机会组织的(通常在新的异源多倍体形成事件之后不久开始运作的机制)。

古多倍体的系统发育分布

假设多倍体大部分时间促进进化,或许它们有时也会促进物种多样性。Stebbins是使用现存植物群体研究进化的“父亲”,他得出结论,现存属中的多倍体是进化的死胡同;这个结论已经得到证实,但并不没有争议。Schranz和同事28注意到一些类群具有一个早分支,然后稍后分化。这些观察结果导致了有用的“辐射滞后”假说,即在多倍体形成事件之后可能经过数百万年的时间才会出现物种分化。最近的一项研究得出结论,我们没有足够数量和质量的数据来测试这个分化问题。

Van de Peer实验室对测序基因组中所有可用的古植物多倍体进行了定年;图1包括他们的数据,以一种近似时间持续和时代的形式呈现出来。这些作者注意到,标记着由撞击陨石引起的大规模灭绝事件的白垩纪-第三纪界线特别富有多倍体事件(图1)(这个界线也被称为白垩纪-古近纪,因为古近纪是第三纪最古老的亚期)。他们认为,多倍体的特殊特征加上小种群大小,在增加净化选择压力的时期中使多倍体处于优势地位。请注意,图1中的每个植物都来自多倍体谱系;多倍体在几乎所有更二倍体的竞争对手灭绝的情况下,反复成功。这是一个惊人的成就,考虑到新的多倍体可能具有非常低的等位基因多样性,并且由于已知的生成平衡配子困难,肯定具有非常低的适合度。Freeling颠倒了Van de Peer实验室的解释-多倍体在不好的时候促进进化的说法:多倍体之所以存活下来,是因为它们难以被杀死。探索他们如何实现保护导致了一个可测试的假设:多倍体在系统发育树中的分布是长时间的营养繁殖-地下或水下-与偶尔的性交(图1)。假定无性繁殖的创造性时期将是Schranz和同事辐射滞后假说的“滞后”。这些提议的无性繁殖创造时期将是达尔文的可憎之谜(白垩纪多样的被子植物化石突然出现)的解释。

重复基因的短期命运

一个重复的基因要么被保留,要么两个基因中的一个被删除(分数化),每个共同保留的顺式作用位点要么分数化,要么不分数化。某些类别的基因往往会被保留,例如编码多亚基组蛋白(如核糖体、蛋白酶体和转录因子复合物)或其他相互作用的蛋白质组装体的亚基组的基因。往往会保留的基因通常编码单独工作的产物(也就是,促进DNA代谢的基因,或者编码核酸酶活性或RNA结合蛋白质),还有一组通常分数化的双子叶基因;这些是单例基因。

重复基因的进化路线是复杂而动态的。已经发表了几个试图解释保留/分数化模式以及重复基因后续进化的模型。一个个体模型可能仅在WGD之后的特定时间间隔或特定类型或强度的选择下处理基因内容。这些模型、理论、思想或概念的注释列表如表1所示。以前的综述主要根据分子机制来分类解释基因保留的模型和思想,或试图将选择与分子模型综合。我们的组织是基于机制和WGD后经过的时间间隔,从最初杂交物的父母植物开始,通过WGD,二倍体化(用于进化二倍体减数行为的突变步骤),分数化,最终到持续多样化和新颖进化。我们强调时间间隔的原因是,一些机制可能主要起到暂时保留基因或顺式元件作为同源对的作用;一些机制(如异种优势)可能是短暂的;而其他机制则更加永久。

扩展重复基因在等位基因多样化中的保留时间。一些类别的基因往往在多倍体后被保留(最近进行了评论),而其他的往往分数化,成为单体。重复基因保留本质上是基因进化的临时阶段的想法至少有十年的历史了。Rastogi和Liberales43认为,基因重复保留机制——在他们的例子中,亚功能化——是更深层次的基因进化路径上的临时阶段,最终通过新功能化的过程产生一个具有新功能的基因(一种新形成的突变等位基因)。亚功能化是一个两次突变的机制,如上文所述。避免基因剂量失衡在新多倍体存在的瞬间就显现出来,当它发生时,在保留基因的人群中,它会成为突变的目标,从而落入了Rastogi和Liberales的观点的总体框架中。

假设1:避免基因剂量失衡。基因剂量失衡是导致曼陀罗和果蝇非整倍体适应度降低和有害表型的历史上被接受的原因。避免基因剂量失衡是解释整个基因组和串联重复之后发生的基因内容变化最广泛适用的解释。在多倍体之后高度保留的基因本体论(GO)类别(例如编码转录因子或蛋白酶体核心蛋白质的类别)在这些基因类型串联重复时保留较差。如果选择作用于避免基因剂量失衡,那么预计一个重复的单个基因在剂量敏感情况下会降低适应性。如果蛋白质复合物亚基之间存在化学计量失衡或基因网络不平衡导致适应度降低,那么串联重复会被净化掉。如果基因是通过多倍体化(WGD)而不是串联重复产生的,这种命运就不会发生,因为在WGD过程中所有基因都同时复制。因此,对于多倍体化后重复的基因,如果产品平衡很重要,分数化就会导致不平衡,并且重复基因将被保留(因为删除会被净化掉)。许多数据与这种基因保留后多倍体化和基因保留后串联重复之间的相互关系一致。虽然避免基因产物失衡解释了阿拉伯芥中测试的70个GO类别,但这并不意味着特定GO类别(例如大型的“转录因子活性”(GO:0003700))中基因的保留也不能通过亚功能化或其他模型来解释得更好。

保留一个基因或顺式作用位点作为一对,从而避免剂量失衡,并不意味着这种保留是永久的。然而,这种机制延长了由于冗余而放松选择的时间,因此可能促进了可能的分化,并且可能预测了WGD后期3阶段(表1)中基因序列加速进化的现象。保留的基因通常具有调控性质,有潜力控制整个基因网络的分化,可作为进化燃料。在每次连续的WGD中重复保留编码转录因子和其他基因调控组分的基因(图1),无疑推动了遗传复杂性的增加,或许还导致从非维管植物开花植物祖先到目前更复杂的后代的植物形态复杂性的最大增加。

江和同事将多倍体化后保留的基因分为三组:大分子复合物、转录调控以及对环境刺激做出反应的基因组。第一组很可能包括剂量平衡基因产物,第二组包含那些可能更容易发生亚功能化的基因,而第三组则包括那些可能对绝对剂量做出反应的基因。在这些被保留的基因中,辐射速度最慢的是I组,而最快的是III组;而在禾本科植物物种中,II组辐射速度最快。此外,李和同事将超保留基因分为两组:中间保留基因和多拷贝基因。其中,中间保留基因与前述研究中的I和II组有关。中间保留基因对剂量平衡敏感。这些结论与避免剂量不平衡的重复保留往往是支持可能最终演化出新颖性的一个临时阶段的更一般命题是一致的。

假设2:亚功能化能够在较长时间内保留基因副本。亚功能化是一种双重突变机制,并不是瞬间发生的。因此,避免剂量不平衡可能会使基因对保持在种群中,从而支持后续的副本保留突变机制,比如亚功能化,这至少是合理的。亚功能化模型可以保留编码序列和顺式作用元件的重复。确实有证据表明存在顺式作用元件的亚功能化,包括通过表观突变。转录因子活性(GO:0003700)远远是多倍体后最常保留的功能类别。这些相同的基因往往具有与之相关的多个顺式结合位点,因此为顺式作用元件的亚功能化提供了多个机会。亚功能化的数学模型已经扩展到估计顺式启动子分离导致伪基因形成的概率。越来越多的证据表明,在玉米或甘蓝菜属等近期多倍体演化中,重复基因表达的分化是常态,而不是例外。然而,关于个体细胞水平的基因表达数据非常有限。亚功能化不仅保留基因对,而且在较长时间内保持它们。

逃逸自适应冲突(EAC)。当基因亚功能化但仍在同一细胞中表达时,例如亚功能化涉及一个蛋白质的不同读框或结构域时,可能会发生冲突。解决这种冲突需要表达调控的差异化或持续的蛋白质序列分化,直到由重复基因编码的蛋白质相互作用的差异足够大,无法发生。

假设3:避免同源基因干扰。对酵母转录因子的研究表明,分化的、重复的转录因子蛋白质在辅因子或DNA结合方面可能存在差异。当这些差异组装成一个单一的转录因子复合物时,可能会干扰其功能。如果这些蛋白质序列差异在异源四倍体之前就存在,那么同源基因干扰将是瞬时的,并且其解决将受到偏好。Baker和合著者强调随着时间推移,这种解决过程可以推动蛋白质水平的调控多样性和最终的新功能化的保留。另一种避免同源冲突的瞬时方法是完全删除其中一个同源基因,或者在多细胞生物中,如果有足够的时间进行多次突变,则进行表达亚功能化,使基因产物不在同一细胞中表达。正如之前所述,植物中编码转录因子的基因是最常保留的。同源基因的RNA产物可能会相互干扰,例如反义RNA或微小RNA,或者可能存在RNA-DNA或DNA-DNA的纠缠。虽然同源干扰可以在长期内推动分子多样性的增加,但理论上来说,这些不兼容性可能解释了为什么植物中某些类型的基因谱系总是在短期内分离成单一基因。需要注意的是,这些单一基因谱系很少编码转录因子。

多倍体后重复基因保留或分离的其他解释。重复基因也可以通过正(增加)剂量选择或绝对剂量选择来保留;即,基因副本越多,适应度越好。剂量选择是另一种称为“创新、扩增和分化”(IAD)的模型的基础。IAD通过一个循环反馈环路起作用。随着小但有益的适应度,剂量选择通过不断改进来保留更多的目标基因,以实现功能创新。在其中一个基因成功创新(新形态突变)之后,剩余的基因副本被减少到两个基因,一个具有原始功能,另一个具有新功能。

在WGD之后,经过松弛的选择的重复基因积累了随机突变。这个非常古老的想法9的现代版本现在被称为“非功能性突变”。在这个过程中,遗传漂变在进化方向上可能发挥重要作用。增加遗传变异有望促进自然分化选择和适应性辐射中新型态的发生。例如,在十字花科家族中,参与芥子烷苷生物合成的基因通过WGD扩张,进一步促进了十字花科特有的芥子烷苷基因多样性和次生代谢物的多样化。此外,在不稳定的环境中,重复基因型将有更多的机会超越其二倍体祖先,因此它们可能优先占据新的生态位5,并发展出适应新环境的新的生理特征。

假设1:新功能化。保留基因对的一种方法是使其中一个基因进化出一种新的功能,这种功能对适应度至关重要。当这样的新形态突变涉及重复基因中的一个基因时,这个过程被称为新功能化。不幸的是,很难区分实际上赋予“新”功能的突变(这些突变预计很少)和导致祖先功能重新表达的突变,例如当删除沉默子或指定更高水平的基因产物(高产突变体,不表达新内容)时所发生的情况。在玉米中,发现13%的所有同源基因对在叶子/颖壳基因表达方面是“调节新功能化”的(但这些研究人员使用的“新”的定义可能过于宽松)。在植物中,新形态突变,即对与祖先功能不竞争的新功能的突变,除了作为具有表型的罕见显性突变体之外,还没有进行过研究。

假设2:巨突变。有时候,一个基因在复制过程中被修改,例如当一个未链接的序列插入到基因内部或附近,或者当染色体断点创建新的顺式作用序列时;突然,这个基因处于一个新的序列环境中。这样的染色体突变有一定的机会产生新的表达或蛋白质,即新功能化。如果这个基因具有重大的表型效应,新的突变等位基因可能被称为“巨突变”。这种染色体水平的突变可能更频繁地发生在串联阵列中的基因或在基因组中移动的基因上。尚未系统地筛选多重外群体中不存在的表达模式的多倍体后重复基因,因此可能通过第一个标准成为真正新的等位基因。骨鱼四倍体体系已被用来寻找真正的新形态增强子,并且至少有一个假设,从哺乳动物新皮层数据中得出,可以从随机序列中推导出新增强子。

基因重复在选择和“稳健性”方面立即产生影响。冗余的基因副本可以保护任何一个同源基因免受突变降解的影响,从而增加至少一个副本保留原始功能的可能性。如果这个稳健性理念是正确的,那么在遗传损伤的环境下,它应该特别适用。Van de Peer实验室将45个被推测为白垩纪-古近纪边界(图1中更新为49个)的被子植物多倍体事件放置在推断的系统发育树上。在这里发生了显著的聚类现象(图1)。这是最有支持的大规模灭绝事件,标志着一次可能的陨石撞击,正如之前讨论过的。这种由各种重复产生的假设的稳健性与极端应激时期非常契合。

图2 | PEB模型的示意图,用于理解新的广杂种或异源四倍体可能表现出异质子的情况。a-e, 我们的比喻是大坝,其中水位表示活力(异杂)和相对基因产物功能。五个基因(a-e)的功能,十个等位基因(a1,a2-e1,e2),构成了一个理想化的基因网络或通路,其基因产物的功能目前限制了活力,这些功能被想象为五个水闸。这些闸门呈大坝的柱子状。最短的闸门控制着水位(虚线表示活力和相对基因功能的水平)。a,b我们假设每个闸门都是两个等位基因的叠加功能,其中一个来自父本1(显性,红色),另一个来自父本2(隐性,蓝色)。还假设纯合父本的五个基因(a和b;红色和蓝色)在功能强度(闸门高度)上有所不同,这是由于遗传变异和特别是由于TE插入76、差异smRNA沉默106,127和/或甲基化19,107,108引起的表观突变。c-e 广杂种及其异源四倍体(“加倍”)的衍生物。c中,这个示例杂种表现出异杂子。在d中,隐性等位基因功能(蓝色)的贡献被任意减少(由于亚基因优势),降低了20%;异杂子仍然存在。更严重的亚基因优势(对隐性(蓝色)亚基因上的基因进行50%沉默,e)抵消了异杂子的效果。P2,父本2。

一个基于选择的框架来协调模型

我们已经定义并回顾了几个常常相容的模型,这些模型有助于解释多倍体后重复基因的保留和进化。我们同意Conant等人的观点,即没有一个模型或理论能够解释所有情况。最有可能的是,每个模型适用于特定的性状、环境或多倍体事件发生后的一定时间间隔(见表1)。在多倍体谱系的进化中,如果我们一味提倡某个或少数几个模型而毫不考虑其他模型,那么我们可能会错过完整的图景。此外,独立提出的用于解释特定数据集的模型通常不适用于不同的环境或不同的多倍体事件。Soltis等人比较了来自12个深入研究的多倍体系统的重复基因演化特征和机制,使用了不同谱系的植物物种的数据集。尽管一些规则通常适用于预测基因的保留和丢失,但作者们发现系统在重复基因演化的许多方面存在差异,如基因沉默与同源基因丧失。适用于某些系统的规则与不同的多倍体中的规则相冲突。他们得出结论,简单化的模型是不可行的。

一个基于选择或适应的观点可能是有成果的,尤其是在研究不同的重复基因保留模式时。鉴于物种之间的许多组合(带有不同的基因/转座子组分)、多倍体后进化的不同时间尺度以及不同的环境因素/栖息地,伴随着WGD的选择松弛产生了可以用来适应变化的遗传多样性。例如,如果新的多倍体和营养繁殖在历史上是相关联的,正如最近提出的并进行了回顾,那么对于地下或水下茎的生长速率(排除了性别或花的多样化)的选择可能是解释多倍体成功的生物学目标。由于我们对WGD事件发生时的生物和环境了解甚少(图1),因此重要的是考虑那些在特定时间、特定环境或不同遗传背景下起作用的模型(见表1)。此外,我们不应假设今天的条件与数百万年前相同。事实上,根据现存多倍体的研究,G.L. Stebbins26得出结论,多倍体是一条进化的死胡同,Barker等人讨论了从现代到古代的推断所涉及的争议和复杂性。

亚基因组优势

亚基因组优势是一种在多倍体中普遍存在的显著的全基因组特征,可能是异源多倍体,其显示出偏倚的分离。

亚基因组优势的定义和最新进展。

Edger和他的同事们对金鱼草四倍体进行研究,证明了亚基因组优势首先发生在广杂交中。

亚基因组优势是指当两个亚基因组的基因共同存在于细胞中时,其中一个亚基因组的基因往往比第二个亚基因组的基因表达水平更高。在从这样的广杂交中衍生出来的异源四倍体中,经过数百万年后,表达较低的亚基因组会倾向于删除更多的基因和顺式作用元件(称为偏倚分离),与其同源基因相比。因此,亚基因组优势是指一个亚基因组即刻和长期上优于另一个亚基因组的情况。

最简单的多倍体是四倍体。同一亚种的个体,包括兄弟姐妹,不是基因上完全相同的,但是这样密切相关的父母之间的四倍体仍然被称为自交四倍体。一项特别设计的实验比较了经过代代内固定的合成自交四倍体水稻和其二倍体亲本,显示它们的转座子中DNA甲基化差异的快速积累。在从不同亚种到不同物种的某一点上,四倍体的父母变得足够不同,可以产生“宽杂交杂种”,其翻倍会产生异源四倍体。足够广泛的杂交后代通常(但并非总是)表现出杂种优势。杂种优势是一种通常暂时的体态生长加速,其特征是父本在某些方面发生了分歧。杂种优异性的特征还包括植物器官的增大,即植物育种者所观察到的“巨型效应”;并且由于减数分裂行为混乱而经常表现出近不育。解释异源多倍体在自然界中普遍存在的一种方式是异源多倍体稳定了杂种优异性的广泛杂交。然而,以往关于玉米和其他杂交作物的研究发现,通过自交抑制,异源四倍体失去了其优异性。酵母的最新研究表明,杂种优异性是对调节不兼容性的即时反应。在本综述后面将会明显,基因组优势和杂种优异性同时出现在广泛的杂交后代中,并且在表型上纠缠在一起,可能相互作用。

古代异源多倍体的优势亚基因组在基因和转座子之间都具有更多的差异。异源多倍体中的亚基因组之间也观察到了不同的甲基化模式和改变的剪接形式。正如之前回顾的那样,玉米优势亚基因组上的基因占据了更大程度的基因型标记表型多样性。基因附近的转座子的甲基化状态可能在基因表达方面起到了引导基因表达的亚基因组位置依赖性的作用。类似地,原始亲本二倍体的转座子负载和/或甲基化状态的差异被假设是产生亚基因组优势的起源。

对于表达亚基因组优势的古代多倍体的推理主要依赖于Hollister和Gaut提出的“权衡”假说。该假说认为,与功能转录单元靠近的许多活跃转座子的沉默以及沉默转座子抑制其附近基因表达之间存在权衡关系。假设解释这种转座子沉默以及通过位置效应对相邻基因进行沉默的机制是由小RNA(smRNA)引导的DNA甲基化(RdDM)。促进从转座子到相邻染色质的沉默蔓延的机制尚未在植物中得到理解(并非所有植物转座子都会引起蔓延)。显然,用于产生古代多倍体的亲本线无法进行研究。即便如此,人们仍然试图推断这些父本可能存在的差异,以初次导致亚基因组优势。Woodhouse 和 Cheng等人通过研究B. rapa的亚基因组之间的差异发现,次级亚基因组上的基因表达较低与转录单元上游DNA上更高的转座子覆盖和同一区域的smRNA覆盖增加有关。通过研究那些表达较高的基因位于次级亚基因组上的情况,即“切换者”,发现smRNA覆盖往往与基因表达相关,而不是亚基因组位置。转座子沉默方面的亲本差异可能是亚基因组优势的起源。Renny-Bayfield及其同事发现,玉米呈现出与Woodhouse和Cheng等人在B. rapa中展示的行为模式相同的行为。此外,Renny-Bayfield和他的同事们还监测了染色质标记、DNA甲基化状态和已知DNA结合蛋白的位置,形成了超出smRNA位置的沉默特征。他们发现一个特别重要的结果:单态区域中的基因和相邻序列(即没有同源基因的染色体段)显示了其亚基因组的表观遗传特征,好像亚基因组之间存在一些连续的结构差异,可以在基因表达之前预先存在并持续至今。这个结果与Schnable等人对玉米的实验结果并不完全吻合,后者通过对不受净化选择影响的基因组区域进行对照实验推断基因表达引起了分配偏倚。

了解亚基因组优势起源的一种更好的方法是在实时中研究原始亲本、杂交体和新的异源四倍体。虽然我们无法在几百万年后测量缺失频率的亚基因组差异,但我们可以测量最近的异源多倍体中基因表达的差异。我们现在知道,在两个足够不同的父本基因组在广杂交中相遇时,亚基因组表达优势可能会发生。Edger和同事对Monkeyflower(Mimulus guttatus和Mimulus luteus)广杂交和异源四倍体的实验特别设计得非常好。他们的论文引用了许多已经出现在最近异源多倍体中的亚基因组优势的案例,包括Tragapogon mirus,小麦和棉花,但这种“即时”的结果非常显著。Mimulus系统具有双亲系,一个合成的广杂交杂交体,一个从合成的杂交体产生的合成异源四倍体,以及一个已知与合成异源四倍体具有相同亲本系的自然出现的异源四倍体物种(<140年)。亲本线之间的杂交体立即显示出亚基因组表达优势,合成和最近的异源四倍体也是如此。这种亚基因组优势随着世代的增加而增强,表明基因组优势会随着时间的推移而“确立”。杂交Monkeyflower的全基因组CHH甲基化显著下降,并在多倍体中恢复到接近父本水平。作者将这种CHH甲基化下降描述为“甲基化重构”,其特征是TE密度的重新调整,这是传统上与杂种优势有关的阶段。实际上,父母之间的种间杂交体已经被报道为具有杂种优势,但在Mimulus亚基因组优势研究中没有报告杂种优势数据。作者描述了亚基因组优势如何在异源多倍体后随着时间的推移而确立,这个结果可能早在年前就被Wendel实验室针对亚基因组AD棉花杂交体和异源四倍体预测过。一个较少流行的假设是将亚基因组优势描述为类似于近交抑制(即在近交过程中逐渐失去杂种优势的现象,正如达尔文在1876年和所有异源四倍体中所指出的抑制)。这种近交抑制-亚基因组优势假设预测,新的M. guttatus/luteus异源四倍体的疑似杂种优势会随着亚基因组表达优势在近交世代中增加(确立)而减弱。

回到Mimulus系统中的亚基因组优势,M. luteus是优势亚基因组。使用三个独立的异源多倍体重复了这个结果。正如对古老异源多倍体的研究所预期的那样,最近的Mimulus异源多倍体在基因附近被转座子相对较少覆盖,并且这些转座子的甲基化较少,虽然与玉米或B. rapa等古老异源多倍体使用类似数据产生的数据相比,同源染色体之间的比较生成的数据不太显著。总之,现在清楚了,像杂种优势一样,亚基因组优势始于父母间的差异以及杂交中的某种相互作用或冲击。

南瓜及其亲属,如葫芦科植物家族的基因组已经被测序和研究。其中有两个亚基因组反映了分离26-31 Ma的父本(使其成为明显的异源四倍体)。然而,古老的四倍体事件本身被认为要年轻得多,尽管仍然比三百万年要老。值得注意的是,这些亚基因组在染色体上完整无损,虽然发生了缩减,但没有偏向分离或亚基因组基因表达优势。也就是说,葫芦科植物的表现像是自然多倍体,但实际上它们不是。可能是因为葫芦的二倍体祖先在TE负载和分布方面没有显着差异,如96中所述。不幸的是,不可能将葫芦的异源四倍体与大约同龄的任何其他异源四倍体进行比较。我们也不可能猜测最初的广杂种是否具有杂种优势,以及这对南瓜和其他特别肥沃的西葫芦和葫芦的培育的可能意义。

广杂种中的基因调控和生长势

2010年还没有理解杂种优势(ref. 81),今天仍然不清楚。目前尚不确定遗传机制还是表观遗传机制更为重要,也不可能公正地评估关于杂种优势的所有数据和模型。然而,我们不能避免杂种优势,因为它与广杂种中的亚基因组表达优势交织在一起。本文回顾的数据得出了一些重要的结论,这些结论支持我们的假设,对“桶子理论”的修订和扩展。我们的模型基本上是经典占优假说,是构建更现实的模型来解释真实的广杂种和真实的生长势限制基因网络及其基因的基础。

正如Edger和同事75所做的猴子花的工作一样,杂种优势和亚基因组表达优势同时并立地在广杂种中发挥作用(Box 1)。因为亚基因组表达优势涉及到RdDM19、74、89、94,而且有一些发表的关于核苷酸长RNA在杂种优势广杂种中的意义的暗示,因此可以安全地假定广杂种的细胞对两个不同的smRNA-gene染色质环境的不可预测融合作出表观反应,通过重新调整关键的量化准确基因调控信息。RdDM操作下调基因的机制被认为是通过从转座子到转录单元的异染色质状态扩散(也就是相对短程的位置效应)。新的高分辨率染色质构象捕获(Hi-C)数据,使用一个去除了拟南芥中RdDM的ago4突变体纯合子,表明RdDM通路是必要的,以防止顺式作用位点无规律地循环/折叠,使它们靠近转录单元。Rowley和同事建议不仅AG04蛋白结合位点会折叠,增强子和沉默子位点也会折叠。因此,在广杂种中基因的RdDM丧失或获取可以导致即时上调或下调。   我们的路径效应平衡(PEB)模型如图2所示,使用可调节闸门控制的水位作为生长势的比喻。图2a、b显示了父本系的生长势水平(水位)。当评估杂种优势(杂种性)时,生长势是被测量的。图2c是表现出杂种优势(跃升生长势水平)的广杂种(或异源四倍体)。图2d、e是类似的广杂种,在这种情况下,亚基因组优势通过基因下调来抵消杂种优势。许多其他机制可能替代或与亚基因组优势结合,但在图2c的情况下没有这样做。在这个模型中,水位由五个(每个柱形状的)闸门中最短的一个控制。每个闸门的高度是每个等位基因表达(作为函数)水平的总和。拍坝就像当前限制杂种优势(跃升)的网络一样。在图2c中,注意到第1闸门限制了4.8个生长势单位的水位,这与限制粉色父本(图2a,优势)和蓝色父本(图2b,从属)的较短闸门限制水位4.1和3.3不同。图2d、e任意地对从属(蓝色)亚基因组上的基因表达施加亚基因组优势(抑制),如果足够严重(图2e),则可以完全消除杂种优势。抵消杂种优势的基因调控机制不必是亚基因组优势。在表1的第二阶段中,RdDM直接作用于基因启动子的复杂折叠/环形也可能发挥作用,多个机制融合成“同源干扰”(其中同源包括基因组中所有同源基因)。同样,在广杂种中,当一个限制基因网络瞬间改变时,生长势的跃升可能被具有不同潜在限制基因表达的不同基因网络限制,并且我们的比喻在新网络上重复自己。因此,虽然在任何时候只有一个基因是限制性的,但不同的网络和基因在快速连续的事件中可能涉及到表观突变,与Mendelian突变不同,它们可以迅速发生并随时间快速改变。在植物中,由于反复的多倍体加上串联和分散的重复,任何基因通常都有几个同源基因。相互作用可以在任何级别上进行,从转录起始到转录速率、信使RNA稳定性、翻译水平、蛋白质甚至蛋白质活性水平(此列表不完整)。广杂种中的新相互作用可能是负面的(RdDM通过反义转录沉默或翻译阻滞、替代剪切产物相互作用、优势负向蛋白质相互作用、优势正向蛋白质相互作用等),也可能是积极的,具有同样数量的可能机制。由于这些多方面的原因,我们的模型不能够是现实的。PEB模型是一个比喻的基础,可以添加关于广杂种和新异源多倍体基因功能相互作用的实验数据。

未来的方向

全基因组复制会创造出一个完整的同时存在的重复基因集。在拟南芥中,研究人员观察到在春化期间,多个等位基因FLC位点从不同的同源染色体物理聚集在一起,并通过多种蛋白质介导的表观遗传沉默进行相互作用。虽然FLC等位基因的相互作用是通过转化引入外源基因实现的,但这是基因来自不同的、非连锁的同源DNA,在其功能过程中可以发生物理相互作用的直接证据。这个案例研究单独强调了不同基因之间的物理相互作用是可能的,并且应该被监测。

如果这些DNA-DNA相互作用来自于不同的染色体,例如通过FLC和RdDM减轻的染色质环回,那么修改为适用于植物材料的Hi-C技术可能会很有用。Hi-C技术通过测序将在三维空间中具有物理接近性的意外片段连接在一起,以研究染色体结构(序列相互作用)。Hi-C是一种能够检测任何与其他片段接近的基因组片段的方法,不仅可以发现短距离(几千碱基对)的接触,还可以发现长距离(跨染色体)的接触。如果染色质的环回/折叠是长距离的,那么任何同源序列(包括多倍体后生成的同源基因)在这个过程中都有可能被“交叉连接”。如果重复基因通过RNA-DNA结合混乱进行物理相互作用,就需要开发新的工具。

最近,越来越清晰的是,染色体不会随意移动或定位。Han等人表明,棉花合成和自然四倍体的染色体会按照母源进行关联,这些亚基因组在减数分裂期间协调。必须有机制确保这一点,我们对它们知之甚少。在体细胞中,我们甚至几乎对染色体相互作用一无所知。

本综述提供的证据表明,杂种优势和亚基因组优势是纠缠在一起的。其他几个机制,一些互补,一些对抗,在宽杂交中运作;所有这些机制可能在同一细胞中同时进行。这个宽杂交的“交响曲”需要持续的研究。我们认为,“杂种优势问题”正接近一个可能既正确又被普遍接受的解决方案。

单个细胞是基因调控和生理学的基本单元(当然不能忽略细胞间通讯)。我们经常监测各种细胞类型、组织类型甚至器官类型的混合物。近年来,已经开发出了许多新技术,用于大规模单细胞RNA测序(scRNA-seq)。这些复杂的技术基于板式、液滴式或微流控式。scRNA-seq可以增加整个器官RNA-seq中失去的特异性。该过程依赖于液滴式技术分析数千个单细胞的能力。从这些研究中得出的细胞特异性基因表达数据应该为我们提供亚功能化和新功能化后多倍体所需的数据,并促进大量cis作用调节结合位点和结合它们的分子的功能注释。

植物细胞壁阻碍了对脆弱的细胞核的直接访问,这阻碍了使用更容易表达在动物细胞中的新方法的直接应用。即便如此,植物学家——特别是那些对杂种优势、近交抑制和多倍体感兴趣的学者——应该持有乐观态度。

THE END
0.一项外.都能作为被子植物是现在地球上最适应环境的植物的解释下列叙述中.除哪一项外.都能作为被子植物是现在地球上最适应环境的植物的解释 [ ] A.繁殖器官是种子.种子内有幼小的生命体一胚及供胚发育的营养物质 B.被子植物都长得较高大.且根系发达.能抵御干旱等恶劣环境侵蚀 C.被子植物种子外有果皮包被.共同组成果实.果实可以保jvzq<84yyy422:5lkcpjcx3eqo5d|||1ujoukhnfa5h95nk59e?egm<3c3h63:::d:hggmh23
1.间发现了盔籽植物。盔籽植物是否能成为解释裸子植物和被子植物【几亿年前的花、戴“头盔”的种子,这些都在化石中被找到了!】在研究花化石的过程中,科学家无意间发现了盔籽植物。盔籽植物是否能成为解释裸子植物和被子植物演化的关键#格致论道#​jvzquC41uwvft7xkpc4dp8xjgs{o1ytuv1jfvjnna365:<>862784@74;;;30qyon
2.果实是什么意思|果实的解释是什么植物所结的实。 如:「果实累累」。 果实的网络解释: 果实(被子植物具有果皮及种子的器官) 被子植物的雌蕊经过传粉受精,由子房或花的其他部分(如花托、萼片等)参与发育而成的器官。果实一般包括果皮和种子两部分,其中,果皮又可分为外果皮、中果皮和内果皮。种子起传播与繁殖的作用。 果实(汉语词语) 果实(gu jvzquC41o0nbqA;0eqs0er~waukbtlm1'G<&;N*;E'K6'JJ';G5
3.日研究为解释菌类多样性提供线索研究结果表明,伞菌纲菌类出现急速多样化的契机是9000万年至7000万年前的白垩纪后期与被子植物的相遇。伞菌纲菌类与被子植物根的菌根共生的进化从距今约2.5亿年前至现在,在各个分类群中都曾独立发生过几次。其中,白垩纪后期在丝膜菌属、丝盖伞属、牛肝菌科等5个分类群中独立发生的菌根共生进化都伴随着急速的物种多样jvzq<84yyy4ykwmwcpku0lto1463565813?0eh634;=189790jzn
4.被子植物门的解释和发音「欧路词典」英汉angiospermn.被子植物 eustelen. 真中柱(存在于大多数裸子植物和被子植物的茎内) palaeoangiosperm古被子植物 proangiospermn. 原被子植物 accoladen. 嘉奖;赞许; 册封爵士的仪式(用剑面在肩上轻拍一下); (连结几行谱表的)连谱号; (窗、门上方的)桃尖拱形线脚,窗或门顶葱形拱线饰 时态: accoladed, accoladingjvzquC41yy}/ixike0tfv8rfkezt1ns1'G>&C;*CD'K6'JI';2+F8.F6':J&G@*:;'G:'N>';9+B:7mvon