- A+
染色质生物学的一个中心目标是揭示翻译后组蛋白标记如何调节基因的表达。然而,人们对组蛋白标记的空间或时间动态知之甚少。哺乳动物细胞中,组蛋白H3第9位赖氨酸的三甲基化(H3Κ9me3)与异染色质和转录沉默区密切相关。H3Κ9me3的抑制作用需要异染色质蛋白1(HP1)结合已有的H3Κ9me3位点,寡聚结合在邻近的核小体上,进而招募H3Κ9特异性组蛋白甲基转移酶(HMTs),介导H3Κ9me3标记的顺式传播。除非遇到阻碍,否则这种积极的反馈将会扩大H3Κ9me3包含域,没有边界。一些研究小组在苍蝇、酵母和其他生物体中发现了该“绝缘体元素”,它们阻止了H3Κ9me3标记的进一步扩展。早期在酵母交配型位点H3K9me3标记上建立的模型解释了标记的记忆如何在细胞世代中保持,但是该模型所预期的分布与哺乳动物细胞中非着丝点H3K9me3标记的基因组分布不一致。
2012年斯坦福大学医学院Gerald R. Crabtree 课题组(“Dynamics and Memory of Heterochromatin in Living Cells”,Cell)建立了适用于小鼠胚胎干细胞的99%非着丝粒组蛋白H3赖氨酸的三甲基化(H3Κ9me3)结构域的“固有有界”模型。该模型不需要边界或绝缘体元件。在本篇文献(“Dynamics of inherently bounded histone modification domains”,PNAS)中他们对建立的该模型做了详细的介绍,并以H3Κ9me3为范例描述了该模型的几个动态特征。
反应流程和假设 首先,将单个基因座的动态建模为一个离散的一维晶格。每个晶格位置对应于一个单独的核小体,类似于染色质的“串珠”图。该晶格{Ij}的范围为j =−128到j = +128,对应于256 +1个核小体或51.4 κbp的DNA(假设核小体间距为200 bp)。为了使模型更加通用,考虑到晶格上的每一个位置j可能占据两种状态中的一种:未修饰状态(Ij=0)或修饰状态(Ij=1)。简单来说,三个特性定义了标准模型: (1)成核(Nucleation):起始点(0位)对应于一个唯一能够形成H3Κ9me3修饰的靶点。这个修饰的形成是以κ+的速率发生的。 (2)繁殖(Propagation):将传播H3Κ9me3一系列过程整合成一个单一的网传播速率(κ+)。在动力学模型中,κ+描述了紧挨着H3Κ9me3标记位点的核小体上H3Κ9me3添加的净速率。从机制上讲,这种传播可能需要多个步骤(例如,HP1的招募、寡聚化、HMT的招募、酶的甲基化等)。然而,为了简单起见,将传播视为一个速率为κ+的速率限制步骤。 (3)周转(Turnover):不像标志的繁殖,标志丢失的可能性是处处相等,因此κ−描述了H3Κ9me3在任何标记的核小体上的随机丢失概率,包括酶催化(例如,去甲基化),组蛋白周转,或任何其他过程等导致了标记的去除。为简单起见,把丢失看作是一个单一的限速步骤率κ−。 基于成核,繁殖和周转的动力学参数,他们发展了一个简单的组蛋白标记的概率描述。基于此模型的蒙特卡罗模拟(Monte Carlo simulations)使他们确定了促进固有有界区域形成的动力学和结构约束。 实现 一个给定的基因座的随机轨迹是通过在每个时间步骤中迭代下列过程来实现的(图1): i)成核:如果靶位点是未修饰的(I0=0),它被转化成修饰状态(I0=1)的概率为α+(α+=κ+Δt)。 ii) 传播:对于晶格上每个被标记的核小体j,如果j-1位置是未被修饰的(Ij-1=0),它被转化成修饰状态(Ij-1=1)的概率为α+。类似的,如果j+1位置是未被修饰的(Ij+1=0),它被转化成修饰状态(Ij+1=1)的概率为α+。因此,标记的传播是从每个标记点向外两个方向进行的。 iii) 周转:对于晶格上每个被标记的核小体j,被转化成未被修饰(Ij=0)的概率为α-(α-=Δtκ-)。 iv) 时间演化:Δt表示模拟时间的增加。 上述描述把传播和周转看作是具有指数分布寿命的齐次泊松过程,允许所有模拟使用周期性边界条件进化。因此,模拟中不存在边界隐式。 建立固有有界域的约束 当这些过程被允许进化时,组蛋白标记的随机域就建立在目标位点上(Fig.1D)。为了确定参数设置空间的哪些区域支持固有有界H3Κ9me3域的建立,他们把κ-作为恒量,可变化的κ+值在0.1κ-和3κ-之间。定义比率,表示标记传播和关闭的相对速率。通过允许模型受不同κ值的约束进行进化,发现只有当κ≤1.5时,才建立了固有有界区域(Fig.2)。当κ> 1.5以上,标记的数量经历了二级相变过程,标记占据了整个基因座(Fig.3A)。 标记的强度和特异性 虽然根据他们模型建立的H3Κ9me3结构域总体上是对称的,且以靶点为中心,但相对传播速率κ在决定整体标记密度和空间特异性方面起着非常重要的作用。当κ值比较低时,平均区域的标记不是很密集,但具有极强的特异性,因为唯一的标记只发生在靶点或非常靠近靶点的地方。随着κ的增加,靶点也越来越容易被标记出来(Fig.3B)。相反,当κ增加时,标记的整体特异性降低,因为区域从靶点向外扩展。为了量化κ对区域整体特异性的影响,引入特异性评分S,(指靶位点的平均标记密度;指整个晶格的平均标记密度)。因为靶位点的平均标记密度在整个晶格中总是最高的,所以当标记在整个基因座完全一致时,该得分返回0值(无特异性);当标记只在目标位点发生时,该得分返回接近1值(完美的特异性)。当κ≤1.5时,区域具有高度特异性(Fig.3C)。当κ>1.5时,模拟经历了相变,进入一个新的状态,该状态显示出很差的特异性。在这种状态下,H3Κ9me3标记无边界的传播。接下来引入“效率”参数E,通过将靶位点特异性组蛋白标记密度参数和特异性参数相乘得到E:。当1.0≤κ≤1.5时,标记效率E最大(Fig.3D)。 固有有界区域的动力学与稳定性 模型的一个重要方面是每个模拟在其轨迹中都会经历标记数量和标记分布的波动。为了描述这些波动并检验固有有界区域的稳定性,他们研究了不同κ值下的区域动态特性。检测κ是如何影响标记数量的波动的,标记数量N(t): 。标记的总数不是静态的,而是在其平均值附近波动(Fig.4A)。通过计算在不同κ值情况下N(t)的均方根(rms)波动,鉴定域大小波动的尺度: 。这些波动的绝对值随着κ的增加而增加(Fig.4B)。但是,当用标记总数的平均值进行归一化时,这些相对的均方根波动反而随着κ的增大而减小(Fig.4C)。因此,尽管随着相对传播速率κ的增加会导致标记数量的绝对值的波动更大,但当用域的整体大小归一化后,这些波动会不成比例地减小。为了检测域的稳定性和记忆,他们计算了不同κ值情况下,轨迹中N(t)的自相关函数ρ(t):(t: 时间步长的单位;T: 时间步长的总数)。发现,随着κ值的增加,自相关增加(Fig.4D)。因此,提高相对繁殖速率可以延长域维持自身修饰状态的时间,提供一定程度的稳定性和记忆。即增加相对繁殖速率减少了波动的相对尺度,有助于区域的稳定性;同时也增加了自相关有助于域的更长时间的记忆的建立。 模型扩展:超越最近邻的标记 尽管在上述标准模型中,标记可能只通过最近邻的接触繁殖,但之前文献报道的一些实验证据表明,不连续繁殖也可能发生。为了探究在一定距离上标记是否会产生固有有界域,他们扩展了标准模型,允许超越相邻接触点的2种组蛋白标记模式的一种发生:关于距离的几何依赖关系模式或者关于距离的幂律依赖关系模式。他们这里关注的可能发生的几何依赖模式,例如,如果当HP1寡聚物在H3Κ9me3标记位点之外扩展后HP1寡聚物表现为简单的单链平衡聚合物,组蛋白甲基转移酶被招募到HP1寡聚物的末端进行H3Κ9me3标记。在实现中,通过用可选步骤iia和iib替换步骤ii来处理这种几何依赖模式。iia)繁殖(左):对于晶格上每个标记的核小体j,从几何分布中得出的整数距离da ∈ [1, 256]的概率p(da)=(1-p)da-1p/D。如果j-da位置是未被修饰的(Ij-da=0),它被转化成修饰的状态(Ij-da=1)的概率是α+。iib) 繁殖(右):类似的,对于晶格上每个标记的核小体j,从几何分布中得出的整数距离db ∈ [1, 256]的概率p(db)=(1-p)db-1p/D。如果j+db位置是未被修饰的(Ij-da=0),它被转化成修饰的状态(Ij+db=1)的概率是α+。对于iia和iib,标准化常数将概率归一化,使得整个基因座的和统一。这里,p指标记最近邻位点的概率,标记繁殖概率随距离d的增大呈几何衰减。在该模型中,有两个浮动参数,κ和p。为了用这两个参数描述固有有界区域的稳定性,他们构建了平均靶点标记密度函数、特异性S函数和效率得分E函数(作为κ和p的函数)的热图(Fig.5)。 效率评分E显示,只有特定的κ和p取值区域能够支持具有高特异性的密集标记区域的形成(Fig.5A)。当p→0和标记沿基因座处处等可能时,固有的约束域在任意κ的值下均不能形成,因为标记太过分散。当p = 1时,模型的行为与上面标准模型中描述的相同,传播仅限于最近邻位置。这里和前面得到的结论一样,在1.0≤κ≤1.5之间建立了一个特异且密集标记的区域(Fig.5A)。在这两种极端情况之间,随着p的增加,具有高度特异性的密集标记区域的κ的取值范围逐渐变宽。为了分析远距离标记对靶点标记密度和特异性的影响,他们们分别检测了这些参数对κ和p的依赖性。发现靶点标记密度仅微弱地依赖于最邻近标记的概率,但是却表现出对传播速率的强烈依赖(Fig.5B)。另一方面,特异性对κ和p具有混合依赖性(Fig.5C): 较高水平的特异性维持在κ≈1,超过这个值后,特异性急剧降低。随着p的增加,特异度在较大范围内保持不变,直到κ≈1.5,特异性急剧降低。 因此,局部标记对域的整体特异性有着积极的贡献。以上结果表明,当标记扩展到最近邻组蛋白之外时,虽然固有有界域可能会形成,但这些域的形成主要是由局部标记驱动的。当使用幂律依赖距离标记时,也得到了类似的结果。说明不管标记的距离依赖的数学细节如何,固有有界域主要是通过局部接触建立的。不过,我们的模型为不连续标记的出现提供了一种机制。在单个细胞中,即使只通过局部接触进行繁殖,不连续也会暂时出现(Fig.1D)。当去标记发生在2个被标记区域之间的一个区域时,不连续事件就会出现。在这些情况下,标记可能会在一段时间内继续作为两个独立的域进行传播。此外,在我们的模拟中,“本地”指的是最邻近的核小体;然而,在染色质中可能通过稳定的环或其他结构来保持物理上的接近性,标记可能会穿过一个环传递,从而导致前面所描述的不连续。 讨论 尽管目前已经有了大量的关于组蛋白标记在基因组上分布的实验数据,但是却只有很少的物理模型能够预测这些标记的空间分布和动态。本文介绍的模型在参数值设置合理性的情况下,可以解释大多数哺乳动物出现的H3Κ9me3域。根据本文模型的预测结果,作者猜测大多数哺乳动物的H3K9me3结构域可能不需要边界或绝缘体元件,因为这些结构域的繁殖固有地受到标记和/或组蛋白周转速度的限制。此外,H3Κ9me3标记不仅受标记的酶位置控制,而且还受标记和删除之间的持续稳定状态平衡控制,这种稳态平衡对维持细胞特性和多能性是不可或缺的。这种平衡在该模型中反映为相对繁殖速率κ。当组蛋白标记的传播局限于局部顺式扩散,κ在1.0和1.5之间时,最容易形成稳健的有界稳定的组蛋白修饰结构域。事实上,这也是他们小鼠胚胎干细胞和成纤维细胞实验数据中最佳的κ值选择范围。这个通用模型抽象了许多已知的复杂性或仍未解决的H3Κ9me3的生物学问题。虽然该模型的直接变化可以用于研究标记的表观遗传记忆,但是该模型没有解决这些标记在复制过程中或复制后传递的机制问题。 文 / 赵玉莉 编 / 薛巧梅 审 / 陈鸿萱
目前评论: