Cancer Cell+Nature Genetics | 大象有形——梁晗组和于海源组分别揭示增强子的转录本质转录调控(transcription regulation)是分子生物学核心大课题——基因调控的首要层级,也是最早受到关注和研究得最为透彻的分支。超过半个世纪的知识积累建构了一个由顺式调控元件(cis-regulatory element)和反式作用因子(trans-acting factor)两大要素相互作用形成的转录调控框架【1,2】。在组成结构上,前者主要包括启动子、增强子和沉默子等非编码DNA序列;而后者则包含RNA聚合酶、转录因子、染色质重塑因子(chromatin remodeler)、甚至是一些RNA结合蛋白(RNA binding protein, RBP)等【3】。在行为逻辑上,顺式元件所蕴含的内在序列特征(intrinsic sequence pattern)往往直接决定了反式因子的结合与作用模式,而反式因子在不同生物场景下的差异性行为也能够反过来影响顺式元件的激活,因而构成了类似“鸡”与“蛋”的相辅相成的复杂逻辑【4】。 ![]() 尽管转录调控机制的大体面貌已经相对明晰,但其中的若干基本环节依然有很大的修正空间,诸多具体细节也仍待厘清。例如,近年来的一系列重要研究表明:启动子核心序列(core promoter sequence)所控制的基因转录经常是异向同时存在的(divergent transcription)【5】、RNA转录酶从转录起始位点起始后并非连贯作用,而是会在启动子下游发生短暂停滞【6】、5端外显子RNA的剪接能够直接增强基因的转录强度【7】等。
如果说上述问题仅仅是对于内涵和外延已然明确的转录调控概念进行丰富和完善,那么从上个世纪八十年代开始的对于增强子(enhancer)的研究至今仍很大程度地着眼于其定义本身,即增强子是什么、在哪里、具备怎样的功能和基因组特征【8】。增强子研究的系统性困难根植于其本身模糊的定义空间和多样灵活的行为模式:“不受作用距离和序列取向限制与基因启动子相互作用促进转录”的定义使得增强子成为了几乎可能遍布于整个基因组的“暗物质”。 对增强子的位置进行搜索的一个重大突破来自于本世纪第一个十年间由Phillip Sharp课题组和任兵(Bing Ren)课题组等发展起来的对于组蛋白修饰H3K27ac和H3K4me1和增强子活性的显著关联【9,10】。由ENCODE计划领衔的对组织特异性表观遗传特征基于染色质免疫沉降技术进行系统性描绘的努力,则使得具有特殊修饰状态的组蛋白与DNA区域的结合几乎成为了判断增强子存在性的金指标。随着研究界对反式调控因子尤其是主调控转录因子(master transcription regulator)捕获的快速进展,增强子的蛋白结合标记得到了极大的扩展。2013年,Richard Young实验室首次提出了“超级增强子”(super enhancer)概念【11】,将其发展为一个由丰富转录因子结合和普遍转录激活为特征的基因调控枢纽。
与基于表观修饰或转录因子结合等基因组特征对增强子进行定义的方向不同,另一个关于增强子身份认知的重要进展来自于对其类似基因的转录特征的描述。由Michael Greenberg课题组首次于2010年【12】发现的增强子RNA(enhancer RNA, eRNA)迅速成为了一个研究热点。其后,研究人员又由测定新生RNA的GRO-seq和标记转录位点的CAGE-seq等方法鉴定出上万个潜在增强子位点【13,14】。不过,虽然增强子的转录被确定与各类经典转录元件,如RNA聚合酶II和辅因子CBP等均具有直接关联【15】,但这种转录行为本身究竟是某种调控功能的必要条件还是基因组背景转录的副产物,仍旧是个争议极大的话题。
2020年10月1日,美国MD安德森癌症研究中心梁晗课题组在Cancer Cell上发表了题为A High-Resolution Map of Human Enhancer RNA Loci Characterizes Super-enhancer Activities in Cancer的研究,首次报道了利用常规RNA-seq信号对增强子单元进行定义,并揭示了增强子独特的由核小体结合决定的调控机制,以及增强子转录活性对细胞类型特异性表型的精准反映。这项研究由课题组成员陈涵博士完成。 ![]() 在该研究中,作者基于增强子激活的转录特性,创造性地提出了增强子转录与基因组背景转录相比应该具有明显高信噪比、高复现性的假说。在实际情况下,考虑到常规转录组测序信号对非编码区域的覆盖度较低,受到背景转录的影响较大,这一假说所预测的增强子转录模式往往无法被准确探测。然而,当具有相似生物学状态的大规模转录组信号被叠加后,就可能显现出增强子单元的独特转录信号。的确,当作者将TCGA计划中跨越32种癌症类型的一万多个RNA-seq样本根据癌症类型分别进行叠加并限制在由H3K27ac规定的超级增强子区域后,观察到了具有明显周期性和尖锐峰型的转录信号,并且几乎均具有100bp左右的长度特征。 ![]() 接下来,作者推测,由于上述具有固定尺度的高复现性转录信号与已知核小体(nucleosome)的结合范围147bp之间具有明显的相似性,因而这些潜在的增强子区域可能建立了与核小体之间的调控关联。为了验证这一假设,作者搜集了数十种组织中的MNase-seq数据(一种于全基因组尺度标定核小体结合位点的经典方法)与上述增强子单元位点进行联立分析,结果发现核小体结合信号的确在增强子区域呈现出显著的对称式分布。更惊人的是,核小体与增强子单元的联系在跨越近亿年的进化过程中呈现出很强的保守性,因而暗示了这种调控模式的功能重要性。 ![]() 对核小体结合信号与增强子转录信号的相对关系的进一步详细分析发现,由跨29种细胞类型的数百万个核小体信号分布降维后的第三个主成分(principal component 3, PC3)几乎完美地区分出两群具有截然不同的结合特征的核小体信号,一种与增强子信号峰处于精准重叠状态,而另一种则相对增强子具有一定程度的上下游偏移。基于这一结果,作者作出假设:核小体结合与增强子转录信号的同步化可能是增强子功能性的良好指标。作为验证,作者发现核小体信号的PC3与增强子区域所含的常见单核苷酸序列变异(common SNP)是由GTEx项目所识别的eQTL位点的概率之间存在显著反比关系。由于eQTL位点往往被认为是能够揭示基因调控因果关系(causal relationship)的重要指征,因此上述结果实际表明了核小体和增强子的同步性与后者的基因调控效应强弱之间的显著关联。尽管这种功能联系的逻辑先后关系需要进一步探讨,但核小体的结合模式是判断增强子存在性的关键指标的事实是确凿无疑的。 ![]() 增强子作为转录调控的关键元件,在生命活动中的功能重要性是不言而喻的。同时,这种功能重要性相对于基因而言往往是高度组织和细胞特异性的。因此,实现对增强子激活程度的准确定量对于揭示其功能后果是极为关键的。与超级增强子尺度过大难以根据转录信号精准定量和表观修饰信号往往缺乏可定量依据【16】不同,该研究所定义的增强子单元具有相当高的精度,并且基于广泛存在的常规转录组数据而量化,因此其蕴藏的关于组织和细胞类型特异性调控逻辑及其所联系的生理、疾病表现型的解释力可能是十分惊人的。具体而言,尽管一个表型与一个或多个基因的特定表达模式具有直接关联,但这种关联往往只在某种特殊细胞类型或细胞状态中有意义;而组织细胞集群的基因表达谱只能提供基因表达的平均度量,因而可能掩盖了细胞特异性基因调控机制与重要表型的联系。相反,增强子经由其转录强度所表征的激活程度是高度环境特异性的,因此即使在常规大体组织测序(bulk sequencing)样本中也能够提供关于特定细胞类型的表达模式变化与相关表型之间的联系。 ![]() 为了印证这一逻辑,在根据转录信号和核小体结合特征成功识别出数十万个潜在增强子单元的基础上,作者利用肿瘤免疫治疗(cancer immunothepary)的公共RNA-seq数据分别定量了增强子激活程度,结果发现,与超两万个蛋白编码基因无一通过显著性测试相比,近两百个增强子单元在对免疫治疗具有良好响应的病人样本中存在显著激活。而更令人兴奋的是,这群增强子经由eQTL联系所对应的靶基因显著富集于CD8+ T细胞功能,因此很好地展示了增强子作为细胞状态特异表型指征的角色。 ![]() 无独有偶,9月21日,来自美国康奈尔大学的于海源课题组在Nature Genetics上发表了题为Transcription imparts architecture, function and logic to enhancer units的研究,报道了基于大规模序列活性筛选的对增强子的转录功能及序列特征的详细分析,经由另一条途径揭示了增强子单元的转录本质。
在该研究中,作者从MYC远端增强子活性由GRO-cap转录信号标定而非表观修饰H3K27ac或H3K4me1信号标定的案例出发,试图系统性地衡量转录信号与增强子活性之间的关联。为此,作者改进了适合于大规模筛选较长非编码DNA片段的转录调控效应的STARR-seq技术,通过对双向序列取向的包含排除了影响RNA稳定性的序列,然后对DNase I超敏感位点(DHS)标定的染色质开放区域DNA片段进行了增强子效应的测量。结果发现,几乎所有表现出增强子活性的片段都来自于GRO-cap转录阳性组,因而为增强子的转录普遍性提供了强证据。 ![]() 考虑到启动子核心序列是基因转录的关键元件及启动子与增强子的序列特征的相似性,作者分析了各类转录相关DNA结合因子的结合基序(binding motif)在增强子序列中的存在性。结果发现,转录调控的关键因子,如TBP、SP1和STAT2等的结合基序均在增强子转录起始位点上游序列中具有很强的富集,且这种特征是在双向转录中同时存在的。 ![]() 由于启动子核心序列特征的存在并不代表增强子一定具有和基因转录类似的结构特征,作者希望通过功能扰动实验来直接证明两者间的逻辑关联。在选取的13个确定具有增强子活性的DNA序列中,当启动子核心序列被省略时,有9个都表现出活性显著降低。因此,这一结果说明与基因类似的启动子转录序列特征的存在在很大程度上是增强子行使功能所必需的。另一方面,这也暗示了增强子的转录是受到精准调控而非随机发生的,因此更进一步地说明转录是增强子的本质之一。 ![]() 基于上述结果,作者总结了增强子单元和启动子序列共享的转录结构,即由转录起始位点上游32bp之外的转录因子的结合和位于转录起始位点上游32bp至下游60bp的启动子核心序列所规定的异向转录统一模型。 ![]() 总之,上述两项研究分别从截然不同的角度展示了增强子转录特征的普遍性,进一步强化了这种属性在其功能执行中的核心地位,为研究界对增强子的身份和本质的认知做出了重要的推动。 原文链接: https://doi.org/10.1016/j.ccell.2020.08.020 参考文献 1.Lee, T. I. & Young, R. A. Transcriptional regulation and its misregulation in disease. Cell 152, 1237–1251 (2013). 2.Andersson, R. & Sandelin, A. Determinants of enhancer and promoter activities of regulatory elements. Nat. Rev. Genet. 21, 71–87 (2020). 3.Xiao, R. et al. Pervasive Chromatin-RNA Binding Protein Interactions Enable RNA-Based Regulation of Transcription. Cell 178, 107-121.e18 (2019). 4.Zeitlinger, J. Seven myths of how transcription factors read the cis-regulatory code. Curr. Opin. Syst. Biol. 301, 127065 (2020). 5.Wu, X. & Sharp, P. A. Divergent transcription: A driving force for new gene origination? Cell 155, 990 (2013). 6.Shao, W. & Zeitlinger, J. Paused RNA polymerase II inhibits new transcriptional initiation. Nat. Genet. 49, 1045–1051 (2017). 7.Fiszbein, A., Krick, K. S., Begg, B. E. & Burge, C. B. Exon-Mediated Activation of Transcription Starts. Cell 179, 1551-1565.e17 (2019). 8.Pennacchio, L. A., Bickmore, W., Dean, A., Nobrega, M. A. & Bejerano, G. Enhancers: Five essential questions. Nat. Rev. Genet. 14, 288–295 (2013). 9.Heintzman, N. D. et al. Distinct and predictive chromatin signatures of transcriptional promoters and enhancers in the human genome. Nat. Genet. 39, 311–318 (2007). 10.Creyghton, M. P. et al. Histone H3K27ac separates active from poised enhancers and predicts developmental state. Proc. Natl. Acad. Sci. U. S. A. 107, 21931–21936 (2010). 11.Whyte, W. A. et al. Master transcription factors and mediator establish super-enhancers at key cell identity genes. Cell 153, 307–319 (2013). 12.Kim, T. K. et al. Widespread transcription at neuronal activity-regulated enhancers. Nature 465, 182–187 (2010). 13.Andersson, R. et al. An atlas of active enhancers across human cell types and tissues. Nature 507, 455–461 (2014). 14.Core, L. J. et al. Analysis of nascent RNA identifies a unified architecture of initiation regions at mammalian promoters and enhancers. Nat. Genet. 46, 1311–1320 (2014). 15.Li, W., Notani, D. & Rosenfeld, M. G. Enhancers as non-coding RNA transcription units: Recent insights and future perspectives. Nat. Rev. Genet. 17, 207–223 (2016). 16.Orlando, D. A. et al. Quantitative ChIP-Seq normalization reveals global modulation of the epigenome. Cell Rep. 9, 1163–1170 (2014). 转自微信公众号BioArt 原文链接: https://mp.weixin.qq.com/s/UIvXgGasFIGi4iSmPu_yvA
|