- A+
第一作者:Wei Qin
通讯作者:Peter E. Cavanagh & Alice Y. Ting
通讯单位:Department of Genetics, StanfordUniversity
许多生物过程是通过蛋白质和核酸的分子相互作用来执行和调节的。邻近标记(PL)技术通过特定蛋白“诱饵”(已知蛋白的cDNA序列)与混杂酶(可在活细胞中催化产生扩散性活性物质)发生基因融合,来标记两者间的相互作用。与”诱饵“相互作用的标记分子随后可经质谱或核酸测序进行富集和鉴定。在此,本文回顾PL技术的发展,并重点介绍将PL应用于分子相互作用的发现和分析的研究,尤以利用PL确定活细胞和生物体中蛋白质-蛋白质,蛋白质-RNA和蛋白质-DNA的相互作用为主。
细胞功能受蛋白质、核酸及其相互作用调控,在蛋白质-蛋白质/蛋白质-RNA/蛋白质-DNA相互作用构成的分子网络中,失调或导致包括癌症、免疫紊乱、神经变性在内的多种人体疾病。开发能够大规模发现活细胞中分子相互作用的方法在生物学探索和治疗干预上具有前瞻性。
表1 PL酶总览
亲和纯化和酵母双杂交(酵母双杂交系统是将待研究的两种蛋白质分别克隆(融合)到酵母表达质粒的转录激活因子(如GAL4等)的DNA结合结构域和转录激活域上,构建成融合表达载体,从表达产物分析两种蛋白质相互作用的系统)的传统方法已广泛应用于发现潜在的分子相互作用,它们又各自存在局限性:亲和纯化时相互作用强度过弱/时间过短,在细胞溶解及随后的洗涤步骤中常常损失;酵母双杂交法通量高,但受到细胞和细胞器种类的限制,比如不适用于膜蛋白,“诱饵”和“猎物”的过表达和标记会导致假阳性信号,标记的空间位阻会导致假阴性信号。
临近标记(PL,本文中定义为由基因编码酶(而非化学催化剂)催化的标记物,能在生物系统中产生扩散性活性物质的技术)互补于上述研究活细胞内相互作用成像的传统方法,使用能基因标记目标蛋白的工程酶(如过氧化物酶APEX2、HRP或生物素连接酶BioID,等),如表1所示。其原理是在已知蛋白上融合一个具有临近标记功能的酶,通过酶介导的蛋白质共价修饰将与已知蛋白相互作用的分子标记上生物素,从而使原本不易被检测的相互作用生物分子被发现和鉴定。这些PL酶将惰性的小分子底物转化为短暂存在的活性物质,比如APEX方法能产生可扩散出酶活性位点的自由基,共同标记邻近的内源物质(图1a, b)。标记半径由活性物质的半衰期和环境中淬灭剂的浓度共同决定,通常在1-10nm间。将PL酶标记为“轮廓图”,其中PL酶上的反应物浓度最高,从源头开始逐纳米下降。过氧化物酶和生物素连接酶产生的活性物质不透膜,因此轮廓图止于膜边界。底物分子通常包含生物素“handle”,以便能够随后使用链霉亲和素珠富集标记的物种,并通过质谱(对于蛋白质)或核酸测序(对于RNA)进行鉴定(图1c)。根据PL酶的定位和表达,PL可用于在不同的长度尺度上确定空间蛋白质组-从整个细胞到细胞器,从亚细胞区室到大分子复合物。本综述中将重点介绍PL在分子相互作用研究中的应用。
图1 基于过氧化物酶和生物素连接酶的临近标记方法用于PPI定位。a. 基于过氧化物酶(如APEX、HRP)的方法,利用H2O2将生物素-苯酚氧化产生优先标记近端内源性蛋白的活性苯氧基。b. 基于生物素连接酶(如BioID、TurboID)的方法,催化ATP和生物素形成具活性的、能扩散并标记近端蛋白的生物素-5’-AMP复合物;c. 定位PPI的蛋白质组学工作流程示例。与目标“诱饵蛋白”融合的PL酶和空间对照组在各自样品中表达。每个样品中的生物素化蛋白质通过后续定量质谱分析法进行浓缩和分析。( POI:目标蛋白)
临近标记用于分析蛋白质间相互作用
蛋白质相互作用包括形成较稳定的蛋白质复合物或瞬时相互作用两类。一些蛋白质之间的瞬时相互作用有重要的生理功能,但是由于比较微弱,常规方法难以检测。近年来,PL技术正在被逐渐应用到蛋白质相互作用的研究中,已经在不同细胞类型中成功解决了众多PPI(蛋白质相互作用)的定位问题(表2)。
表2 临近标记定位PPIs示例
临近标记用于分析蛋白质-RNA相互作用
蛋白质与RNA之间的相互作用对于从转录和翻译到先天免疫和应激反应等广泛的细胞功能至关重要,并且已经开发出许多方法来研究这些相互作用,现有方法可大致分为以蛋白质为中心或以RNA为中心(表3)。
表3 不同蛋白质-核酸方法的比较(部分)
在以蛋白质为中心的方法中,可以通过RNA测序来鉴定与特定目标诱饵相互作用的RNA partner;以RNA为中心时,能够识别特定RNA诱饵的蛋白质partner。用于蛋白质拉下(Pull-down assay)的抗体可得,RNA测序也较易,因此前种方法更多,能得到多种蛋白质-RNA相互作用图。此外,蛋白质诱饵免疫沉淀(CLIP)法特异性好,无需任何组分的外源性表达,倘在前添加化学物质或紫外线(UV)交联步骤可提高RNA捕获的效率。两种方法的靶标相反,互为相互作用识别主客体。
APEX-RIP使用甲醛,而临近-CLIP在细胞裂解之前用紫外线将APEX-生物素化的蛋白质与RNA交联,从而富集基于链霉亲和素的蛋白质RNA复合物(图2a)。该法已用于内质视网膜、核纤层和细胞-细胞界面。mRNA 3'UTR位于细胞-细胞界面,此前发表文章中,还实现了使用Proximity-CLIP观察CUG重复序列在RNA结合蛋白(RBP)保护的mRNA 3'UTR的足迹中的富集[1]。
在APEX-RIP中,使用甲醛会增加时间和复杂性,并降低空间特异性。更直接的方法中,在一种更直接的方法中,APEX-seq通过使用APEX融合蛋白直接生物素化临近的内源性RNA而完全不需要蛋白质-RNA交联(图2b)。活细胞内标记1 min后,使用链霉亲和素来富集标记了的RNA用于测序。APEX-seq改进后可使用更有效的底物,生物素-苯胺,来提高RNA捕获效率[2]。
另一种以蛋白质为中心的PL方法,发色团辅助的邻近标记和测序(CAP-seq),结合了RNA碱基的光氧化作用,可以被胺探针捕获并通过高通量测序进行鉴定(图2c)。尽管CAP-seq的时间分辨率(~20 min)会比APEX-seq(~ 1 min)低一些,但两种方法在标记RNA的机理是不同的,甚至算得上互补。相较于传统的“蛋白质中心测序法”,基于PL的两种技术都不需要抗体或交联步骤,能简单用于识别特定RBPs的临近RNAs的相互作用。
RaPID(RNA-蛋白质相互作用检测)通过用BoxB适配体标记目标RNA,募集噬菌体λN肽和生物素连接酶BASU的融合蛋白,从而使RBP进行生物素化(图2d)。RaPID用于探索与Zika 病毒RNA相互作用的主体蛋白。类似地,MS2外壳蛋白能与BioID和APEX2融合,以将这些PL酶募集至MS2标记的RNAs(图2e)。然而,这些方法仅定位与外源表达的标记RNA相互作用的蛋白质,或无法准确反映天然转录本的相互作用组。
因此后来开发了RNA-引导的CRISPR体系,能靶向内源性RNAs。举例而言,Han等人靶向了与APEX2和双链RNA结合结构域(dsRBD)(增强其结合亲和力)融合的对人端粒酶RNA的无催化作用的RfxCas13d(图2f)。通过该方法,团队发现了人类端粒酶RNA和N6-甲基腺苷(m6A)脱甲基酶ALKBH5之间的未知相互作用,随后的研究表明,ALKBH5的转录后调控会影响端粒酶复合物的组装和活性。
图2 研究蛋白质-核酸相互作用的PL方法。a. APEX-RIP和临近-CLIP。针对特定亚细胞位置的APEX催化近端蛋白质的生物素化(粉色B),蛋白质-RNA相互作用随后通过UV或甲醛(FA)交联。可以通过基于链霉亲和素的富集来捕获交联的RNA。b. APEX-seq示意图。APEX直接生物素化诱饵近端的RNA(黄色)而非远端的RNA(灰色)。c. Cap-seq. 蓝光照射下,miniSOG产生活性氧物质与RNA中的G碱基反应,随后与氨基探针形成加和产物。d. RaPID. 用BoxB适配体标记目标RNA,募集λN的融合蛋白以及一种混杂式生物素连接酶来生物素化相关RBPs。e. 基于MS2标记和MS2外壳蛋白(MCP)的PL方法,可捕获与目标RNA相关的RBPs。f-g. 基于dCas13的PL策略。h. ChromlD.BASU与能够特异性识别特定染色质标记的工程染色质读取器融合在一起,从而使染色质结合蛋白的生物素化。
临近标记用于分析蛋白质-DNA相互作用
蛋白质-DNA相互作用对于调节基因表达,基因组完整性和染色质组织至关重要。ChIP-seq广泛用于与目标蛋白联系的DNA区的捕获和测序。这种方法的PL适应发生在活细胞中,并使用过氧化物酶APEX对“诱饵”附近的蛋白质进行生物素化,而“诱饵”又通过甲醛与相邻的DNA区域交联。随后,链霉亲和素富集生物素化的蛋白质-DNA片段复合物,利用下一代测序进行分析。ALaP(用于APEX介导的染色质标记和纯化)在概念上类似于APEX-RIP,与传统的ChIP-seq相比,灵敏度更高,但特异性有所降低。ALaP还进一步适用于定位早幼粒细胞白血病体的基因组接触位点,即与染色质物理相互作用的相分离的核结构。
对于以DNA为中心的定位成像,就无偏倚鉴定目标基因组位点或染色质复合物附近的蛋白质,已经开发了几种方法。三组独立地将PL与基于CRISPR的基因组靶向结合。将APEX2与无催化活性的dCas9融合以靶向特定的基因组位点(如端粒和着丝粒),可使相关蛋白生物素化、富集并通过质谱分析(图2g)。为了探究与特定染色质复合物相关的蛋白质,报道了RIME(内源蛋白质的快速免疫沉淀质谱)和ChIP-MS。通过将BASU与特异于染色质修饰的工程读码器融合,ChromID被用于确定特定染色质标记处的蛋白质相互作用组(图2h)。ChromID识别了在组蛋白H3 Lys4和Lys27上被三甲基化修饰的启动子区域。
临近连接的局限性
(1)诱导融合。使用基于PL的方法进行分子相互作用作图需要将PL酶(27–44 KDa)直接融合到目标蛋白上,这需要转染融合构建体或采用其他诱导方法,例如病毒感染。融合过程或直接影响靶标蛋白的功能、位置甚至相互作用组,因此,进行功能和定位分析以确认PL酶融合构建体保持生理相关性并表现出与目的内源蛋白相似的行为具有重要意义。
(2)PL酶的专一性。每种PL酶都具有各自的优缺点(表1),其选择高度依赖于特定的应用。
(3)灵敏度有待增强。如果使用定量质谱分析,并选择适当的比例或统计分析对照,PL实验可以产生高度特异性的PL数据集。但由于下述原因,PL技术的灵敏度或不够理想:a. 一些情况下,比率分析或滤除双重定位的蛋白质(即,既存在于细胞质中又位于线粒体外膜上;b. 或无法检测到缺乏表面暴露的酪氨酸(针对APEX)或赖氨酸(针对BioID和TurboID)的蛋白质,并且不同的PL酶可能会偏向于标记某些蛋白质底物。
PL进行分子相互作用定位的技术上的进步,使得此前难以进行的生物学研究成为可能。进一步的工具开发和工程设计或使作用定位图更全面,并在更大范围的模型系统中提高时空特异性。尽管生物素连接酶(例如BioID和TurboID)已成功用于许多生物体中的体内蛋白质组学定位,但进一步的优化(例如使用非生物素探针避免内源性生物素化蛋白质的背景信号)可能会改善体内PL的相容性。
对于蛋白质-核酸作用定位,提高PL酶对RNA或DNA标记的效率将增强不同细胞群体中转录组和基因组的敏感性和分析能力。同时,此外,基于CRISPR的核酸靶向和结合稳定性的提高按理能改进使用该机制的PL方法,并使其能够应用于低水平表达的内源性转录本。使用多路复用的PL酶和富集方法,还能同时实现多种作用力的定位。随着尖端的PL技术的不断发展,可能会极大地扩展基于PL的探索范围,并解决更具挑战性的问题,例如确定分子相互作用的亲和力、化学计量比和接触位点。
~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~
【参考文献】
[1]. Proximity-CLIP provides a snapshot of protein-occupied RNA elements in subcellular compartments. at. Methods 15, 1074–1082 (2018).
[2] Expanding APEX2 substrates for proximity-dependent labeling of nucleic acids and proteins in living cells. Angew. Chem. Int. Ed. Engl. 58, 11763–11767 (2019).

目前评论: