

Citation: Jin Jiaoyu, Yan Xiaoxuan, Liu Yaping, Lan Wenxian, Wang Chunxi, Xu Bin, Cao Chunyang. Recent Advances in the Structural Studies on Cytosine Deaminase APOBEC3 Family Members and Their Nucleic Acid Complexes[J]. Acta Chimica Sinica, 2019, 77(11): 1089-1098. doi: 10.6023/A19080296

胞嘧啶脱氨基化酶APOBEC3家族及其与核酸复合物结构研究进展
English
Recent Advances in the Structural Studies on Cytosine Deaminase APOBEC3 Family Members and Their Nucleic Acid Complexes
-
Key words:
- APOBEC3
- / cytidine deamination
- / HIV virus
- / nucleic acid
- / structure
-
1. 引言
人源APOBEC3家族是一种具有抗HIV病毒活性的蛋白分子, 是一个庞大的胞嘧啶脱氨基化酶家族[1], 其成员包括APOBEC3A(简称A3A)、APOBEC3B(简称A3B)、APOBEC3C(简称A3C)、APOBEC3DE(简称A3DE)、APOBEC3F(简称A3F)、APOBEC3G (简称A3G)、APOBEC3H (简称A3H)[2].如图 1A所示, A3A、A3C及A3H包含一个Zn2+结合区域(即CD1), 而A3B、A3DE、A3F及A3G包含两个Zn2+配位的胞嘧啶脱氨基化区域(即CD1和CD2), CD1与CD2功能域均包含氨基酸序列HXE(X)23-28 CXXC片段[3].根据相对保守的氨基酸基元序列, 它们又被分为三类(图 1B): Z1 (A3A、A3B-CD2、A3G-CD2)、Z2 (A3B-CD1、A3C、A3DE、A3F、A3G-CD1)、Z3 (A3H)[2].基元序列中保守的组氨酸及两个半胱氨酸与Zn2+配位(图 1C), 而谷氨酸为催化反应中质子的传递手(shuttle).
图 1
图 1. A3家族蛋白结构域组成与分类: (A) A3家族蛋白CD1与CD2分类; (B) A3家族蛋白结构域按Z1、Z2、Z3进行分类; (C)三类Z区域的氨基酸序列比对[2], 与Zn2+配位的氨基酸上面标了星号Figure 1. Classification and nomination of the functional domain of A3 family members. (A) The classification of CD1 and CD2 domains of A3 family members; (B) A3 family is classified according to Z1, Z2, Z3; (C) Sequence alignment of three types of Z regions[2], in which residues ligated with Zn2+were marked with starA3家族以串联重复形式排列于第22号染色体.这些成员中, A3A、A3B还与肿瘤发生、发展密切相关. A3A还能使巨噬细胞中RNA的胞嘧啶脱氨基化产生尿嘧啶, 从而导致病原体蛋白氨基酸序列发生变异.一般来讲, A3蛋白只有与单链DNA(即ssDNA)或者RNA(即ssRNA)发生特异性相互作用后才能进行催化脱氨基化反应.由于A3蛋白CD1或者CD2结构域催化脱氨基化反应速度很快, 因此捕获瞬态的A3-CD1或者A3-CD2与单链核酸形成的复合物非常困难.截至目前, A3家族与核酸形成的复合物结构得到解析的有A3A, A3F, A3G和A3H.目前有关A3蛋白与核酸复合物的结构最新研究结果的综述较少, 中文综述基本没有.为了使国内科研工作者更好地理解A3家族蛋白脱氨基化机理, 本文对近几年A3家族结构及其与核酸的复合物结构研究进展作一个简明的介绍.
2. APOBEC3家族蛋白结构及其催化胞嘧啶脱氨基化活性
2.1 A3家族蛋白胞嘧啶脱氨基化的可能机制
由于A3蛋白催化胞嘧啶脱氨基化反应较快, 无法捕获它们与核酸催化反应时的瞬态复合体, 故有关A3蛋白如何与DNA或RNA特异性结合并进行脱氨基化反应的机制尚未被人所知.为此, 基于细菌和酵母的DNA、RNA胞嘧啶脱氨基化酶与胞嘧啶复合物结构研究结果, Harris等[4]提出图 2所示催化机理.具体步骤包括:第一步, Zn2+与两个半胱氨酸、一个组氨酸配位, 一个水分子进攻Zn2+; 第二步, 活性位点氨基酸谷氨酸侧链羧酸根离子与水分子及Zn2+作用产生一个OH-离子; 第三步, 谷氨酸质子化胞嘧啶芳环的第三位氮原子, 使得原子N3—C4间的化学键不再稳定, C4原子变得易于被OH-进攻; 第四步, OH-进攻C4原子, 产生C4取代的不稳定过渡态; 水分子的另一个质子也被谷氨酸掘去.第五步, 氨基接受该质子, 导致C—N键断裂, 成功脱氨基化.
图 2
2.2 A3家族抗病毒与生物功能
2.2.1 APOBEC3A (A3A)结构与胞嘧啶脱氨基化活性
在干扰素刺激后, A3A基因在单核细胞和巨噬细胞中大量表达[5]. A3A活性具有多样性, 能够降解外源DNA, 阻断外源病毒(人类乳头状瘤病毒、劳斯肉瘤病毒、细小病毒和HIV-1病毒)的复制, 抑制逆转录因子(LINE-1和LTR)的转录[5]. A3A能够特异性识别ssDNA中靶序列5'-TTCA-3'或者5'-CCCA-3'中的3'-端胞嘧啶[4], 在先天性免疫响应中通过使病毒抗原体在转录过程中产生的单链DNA中胞嘧啶脱氨基化, 发挥抑制病毒的作用[6]. A3A也能够识别5-甲基化胞嘧啶(5mC), 诱导细胞周期停止以及细胞核和线粒体DNA体细胞超突变[6].氨基酸E72是其活性位点. A3A四点突变体E72Q/L63N/ C64S/C171Q核磁共振(即: nuclear magnetic resonance, 简称NMR)溶液三维结构显示, 其结构类似于A3G- CD2[6], 锌离子与保守的组氨酸H70, 半胱氨酸C101, C106侧链配位[4]. A3A的结构由6个α-螺旋(helix), 5个β-折叠(sheet)和锌离子结合位点构成, 其中β2-折叠是不连续的.而其双点突变体E72Q/C171A的晶体结构显示, 该双突变体为二聚体[7], 表明半胱氨酸C64导致蛋白A3A二聚.
2.2.2 APOBEC3B (A3B)结构与胞嘧啶脱氨基化活性
基因敲除实验显示, A3B能同时对ssDNA和ssRNA中胞嘧啶进行脱氨基化, 造成大量的C→T的突变[8].在乳腺癌肿瘤细胞中, 发现A3B的mRNA的水平上调, 显示A3B大量表达[7].在乳腺癌细胞系提取物中可以检测到内源性A3B编辑的DNA包含C-U的突变. A3B的过量表达会促使细胞循环偏离, 细胞死亡, DNA破碎.全长A3B及A3B-CD2均优先对包含靶序列片段5'-G-2T-1C0G+1-3'的ssDNA中碱基序列5'-TC进行脱氨基化, 这是在乳腺癌、肺癌、膀胱癌、子宫颈癌等肿瘤中频繁出现突变的双碱基位点[8].因此A3B是很好的抗癌药物靶标.
研究表明[7~9], 全长A3B及A3B-CD2不能在大肠杆菌(E. coli)中可溶性大量表达. 2015年Shi等[9]构建了包含A3B-CD2四点突变体F200S/W228S/L230K/F308K基因的质粒, 实现在E. coli中可溶性大量表达A3B-CD2, 遗憾的是不易结晶; 为了降低表面构象熵值使得蛋白更易于结晶, 他们进一步将蛋白A3B-CD2中β2-α2之间的loop-3截掉(即: A3B-CD2QMΔloop3, 其中QM寓意四位点突变), 发现该突变体在E. coli中不仅能可溶性大量表达, 其催化脱氨基化活性比突变体E255A的活性提升了将近100倍, 但比野生型A3B-CD2稍弱, 不过易于结晶.该A3B-CD2突变体的晶体结构[9]研究显示, A3B-CD2三维结构类似于A3G-CD2, 但催化中心结构更为紧凑. A3B-CD2整体结构与其他A3成员的结构非常相似, 由单层5个β-sheet组成, 周围有6个α-helix和7个loop, 与底物ssDNA的结合受附近构象柔性很强的loop调控.将A3B-CD2中loop-3截掉后, A3B-CD2对ssDNA碱基的选择性没有变化, 说明loop-3对识别ssDNA中靶序列没有影响.为了解决A3B-CD1结构域不可溶表达以及聚集问题, 2017年Xiao等[10]进一步构建了包含A3B-CD1六点突变体(即: Y13D/Y28S/Y83D/ W127S/Y162D/Y191H)基因的表达质粒.该A3B-CD1突变体晶体结构显示A3B-CD1具有经典的、保守的A3家族蛋白折叠结构, 即由5个β-sheet组成, 被6个α-helix和7个loop包围.与其他Z2型域结构如A3C、rA3G-CD1(即:灵长类动物A3G-CD1)和A3F-CD2相比, A3B-CD1的loop-3长度相对较短.同时, 从结构中可以看到, A3B-CD1一个显著的特征是α4螺旋不连续.酶活实验显示A3B-CD1对催化胞嘧啶脱氨基化活性及ssDNA碱基序列选择性没有影响[10].
2.2.3 APOBEC3C (A3C)结构与胞嘧啶脱氨基化活性
研究表明, A3C与HIV-1病毒感染因子Vif相互作用, 被其介导通过泛素化途径降解[11]. A3C与Vif的作用界面主要是由一些疏水性和负电荷的残基形成的浅槽. A3C对HIV-1病毒没有作用, 但能抑制猴免疫缺陷病毒(SIV病毒). 2013年Kitamura等[5]报道了A3C的二聚体晶体结构, 显示A3C结构类似于A3G-CD2和A3A, 同样由6个α-helix和5个β-sheet构成, 但不同于A3G-CD2和A3A的是, A3C的β2-sheet是连续的. A3C与A3G-CD2(PDB code: 3IR2)结构差别主要体现在loop-1、-3、-4和-7上, 而loop上的一些残基相对保守, 如残基R30、N57、H66、W94、R122和Y124对应于A3G-CD2中的残基R215、N244、H257、W285、R313和Y315(图 3), 它们对稳定催化中心的构象以及底物DNA的结合非常重要[5].
图 3
图 3. A3家族蛋白氨基酸序列对比图. Clustal Omega的氨基酸比对结果的图上方显示了二级结构(α螺旋、β折叠及loop).其中, A3蛋白中序列保守的氨基酸H70、W98、Y130(在A3A中的编号)均参与了DNA特异性识别Figure 3. The sequence alignment of A3 family protein. Clustal Omega amino acids alignment showing secondary structures (α-helices, β-strand and loop). In A3 members, conserved residues H70, W98 and Y130 (in A3A) are all involved in DNA interactions2.2.4 APOBEC3DE (A3DE)生物学功能
A3DE能够在非允许型细胞中大量表达, 抑制HIV-1和SIV病毒复制, 但是活性弱于A3G和A3F[12]. A3DE基因被敲除后, 不会影响老鼠的生存、发育与繁殖[12].来自人与来自黑猩猩的A3DE氨基酸序列差别最大, 来自黑猩猩的A3DE限制免疫型病毒HIV-1和SIV的感染, 而人源A3DE只对HIV-1有弱的抗病毒活性[6].目前, 尚未实现A3DE蛋白的CD1与CD2结构域在E. coli、yeast等体系中可溶性大量表达, 因此有关它们的结构与功能研究比较缺乏.
2.2.5 APOBEC3F (A3F)结构与胞嘧啶脱氨基化活性
A3F也是人类细胞编码的HIV抗性基因[13], 全长13.24 Kb, 其mRNA全长2672 bp, 编码框为1122 bp, 编码373个氨基酸.与A3G相同, 在病毒转染实验中发现A3F对病毒DNA具有突变能力.与A3G不同的是, A3F主要诱导反转录病毒cDNA双链核苷酸中5'- TC的胞嘧啶发生脱氨基化, 引发DNA负链5'-TC到TT的突变; A3G特异性地脱氨基化5'-CC中的3'端的胞嘧啶.这两种反应都产生尿嘧啶, 引发DNA负链5'-CC到CT的突变[14, 15].所以病毒DNA正链会同时显示5'-GA到AA和5'-GG到AG超突变.这与HIV-1检验结果一致, 即二核苷酸脱氨基化在超突变表型中非常明显[16, 17].
对A3DE、A3F-CD2和A3G-CD1上的相应残基进行突变发现, 这些蛋白与Vif的作用界面高度保守. A3G有关键的Vif相互作用区(即氨基酸D128)[18], A3F相应区域的残基突变后基本不会影响与Vif的结合[18].但是从患者中获得的5'-GA到AA的超突变比5'-GG到AG多[17].这可能是因为A3F蛋白第127位的谷氨酸(即E127)处于W126ERD129基序中, 邻近的精氨酸R128侧链正电荷抵消了这段区域的负电荷, 使A3F蛋白具有拮抗HIV-1病毒Vif能力[8].与A3G相比, A3F中虽然有一小部分电荷发生改变, 但不足以改变其与Vif相互作用, A3F蛋白不能完全使HIV-1病毒的Vif功能得到抑制[4, 18].
2013年, Bohn[19]和Siu[20]等分别报道了A3F-CD2 (氨基酸185到373片段)-11X(即: 11个位点突变体)的四聚体晶体结构和嵌合体A3Fc-CD2 (即: A3F-CD2的氮端氨基酸195-217序列被A3G-CD2氮端氨基酸序列197-221取代)的二聚体晶体结构.它们均表明, 单体A3F-CD2主要是由6个α-helix和5个β-sheet构成, 其中β2折叠是连续的, 这一特征不同于A3G-CD2和A3A, 但与A3C一致.
2.2.6 APOBEC3G (A3G)结构与胞嘧啶脱氨基化活性
A3G又叫CEM15, 编码384个氨基酸, 分子量46 kDa, 主要在睾丸、卵巢、脾、外周血粒细胞和T淋巴细胞中表达[21].如图 1所示, A3G含有两个结构域, 分别为N-端结构域(CD1)和C-端结构域(CD2), A3G-CD1介导病毒的壳体化, A3G-CD2结构域负责催化胞嘧啶脱氨基化[22], 诱导逆转录病毒发生G→A超突变, 该突变能够被尿嘧啶DNA糖基化酶(即UDG)切断产生无嘌呤的嘧啶位点(即AP site), 再被核酸内切酶识别和切断, 使正链DNA不能正常合成[23].所以, 病毒DNA正链上G→A的超突变产生终止密码子或引发非病毒蛋白的产生[24], 致使HIV基因组不能正常执行其功能, 从而达到A3G抑制HIV-1复制的效果[25].
HIV病毒利用其Vif蛋白来拮抗A3G活性. Vif蛋白(特别是在HIV-1中)含有192个氨基酸, 对病毒的复制和感染具有非常强的调节能力[25].其结构域锌螯合区(100-142aa)与蛋白Cu15结合, 并与Elongin B和Elongin C、Rbx1等蛋白形成SCF (即: Skp1-Cul5-Fbox)多元复合物, 使得Vif与A3G非催化结构域CD1发生作用[13], 诱导A3G降解.但是Vif并不能通过这种结合方式完全拮抗A3G蛋白[13]. Vif也会通过降低A3G mRNA的翻译水平来抑制A3G蛋白的表达[22~24].
A3G诱发HIV-1病毒DNA发生的超突变位置主要在基序5'-CCC-3'中3'端第三个碱基胞嘧啶C上[26], 降低HIV病毒cDNA的表达[27]. A3G与病毒DNA结合时, 主要与DNA负链结合, 从3'端开始不断跳跃或滑动到5'端, 使病毒负链DNA持续发生胞嘧啶脱氨化[20]. A3G脱氨基化活性与DNA序列有关, 3'端的序列对活性的影响大于5'端[13].当3'端和5'端都有三个腺嘌呤时, A3G特异性活性最高, 而当3'端和5'端都有三个胸腺嘧啶时, A3G特异性催化脱氨基化活性最低[28]. A3G-CD2晶体结构与溶液结构[26]研究表明, A3G-CD2由六个α-helix和五个β-sheet构成, 其中β2是不连续的.残基F202、N208、W211、R213、R215、N244、R256、W269、H257、L271、W285、Y315DDQ318、V351、W361和R374的突变会严重影响A3G-CD2脱氨基化活性[29, 30].
2015年, Kouno等[22]利用进化方法分析氨基酸序列、并结合定点突变方法获得了可溶性很好的能与Vif蛋白相互作用的A3G-CD1结构域, 利用核磁共振技术解析了其自由态溶液三维结构.该结构显示, 一个较小的Zn2+结合口袋使得A3G-CD1结构域三维结构不同于A3G-CD2结构.由于全长A3G样品难以制备, 目前无法获取全长蛋白结构及其与DNA的结合方式.在2008年, Bennett等[31]以A3G-CD2的晶体结构为模板, 利用小角散射(SAXS)数据进行修正得到全长A3G的SAXS结构, 全长A3G的SAXS的二聚体结构是由A3G-CD2以tail-to-tail形式形成. 2014年曹春阳课题组[32]通过结晶的方式得到了新的A3G-CD2的head-to-tail二聚体模式结构.结合A3G-CD1三维结构模型和多种生化数据分析验证, 他们推测该二聚体形式可能是全长A3G的结构模型, 并由此推测出了全长A3G与ssDNA的结合模式.
2.2.7 APOBEC3H (A3H)结构与胞嘧啶脱氨基化活性
A3H在细胞系中表达量很低, 抗病毒活性尚不清楚. Dang等[33]认为在人源和黑猩猩的A3H基因的第五个外显子上存在提前终止密码子, 这样只能获得截短的缺少碳端29个氨基酸的A3H, 该截短体蛋白不会降低蛋白的稳定性[34~37], 但是会严重降低截短蛋白mRNA的表达水平[38].利用在人类巨细胞病毒中获得的包含一个内含子的载体可以使A3H截短体的表达水平修复到正常水准[39].这样A3H抵抗病毒的活性提高150倍[40~42].但是通过序列分析, A3H并不能使HIV-1基因组发生大量的G-A的超突变.这意味着A3H可能并不是依靠胞嘧啶脱氨基化来抑制病毒的活性, 而可能采用另外一种抗病毒的方式[43].
在整个A3家族蛋白中, A3H比较独特, 只含有一个CD1结构域, 既能与Vif相互作用, 又能对ssDNA的胞嘧啶进行催化脱氨基化.其氨基酸序列在不同来源的标本中差异最大[44].目前, 有7个A3H的单体模型(haplotype)被发现(简称: Hap I-VII), 其中只有Hap II、Hap V及Hap VII能够稳定表达, 抑制Vif缺失的HIV-1病毒复制.进行脱氨基化反应时, A3H对ssDNA序列的特异性如下: TTCA>TTCT>TTCG>ACCCA>TGCA.一般认为3'-端的嘧啶环对A3H的催化脱氨基化活性很重要[45~49].
3. APOBEC3(A3)蛋白与核酸复合物结构研究进展
所有的A3蛋白都具有保守的二级结构特征, 保守的锌配位的脱氨酶序列基序形成胞苷脱氨酶结构域的核心催化位点.催化位点相邻的loop-1, loop-3和loop-7的长度、柔性、氨基酸组成和空间构象的变化, 决定了A3蛋白对胞嘧啶催化脱氨基化形成尿苷的生物活性、底物DNA或者RNA特异性识别的选择性.为了深刻理解A3蛋白催化胞嘧啶脱氨基化的分子机制, 下面我们对已经报道的A3蛋白与核酸复合物结构进行简单概述.
3.1 APOBEC3A(A3A)与核酸复合物结构研究进展
2017年, Schiffer课题组[50]报道了A3A突变体(E72A/C171A)与15-mer的ssDNA(碱基序列为5'-TTT TTT-2 T-1C0T1 T2TT TTT-3')复合物晶体结构.此复合物结构不仅解析了A3A催化的活性位点, 而且确定了特异性识别CC/TC基序的残基.同时, 该结构显示, ssDNA以U型方式紧密地结合在A3A蛋白活性位点的沟槽中(图 4A), 揭示了所有多核苷酸胞嘧啶脱氨基化酶中可能具有保守的ssDNA特异性识别的结构和分子机制.脱氨基化反应的目标位点dC0埋藏在A3A蛋白的活性位点区.氨基酸Y130通过与嘧啶环形成T形π-π堆积作用而有助于固定dC0构象(图 4B), Y130侧链羟基与碱基dC0的5'-磷酸基团形成氢键, 氨基酸H70侧链位于dC0的N1原子上, 形成π-π堆叠作用, 氨基酸A71主链NH原子与碱基dC0的2-羰基氧原子形成氢键.
图 4
图 4. A3A突变体E72A/C171A与ssDNA复合物晶体结构(PDB号5KEG)[50]. (A)复合物结构cartoon显示模式; (B)A3A与靶核苷酸碱基(dC0)之间相互作用的立体图; (C) H29侧链与底物DNA之间的相互作用.图中A3A为绿色, DNA为橙色, 图中灰色和红色球分别代表锌离子和水分子, 橙色和黑色虚线分别代表氢键和π-轨道作用.图B和C中氨基酸与碱基以球棍模式显示Figure 4. The crystal structure of A3A E72A/C171A variant in complex with ssDNA (PDB code 5KEG) [50]. (A) Complex structure was displayed in cartoon mode; (B) Interactions between A3A and the target nucleotide base (dC0); (C) Interactions between H29 side chain and the substrate DNA. A3A structure is shown in green, and the DNA is shown in orange; in all picture, Zn2+ ion and water (W) are indicated by grey and red spheres, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines. The structures of residues and bases in (B) and (C) were shown in stick mode此外, 残基W98和S99的羰基氧原子与dC0的NH2形成分叉的氢键, 稳定了dC0构象, 同时决定了胞嘧啶对胸腺嘧啶的特异性.总之, 底物胞嘧啶与A3A活性位点残基的多重相互作用确保了底物脱氨基化反应和产物释放所需的特异性识别的几何结构.复合物结构也揭示了氨基酸H29是A3A结合ssDNA的另一个关键残基(图 4C).与ssDNA结合后H29侧链旋转, 与底物广泛作用, 锁定活性位点以允许催化.一旦催化发生, H29需要旋转出该位置以释放脱氨基化产物. H29与dT1的骨架磷酸盐形成氢键, H29的侧链在dT1识别中至关重要, 咪唑环定位于与dT1的嘧啶环侧面, 形成稳定的π-π堆叠作用.这种相对非特异性的堆叠作用解释了在+1位置碱基明显缺乏特异性.因此, 组氨酸H29通过一系列协调的氢键和堆叠相互作用定义了底物ssDNA中的碱基dT1的独特作用.
3.2 APOBEC3B (A3B)与核酸复合物结构研究进展
A3B催化结构域CD2与A3A具有92%的氨基酸序列同源性, 序列不同部分主要在包括loop区域的溶剂暴露表面部分. 2016年12月, Aihara课题组[51]报道了分辨率为0.17 nm的人源A3B与A3A嵌合体(即: A3B的loop-3被A3A的loop-1代替, 即A3Bctd-QMΔloop3- A3Aloop1, 也简称为A3Bctd*)的突变体(E255A)与7-mer ssDNA (碱基序列为5'-TTT T-1C0A+1 T)复合物晶体结构, 该结构显示DNA也以U型构象结合A3B (图 5A).如图 5B所示, 这种特异性相互作用使得ssDNA中碱基dT-1发生翻转, 靶碱基dC0插入Zn2+配位活性口袋, dC0侧链芳环与氨基酸Y313形成T形π-π堆叠作用, 碱基dT-1被序列保守的氨基酸W281, Y313和Y315(对应于A3A中氨基酸W98, Y130和Y132, 氨基酸序列比对参见图 3)形成的疏水口袋包围, 其中嘧啶环N3和O2原子与D314(对应于A3A的氨基酸D131)的侧链形成氢键, 这些相互作用解释了A3B和A3A对5'-TC基序的强选择性.
图 5
图 5. A3B嵌合体与ssDNA复合物晶体结构(PDB号5TD5)[51]. (A) cartoon模式显示的复合物结构; (B)A3B活性位点和DNA作用细节.图中A3B为绿色, DNA为橙色, 灰色和红色球分别代表锌离子和水分子, 橙色虚线代表氢键Figure 5. Crystal structure of chimeric A3B variant in complex with ssDNA (PDB code 5TD5)[51]. (A) Complex structure was displayed in cartoon mode; (B) Interactions between A3B active site and DNA. A3B is in green, DNA is shown in orange, Zn2+ ion and water (W) are indicated by grey and red spheres, and hydrogen bonds is depicted by orange dashed lines, respectively3.3 APOBEC3F (A3F)与核酸复合物结构研究进展
2017年, Chen课题组[52]解析了A3F-CD2与10-nt poly-dT ssDNA(即序列为5′-T1T2T3 T4T5T6 T7T8T9 T10-3′)的复合物晶体结构, 分辨率为0.37 nm.该结构显示在晶体一个不对称单元(ASU)中, 有八个A3F-CD2分子和两个有序的10-nt ssDNA分子, 每个ssDNA与四个A3F-CD2分子相互作用(图 6A).每个A3F-CD2通过五个赖氨酸残基(K334, K337, K352, K355和K358)组成了高度带正电的表面(图 6B), 该带正电荷的表面通过三个赖氨酸残基K352, K355和K358与带负电荷的ssDNA磷酸主链作用.而且, 四个A3F-CD2亚基的氨基酸Y333分别与DNA的碱基dT1、dT3、dT7和dT9的胸腺嘧啶形成疏水性π-π堆积作用(图 6C).因此, poly-dT ssDNA通过与其带负电荷的主链静电作用和与其非配对碱基的疏水作用的组合与A3F-CD2相互作用, 这与单链核酸的非序列特异性结合所预期的相互作用完全一致.结构分析显示, 该DNA结合区并不在发生脱氨基化反应的Zn2+结合位点中心, 但是该DNA碱基结合区对A3F-CD2特异性识别ssDNA起着至关重要的作用.
图 6
图 6. A3F-CD2与ssDNA复合物晶体结构[52, 53]. (A)以cartoon模式显示的A3F-CD2与poly-dT ssDNA复合物晶体结构(PDB号5W2M), 四个单体A3F-CD2结构分别用绿色, 淡紫色, 金黄色, 淡蓝色显示, DNA用橙色显示; (B) A3F-CD2与poly-dT ssDNA复合物晶体结构表面电势图(蓝色为正电荷、红色为负电荷). (C)A3F-CD2氨基酸Y333(淡蓝色、紫色、绿色与黄色显示)与DNA碱基dT(橙色显示)之间的相互作用细节图.氨基酸与碱基均以球棍模式显示; (D)以cartoon模式显示的嵌合体A3Fc-CD2二聚体与底物DNA的复合物晶体结构(PDB号5ZVA). A3Fc-CD2单体用绿色和淡蓝色表示. (E)图D中A3Fc-CD2单体a残基Y333、Y359与K358形成第一个DNA结合位点; (F)图D中A3Fc-CD2单体b残基W277、Y307、Y308、F309和W310形成第二个DNA结合位点.图中灰色和红色球分别代表锌离子和水分子, 橙色和黑色虚线分别代表氢键和π-轨道相互作用Figure 6. Crystal structure of A3B in complex with ssDNA[52, 53]. (A) Crystal structure of A3F-CD2 tetramer and substrate DNA(PDB code 5W2M), four A3F-CD2 monomers are in green, lavender, golden yellow, light blue, respectively, and DNA is in orange; (B) Electrostatic surface of crystal structure of A3F-CD2 in complex with DNA (blue is positive charge, red is negative charge). (C) Residue Y333 in each A3F-CD2 (cyan, green, pink and yellow) stacks with base dT in DNA (orange). (D) Crystal structure of chimeric A3Fc-CD2 dimer in complex with ssDNA (PDB code 5ZVA), two A3Fc-CD2 monomers are in green and light blue, respectively; (E) Residues Y333, K358 and K359 in A3Fc-CD2 monomer a form the first DNA binding site; (F) Residues W277, Y307, Y308, F309 and W310 in A3Fc-CD2 monomer b form the second DNA binding site. Zn2+ion and water (W) are indicated by spheres colored grey and red, respectively, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines, respectively2018年, 曹春阳课题组[53]报道了A3F-CD2和A3G-CD2形成的嵌合体(即; A3F-CD2的残基片段195-217被A3G-CD2的残基片段197-221替换, 简称A3Fc-CD2)与ssDNA复合物晶体结构(图 6D).他们所用的ssDNA碱基序列分别为: 5'-ATT TT5C6 A7A8T9 T-3'和5'-ATT TT5C6 A7A8C9 T-3', 均包含目标序列5'-TC.遗憾的是, 复合物结构中目标碱基胞嘧啶dC6未进入到Zn2+结合的活性口袋, 一个分子DNA在两个位点结合两个A3Fc-CD2分子(即单体A和B).如图 6E所示, 第一个位点由单体A中残基Y333、K358和Y359形成, 远离Zn2+结合基序, 通过π-π堆积和氢键与碱基dT5、dC6和dA7发生相互作用. 图 6F显示, 第二个位点由疏水性氨基酸W277、Y307、Y308、F309和W310组成, 靠近单体B中Zn2+结合区, 与碱基dA8通过π-π堆积和疏水相互作用.很明显, A3Fc-CD2中赖氨酸K, 酪氨酸Y, 以及色氨酸W在底物识别过程中发挥重要作用.
3.4 APOBEC3G (A3G)与核酸复合物结构研究进展
2015年, Chen课题组[54]解析了灵长类动物A3G- CD1 (简称rA3G-CD1)和9-nt poly-dT的ssDNA复合物的晶体结构(图 7A).该结构揭示了Zn2+-配位中心周围loop和残基的构象因为DNA结合发生改变. rA3G-CD1的二聚体界面氨基酸对于A3G寡聚化, 核酸结合和Vif介导的降解非常重要[49, 50].这些发现阐明了A3G抗病毒机制和HIV的Vif蛋白靶向A3G的分子基础.为了提高蛋白A3G-CD1可溶性表达几率, 他们用来自人源的A3G-CD2(即hA3G-CD2)的四个残基AEAG取代rA3G-CD1的loop-8上的八个残基(CQKRDGPH).在该复合物晶体结构中, 在Zn2+中心口袋周围观察到明显的额外电子密度, 对应于结合的poly-dT ssDNA的三个碱基.与自由态(即: apo) rA3G-CD1晶体结构相比, 复合物晶体结构中Zn2+中心口袋周围的loop-1、loop-3、loop-5、loop-7、β1和β2折叠区域都具有显着的构象变化(图 7B中红色箭头).残基S28 (loop-1上), H65 (与Zn2+-配位), Y125 (loop-7上)和Y131都直接与寡核苷酸磷酸骨架形成氢键.插入Zn2+中心口袋的胸腺嘧啶碱基dT0, 其芳环上的羰基氧与Zn2+配位的水分子形成氢键, N3原子与loop-5上的氨基酸S95侧链羟基形成氢键(图 7C).这些作用稳定了DNA的构象.
图 7
图 7. rA3G-CD1与ssDNA复合物晶体结构[54]. (A) rA3G-CD1二聚体与底物DNA的复合物结构(PDB号5K83);两个rA3G-CD1单体分别用绿色与紫色表示. (B) rA3G-CD1和ssDNA复合物晶体结构中单体rA3G-CD1结构(绿色)与自由态rA3G-CD1 (即apo rA3G-CD1, 灰色)结构重叠图; Loop-1, loop-3, loop-5, loop-7分别简称为LP1, LP3, LP5, LP7.红色箭头表示结合DNA后loop, β1和β2构象的变化. (C) poly- dT结合锌离子中心的细节图.图中DNA为橙色.灰色和红色球分别代表锌离子和水分子, 图C中橙色和黑色虚线分别代表氢键和π-轨道相互作用Figure 7. The crystal structure of rA3G-CD1 in complex with ssDNA[54]. (A) Complex structure of rA3G-CD2 dimer and substrate DNA (orange) (PDB code 5K83); The two rA3G-CD1monomers are shown in green and purple, respectively. (B) Superimposition of bound rA3G-CD1 (green) and apo rA3G-CD1 (grey). loop-1, loop-3, loop-5 and loop-7 were referred as LP1, LP3, LP5 and LP7, respectively. Red arrows indicate the major conformational shifts of loop, β1and β2 upon DNA binding. (C) Interaction between poly-dT and zinc ion binding pocket. In all figures, DNA is in orange. Zn2+ion and water (W) are indicated by spheres colored grey and red, respectively, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines, respectivelyA3G-CD2与ssDNA结合特别弱, 使得A3G-CD2特异性识别5'-CC基序进行脱氨基化的分子机制和A3G-CD2与ssDNA复合物结构研究非常困难.为此, 2018年Hiroshi Matsuo课题组设计包含A3G-CD2十个位点的突变体(即: P200A/L234K/N236A/C243A/P247K/ F310K/Q318K/C321A/Q322A/C356A)[55]基因的质粒来可溶性表达A3G-CD2.该突变体由于在loop-3及loop-7上分别引入带正电荷的赖氨酸, 明显增强了A3G-CD2与DNA的相互作用, 并且与野生型A3G-CD2相比, 具有更高的脱氨基化活性.为了得到稳定的A3G-CD2与ssDNA形成的复合物, 他们进一步设计了该A3G-CD2高活性蛋白的失活E256A突变体(简称A3G-CDT2*), 解析了其与碱基序列长度为9-nt的ssDNA (碱基序列为5'-AAT CCC AAA)复合物晶体结构(图 8A), 分辨率为0.186 nm.该结构揭示了A3G-CD2特异性识别功能相关的靶序列5'-TCCCA的结构基础; 揭示了氨基酸W211在底物识别中的关键作用, 暗示了激活诱导的胞嘧啶脱氨基化酶(AID)可能存在保守色氨酸的类似识别[41].复合物结构中, 靶序列5'-TCCCA中五个核苷酸都参与和蛋白的相互作用.将靶序列中的核苷酸进行编号, 目标胞苷为0, 则可表示为5'-T-3C-2C-1C0A+1.涉及dT-3的最显著的相互作用是与残基W211的π-π堆积(图 8B). dT-3还通过其5'-磷酸基团与dC-2核苷酸之间形成氢键发生相互作用. dC-2的Watson-Crick面通过水介导在嘧啶羰基和氨基酸D316主链氨基以及氨基酸R374的胍基形成氢键(图 8B).此外, dC-2芳环嘧啶N3原子通过与D316羧基和水形成氢键.同时, dC-2嘧啶环与W211的吲哚环具有疏水相互作用, 产生空间约束.目标胞嘧啶(dC0)紧密堆积在Zn2+离子, 氨基酸H257芳环通过与Zn2+螯合并与Y315形成T-形π-π堆积作用(图 8C). dA+1嘌呤环与H216咪唑环形成π-π堆叠作用.鉴于组氨酸与嘌呤环能够形成比嘧啶环更强的π-π堆积, 所以这种相互作用使得A3G-CD2特异性识别dC0的+1位的碱基为含嘌呤的核苷(dA), 而不是含嘧啶的核苷, 这就解释了为什么5'-CCCA是A3G优先脱氨基序列.另外, 5'-磷酸基团与H216的主链羰基和N244的侧链氨基形成水介导的氢键(图 8D). A3G-CD2通过其Watson- Crick面形成的氢键识别5'-C-2C-1C0, 通过使用强π-π堆积作用识别dT-3和dA+1. A3G-CD2与ssDNA的复合物结构在原子分辨率水平上揭示了A3G的催化结构域独特地结合底物ssDNA, 催化dC0脱氨基化分子机制.但是需要说明的是, 该结构不能回答碱基dC-1在体外(in vitro)能够被进一步脱氨基化的分子机制.
图 8
图 8. A3G-CDT2*与ssDNA复合物晶体结构(PDB号6BUX) [55]. (A)以cartoon模式显示的复合物结构; (B, C, D) A3G-CDT2*与碱基dC-2、dT-3、dC0和dA+1之间相互作用细节图(球棍模式显示).图中A3G-CDT2*为绿色, DNA为橙色.灰色和红色球分别代表锌离子和水分子, 橙色和黑色虚线分别代表氢键和π-轨道相互作用Figure 8. The crystal structure of A3G-CD2 variant A3G-CDT2* in complex with ssDNA (PDB code 6BUX) [55]. (A) Complex structure was displayed in cartoon mode; (B, C, D) Interactions between bases dC-2, dT-3, dC0 and dA+1 (in orange stick) in DNA and residues (in green stick) in A3G-CDT2*. In all picture, A3G-CDT2* is in green, and DNA is in orange; Zn2+ion and water (W) are indicated by grey and red spheres, respectively, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines, respectively2019年, 曹春阳课题组[56]通过核磁共振技术解析了有催化活性的野生型A3G-CD2蛋白与ssDNA的溶液结构.在该结构中, ssDNA碱基序列为5'-ATT C4C5C6I A7AT T-3'(简称为TCCC6I), 他们将位阻较大的碘原子引入胞苷(dC6I)的5-碳位.碘的引入将A3G-CD2脱氨基化氨基酸序列偏好从CCC转换为TCC, 只有轻微的dC6I脱氨化作用被观察到(即只有少量CCC偏好被发现). A3G-CD2与两个脱氨基化产物TCUC6I ssDNA(碱基序列5'-ATT C4U5C6I A7AT T-3')和TCUU6I ssDNA(碱基序列5'-ATT C4U5U6I A7AT T-3')形成的复合物溶液三维结构表明, 脱氨基化产物ssDNA分别以CCC(图 9A)和TCC(图 9B)模式结合A3G-CD2, 它们的差异在于loop-3相对于DNA 3'-端的位置不同.由这两个复合物结构可以推测, A3G-CD2首先通过CCC模式结合底物DNA, 使目标碱基dC6脱氨基化.然后, 由于脱氨基化中间体产物TCCU6 ssDNA与A3G-CD2之间弱结合亲和力, A3G-CD2通过TCC作用方式结合底物DNA, 使基序中dC5发生进一步发生脱氨基化.这里需要强调的是, 与A3G明显不同的是, 当具有或不具有CD1结构域的A3G同源蛋白特异性地识别含有靶基序5'-TC的底物ssDNA时, 它们仅用一种方式结合ssDNA进行催化胞嘧啶脱氨基化作用.
图 9
图 9. A3G-CD2与DNA的NMR溶液结构[56]. (A)脱氨基化产物TCUU6I DNA以CCC模式结合A3G-CD2的复合物结构(PDB号6K3J); (B)脱氨基化产物TCUC6I DNA以TCC模式结合A3G-CD2的复合物结构(PDB号6K3K).图中A3G-CD2为绿色, DNA为橙色, 灰色球代表锌离子Figure 9. NMR solution structure of A3G-CD2 and ssDNA[56]. (A) Deamination product TCUU6I ssDNA binds to A3G-CD2 in a CCC mode (PDB code 6K3J). (B) Deamination product TCUC6I ssDNA binds to A3G-CD2 in a TCC mode (PDB code 6K3K). In all picture, A3G-CD2 is shown in green, and the DNA is shown in orange, Zn2+ion is indicated by grey spheres3.5 APOBEC3H(A3H)与核酸复合物结构研究进展
A3H是一种哺乳动物特异性胞苷脱氨酶, 有效限制逆转录病毒的复制, 它们结合RNA的能力是必不可少的[24~32]. 2017年5月, Smith等[57]获得了结合双链RNA (dsRNA)的猪尾猕猴A3H(简称pgtA3H)的分辨率为0.224 nm的晶体结构(图 10A). pgtA3H在短RNA双链体周围形成二聚体. pgtA3H结合RNA后, 仍具有有效的胞苷脱氨酶活性.该结构揭示了一种不寻常的RNA结合模式, 其中七碱基对的两条RNA链两端与两个pgtA3H分子产生广泛相互作用. 2017年11月, Harris课题组[58]报道了人源A3H结合dsRNA的复合物晶体结构(图 10B), 双链RNA与A3H单体的loop-1上的氨基酸R18和α6螺旋上的氨基酸K168, R171, A172, R175, R176和R179结合.从结构中可以发现人源A3H与双链RNA结合在很大程度上由酶和RNA磷酸二酯骨架之间静电作用介导, 与序列特异性接触相反.这种结合机制可能有利于对病毒和转座子复制的先天免疫防御. 2018年6月Iwatani课题组[59]报道了黑猩猩A3H (cpzA3H)二聚体与短dsRNA复合物分辨率为0.22 nm晶体结构(图 10C).在该结构中, dsRNA通过介导A3H二聚的机制结合蛋白, 对cpzA3H与dsRNA复合物结构中dsRNA核苷酸进行分析, 可以发现cpzA3H对于dsRNA中与之相互作用的富含GC的回文序列序列偏好, 主要由loop-1中精氨酸决定.
图 10
图 10. 不同来源的A3H与不同dsRNA复合物晶体结构[57~59]. (A)猪尾猴源A3H二聚体与底物RNA复合物结构(PDB号5W3V)A3H单体用绿色和紫色表示, dsRNA显示为橙色; (B)人源A3H二聚体与底物RNA复合物结构(PDB号6BOB)A3H显示为绿色, dsRNA显示为橙色. (C)黑猩猩A3H(cpzA3H)二聚体与双链RNA复合物晶体结构(PDB号5Z98). A3H不同单体用草绿色和浅紫色表示, dsRNA为橙色.所有图中灰色球代表锌离子Figure 10. Crystal complex structures of A3H from different hosts and dsRNA[57~59]. (A) Complex structure of pig-tailed macaque A3H and dsRNA (PDB code 5W3V), two A3H monomers are in green and purple, and dsRNA is in orange, respectively; (B) Complex structure of human A3H and dsRNA (PDB code 6BOB), A3H is in green and dsRNA is in orange, respectively. (C) Complex structure of chimpanzee A3H and dsRNA (PDB code 5Z98), two A3H monomers are in grass and lilac, dsRNA is in orange, respectively. In all pictures, Zn2+ion is indicated by grey spheres4. 总结与展望
A3家族蛋白催化单链DNA或者RNA上胞嘧啶脱氨基化, 抑制病毒复制, 从而使宿主抵御病毒感染.自由态A3蛋白结构研究表明A3家族蛋白中β2链的结构具有可变性. A3A、A3G和A3B-CD2的蛋白结构具有间断的β2链, β2链的正常连续中心被短、凸出环(loop)或螺旋替换. A3C、A3F-CD2和A3G-CD1蛋白均具有连续的β2链. A3G-CD1结构中β2链较短, loop-2较长且不太紧凑. A3家族蛋白中与Zn2+配位的氨基酸具有很高的保守性(如图 1所示); 同时, A3蛋白与ssDNA形成的复合物三维结构显示, A3与ssDNA相互作用的位点也比较保守(图 3), 催化位点带正电荷残基和芳香残基片段, 通过与带负电荷的核酸骨架发生氢键相互作用、与核酸碱基发生堆叠作用进行目标序列的特异性识别.这类相互作用通常由蛋白质表面上的浅槽介导.
目前, 包含两个Zn2+结合结构域的全长A3家族蛋白(CD1+CD2)在E coli或者酵母中都不易可溶表达, 从而无法开展全长A3B、A3C、A3H及A3G与核酸的复合物结构研究, 也就很难理解两个结构域之间如何协调进行胞嘧啶脱氨基化作用的分子机制.因此, 借助昆虫细胞、真核细胞等体系可溶性表达这些A3家族成员全长蛋白, 再将它们与DNA或者RNA进行组装形成新的复合物, 以及将它们与Vif等蛋白组装成分子量更大的复合物, 利用冷冻电镜等技术, 开展它们相互作用分子机制、催化胞嘧啶脱氨基化机制、抗病毒机制、泛素化降解机制等研究, 应为该领域后期主要研究方向之一.
-
-
[1]
Goila-Gaur, R.; Strebel, K. Retrovirology 2008, 5, 51. doi: 10.1186/1742-4690-5-51
-
[2]
Larue, R. S.; Andresdottir, V.; Blanchard, Y.; Conticello, S. G.; Derse, D.; Emerman, M.; Greene, W. C.; Jonsson, S. R.; Landau, N. R.; Lochelt, M.; Malik, H. S.; Malim, M. H.; Munk, C.; O'Brien, S. J.; Pathak, V. K.; Strebel, K.; Wain-Hobson, S.; Yu, X. F.; Yuhki, N.; Harris, R. S. J. Virol. 2009, 83, 494. doi: 10.1128/JVI.01976-08
-
[3]
Wedekind, J. E. Trends Genet. 2003, 19, 207. doi: 10.1016/S0168-9525(03)00054-4
-
[4]
Harris, R. S.; Liddament, M. T. Nat. Rev. Immunol. 2004, 4, 868. doi: 10.1038/nri1489
-
[5]
Kitamura, S.; Ode, H.; Nakashima, M. Nat. Struct. Mol. Biol. 2012, 19, 1005. doi: 10.1038/nsmb.2378
-
[6]
Mitra, M.; Hercik, K.; Byeon, I. J. L. Nucleic Acids Res. 2014, 42, 1095. doi: 10.1093/nar/gkt945
-
[7]
Chen, K. M.; Harjes, E.; Gross, P. J.; Fahmy, A.; Lu, Y.; Shindo, K. Seibutsu Butsuri 2008, 48, 116. http://med.wanfangdata.com.cn/Paper/Detail/PeriodicalPaper_PM18288108
-
[8]
Burns, M. B.; Lackey, L.; Carpenter, M. A.; Rathore, A.; Land, A. M.; Leonard, B. Nature 2013, 494, 366. doi: 10.1038/nature11881
-
[9]
Shi, K.; Carpenter, M. A.; Kurahashi, K.; Harris, R. S.; Aihara, H. J. Biol. Chem. 2015, 290, 28120. doi: 10.1074/jbc.M115.679951
-
[10]
Xiao, X.; Yang, H.; Arutiunian, V.; Fang, Y.; Chen, X. S. Nucleic Acids Res. 2017, 45, 7494. doi: 10.1093/nar/gkx362
-
[11]
Nathans, R.; Cao, H.; Sharova, N.; Ali, A.; Sharkey, M.; Stranska, R. Nat. Biotechnol. 2008, 26, 1187. doi: 10.1038/nbt.1496
-
[12]
Dang, Y.; Wang, X.; Esselman, W. J.; Zheng, Y. H. J. Virol. 2006, 80, 10522. doi: 10.1128/JVI.01123-06
-
[13]
Stanley, B. J.; Ehrlich, E. S.; Short, L.; Yu, Y.; Xiong, Y. J. Virol. 2008, 82, 8656. doi: 10.1128/JVI.00767-08
-
[14]
Seplyarskiy, V. B.; Andrianova, M. A.; Bazykin, G. A. Genome Res. 2017, 27, 175. doi: 10.1101/gr.210336.116
-
[15]
Zheng, Y. H.; Irwin, D.; Kurosu, T. J. Virol. 2004, 78, 6073. doi: 10.1128/JVI.78.11.6073-6076.2004
-
[16]
Byeon, I. J. L.; Ahn, J.; Mitra, M.; Byeon, C. H.; Hercík, K.; Hritz, J. Nat. Commun. 2013, 4, 1890. doi: 10.1038/ncomms2883
-
[17]
Chelico, L.; Prochnow, C.; Erie, D. A. J. Biol. Chem. 2010, 283, 16195. http://med.wanfangdata.com.cn/Paper/Detail/PeriodicalPaper_PM20212048
-
[18]
Guo, Y.; Dong, L.; Qiu, X.; Wang, Y.; Zhang, B.; Liu, H. Nature 2014, 505(7482), 229. doi: 10.1038/nature12884
-
[19]
Bohn, M. F. Structure 2013, 21, 1042. doi: 10.1016/j.str.2013.04.010
-
[20]
Siu, K. K.; Sultana, A.; Azimi, F. Nat. Commun. 2013, 4, 2593. doi: 10.1038/ncomms3593
-
[21]
Matsui, M.; Shindo, K.; Izumi, T.; Io, K.; Shinohara, M.; Komano, J.; Kobayashi, M.; Kadowaki, N.; Harris, R. S.; Takaori-Kondo, A. Virol. J. 2014, 11, 122. doi: 10.1186/1743-422X-11-122
-
[22]
Kouno, T.; Luengas, E. M.; Shigematsu, M. Nat. Struct. Mol. Biol. 2015, 22(6), 485. doi: 10.1038/nsmb.3033
-
[23]
Klarmann, G. J. J. Biol. Chem. 2003, 278, 7902. doi: 10.1074/jbc.M207223200
-
[24]
Furukawa, A.; Nagata, T.; Matsugami, A. Nucleic Acids Symp. Ser. 2009, 53, 87. doi: 10.1093/nass/nrp044
-
[25]
Mangeat, B.; Turelli, P.; Caron, G.; Friedli, M.; Perrin, L.; Trono, D. Nature 2003, 4244, 99.
-
[26]
Peng, G. J. Exp. Med. 2006, 203, 41. doi: 10.1084/jem.20051512
-
[27]
Chelico, L.; Pham, P.; Calabrese, P.; Goodman, M. F. Nat. Struct. Mol. Biol. 2006, 13, 392 doi: 10.1038/nsmb1086
-
[28]
Harjes, E.; Gross, P. J.; Chen, K. M.; Lu, Y.; Shindo, K. J. Mol. Biol. 2009, 389, 819. doi: 10.1016/j.jmb.2009.04.031
-
[29]
Wichroski, M. J.; K. Ichiyama; T. M. Rana. J. Biol. Chem. 2005, 280, 8387. http://www.jbc.org/content/280/9/8387
-
[30]
Sheehy, A. M.; Gaddis, N. C.; Choi, J. D.; Malim, M. H. Nature 2002, 418, 646. doi: 10.1038/nature00939
-
[31]
Bennett, R. P.; Presnyak, V.; Wedekind, J. E.; Smith, H. C. J. Biol. Chem. 2008, 283, 7320. doi: 10.1074/jbc.M708567200
-
[32]
Lu, X.; Zhang, T. L.; Xu, Z. J. Biol. Chem. 2015, 290, 4010. doi: 10.1074/jbc.M114.624262
-
[33]
Dang, Y.; Siew, L. M.; Wang, X. J.; Han, Y. X.; Lampen, R.; Zheng, Y. H. J. Biol. Chem. 2008, 283, 11606. doi: 10.1074/jbc.M707586200
-
[34]
Jarmuz, A.; Chester, A.; Bayliss, J.; Gisbourne, J.; Dunham, I.; Scott, J. Genomics 2002, 79, 285. doi: 10.1006/geno.2002.6718
-
[35]
Holden, L. G.; Prochnow, C.; Chang, Y. P. Nature 2008, 456, 121. doi: 10.1038/nature07357
-
[36]
Olson, M. E.; Li, M.; Harris, R. S. Chem. Med. Chem. 2013, 8, 112. doi: 10.1002/cmdc.201200411
-
[37]
Jager, S.; Kim, D. Y.; Hultquist, J. F.; Shindo, K.; Larue, R. S.; Kwon, E. Nature 2012, 481, 371. doi: 10.1038/nature10693
-
[38]
Mehle, A.; Strack, B.; Ancuta, P.; Zhang, C.; Mcpike, M.; Gabuzda, D. J. Biol. Chem. 2004, 279, 7792. doi: 10.1074/jbc.M313093200
-
[39]
Marcsisin, S. R.; Engen, J. R. J. Mol. Biol. 2010, 402, 892. doi: 10.1016/j.jmb.2010.08.026
-
[40]
Bergeron, J. R.; Huthoff, H.; Veselkov, D. A.; Beavil, R. L.; Sanderson, M. R. PLoS Pathog. 2010, 6, e1000925. doi: 10.1371/journal.ppat.1000925
-
[41]
Reingewertz, T. H.; Shalev, D. E.; Friedler, A. Protein Pept. Lett. 2010, 17, 988. doi: 10.2174/092986610791498876
-
[42]
Liddament, M. T.; Brown, W. L.; Schumacher, A. J.; Harris, R. S. Curr. Biol. 2004, 14, 1385. doi: 10.1016/j.cub.2004.06.050
-
[43]
Lu, Z.; Bergeron, J. R. C.; AtkinsLu, Z.; Bergeron, J. R. C.; Atkinson, R. A.; Schaller, T.; Veselkov, D. A.; Oregioni, A. Open. Biol. 2013, 3, 130100. doi: 10.1098/rsob.130100
-
[44]
Luo, K.; Xiao, Z.; Ehrlich, E.; Yu, Y.; Liu, B.; Zheng, S. Proc. Natl. Acad. Sci. U. S. A. 2005, 102, 11444. doi: 10.1073/pnas.0502440102
-
[45]
Stenglein, M. D.; Burns, M. B.; Li, M.; Lengyel, J.; Harris, R. S. Nat. Struct. Mol. Biol. 2010, 17, 222. doi: 10.1038/nsmb.1744
-
[46]
Chelico, L.; Pham, P.; Calabrese, P.; Goodman, M. F. Nat. Struct. Mol. Biol. 2006, 13, 392. doi: 10.1038/nsmb1086
-
[47]
Ronsard, L.; Raja, R.; Panwar, V.; Saini, S.; Mohankumar, K.; Sridharan, S. Sci. Rep. 2015, 5, 15438. doi: 10.1038/srep15438
-
[48]
Yamanaka, S.; Balestra, M. E.; Ferrell, L. D. Proc. Nat. Acad. Sci. U. S. A. 1995, 92, 8483. doi: 10.1073/pnas.92.18.8483
-
[49]
Navarro, F.; Bollman, B.; Chen, H. Virology 2005, 333, 374. doi: 10.1016/j.virol.2005.01.011
-
[50]
Kouno, T.; Silvas, T. V.; Hilbert, B. J.; Shandilya, S. M. D.; Bohn, M. F.; Kelch, B. A.; Royer, W. E.; Somasundaran, M.; Kurt Yilmaz, N.; Matsuo, H.; Schiffer, C. A. Nat. Commun. 2017, 8, 15024. doi: 10.1038/ncomms15024
-
[51]
Shi, K.; Carpenter, M. A.; Banerjee, S.; Shaban, N. M.; Kurahashi, K.; Salamango, D. J.; McCann, J. L.; Starrett, G. J.; Duffy, J. V.; Demir, O.; Amaro, R. E.; Harki, D. A.; Harris, R. S.; Aihara, H. Nat. Struct Mol. Biol. 2017, 24, 131. doi: 10.1038/nsmb.3344
-
[52]
Fang, Y.; Xiao, X.; Li, S.; Wolfe, A.; Chen, X. S. J. Mol. Biol. 2018, 430, 87. doi: 10.1016/j.jmb.2017.11.007
-
[53]
Cheng, C.; Zhang, T.; Wang, C. X.; Lan, W.; Ding, J.; Cao, C. Y. Chin. J. Chem. 2018, 36, 1241. doi: 10.1002/cjoc.201800508
-
[54]
Xiao, X.; Li, S. X.; Yang, H.; Chen, X. S. Nat. Commun. 2016, 7, 12193. doi: 10.1038/ncomms12193
-
[55]
Maiti, A.; Myint, W.; Kanai, T.; Delviks-Frankenberry, K.; Sierra Rodriguez, C.; Pathak, V. K.; Schiffer, C. A.; Matsuo, H. Nat. Commun. 2018, 9, 2460. doi: 10.1038/s41467-018-04872-8
-
[56]
Yan, X. X.; Lan, W. X.; Wang, C. X.; Cao, C. Y. Chem. Asian J. 2019, 14, 2235. doi: 10.1002/asia.201900480
-
[57]
Bohn, J. A.; Thummar, K.; York, A.; Raymond, A.; Brown, W. C.; Bieniasz, P. D.; Hatziioannou, T.; Smith, J. L. Nat. Commun. 2017, 8, 1021. doi: 10.1038/s41467-017-01309-6
-
[58]
Nadine, M. S.; Shi, K.; Lauer, K. V.; Brown, W. L.; Aihara, H.; Harris, R. S. Mol. Cell 2018, 69, 75. doi: 10.1016/j.molcel.2017.12.010
-
[59]
Matsuoka, T.; Nagae, T.; Ode, H.; Awazu, H.; Kurosawa, T.; Hamano, A.; Matsuoka, K.; Hachiya, A.; Imahashi, M.; Yokomaku, Y.; Watanabe, N.; Iwatani, Y. Nucleic Acids Res. 2018, 46, 10368. doi: 10.1093/nar/gky676
-
[1]
-
图 1 A3家族蛋白结构域组成与分类: (A) A3家族蛋白CD1与CD2分类; (B) A3家族蛋白结构域按Z1、Z2、Z3进行分类; (C)三类Z区域的氨基酸序列比对[2], 与Zn2+配位的氨基酸上面标了星号
Figure 1 Classification and nomination of the functional domain of A3 family members. (A) The classification of CD1 and CD2 domains of A3 family members; (B) A3 family is classified according to Z1, Z2, Z3; (C) Sequence alignment of three types of Z regions[2], in which residues ligated with Zn2+were marked with star
图 3 A3家族蛋白氨基酸序列对比图. Clustal Omega的氨基酸比对结果的图上方显示了二级结构(α螺旋、β折叠及loop).其中, A3蛋白中序列保守的氨基酸H70、W98、Y130(在A3A中的编号)均参与了DNA特异性识别
Figure 3 The sequence alignment of A3 family protein. Clustal Omega amino acids alignment showing secondary structures (α-helices, β-strand and loop). In A3 members, conserved residues H70, W98 and Y130 (in A3A) are all involved in DNA interactions
图 4 A3A突变体E72A/C171A与ssDNA复合物晶体结构(PDB号5KEG)[50]. (A)复合物结构cartoon显示模式; (B)A3A与靶核苷酸碱基(dC0)之间相互作用的立体图; (C) H29侧链与底物DNA之间的相互作用.图中A3A为绿色, DNA为橙色, 图中灰色和红色球分别代表锌离子和水分子, 橙色和黑色虚线分别代表氢键和π-轨道作用.图B和C中氨基酸与碱基以球棍模式显示
Figure 4 The crystal structure of A3A E72A/C171A variant in complex with ssDNA (PDB code 5KEG) [50]. (A) Complex structure was displayed in cartoon mode; (B) Interactions between A3A and the target nucleotide base (dC0); (C) Interactions between H29 side chain and the substrate DNA. A3A structure is shown in green, and the DNA is shown in orange; in all picture, Zn2+ ion and water (W) are indicated by grey and red spheres, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines. The structures of residues and bases in (B) and (C) were shown in stick mode
图 5 A3B嵌合体与ssDNA复合物晶体结构(PDB号5TD5)[51]. (A) cartoon模式显示的复合物结构; (B)A3B活性位点和DNA作用细节.图中A3B为绿色, DNA为橙色, 灰色和红色球分别代表锌离子和水分子, 橙色虚线代表氢键
Figure 5 Crystal structure of chimeric A3B variant in complex with ssDNA (PDB code 5TD5)[51]. (A) Complex structure was displayed in cartoon mode; (B) Interactions between A3B active site and DNA. A3B is in green, DNA is shown in orange, Zn2+ ion and water (W) are indicated by grey and red spheres, and hydrogen bonds is depicted by orange dashed lines, respectively
图 6 A3F-CD2与ssDNA复合物晶体结构[52, 53]. (A)以cartoon模式显示的A3F-CD2与poly-dT ssDNA复合物晶体结构(PDB号5W2M), 四个单体A3F-CD2结构分别用绿色, 淡紫色, 金黄色, 淡蓝色显示, DNA用橙色显示; (B) A3F-CD2与poly-dT ssDNA复合物晶体结构表面电势图(蓝色为正电荷、红色为负电荷). (C)A3F-CD2氨基酸Y333(淡蓝色、紫色、绿色与黄色显示)与DNA碱基dT(橙色显示)之间的相互作用细节图.氨基酸与碱基均以球棍模式显示; (D)以cartoon模式显示的嵌合体A3Fc-CD2二聚体与底物DNA的复合物晶体结构(PDB号5ZVA). A3Fc-CD2单体用绿色和淡蓝色表示. (E)图D中A3Fc-CD2单体a残基Y333、Y359与K358形成第一个DNA结合位点; (F)图D中A3Fc-CD2单体b残基W277、Y307、Y308、F309和W310形成第二个DNA结合位点.图中灰色和红色球分别代表锌离子和水分子, 橙色和黑色虚线分别代表氢键和π-轨道相互作用
Figure 6 Crystal structure of A3B in complex with ssDNA[52, 53]. (A) Crystal structure of A3F-CD2 tetramer and substrate DNA(PDB code 5W2M), four A3F-CD2 monomers are in green, lavender, golden yellow, light blue, respectively, and DNA is in orange; (B) Electrostatic surface of crystal structure of A3F-CD2 in complex with DNA (blue is positive charge, red is negative charge). (C) Residue Y333 in each A3F-CD2 (cyan, green, pink and yellow) stacks with base dT in DNA (orange). (D) Crystal structure of chimeric A3Fc-CD2 dimer in complex with ssDNA (PDB code 5ZVA), two A3Fc-CD2 monomers are in green and light blue, respectively; (E) Residues Y333, K358 and K359 in A3Fc-CD2 monomer a form the first DNA binding site; (F) Residues W277, Y307, Y308, F309 and W310 in A3Fc-CD2 monomer b form the second DNA binding site. Zn2+ion and water (W) are indicated by spheres colored grey and red, respectively, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines, respectively
图 7 rA3G-CD1与ssDNA复合物晶体结构[54]. (A) rA3G-CD1二聚体与底物DNA的复合物结构(PDB号5K83);两个rA3G-CD1单体分别用绿色与紫色表示. (B) rA3G-CD1和ssDNA复合物晶体结构中单体rA3G-CD1结构(绿色)与自由态rA3G-CD1 (即apo rA3G-CD1, 灰色)结构重叠图; Loop-1, loop-3, loop-5, loop-7分别简称为LP1, LP3, LP5, LP7.红色箭头表示结合DNA后loop, β1和β2构象的变化. (C) poly- dT结合锌离子中心的细节图.图中DNA为橙色.灰色和红色球分别代表锌离子和水分子, 图C中橙色和黑色虚线分别代表氢键和π-轨道相互作用
Figure 7 The crystal structure of rA3G-CD1 in complex with ssDNA[54]. (A) Complex structure of rA3G-CD2 dimer and substrate DNA (orange) (PDB code 5K83); The two rA3G-CD1monomers are shown in green and purple, respectively. (B) Superimposition of bound rA3G-CD1 (green) and apo rA3G-CD1 (grey). loop-1, loop-3, loop-5 and loop-7 were referred as LP1, LP3, LP5 and LP7, respectively. Red arrows indicate the major conformational shifts of loop, β1and β2 upon DNA binding. (C) Interaction between poly-dT and zinc ion binding pocket. In all figures, DNA is in orange. Zn2+ion and water (W) are indicated by spheres colored grey and red, respectively, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines, respectively
图 8 A3G-CDT2*与ssDNA复合物晶体结构(PDB号6BUX) [55]. (A)以cartoon模式显示的复合物结构; (B, C, D) A3G-CDT2*与碱基dC-2、dT-3、dC0和dA+1之间相互作用细节图(球棍模式显示).图中A3G-CDT2*为绿色, DNA为橙色.灰色和红色球分别代表锌离子和水分子, 橙色和黑色虚线分别代表氢键和π-轨道相互作用
Figure 8 The crystal structure of A3G-CD2 variant A3G-CDT2* in complex with ssDNA (PDB code 6BUX) [55]. (A) Complex structure was displayed in cartoon mode; (B, C, D) Interactions between bases dC-2, dT-3, dC0 and dA+1 (in orange stick) in DNA and residues (in green stick) in A3G-CDT2*. In all picture, A3G-CDT2* is in green, and DNA is in orange; Zn2+ion and water (W) are indicated by grey and red spheres, respectively, hydrogen bonds and π-orbital interaction are depicted by orange and black dashed lines, respectively
图 9 A3G-CD2与DNA的NMR溶液结构[56]. (A)脱氨基化产物TCUU6I DNA以CCC模式结合A3G-CD2的复合物结构(PDB号6K3J); (B)脱氨基化产物TCUC6I DNA以TCC模式结合A3G-CD2的复合物结构(PDB号6K3K).图中A3G-CD2为绿色, DNA为橙色, 灰色球代表锌离子
Figure 9 NMR solution structure of A3G-CD2 and ssDNA[56]. (A) Deamination product TCUU6I ssDNA binds to A3G-CD2 in a CCC mode (PDB code 6K3J). (B) Deamination product TCUC6I ssDNA binds to A3G-CD2 in a TCC mode (PDB code 6K3K). In all picture, A3G-CD2 is shown in green, and the DNA is shown in orange, Zn2+ion is indicated by grey spheres
图 10 不同来源的A3H与不同dsRNA复合物晶体结构[57~59]. (A)猪尾猴源A3H二聚体与底物RNA复合物结构(PDB号5W3V)A3H单体用绿色和紫色表示, dsRNA显示为橙色; (B)人源A3H二聚体与底物RNA复合物结构(PDB号6BOB)A3H显示为绿色, dsRNA显示为橙色. (C)黑猩猩A3H(cpzA3H)二聚体与双链RNA复合物晶体结构(PDB号5Z98). A3H不同单体用草绿色和浅紫色表示, dsRNA为橙色.所有图中灰色球代表锌离子
Figure 10 Crystal complex structures of A3H from different hosts and dsRNA[57~59]. (A) Complex structure of pig-tailed macaque A3H and dsRNA (PDB code 5W3V), two A3H monomers are in green and purple, and dsRNA is in orange, respectively; (B) Complex structure of human A3H and dsRNA (PDB code 6BOB), A3H is in green and dsRNA is in orange, respectively. (C) Complex structure of chimpanzee A3H and dsRNA (PDB code 5Z98), two A3H monomers are in grass and lilac, dsRNA is in orange, respectively. In all pictures, Zn2+ion is indicated by grey spheres
-

计量
- PDF下载量: 36
- 文章访问数: 2327
- HTML全文浏览量: 654