Citation: Zhang Pengcheng, Guo Jia, Zhu Gen, Fang Wenyu, Tang Qianyuan, Bao Lei, Kang Wenbin. Monte Carlo Simulations of Composition-Related Structural Transition of Disordered Peptides: The Case Study of Random Peptides Composed of Lysine, Glutamic Acids and Isoleucine[J]. Acta Chimica Sinica, 2020, 78(9): 994-1000. doi: 10.6023/A20060249
无序随机多肽组分相关的结构转变的蒙特卡洛模拟:以赖氨酸、谷氨酸和异亮氨酸组成的随机多肽为例
English
Monte Carlo Simulations of Composition-Related Structural Transition of Disordered Peptides: The Case Study of Random Peptides Composed of Lysine, Glutamic Acids and Isoleucine
-
Key words:
- intrinsically disordered protein
- / conformation
- / sequence
- / hydrophobicity
- / Monte Carlo simulations
-
1. 引言
蛋白质或多肽是由氨基酸脱水缩合形成的一种生物大分子. 在自然生理条件下由不同的氨基酸序列构成的蛋白质, 其结构特征有着差异并且发挥着不同的作用. 例如, 有些形成紧密的球形结构, 有些则是处于无序状态. 关于蛋白质序列与结构关系的研究一直是分子生物学、生物化学和生物物理学等学科的一个重要问 题[1-3]. 在球状蛋白折叠过程中, 漏斗形的能量面被提出并广泛应用于解释可溶性球状蛋白质的热力学和动力学问题[4-15]. 近些年来, 研究发现内禀无序蛋白质(下文简称为无序蛋白)和无序多肽数量的逐渐增加[16-26]. 在自然生理条件下, 这一类蛋白质表现为没有唯一的结构, 因此揭示蛋白质序列与结构关系变得更为复杂. 漏斗形能量面不再完全适用于揭示无序蛋白的热力学和动力学行为, 提出理解这一类蛋白质多样化结构特征的理论是人们一直关注的热点问题.
Uversky等[27, 28]基于大量的生物信息学统计提出了蛋白质组分相关的二维相图. 随后Pappu等[29, 30]通过大规模的分子模拟研究提出了蛋白质结构分类的三维相图. 这些相图都能对折叠蛋白和无序蛋白进行区分. 例如, 对无序蛋白的序列而言, 带电残基发挥着重要的作用[30]. 无序蛋白的结构与序列的带电性质有着密切的联系. 例如, Pappu等[29, 30]使用平均净电荷量(net charge per residue, NCPR)和带电残基比例(fraction of charged residues, FCR)为序参量广泛地研究过大量的无序多肽. Das等[29, 30]发现带电残基的排列方式对无序蛋白结构有着一定的影响, 王炜课题组[31]之前的研究也充分证实了这一现象. 此外, 关于蛋白质的疏水性如何调控蛋白质的结构有不同的观点. 在物理学上, 平均疏水性(mean hydrophobicity, H)和带电残基比例二者大致是呈负相关性关系, 疏水作用和静电作用都对蛋白质组分相关的结构转变有着贡献. Dill等[32]认为球状蛋白的折叠过程中, 疏水作用发挥着重要角色. Ashbaugh等[33, 34]认为考虑到抗衡离子凝聚作用, 带电残基数量的减少引起了多肽从无规卷曲到球形结构的转变. 课题组之前的研究重点关注了赖氨酸、谷氨酸和丙氨酸组分的无序随机多肽系统, 发现这一类随机多肽随着疏水作用增强多肽从扩展结构转变到球形结构[20]. 在无序随机多肽结构的转变过程中, 疏水作用和静电作用到底是是怎样精密地调控多肽的结构的?这两种相互作用到底是谁占据着主导作用?
为了回答上述问题, 本工作系统地研究了由赖氨酸(Lys, K)、谷氨酸(Glu, E)和异亮氨酸(Ile, I)组成随机无序多肽. 基于ABSINTH (self-Assembly of Biomolecules Studied by an Implicit, Novel, and Tunable Hamiltonian)模型[35], 利用全原子蒙特卡洛模拟方法研究了随机多肽的构象特征. 结果表明, 对每一条多肽, 随着温度的升高从紧密构象转变到扩展构象. 多肽的转变温度Tc依赖于疏水性氨基酸的比例以及净电荷量. 随着疏水性氨基酸数目的增加, 转变温度Tc相应的升高. 也就是说, 当平均疏水性H小于临界疏水性值Hc时, 多肽的转变温度几乎都很低(大约都在280 K); 当平均疏水性H大于临界疏水性值Hc时, 随着多肽疏水性H的增大转变温度升高到340 K. 定量地, 多肽从扩展结构到紧密转变的临界疏水性值与前人的研究结论是一致的[20]. 统计分析了氨基酸残基之间接触对数目, 结果表明在多肽结构转变过程中, 疏水作用变化比较显著, 这侧面反映了对无序多肽的塌缩转变过程中, 疏水作用发挥着相对重要的作用. 此外, 不同带电残基的排列对多肽结构有着一定的调控效应. 具体的, 当疏水性较小时, 电荷的排列对多肽的结构有着显著的影响; 随着疏水性增大, 多肽结构的涨落特性逐渐消失. 总之, 在无序多肽结构转变过程中, 疏水作用对结构的塌缩转变起着主要作用, 而随疏水性增强, 电荷的排列对结构的影响逐渐消失.
2. 模型与方法
2.1 研究对象
为了考察在正常的生理pH环境条件下疏水作用和静电作用的竞争, 考虑了三种类型的氨基酸, 它们分别是两种带电的氨基酸(赖氨酸和谷氨酸)和一种电中性氨基酸(异亮氨酸). 这种氨基酸的组合方式类似于Das和王炜课题组之前的研究[20, 29, 30, 35, 36]. 这里带电性质的选择对应生理条件的情形. 对每一条多肽的N端和C端, 分别利用乙酰基(ACE)和甲基(NME)进行保护. 本研究中, 产生了一系列链长l=50的随机序列(共31条). 具体的序列信息参考表 1.
表 1
Label Sequence k H sv1 EKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEK 0 0.089 sv2 KKKEEEEEEEEEKKKKKKKKKKKKKKEEKKEKKKKKEEEEEEEEKEEEEE 0.5 0.089 sv3 EEEEEEEEEEEEEEEEEEEEEEEEEKKKKKKKKKKKKKKKKKKKKKKKKK 1.0 0.089 sv4 EKEKEKEKEKEKEKEKEKEKEKIIIIIIEKEKEKEKEKEKEKEKEKEKEK 0 0.198 sv5 IEEEKEEKKKKKKKKEEEEEKKKKKKKKKKKKEIIIIEKIEEEEEEEEEE 0.5 0.198 sv6 KKKKKKKKKKKKKKKKKKKKKKIIIIIIEEEEEEEEEEEEEEEEEEEEEE 1.0 0.198 sv7 KIEKIEIEEKIEIKEEKEIEEEKIKEKKKKEEIKEKKKEKIKKEIEKKEE 0 0.271 sv8 EEEEEEEEEEKKKKKKKEIIIIIIIEEEEEKKKKKIIKKKKKKKKEEEEI 0.5 0.271 sv9 EEEEEEEEEEEEEEEEEEEEIIIIIIIIIIKKKKKKKKKKKKKKKKKKKK 1.0 0.271 sv10 IEIEIKIIIEKEIKIEEKEKKEKIEIEIKKKEEKEKEKIIIEKIIEKKKE 0 0.380 sv11 EEIEEKIKKKIKKKKKKIIIIIIKIKKIIIEIKIEEEEEEEEEEEEKKIK 0.5 0.380 sv12 EEEEEEEEEEEEEEEEEIIIIIIIIIIIIIIIIKKKKKKKKKKKKKKKKK 1.0 0.380 sv13 EKEKEIKEIKEKEEKKIEIIKIEIIIKEIKEIIEKIIIKEEKKIIIIIEK 0 0.453 sv14 KIIIKKKIIKKIKKIEEEEEEEEEEIEKKKEKIIIIIIEIKIIIEEIKKI 0.5 0.453 sv15 KKKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEEE 1.0 0.453 sv16 EKEKEKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEKEKEK 0 0.489 sv17 EEEEEEIIIIEEEEEKKKKEEIIIIIIIIIIIIIIIIIIKKKKKKKKKKE 0.5 0.489 sv18 KKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEE 1.0 0.489 sv19 EKKIEIIKIKIIEIKEEEEIIKEIIKEIEKIKKIIIEIIIIIIEIKIKII 0 0.563 sv20 KKKKKKKKKIIIEIIIIEIIIIEIIKIKKIIIEIIEEEIEEEIEEIIIII 0.5 0.563 sv21 EEEEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKKKK 1.0 0.563 sv22 EKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEK 0 0.635 sv23 EEEEKKKKKKKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEEEEEEKKK 0.5 0.562 sv24 EEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKK 1.0 0.562 sv25 IKIIEIIKIEIIIIIIIIEKIIIIIIEKEIIIIKIEIKIIIIEKIIIIII 0 0.745 sv26 IEIIKKKKKKIIIIIKIIIIIIIIIEEIIEIEIIIIIIIIEEIIIIIIII 0.5 0.745 sv27 EEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKK 1.0 0.745 sv28 IIIIIEIIIIIIIIIEIIIIIIKIIIIIEIIIIIIIIKIIIIIIEIKKEK 0 0.817 sv29 IIIIIIIIIIIIIIIIIIIIIIIIIIIEIEIIIEIIIEIIIKKKKIIIKE 0.5 0.817 sv30 EEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKK 1.0 0.817 sv31 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII - 1.000 在模拟中, 将多肽放置在半径为7.5 nm的球形盒子内. 为了考虑溶剂离子的影响, 本研究模拟了浓度为15 mmol/L的氯化钠溶液. 这一数值和生理浓度(150 mmol/L)有差别. 不过前人和王炜课题组之前对无序多肽的研究表明氯化钠的浓度对于谷氨酸和赖氨酸组成的随机多肽体系的结构特征没有显著影响[20, 29, 31]. 因此, 本工作选择15 mmol/L的氯化钠浓度是合理的.
2.2 相互作用模型
为了刻画各种相互作用的效应, 本研究中使用了全原子模型. ABSINTH模型是一种成功用于刻画内禀无序多肽体系的隐式溶剂模型[35]. 其能量表达式为:
$ {U_{{\rm{total}}}}{\rm{ = }}{U_{{\rm{tor}}}} + {U_{{\rm{Disp}}}} + {U_{{\rm{EV}}}}{\rm{ + }}{W_{{\rm{Solv}}}} + {W_{{\rm{el}}}} $
(1) 其中Utor表示二面角扭转势能; UDisp+UEV对应于修正的范德瓦尔斯相互作用势, UDisp和UEV分别表示短程吸引项和排斥项; WSolv为ABSINTH模型中的平均场相互作用; Wel表示静电相互作用的贡献.
在本工作中也是采用了ABSINTH隐式水全原子模型. 即本工作研究中选择了abs3.2_opls.prm相互作用参数文件. 模拟过程中采用基于原子的软球势边界条件. 氨基酸残基原子间Lennard-Jones势和静电相互作用的截断距离分别设置为1 nm和1.4 nm. 溶液中盐离子和侧链部分净电荷之间的静电相互作用则没有采取截断设置[20, 29, 31].
2.3 模拟方法
模拟采用软件包CAMPARI2.0[36]实现, 应用ABSINTH模型[35]和OPLS-AA/L力场. 为了提高采样的效率, 利用温度副本交换采样方法(Replica-Exchange Monte Carlo, REMC)[37-40]和马尔可夫链蒙特卡洛方法(Markov Chain Metropolis Monte Carlo, MCMC). REMC是一种增强采样技术, 采用的方法是在不同温度下对具有相似势能的体系进行采样. 通过这种方法, 体系可能会越过势能面上的能垒, 从而探索新的构象空间. 体系副本数目, 温度空间的范围和温度分布决定了副本之间的平均交换概率. 模拟体系的势能会随温度的增加而增加, 副本的温度分布应服从指数分布. 因此, 在模拟过程的温度副本交换方法(REMC)选择了从280 K到430 K的12个温度副本(280, 293, 298, 305, 315, 325, 335, 350, 365, 380, 395, 430), 低温区域副本比较密集, 而高温区域相对稀疏. 模拟的总步数为4.65×107步, 相邻温度副本间每隔5×104步交换一次构象. 由于模拟设置的初始构象是从完全随机的结构出发, 系统经过一定的模拟步数弛豫将达到平衡状态, 因此在统计分析时将模拟初始1.5×106步舍掉, 这保证了后续统计分析是对平衡态结果的研究. 图 1给出了温度为298 K时I50多肽系统回转半径随模拟步数的演化轨迹, 发现经过1.0×106模拟步数时系统已弛豫到平衡状态. 在本工作中, 仅仅对常温(298 K)这一温度副本的情况进行了系统地讨论.
图 1
2.4 刻画无序多肽的参量
为了描述多肽的序列和结构等特征, 引入了如下几个特征物理量. 平均净电荷量(NCPR)、归一化平均疏水性(H)、模式参数(κ)、回转半径(Rg)以及氨基酸残基接触对数(contact number, Nc). 在这些参量中, NCPR、H和κ用来描述无序多肽序列的组分和排列特征. 其中疏水性H是一个重要的序参量, 通过对序列中所有氨基酸的疏水性进行平均并归一化来定义. 对每一个氨基酸残基使用Kyte-Doolittle疏水性打分值[41]. 本工作中为了简明起见, 将多肽序列的疏水性归一化处理, 其范围是[0, 1]. 也就是说, 异亮氨酸的疏水性为1、精氨酸的疏水性为0. 对应的本工作中的赖氨酸的疏水性为0.066、谷氨酸的疏水性为0.1111. 另外一个参量是平均净电荷量NCPR=f+-f-, 这里的f+和f-分别表示序列中带正负电荷的氨基酸的占比. 当多肽链的疏水性水平保持不变时, 其回转半径依赖于正负电荷的排列情况[20, 29, 31], 在以前的研究中, 通常用模式参数κ表征序列中正负电荷的混合程度, 其定义如下[20, 29, 31]:
$ \sigma {\rm{ = }}\frac{{{{({f_ + } - {f_ - })}^2}}}{{{{({f_ + } + {f_ - })}^2}}} $
(2) $ {\sigma _i}{\rm{ = }}\frac{{{{({f_ + } - {f_ - })}_i}^2}}{{{{({f_ + } + {f_ - })}_i}^2}} $
(3) $ \varDelta {\rm{ = }}\frac{{\sum\nolimits_{i = 1}^{{N_{{\rm{blob}}}}} {{{({\sigma _i} - \sigma )}^2}} }}{{{N_{{\rm{blob}}}}}} $
(4) $ K{\rm{ = }}\frac{\varDelta }{{{\varDelta _{\max }}}} $
(5) 对每一条序列, 根据式(2), 我们可以求出其电荷分布的不对称程度, 它可以理解为某种“极化强度”. 类似地, 通过将序列划分为Nblob个不重复的片段来计算模式参数, 每个片段可以包含g=5或者g=6个氨基酸残基, 其中第i个片段的电荷不对称性σi可以由式(3)计算得出. 序列的整体电荷不对称性σ的方差Δ定义为式(4). 不同序列的电荷不对称性的方差Δ是不同的, 其中正负电荷完全分离的状态方差最大(记为Δmax). 其余序列的模式参数κ定义为该序列的方差Δ除以Δmax. 当赖氨酸和谷氨酸完全分离时, κ为1; 当赖氨酸和谷氨酸混合均匀时, κ接近于零.
除了上述序列特性相关的物理量之外, 也引入了一些结构相关的物理量. 在常温下, 这些多肽大多数是无序的, 之前大量的柔性聚合物的研究表明可以用回转半径来描述多肽的几何状态[29, 30, 35, 36, 42, 43]. 也引入了残基接触对数目Nc来表示多肽结构中氨基酸残基接触的详细信息. 本工作中, 任何两个残基的重原子之间的距离小于等于0.5 nm, 则认为它们之间有接触. 通过分析不同氨基酸残基之间的接触对数目, 可以分析多肽内部何种相互作用占有主要地位.
3. 结果与讨论
3.1 无序随机多肽的构象塌缩转变
无序多肽通常没有确定的稳定结构(或者天然结构). 为了研究无序多肽序列与结构之间的关系, 在进行统计分析轨迹之前检查模拟采样的平衡性和收敛性是非常有必要的. 根据之前的研究经验以及参数设 置[20, 29, 31], 本工作的蒙特卡洛模拟采样是足够而充分的. 对所有的多肽有着随着温度的升高, 结构从紧密转变到松散的普适的行为, 具体的参考之前文章的研究结 果[20, 29, 31]. 在论述之前, 值得说明的是仅仅研究了电中性的多肽系统(NCPR=0). 为了描述无序多肽结构的转变情况, 利用统计物理方法计算了多肽的热力学性质参量. 例如, 在图 2(A)中展示了E20I10K20序列中κ=0.5的一条多肽比热随着温度的变化曲线. 可以看出, 在温度为Tc=335 K处比热有一个峰值. 这个结果表明, 在这个温度值附近多肽结构涨落最大, 对应着结构转变. 对其余的无序多肽也会观察到结构转变的现象. 随着无序多肽系统的疏水残基和带电残基的数目的变化, 转变温度也会相应的变化. 图 2(B)给出了平均转变温度值<Tc>随着平均疏水性H的变化曲线. 这里的<Tc>表示是同一疏水性而不同模式参数κ的平均值. 结果表明, 对于平均疏水性较小的多肽, 其转变温度大约在280~300 K; 但是当平均疏水性大于临界值Hc时, 转变温度逐渐上升到340 K附近.
图 2
3.2 无序随机多肽结构塌缩转变的相图
在图 2(B)中, 标注了Hc表示系统的临界转变疏水性值. 对于较小疏水性值的无序多肽, 因其转变温度小于实验室温度(300 K), 其结构较为扩展; 在常温下, 强疏水性值的无序多肽, 其结构比较紧密. 这一结论与回转半径的变化趋势是相吻合的. 在图 2(C)中, 给出了298 K温度下的所有多肽的回转半径平均值<Rg>随着平均疏水性H的变化曲线. 研究发现, 回转半径随着疏水性值升高而逐渐减小. 同时疏水性值较小时, 回转半径的涨落值较大. 与预期符合的是, 回转半径的变化趋势与图 2(B)给出的结构转变是一致的.
将所有模拟的数据放在以NCPR和H为序参量的二维相图中(如图 3所示). 研究发现, 结论与前人的研究是一致的[28, 29, 31, 44]. 图 3中红色的虚线将多肽可及区域分为紧密构象和扩展构象两块区域. 在边界线左侧区域, 多肽回转半径比较大, 结构相对松散. 在边界线右侧区域, 多肽回转半径较小, 结构相对紧密. 这一边界线给出了多肽结构从无规卷曲到紧密球形的转变. 为了直观清晰, 在图 4中展示了模拟的典型结构. 可以看出, 随着疏水性增强(横轴表示H逐渐增大), 多肽结构逐渐从无规卷曲转变到球形折叠结构; 此外, 多肽序列中电荷的分布对结构的调控逐渐减弱. 例如, 图 4(A)表示(EK)25序列的电荷分布对其构象有着明显的调控作用; 随着疏水性H增大, 多肽结构的涨落逐渐降低了并出现典型的二级结构.
图 3
图 4
有趣的是, 对于无序多肽而言, 这一边界线将其分为两种类型的构象特征. 对于折叠蛋白质而言, 其天然结构比较紧密并且出现在右侧青色区域, 此外右侧区域也给形成折叠蛋白质给出了必要的条件. 这种无序多肽的结构转变给天然蛋白质的转变提供了基本的约束规则[13, 14]. 在这种约束情况下, 天然的无序蛋白和折叠蛋白也可以通过上述的边界线来划分. 因此, 研究结果理性地刻画了蛋白质系统内部疏水作用和静电作用所发挥的效应.
3.3 疏水相互作用在组分相关的结构转变中作用
考虑到带电残基和疏水残基呈负相关性情况, 何种相互作用在上述的结构转变中发挥着主要作用是比较困难的. 为了明确静电和疏水何种相互作用在上述结构转变中发挥主导作用以及帮助人们理解结构转变的机制, 统计分析了各种类型氨基酸残基之间的接触对数目情况. 在图 5中, 给出了“疏水-疏水”(I-I)、“疏水-电荷”(I-charged)、“电荷-电荷”(charged-charged)以及所有的残基之间的接触对数目. 研究发现, 随着平均疏水性数值增加, 所有氨基酸残基间接触数目单调上升. 这表明随着疏水性增加, 多肽的紧密程度增加. 这与上述提到的随着疏水性增加多肽结构转变是一致的. 此外, 特别是当系统的平均疏水性大于0.4之后, “疏水-疏水”氨基酸之间的残基接触对数目占大多数. 总体来讲, “电荷-电荷”以及“疏水-电荷”氨基酸残基之间的接触对数目保持非常低的水平. 这一结果表明, 在上述组分相关的结构转变过程中疏水作用发挥着重要的作用, 在其构象转变过程中占据着主要地位.
图 5
3.4 结构涨落对电荷排列情况的依赖性
为了进一步研究疏水作用和静电相互作用的竞争, 研究了不同疏水性值的多肽系统的回转半径与电荷排列情况之间的关系. 在图 6(A)中, 给出了回转半径与疏水性值、模式参数之间的关系. 数据结果表明, 数据点可以分为两个区域. 当多肽系统的平均疏水性小于0.45时, 对不同的模式参数κ回转半径涨落(fluctuation of the gyration radius, ΔRg)变化比较大; 当多肽系统的平均疏水性大于0.45时, 所有的数据几乎汇合到一起形成一条线. 这表明在较小的疏水性时, 多肽系统的形状对正负电荷的排列情况比较敏感; 但是当疏水性大于临界疏水值时, 这种敏感行为逐渐消失. 在图 6(B)中给出了回转半径涨落值与平均疏水性的关系. 数据表明, 当平均疏水性值大于0.45时, 回转半径的涨落几乎不存在了. 这一临界疏水性值与图 2给出结论是一致的. 这个结果侧面反映了在组分依赖的结构转变前后, 静电相互作用所发挥的不同的作用.
图 6
4. 结论
蛋白质系统内部存在着复杂的各种相互作用. 理解蛋白质内部的各种相互作用及它们之间的竞争是蛋白质物理中的一个重要问题. 为了刻画蛋白质系统中的疏水作用和静电作用发挥的角色, 以谷氨酸、赖氨酸和异亮氨酸三种代表性氨基酸组分出发, 构建一系列随机多肽序列, 利用全原子模型、温度副本交换及蒙特卡洛模拟方法, 研究了无序多肽序列与结构之间的关系. 研究表明, 随着多肽的疏水性增加, 多肽从扩展构象转变到紧密构象. 通过对各种序列变体的研究, 发现疏水相互作用在多肽的构象转变过程中发挥主要作用. 这种结构的转变与无序蛋白到折叠蛋白质转变是一致的, 并揭示了天然蛋白质中蕴含的序列与结构关系的基本物理图像. 此外, 分析疏水作用和静电作用在无序多肽构象转变过程中的贡献, 研究发现疏水作用在组分相关的结构转变过程中占有主导地位, 而静电相互作用在构象扩展的情况下也发挥重要的作用. 值得指出, 目前的研究仅仅是对电中性的无序随机多肽系统的研究, 对含有其他疏水性氨基酸的情况及其序列特征与“液-液相分离”之间关系的研究需要进一步的探索[45-50]. 此外, 关于格点模型中的无序蛋白等生物大分子“液-液相分离”过程的蒙特卡洛模拟需要进一步开展和探索[51, 52]. 期望本研究结论对基于序列出发的蛋白质序列设计或者蛋白质工程有着重要的指导意义[51-54].
-
-
[1]
Kister, A. E.; Potapov, V. Biochem. Soc. Trans. 2013, 41, 616. doi: 10.1042/BST20120308
-
[2]
Sadowski, M. I.; Jones, D. T. Curr. Opin. Struct. Biol. 2009, 19, 357. doi: 10.1016/j.sbi.2009.03.008
-
[3]
Shenoy, S. R.; Jayaram, B. Curr. Protein Pept. Sci. 2010, 11, 498. doi: 10.2174/138920310794109094
-
[4]
Chu, X.; Gan, L.; Wang, E.; Wang, J. Proc. Natl. Acad. Sci. U. S. A. 2013, 110, E2342. doi: 10.1073/pnas.1220699110
-
[5]
Daggett, V.; Fersht, A. Nat. Rev. Mol. Cell Biol. 2003, 4, 497. doi: 10.1038/nrm1126
-
[6]
Daggett, V.; Fersht, A. R. Trends Biochem. Sci. 2003, 28, 18. doi: 10.1016/S0968-0004(02)00012-9
-
[7]
Dinner, A. R.; Sali, A.; Smith, L. J.; Dobson, C. M.; Karplus, M. Trends Biochem. Sci. 2000, 25, 331. doi: 10.1016/S0968-0004(00)01610-8
-
[8]
Leelananda, S. P.; Jernigan, R. L.; Kloczkowski, A. J. Comput. Biol. 2016, 23, 400. doi: 10.1089/cmb.2015.0209
-
[9]
Li, H.; Helling, R.; Tang, C.; Wingreen, N. Science 1996, 273, 666. doi: 10.1126/science.273.5275.666
-
[10]
Matouschek, A.; Serrano, L.; Fersht, A. R. J. Mol. Biol. 1992, 224, 819. doi: 10.1016/0022-2836(92)90564-Z
-
[11]
Onuchic, J. N.; Luthey-Schulten, Z.; Wolynes, P. G. Annu. Rev. Phys. Chem. 1997, 48, 545. doi: 10.1146/annurev.physchem.48.1.545
-
[12]
Schug, A.; Onuchic, J. N. Curr. Opin. Pharmacol. 2010, 10, 709. doi: 10.1016/j.coph.2010.09.012
-
[13]
Wang, J.; Wang, W. Nat. Struct. Biol. 1999, 6, 1033. doi: 10.1038/14918
-
[14]
Wang, J.; Wang, W. Adv. Phys. X 2016, 1, 444. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[15]
Wolynes, P. G. Biochimie 2015, 119, 218. doi: 10.1016/j.biochi.2014.12.007
-
[16]
Apicella, A.; Marascio, M.; Colangelo, V.; Soncini, M.; Gautieri, A.; Plummer, C. J. J. Biomol. Struct. Dyn. 2017, 35, 1813. doi: 10.1080/07391102.2016.1196151
-
[17]
Dyson, H. J.; Wright, P. E. Nat. Rev. Mol. Cell Biol. 2005, 6, 197. doi: 10.1038/nrm1589
-
[18]
Gao, M.; Yang, F.; Zhang, L.; Su, Z.; Huang, Y. J. Biomol. Struct. Dyn. 2018, 36, 1171. doi: 10.1080/07391102.2017.1316519
-
[19]
Jain, A.; Ashbaugh, H. S. J. Chem. Phys. 2008, 129, 174505. doi: 10.1063/1.3003577
-
[20]
Kang, W. B.; He, C.; Liu, Z. X.; Wang, J.; Wang, W. J. Biomol. Struct. Dyn. 2019, 37 1956. doi: 10.1080/07391102.2018.1472669
-
[21]
Khan, S. H.; Jasuja, R.; Kumar, R. J. Biomol. Struct. Dyn. 2017, 35, 2248. doi: 10.1080/07391102.2016.1214086
-
[22]
Migliaccio, A. R.; Uversky, V. N. J. Biomol. Struct. Dyn. 2018, 36, 1617. doi: 10.1080/07391102.2017.1330224
-
[23]
Oldfield, C. J.; Dunker, A. K. Annu. Rev. Biochem. 2014, 83, 553. doi: 10.1146/annurev-biochem-072711-164947
-
[24]
Singh, I.; Singh, S.; Uversky, V. N.; Chandra, R. J. Biomol. Struct. Dyn. 2017, 1. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[25]
Uversky, V. N.; Oldfield, C. J.; Dunker, A. K. Annu. Rev. Biophys. 2008, 37, 215. doi: 10.1146/annurev.biophys.37.032807.125924
-
[26]
Yacoub, H. A.; Al-Maghrabi, O. A.; Ahmed, E. S.; Uversky, V. N. J. Biomol. Struct. Dyn. 2017, 35, 836. doi: 10.1080/07391102.2016.1164077
-
[27]
Uversky, V. N. Protein Sci. 2002, 11, 739. doi: 10.1110/ps.4210102
-
[28]
Uversky, V. N.; Gillespie, J. R.; Fink, A. L. Proteins 2000, 41, 415. doi: 10.1002/1097-0134(20001115)41:3<415::AID-PROT130>3.0.CO;2-7
-
[29]
Das, R. K.; Pappu, R. V. Proc. Natl. Acad. Sci. U. S. A. 2013, 110, 13392. doi: 10.1073/pnas.1304749110
-
[30]
Mao, A. H.; Crick, S. L.; Vitalis, A.; Chicoine, C. L.; Pappu, R. V. Proc. Natl. Acad. Sci. U. S. A. 2010, 107, 8183. doi: 10.1073/pnas.0911107107
-
[31]
Kang, W. B.; Wang, J.; Wang, W. Acta Phys. Sin. 2018, 67, 058701. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[32]
Yue, K.; Dill, K. A. Proc. Natl. Acad. Sci. U. S. A. 1995, 92, 146. doi: 10.1073/pnas.92.1.146
-
[33]
Ashbaugh, H. S.; Asthagiri, D. J. Chem. Phys. 2008, 129, 204501. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[34]
Ashbaugh, H. S.; Hatch, H. W. J. Am. Chem. Soc. 2008, 130, 9536. doi: 10.1021/ja802124e
-
[35]
Vitalis, A.; Pappu, R. V. J. Comput. Chem. 2009, 30, 673. doi: 10.1002/jcc.21005
-
[36]
Vitalis, A.; Pappu, R. V. Annu. Rep. Comput. Chem. 2009, 5, 49. doi: 10.1016/S1574-1400(09)00503-9
-
[37]
Jiang, P.; Yasar, F.; Hansmann, U. H. J. Chem. Theory Comput. 2013, 9, 3816. doi: 10.1021/ct400312d
-
[38]
Mitsutake, A.; Okamoto, Y. Phys. Rev. E Stat. Nonlin Soft Matter Phys. 2009, 79, 047701. doi: 10.1103/PhysRevE.79.047701
-
[39]
Nanias, M.; Czaplewski, C.; Scheraga, H. A. J. Chem. Theory Comput. 2006, 2, 513. doi: 10.1021/ct050253o
-
[40]
Yoda, T.; Sugita, Y.; Okamoto, Y. Proteins 2007, 66, 846. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[41]
Kyte, J.; Doolittle, R. F. J. Mol. Biol. 1982, 157, 105. doi: 10.1016/0022-2836(82)90515-0
-
[42]
Das, R. K.; Crick, S. L.; Pappu, R. V. J. Mol. Biol. 2012, 416, 287. doi: 10.1016/j.jmb.2011.12.043
-
[43]
Pappu, R. V.; Wang, X.; Vitalis, A.; Crick, S. L. Arch. Biochem. Biophys. 2008, 469, 132. doi: 10.1016/j.abb.2007.08.033
-
[44]
Jin, F.; Liu, Z. R.; Biophys. J. 2013, 104, 488. doi: 10.1016/j.bpj.2012.12.012
-
[45]
Ruff, K. M.; Pappu, R. V.; Holehouse, A. S. Curr. Opin. Struct. Biol. 2019, 56, 1. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[46]
Choi, J. M.; Dar, F.; Pappu, R. V. PLOS Comp. Biol. 2019, 15, e1007028. doi: 10.1371/journal.pcbi.1007028
-
[47]
Zhou, H. X.; Nguemaha, V.; Mazarakos, K.; Qin, S. B. Trends Biochem. Sci. 2018, 43, 499. doi: 10.1016/j.tibs.2018.03.007
-
[48]
Dignon, G. L.; Zheng, W. W.; Best, R. B.; Kim, Y. C.; Mittal, J. Proc. Natl. Acad. Sci. U. S. A. 2018, 115, 9929. doi: 10.1073/pnas.1804177115
-
[49]
Uversky, V. N. Curr. Opin. Struc. Biol. 2017, 44, 18. doi: 10.1016/j.sbi.2016.10.015
-
[50]
张鹏程, 方文玉, 鲍磊, 康文斌, 物理学报, 2020, 69, 138701. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498Zhang, P. C.; Fang, W. Y.; Bao, L.; Kang, W. B. Acta Phys. Sin. 2020, 69, 138701(in Chinese). http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[51]
王贵昌, 崔永斌, 孙予罕, 钟炳, 化学学报, 1998, 56, 867. http://www.cnki.com.cn/Article/CJFDTotal-HXXB199809005.htmWang, G. C.; Cui, Y. B.; Sun, Y. H.; Zhong, B. Acta Chim. Sinica 1998, 56, 867(in Chinese). http://www.cnki.com.cn/Article/CJFDTotal-HXXB199809005.htm
-
[52]
曹达鹏, 汪文川, 段雪, 矫庆泽, 化学学报, 2001, 59, 297. http://www.cnki.com.cn/Article/CJFDTotal-HXXB200102026.htmCao, D. P.; Wang, W. C.; Duan, X.; Jiao, Q. Z. Acta Chim. Sinica 2001, 59, 297(in Chinese). http://www.cnki.com.cn/Article/CJFDTotal-HXXB200102026.htm
-
[53]
王大成, 蛋白质工程, 化学工业出版社, 北京, 2008, p. 65 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498Wang, D. C. Protein Engineering, Vol. 1, Chemical Industry Press, Beijing, 2008, p. 65(in Chinese). http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[54]
邓海游, 贾亚, 张阳, 物理学报, 2016, 65, 178701. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498Deng, H. Y.; Jia, Y.; Zhang, Y Acta Phys. Sin. 2016, 65, 178701(in Chinese). http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
-
[1]
-
图 2 (A) E20I10K20序列中κ=0.5比热Cv与温度T关系曲线, 其中峰值对应系统的转变温度Tc. (B)平均转变温度<Tc>与平均疏水性H的关系曲线. (C) 回转半径<Rg>与平均疏水性H的关系曲线.
Figure 2 (A) The specific heat capacity Cv vs. the temperature T for the sequence E20I10K20 with κ=0.5. The transition temperature Tc corresponds to the position of the peak of the curve. (B) The averaged transition temperature <Tc> vs. the mean hydrophobicity H, and (C) the gyration radius <Rg> vs. the mean hydrophobicity H for electrically neutral EIK systems with different amino-acid compositions.
图 3 以平均疏水性(H)和平均净电荷量(NCPR)为序参量的二维相图. 蛋白质仅能出现在粉红色和青色的区域. 青色的三角形区域代表结构紧密的蛋白质. 粉色的多边形区域表示无序蛋白. 这两块区域通过红色的虚线划分. 图中的不同颜色的圆点表示本工作中所有多肽的模拟的平均回转半径的大小.
Figure 3 The phase diagram based on the hydrophobicity (H) and the net charge per residues (NCPR). The region with the pink (or cyan) color corresponds to the compositions of peptides with extended (or compact) conformations. As a reference, the boundary between the IDPs and folded proteins based on bioinformatical analysis is given as the red dashed line. All the simulated peptides are marked on the diagram with dots whose sizes are proportional to the average gyration radii of the peptides.
图 4 T=298 K情况下不同疏水性和电荷分布, 温度副本交换蒙特卡洛模拟的典型构象. 其中赖氨酸, 谷氨酸和异亮氨酸分别用蓝色、红色和灰色表示. 所有的结构都采用PyMOL软件绘图. (A) H=0.08855, (B) H=0.38021, (C) H=0.81771, (D) H=1.0. 对(A)~(C)而言, 上下两幅子图分别表示κ=0和κ=1的序列所对应的结构.
Figure 4 Representative conformations sampled from the simulation trajectories (T=298 K) for electrically neutral peptides with different hydrophobicity. Here, the lysine (K), glutamate acid (E) and isoleucines (I) are colored in blue, red, and gray, respectively. The conformations are rendered with PyMOL package. (A) H=0.08855, (B) H=0.38021, (C) H=0.81771, (D) H=1.0. For (A)~(C), the upper and lower subfigures denote peptide sequences with κ=0 and κ=1, respectively.
图 5 平均残基接触对数目Nc随着疏水性H变化的趋势. 三种不同类型的接触对数分别用不同的颜色区分: 异亮氨酸之间的接触对数目(红色的正方形)、异亮氨酸与带电残基之间的接触对数(黑色的圆形)、带电氨基酸残基之间的接触对数目(绿色的上三角形); 此外, 任意类型的残基接触对总数也在图中(蓝色的下三角形)标出.
Figure 5 The average number of contacts Nc vs. mean hydrophobicity H. We divided all contacts into three different types: isoleucine-isoleucine (red squares), isoleucine-charged residues (black circle), and contacts of charged residue pairs (green upper triangles). The total number of residue contacts is also plotted in the graph (blue down triangles).
图 6 (A) 多肽的回转半径Rg随着平均疏水性H的变化趋势, 图中不同颜色的数据点分别对应于不同κ值的情况. (B)回转半径的涨落值ΔRg随着平均疏水性H的变化趋势.
Figure 6 (A) The gyration radius Rg vs. the mean hydrophobicity H for the peptides. The cases with different κ are given in various colors, as indicated by the legend. (B) The fluctuation of the gyration radius ΔRg vs. the mean hydrophobicity H for the peptides.
表 1 本工作研究的多肽系统的31条代表序列. 第一列表示序列标签; 第二列表示序列, 红色的表示谷氨酸, 蓝色的表示赖氨酸, 黑色的表示异亮氨酸; 第三列为序列相应的模式参数κ; 第四列为序列的平均疏水性H.
Table 1. The 31 sequences analyzed in this research. In the table, Column 1 shows the label of each sequence. Column 2 shows the sequence, with Glu (E) residues in red, Lys (K) residues in blue, and Ile (I) residues in black. Column 3 shows the κ-values. Column 4 shows the mean hydrophobicity.
Label Sequence k H sv1 EKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEK 0 0.089 sv2 KKKEEEEEEEEEKKKKKKKKKKKKKKEEKKEKKKKKEEEEEEEEKEEEEE 0.5 0.089 sv3 EEEEEEEEEEEEEEEEEEEEEEEEEKKKKKKKKKKKKKKKKKKKKKKKKK 1.0 0.089 sv4 EKEKEKEKEKEKEKEKEKEKEKIIIIIIEKEKEKEKEKEKEKEKEKEKEK 0 0.198 sv5 IEEEKEEKKKKKKKKEEEEEKKKKKKKKKKKKEIIIIEKIEEEEEEEEEE 0.5 0.198 sv6 KKKKKKKKKKKKKKKKKKKKKKIIIIIIEEEEEEEEEEEEEEEEEEEEEE 1.0 0.198 sv7 KIEKIEIEEKIEIKEEKEIEEEKIKEKKKKEEIKEKKKEKIKKEIEKKEE 0 0.271 sv8 EEEEEEEEEEKKKKKKKEIIIIIIIEEEEEKKKKKIIKKKKKKKKEEEEI 0.5 0.271 sv9 EEEEEEEEEEEEEEEEEEEEIIIIIIIIIIKKKKKKKKKKKKKKKKKKKK 1.0 0.271 sv10 IEIEIKIIIEKEIKIEEKEKKEKIEIEIKKKEEKEKEKIIIEKIIEKKKE 0 0.380 sv11 EEIEEKIKKKIKKKKKKIIIIIIKIKKIIIEIKIEEEEEEEEEEEEKKIK 0.5 0.380 sv12 EEEEEEEEEEEEEEEEEIIIIIIIIIIIIIIIIKKKKKKKKKKKKKKKKK 1.0 0.380 sv13 EKEKEIKEIKEKEEKKIEIIKIEIIIKEIKEIIEKIIIKEEKKIIIIIEK 0 0.453 sv14 KIIIKKKIIKKIKKIEEEEEEEEEEIEKKKEKIIIIIIEIKIIIEEIKKI 0.5 0.453 sv15 KKKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEEE 1.0 0.453 sv16 EKEKEKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEKEKEK 0 0.489 sv17 EEEEEEIIIIEEEEEKKKKEEIIIIIIIIIIIIIIIIIIKKKKKKKKKKE 0.5 0.489 sv18 KKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEE 1.0 0.489 sv19 EKKIEIIKIKIIEIKEEEEIIKEIIKEIEKIKKIIIEIIIIIIEIKIKII 0 0.563 sv20 KKKKKKKKKIIIEIIIIEIIIIEIIKIKKIIIEIIEEEIEEEIEEIIIII 0.5 0.563 sv21 EEEEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKKKK 1.0 0.563 sv22 EKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEK 0 0.635 sv23 EEEEKKKKKKKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEEEEEEKKK 0.5 0.562 sv24 EEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKK 1.0 0.562 sv25 IKIIEIIKIEIIIIIIIIEKIIIIIIEKEIIIIKIEIKIIIIEKIIIIII 0 0.745 sv26 IEIIKKKKKKIIIIIKIIIIIIIIIEEIIEIEIIIIIIIIEEIIIIIIII 0.5 0.745 sv27 EEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKK 1.0 0.745 sv28 IIIIIEIIIIIIIIIEIIIIIIKIIIIIEIIIIIIIIKIIIIIIEIKKEK 0 0.817 sv29 IIIIIIIIIIIIIIIIIIIIIIIIIIIEIEIIIEIIIEIIIKKKKIIIKE 0.5 0.817 sv30 EEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKK 1.0 0.817 sv31 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII - 1.000
计量
- PDF下载量: 14
- 文章访问数: 2406
- HTML全文浏览量: 315