无序随机多肽组分相关的结构转变的蒙特卡洛模拟:以赖氨酸、谷氨酸和异亮氨酸组成的随机多肽为例

引用本文: 张鹏程, 郭佳, 朱根, 方文玉, 唐乾元, 鲍磊, 康文斌. 无序随机多肽组分相关的结构转变的蒙特卡洛模拟:以赖氨酸、谷氨酸和异亮氨酸组成的随机多肽为例[J]. 化学学报, 2020, 78(9): 994-1000. doi: 10.6023/A20060249 shu

Citation: Zhang Pengcheng, Guo Jia, Zhu Gen, Fang Wenyu, Tang Qianyuan, Bao Lei, Kang Wenbin. Monte Carlo Simulations of Composition-Related Structural Transition of Disordered Peptides: The Case Study of Random Peptides Composed of Lysine, Glutamic Acids and Isoleucine[J]. Acta Chimica Sinica, 2020, 78(9): 994-1000. doi: 10.6023/A20060249 shu

无序随机多肽组分相关的结构转变的蒙特卡洛模拟:以赖氨酸、谷氨酸和异亮氨酸组成的随机多肽为例

张鹏程 ^a, ,
郭佳 ^a, ,
朱根 ^a, ,
方文玉 ^a, ,
唐乾元 ^{c,
,} ,
鲍磊 ^{a,b,
,} ,
康文斌 ^{a,b,
,}

a.
湖北医药学院公共卫生与管理学院十堰 442000
b.
湖北省南水北调水源区生物医药研发检测共享平台十堰 442000
c.
东京大学综合文化研究科广域科学专攻相关基础科学系日本东京 153-8902

通讯作者: Tang, Qianyuan, wbkang@hbmu.edu.cn; Bao, Lei, bolly@whu.edu.cn; Kang, Wenbin, tangqianyuan@gmail.com

基金项目:

项目受国家自然科学基金（No.11947006）、湖北医药学院人才启动金项目（Nos.2019QDJZR12，2018QDJZR22）和湖北省教育厅科学技术研究项目（No.B2018434）资助.

摘要: 无序蛋白和折叠蛋白二者在结构和序列组成上存在着明显的差异.是疏水相互作用还是静电相互作用诱导了多肽结构的转变?在多肽结构转变过程中，疏水相互作用和静电相互作用各自发挥着什么样的作用?本工作以正（赖氨酸）、负（谷氨酸）和疏水性（异亮氨酸）的三种氨基酸为组分，产生了一系列电中性的无序随机多肽系统.利用全原子模型并采用蒙特卡洛方法进行了大规模计算模拟.结果表明，随着温度升高，多肽将从紧密构象转变到扩展构象.不同的多肽其转变温度依赖于疏水性氨基酸和带电氨基酸的比例.当平均疏水性低于临界疏水性时，转变温度低于室温；当平均疏水性大于临界疏水性时，转变温度高于室温.定量分析发现，临界疏水性数值与生物信息研究的结论是吻合的.此外，统计氨基酸残基之间的接触对数目表明，在多肽结构的转变过程中疏水作用发挥着主要作用.研究结果对蛋白质序列与结构关系的研究具有一定的理论指导意义，期望对基于序列的蛋白质全新设计提供参考.

关键词:

English

Monte Carlo Simulations of Composition-Related Structural Transition of Disordered Peptides: The Case Study of Random Peptides Composed of Lysine, Glutamic Acids and Isoleucine

Zhang Pengcheng ^a, ,
Guo Jia ^a, ,
Zhu Gen ^a, ,
Fang Wenyu ^a, ,
Tang Qianyuan ^{c,
,} ,
Bao Lei ^{a,b,
,} ,
Kang Wenbin ^{a,b,
,}

a.
Public Health and Management School, Hubei University of Medicine, Shiyan 442000, China
b.
Hubei Biomedical Detection Sharing Platform in Water Source Area of South to North Water Diversion Project, Shiyan 442000, China
c.
Department of Basic Science, Graduate School of Arts and Sciences, The University of Tokyo, Tokyo 153-8902, Japan

Corresponding author: Tang Qianyuan, wbkang@hbmu.edu.cn; Bao Lei, bolly@whu.edu.cn; Kang Wenbin, tangqianyuan@gmail.com

Received Date: 18 June 2020
Available Online: 15 September 2020
Fund Project:

Project supported by the National Natural Science Foundation of China (No. 11947006), the Cultivating Project for Young Scholar at Hubei University of Medicine (Nos. 2019QDJZR12, 2018QDJZR22), and the Natural Science Foundation of Hubei Provincial Department of Education (No. B2018434).

Abstract: Intrinsically disordered proteins (IDPs) are a unique class of proteins without stable native structures. Like globular proteins, the structure and the dynamics of IDPs are also encoded in their amino acid sequences. IDPs usually contain a larger proportion of hydrophilic or charged amino acids than globular proteins. Interestingly, even with the same hydrophobicity and number of charged residues, the differences in sequence arrangement can lead to different structures of the peptides. In this work, to model such an effect, we conduct molecular simulations based on a series of peptides with randomly composed of charged residues (including glutamic acids and lysines) and isoleucine. In the simulation, we use the ABSINTH (self-Assembly of Biomolecules Studied by an Implicit, Novel, and Tunable Hamiltonian) implicit solvation model and employ the all-atom Markov Chain Monte Carlo method with replica-exchange sampling. Our simulations clearly show a transition between the extended conformations to compact structures for each peptide. The corresponding transition temperature is found to be dependent on the portion of the hydrophobic and charged residues. When the mean hydrophobicity is larger than a certain threshold, the transition temperature is higher than the room temperature, and vice versa. Such a result has outlined the borderline between intrinsically disordered proteins and the folded proteins. It is also consistent with previous analysis based on bioinformatics techniques. Furthermore, the contributions of different kinds of interactions to the structural variation of peptides are analyzed based on the contact statistics and the charge-pattern dependence of the gyration radii of the peptides. Our simulation results imply that the hydrophobicity of the sequence dominates the order-disorder transitions of IDPs, while the charge distribution can also affect such transitions. Based on these results, we achieve a comprehensive understanding of the sequence-structure relation of the natural proteins and the underlying physics. Our results may broaden our perspective of the sequence-structure relation of protein systems and shed light on the design of both ordered and disordered proteins.

Key words:

1. 引言

蛋白质或多肽是由氨基酸脱水缩合形成的一种生物大分子. 在自然生理条件下由不同的氨基酸序列构成的蛋白质, 其结构特征有着差异并且发挥着不同的作用. 例如, 有些形成紧密的球形结构, 有些则是处于无序状态. 关于蛋白质序列与结构关系的研究一直是分子生物学、生物化学和生物物理学等学科的一个重要问题^[1-3]. 在球状蛋白折叠过程中, 漏斗形的能量面被提出并广泛应用于解释可溶性球状蛋白质的热力学和动力学问题^[4-15]. 近些年来, 研究发现内禀无序蛋白质(下文简称为无序蛋白)和无序多肽数量的逐渐增加^[16-26]. 在自然生理条件下, 这一类蛋白质表现为没有唯一的结构, 因此揭示蛋白质序列与结构关系变得更为复杂. 漏斗形能量面不再完全适用于揭示无序蛋白的热力学和动力学行为, 提出理解这一类蛋白质多样化结构特征的理论是人们一直关注的热点问题.

Uversky等^{[27, 28]}基于大量的生物信息学统计提出了蛋白质组分相关的二维相图. 随后Pappu等^{[29, 30]}通过大规模的分子模拟研究提出了蛋白质结构分类的三维相图. 这些相图都能对折叠蛋白和无序蛋白进行区分. 例如, 对无序蛋白的序列而言, 带电残基发挥着重要的作用^[30]. 无序蛋白的结构与序列的带电性质有着密切的联系. 例如, Pappu等^{[29, 30]}使用平均净电荷量(net charge per residue, NCPR)和带电残基比例(fraction of charged residues, FCR)为序参量广泛地研究过大量的无序多肽. Das等^{[29, 30]}发现带电残基的排列方式对无序蛋白结构有着一定的影响, 王炜课题组^[31]之前的研究也充分证实了这一现象. 此外, 关于蛋白质的疏水性如何调控蛋白质的结构有不同的观点. 在物理学上, 平均疏水性(mean hydrophobicity, H)和带电残基比例二者大致是呈负相关性关系, 疏水作用和静电作用都对蛋白质组分相关的结构转变有着贡献. Dill等^[32]认为球状蛋白的折叠过程中, 疏水作用发挥着重要角色. Ashbaugh等^{[33, 34]}认为考虑到抗衡离子凝聚作用, 带电残基数量的减少引起了多肽从无规卷曲到球形结构的转变. 课题组之前的研究重点关注了赖氨酸、谷氨酸和丙氨酸组分的无序随机多肽系统, 发现这一类随机多肽随着疏水作用增强多肽从扩展结构转变到球形结构^[20]. 在无序随机多肽结构的转变过程中, 疏水作用和静电作用到底是是怎样精密地调控多肽的结构的？这两种相互作用到底是谁占据着主导作用?

为了回答上述问题, 本工作系统地研究了由赖氨酸(Lys, K)、谷氨酸(Glu, E)和异亮氨酸(Ile, I)组成随机无序多肽. 基于ABSINTH (self-Assembly of Biomolecules Studied by an Implicit, Novel, and Tunable Hamiltonian)模型^[35], 利用全原子蒙特卡洛模拟方法研究了随机多肽的构象特征. 结果表明, 对每一条多肽, 随着温度的升高从紧密构象转变到扩展构象. 多肽的转变温度T_c依赖于疏水性氨基酸的比例以及净电荷量. 随着疏水性氨基酸数目的增加, 转变温度T_c相应的升高. 也就是说, 当平均疏水性H小于临界疏水性值H_c时, 多肽的转变温度几乎都很低(大约都在280 K); 当平均疏水性H大于临界疏水性值H_c时, 随着多肽疏水性H的增大转变温度升高到340 K. 定量地, 多肽从扩展结构到紧密转变的临界疏水性值与前人的研究结论是一致的^[20]. 统计分析了氨基酸残基之间接触对数目, 结果表明在多肽结构转变过程中, 疏水作用变化比较显著, 这侧面反映了对无序多肽的塌缩转变过程中, 疏水作用发挥着相对重要的作用. 此外, 不同带电残基的排列对多肽结构有着一定的调控效应. 具体的, 当疏水性较小时, 电荷的排列对多肽的结构有着显著的影响; 随着疏水性增大, 多肽结构的涨落特性逐渐消失. 总之, 在无序多肽结构转变过程中, 疏水作用对结构的塌缩转变起着主要作用, 而随疏水性增强, 电荷的排列对结构的影响逐渐消失.

2. 模型与方法

2.1 研究对象

为了考察在正常的生理pH环境条件下疏水作用和静电作用的竞争, 考虑了三种类型的氨基酸, 它们分别是两种带电的氨基酸(赖氨酸和谷氨酸)和一种电中性氨基酸(异亮氨酸). 这种氨基酸的组合方式类似于Das和王炜课题组之前的研究^{[20, 29, 30, 35, 36]}. 这里带电性质的选择对应生理条件的情形. 对每一条多肽的N端和C端, 分别利用乙酰基(ACE)和甲基(NME)进行保护. 本研究中, 产生了一系列链长l＝50的随机序列(共31条). 具体的序列信息参考表 1.

表 1

表 1 本工作研究的多肽系统的31条代表序列. 第一列表示序列标签; 第二列表示序列, 红色的表示谷氨酸, 蓝色的表示赖氨酸, 黑色的表示异亮氨酸; 第三列为序列相应的模式参数κ; 第四列为序列的平均疏水性H.

Table 1. The 31 sequences analyzed in this research. In the table, Column 1 shows the label of each sequence. Column 2 shows the sequence, with Glu (E) residues in red, Lys (K) residues in blue, and Ile (I) residues in black. Column 3 shows the κ-values. Column 4 shows the mean hydrophobicity.

下载: 导出CSV

Label	Sequence	k	H
sv1	EKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEK	0	0.089
sv2	KKKEEEEEEEEEKKKKKKKKKKKKKKEEKKEKKKKKEEEEEEEEKEEEEE	0.5	0.089
sv3	EEEEEEEEEEEEEEEEEEEEEEEEEKKKKKKKKKKKKKKKKKKKKKKKKK	1.0	0.089
sv4	EKEKEKEKEKEKEKEKEKEKEKIIIIIIEKEKEKEKEKEKEKEKEKEKEK	0	0.198
sv5	IEEEKEEKKKKKKKKEEEEEKKKKKKKKKKKKEIIIIEKIEEEEEEEEEE	0.5	0.198
sv6	KKKKKKKKKKKKKKKKKKKKKKIIIIIIEEEEEEEEEEEEEEEEEEEEEE	1.0	0.198
sv7	KIEKIEIEEKIEIKEEKEIEEEKIKEKKKKEEIKEKKKEKIKKEIEKKEE	0	0.271
sv8	EEEEEEEEEEKKKKKKKEIIIIIIIEEEEEKKKKKIIKKKKKKKKEEEEI	0.5	0.271
sv9	EEEEEEEEEEEEEEEEEEEEIIIIIIIIIIKKKKKKKKKKKKKKKKKKKK	1.0	0.271
sv10	IEIEIKIIIEKEIKIEEKEKKEKIEIEIKKKEEKEKEKIIIEKIIEKKKE	0	0.380
sv11	EEIEEKIKKKIKKKKKKIIIIIIKIKKIIIEIKIEEEEEEEEEEEEKKIK	0.5	0.380
sv12	EEEEEEEEEEEEEEEEEIIIIIIIIIIIIIIIIKKKKKKKKKKKKKKKKK	1.0	0.380
sv13	EKEKEIKEIKEKEEKKIEIIKIEIIIKEIKEIIEKIIIKEEKKIIIIIEK	0	0.453
sv14	KIIIKKKIIKKIKKIEEEEEEEEEEIEKKKEKIIIIIIEIKIIIEEIKKI	0.5	0.453
sv15	KKKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEEE	1.0	0.453
sv16	EKEKEKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEKEKEK	0	0.489
sv17	EEEEEEIIIIEEEEEKKKKEEIIIIIIIIIIIIIIIIIIKKKKKKKKKKE	0.5	0.489
sv18	KKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEE	1.0	0.489
sv19	EKKIEIIKIKIIEIKEEEEIIKEIIKEIEKIKKIIIEIIIIIIEIKIKII	0	0.563
sv20	KKKKKKKKKIIIEIIIIEIIIIEIIKIKKIIIEIIEEEIEEEIEEIIIII	0.5	0.563
sv21	EEEEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKKKK	1.0	0.563
sv22	EKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEK	0	0.635
sv23	EEEEKKKKKKKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEEEEEEKKK	0.5	0.562
sv24	EEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKK	1.0	0.562
sv25	IKIIEIIKIEIIIIIIIIEKIIIIIIEKEIIIIKIEIKIIIIEKIIIIII	0	0.745
sv26	IEIIKKKKKKIIIIIKIIIIIIIIIEEIIEIEIIIIIIIIEEIIIIIIII	0.5	0.745
sv27	EEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKK	1.0	0.745
sv28	IIIIIEIIIIIIIIIEIIIIIIKIIIIIEIIIIIIIIKIIIIIIEIKKEK	0	0.817
sv29	IIIIIIIIIIIIIIIIIIIIIIIIIIIEIEIIIEIIIEIIIKKKKIIIKE	0.5	0.817
sv30	EEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKK	1.0	0.817
sv31	IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII	-	1.000

在模拟中, 将多肽放置在半径为7.5 nm的球形盒子内. 为了考虑溶剂离子的影响, 本研究模拟了浓度为15 mmol/L的氯化钠溶液. 这一数值和生理浓度(150 mmol/L)有差别. 不过前人和王炜课题组之前对无序多肽的研究表明氯化钠的浓度对于谷氨酸和赖氨酸组成的随机多肽体系的结构特征没有显著影响^{[20, 29, 31]}. 因此, 本工作选择15 mmol/L的氯化钠浓度是合理的.

2.2 相互作用模型

为了刻画各种相互作用的效应, 本研究中使用了全原子模型. ABSINTH模型是一种成功用于刻画内禀无序多肽体系的隐式溶剂模型^[35]. 其能量表达式为:

$ {U_{{\rm{total}}}}{\rm{ = }}{U_{{\rm{tor}}}} + {U_{{\rm{Disp}}}} + {U_{{\rm{EV}}}}{\rm{ + }}{W_{{\rm{Solv}}}} + {W_{{\rm{el}}}} $

(1)

其中U_tor表示二面角扭转势能; U_Disp＋U_EV对应于修正的范德瓦尔斯相互作用势, U_Disp和U_EV分别表示短程吸引项和排斥项; W_Solv为ABSINTH模型中的平均场相互作用; W_el表示静电相互作用的贡献.

在本工作中也是采用了ABSINTH隐式水全原子模型. 即本工作研究中选择了abs3.2_opls.prm相互作用参数文件. 模拟过程中采用基于原子的软球势边界条件. 氨基酸残基原子间Lennard-Jones势和静电相互作用的截断距离分别设置为1 nm和1.4 nm. 溶液中盐离子和侧链部分净电荷之间的静电相互作用则没有采取截断设置^{[20, 29, 31]}.

2.3 模拟方法

模拟采用软件包CAMPARI2.0^[36]实现, 应用ABSINTH模型^[35]和OPLS-AA/L力场. 为了提高采样的效率, 利用温度副本交换采样方法(Replica-Exchange Monte Carlo, REMC)^[37-40]和马尔可夫链蒙特卡洛方法(Markov Chain Metropolis Monte Carlo, MCMC). REMC是一种增强采样技术, 采用的方法是在不同温度下对具有相似势能的体系进行采样. 通过这种方法, 体系可能会越过势能面上的能垒, 从而探索新的构象空间. 体系副本数目, 温度空间的范围和温度分布决定了副本之间的平均交换概率. 模拟体系的势能会随温度的增加而增加, 副本的温度分布应服从指数分布. 因此, 在模拟过程的温度副本交换方法(REMC)选择了从280 K到430 K的12个温度副本(280, 293, 298, 305, 315, 325, 335, 350, 365, 380, 395, 430), 低温区域副本比较密集, 而高温区域相对稀疏. 模拟的总步数为4.65×10⁷步, 相邻温度副本间每隔5×10⁴步交换一次构象. 由于模拟设置的初始构象是从完全随机的结构出发, 系统经过一定的模拟步数弛豫将达到平衡状态, 因此在统计分析时将模拟初始1.5×10⁶步舍掉, 这保证了后续统计分析是对平衡态结果的研究. 图 1给出了温度为298 K时I₅₀多肽系统回转半径随模拟步数的演化轨迹, 发现经过1.0×10⁶模拟步数时系统已弛豫到平衡状态. 在本工作中, 仅仅对常温(298 K)这一温度副本的情况进行了系统地讨论.

图 1

图 1. (A) 298 K温度时, I₅₀多肽的回转半径随着模拟步数的演化曲线. (B)表示截取了(A)图中0至1.0×10⁶模拟步数内弛豫时间段的曲线.

Figure 1. (A) The gyration radius R_g as function of the simulation steps (MC step) at T＝298 K for I₅₀ peptide, and (B) shows the relaxation process during the first 1.0×10⁶ steps of the simulation.

下载: 全尺寸图片幻灯片

2.4 刻画无序多肽的参量

为了描述多肽的序列和结构等特征, 引入了如下几个特征物理量. 平均净电荷量(NCPR)、归一化平均疏水性(H)、模式参数(κ)、回转半径(R_g)以及氨基酸残基接触对数(contact number, N_c). 在这些参量中, NCPR、H和κ用来描述无序多肽序列的组分和排列特征. 其中疏水性H是一个重要的序参量, 通过对序列中所有氨基酸的疏水性进行平均并归一化来定义. 对每一个氨基酸残基使用Kyte-Doolittle疏水性打分值^[41]. 本工作中为了简明起见, 将多肽序列的疏水性归一化处理, 其范围是[0, 1]. 也就是说, 异亮氨酸的疏水性为1、精氨酸的疏水性为0. 对应的本工作中的赖氨酸的疏水性为0.066、谷氨酸的疏水性为0.1111. 另外一个参量是平均净电荷量NCPR＝f_＋－f_-, 这里的f_＋和f_-分别表示序列中带正负电荷的氨基酸的占比. 当多肽链的疏水性水平保持不变时, 其回转半径依赖于正负电荷的排列情况^{[20, 29, 31]}, 在以前的研究中, 通常用模式参数κ表征序列中正负电荷的混合程度, 其定义如下^{[20, 29, 31]}:

$ \sigma {\rm{ = }}\frac{{{{({f_ + } - {f_ - })}^2}}}{{{{({f_ + } + {f_ - })}^2}}} $

(2)

$ {\sigma _i}{\rm{ = }}\frac{{{{({f_ + } - {f_ - })}_i}^2}}{{{{({f_ + } + {f_ - })}_i}^2}} $

(3)

$ \varDelta {\rm{ = }}\frac{{\sum\nolimits_{i = 1}^{{N_{{\rm{blob}}}}} {{{({\sigma _i} - \sigma )}^2}} }}{{{N_{{\rm{blob}}}}}} $

(4)

$ K{\rm{ = }}\frac{\varDelta }{{{\varDelta _{\max }}}} $

(5)

对每一条序列, 根据式(2), 我们可以求出其电荷分布的不对称程度, 它可以理解为某种“极化强度”. 类似地, 通过将序列划分为N_blob个不重复的片段来计算模式参数, 每个片段可以包含g＝5或者g＝6个氨基酸残基, 其中第i个片段的电荷不对称性σ_i可以由式(3)计算得出. 序列的整体电荷不对称性σ的方差Δ定义为式(4). 不同序列的电荷不对称性的方差Δ是不同的, 其中正负电荷完全分离的状态方差最大(记为Δ_max). 其余序列的模式参数κ定义为该序列的方差Δ除以Δ_max. 当赖氨酸和谷氨酸完全分离时, κ为1; 当赖氨酸和谷氨酸混合均匀时, κ接近于零.

除了上述序列特性相关的物理量之外, 也引入了一些结构相关的物理量. 在常温下, 这些多肽大多数是无序的, 之前大量的柔性聚合物的研究表明可以用回转半径来描述多肽的几何状态^{[29, 30, 35, 36, 42, 43]}. 也引入了残基接触对数目N_c来表示多肽结构中氨基酸残基接触的详细信息. 本工作中, 任何两个残基的重原子之间的距离小于等于0.5 nm, 则认为它们之间有接触. 通过分析不同氨基酸残基之间的接触对数目, 可以分析多肽内部何种相互作用占有主要地位.

3. 结果与讨论

3.1 无序随机多肽的构象塌缩转变

无序多肽通常没有确定的稳定结构(或者天然结构). 为了研究无序多肽序列与结构之间的关系, 在进行统计分析轨迹之前检查模拟采样的平衡性和收敛性是非常有必要的. 根据之前的研究经验以及参数设置^{[20, 29, 31]}, 本工作的蒙特卡洛模拟采样是足够而充分的. 对所有的多肽有着随着温度的升高, 结构从紧密转变到松散的普适的行为, 具体的参考之前文章的研究结果^{[20, 29, 31]}. 在论述之前, 值得说明的是仅仅研究了电中性的多肽系统(NCPR＝0). 为了描述无序多肽结构的转变情况, 利用统计物理方法计算了多肽的热力学性质参量. 例如, 在图 2(A)中展示了E₂₀I₁₀K₂₀序列中κ＝0.5的一条多肽比热随着温度的变化曲线. 可以看出, 在温度为T_c＝335 K处比热有一个峰值. 这个结果表明, 在这个温度值附近多肽结构涨落最大, 对应着结构转变. 对其余的无序多肽也会观察到结构转变的现象. 随着无序多肽系统的疏水残基和带电残基的数目的变化, 转变温度也会相应的变化. 图 2(B)给出了平均转变温度值<T_c>随着平均疏水性H的变化曲线. 这里的<T_c>表示是同一疏水性而不同模式参数κ的平均值. 结果表明, 对于平均疏水性较小的多肽, 其转变温度大约在280～300 K; 但是当平均疏水性大于临界值H_c时, 转变温度逐渐上升到340 K附近.

图 2

图 2. (A) E₂₀I₁₀K₂₀序列中κ＝0.5比热C_v与温度T关系曲线, 其中峰值对应系统的转变温度T_c. (B)平均转变温度<T_c>与平均疏水性H的关系曲线. (C) 回转半径<R_g>与平均疏水性H的关系曲线.

Figure 2. (A) The specific heat capacity C_v vs. the temperature T for the sequence E₂₀I₁₀K₂₀ with κ＝0.5. The transition temperature T_c corresponds to the position of the peak of the curve. (B) The averaged transition temperature <T_c> vs. the mean hydrophobicity H, and (C) the gyration radius <R_g> vs. the mean hydrophobicity H for electrically neutral EIK systems with different amino-acid compositions.

下载: 全尺寸图片幻灯片

3.2 无序随机多肽结构塌缩转变的相图

在图 2(B)中, 标注了H_c表示系统的临界转变疏水性值. 对于较小疏水性值的无序多肽, 因其转变温度小于实验室温度(300 K), 其结构较为扩展; 在常温下, 强疏水性值的无序多肽, 其结构比较紧密. 这一结论与回转半径的变化趋势是相吻合的. 在图 2(C)中, 给出了298 K温度下的所有多肽的回转半径平均值<R_g>随着平均疏水性H的变化曲线. 研究发现, 回转半径随着疏水性值升高而逐渐减小. 同时疏水性值较小时, 回转半径的涨落值较大. 与预期符合的是, 回转半径的变化趋势与图 2(B)给出的结构转变是一致的.

将所有模拟的数据放在以NCPR和H为序参量的二维相图中(如图 3所示). 研究发现, 结论与前人的研究是一致的^{[28, 29, 31, 44]}. 图 3中红色的虚线将多肽可及区域分为紧密构象和扩展构象两块区域. 在边界线左侧区域, 多肽回转半径比较大, 结构相对松散. 在边界线右侧区域, 多肽回转半径较小, 结构相对紧密. 这一边界线给出了多肽结构从无规卷曲到紧密球形的转变. 为了直观清晰, 在图 4中展示了模拟的典型结构. 可以看出, 随着疏水性增强(横轴表示H逐渐增大), 多肽结构逐渐从无规卷曲转变到球形折叠结构; 此外, 多肽序列中电荷的分布对结构的调控逐渐减弱. 例如, 图 4(A)表示(EK)₂₅序列的电荷分布对其构象有着明显的调控作用; 随着疏水性H增大, 多肽结构的涨落逐渐降低了并出现典型的二级结构.

图 3

图 3. 以平均疏水性(H)和平均净电荷量(NCPR)为序参量的二维相图. 蛋白质仅能出现在粉红色和青色的区域. 青色的三角形区域代表结构紧密的蛋白质. 粉色的多边形区域表示无序蛋白. 这两块区域通过红色的虚线划分. 图中的不同颜色的圆点表示本工作中所有多肽的模拟的平均回转半径的大小.

Figure 3. The phase diagram based on the hydrophobicity (H) and the net charge per residues (NCPR). The region with the pink (or cyan) color corresponds to the compositions of peptides with extended (or compact) conformations. As a reference, the boundary between the IDPs and folded proteins based on bioinformatical analysis is given as the red dashed line. All the simulated peptides are marked on the diagram with dots whose sizes are proportional to the average gyration radii of the peptides.

下载: 全尺寸图片幻灯片

图 4

图 4. T＝298 K情况下不同疏水性和电荷分布, 温度副本交换蒙特卡洛模拟的典型构象. 其中赖氨酸, 谷氨酸和异亮氨酸分别用蓝色、红色和灰色表示. 所有的结构都采用PyMOL软件绘图. (A) H＝0.08855, (B) H＝0.38021, (C) H＝0.81771, (D) H＝1.0. 对(A)～(C)而言, 上下两幅子图分别表示κ＝0和κ＝1的序列所对应的结构.

Figure 4. Representative conformations sampled from the simulation trajectories (T＝298 K) for electrically neutral peptides with different hydrophobicity. Here, the lysine (K), glutamate acid (E) and isoleucines (I) are colored in blue, red, and gray, respectively. The conformations are rendered with PyMOL package. (A) H＝0.08855, (B) H＝0.38021, (C) H＝0.81771, (D) H＝1.0. For (A)～(C), the upper and lower subfigures denote peptide sequences with κ＝0 and κ＝1, respectively.

下载: 全尺寸图片幻灯片

有趣的是, 对于无序多肽而言, 这一边界线将其分为两种类型的构象特征. 对于折叠蛋白质而言, 其天然结构比较紧密并且出现在右侧青色区域, 此外右侧区域也给形成折叠蛋白质给出了必要的条件. 这种无序多肽的结构转变给天然蛋白质的转变提供了基本的约束规则^{[13, 14]}. 在这种约束情况下, 天然的无序蛋白和折叠蛋白也可以通过上述的边界线来划分. 因此, 研究结果理性地刻画了蛋白质系统内部疏水作用和静电作用所发挥的效应.

3.3 疏水相互作用在组分相关的结构转变中作用

考虑到带电残基和疏水残基呈负相关性情况, 何种相互作用在上述的结构转变中发挥着主要作用是比较困难的. 为了明确静电和疏水何种相互作用在上述结构转变中发挥主导作用以及帮助人们理解结构转变的机制, 统计分析了各种类型氨基酸残基之间的接触对数目情况. 在图 5中, 给出了“疏水-疏水”(I-I)、“疏水-电荷”(I-charged)、“电荷-电荷”(charged-charged)以及所有的残基之间的接触对数目. 研究发现, 随着平均疏水性数值增加, 所有氨基酸残基间接触数目单调上升. 这表明随着疏水性增加, 多肽的紧密程度增加. 这与上述提到的随着疏水性增加多肽结构转变是一致的. 此外, 特别是当系统的平均疏水性大于0.4之后, “疏水-疏水”氨基酸之间的残基接触对数目占大多数. 总体来讲, “电荷-电荷”以及“疏水-电荷”氨基酸残基之间的接触对数目保持非常低的水平. 这一结果表明, 在上述组分相关的结构转变过程中疏水作用发挥着重要的作用, 在其构象转变过程中占据着主要地位.

图 5

图 5. 平均残基接触对数目N_c随着疏水性H变化的趋势. 三种不同类型的接触对数分别用不同的颜色区分: 异亮氨酸之间的接触对数目(红色的正方形)、异亮氨酸与带电残基之间的接触对数(黑色的圆形)、带电氨基酸残基之间的接触对数目(绿色的上三角形); 此外, 任意类型的残基接触对总数也在图中(蓝色的下三角形)标出.

Figure 5. The average number of contacts N_c vs. mean hydrophobicity H. We divided all contacts into three different types: isoleucine-isoleucine (red squares), isoleucine-charged residues (black circle), and contacts of charged residue pairs (green upper triangles). The total number of residue contacts is also plotted in the graph (blue down triangles).

下载: 全尺寸图片幻灯片

3.4 结构涨落对电荷排列情况的依赖性

为了进一步研究疏水作用和静电相互作用的竞争, 研究了不同疏水性值的多肽系统的回转半径与电荷排列情况之间的关系. 在图 6(A)中, 给出了回转半径与疏水性值、模式参数之间的关系. 数据结果表明, 数据点可以分为两个区域. 当多肽系统的平均疏水性小于0.45时, 对不同的模式参数κ回转半径涨落(fluctuation of the gyration radius, ΔR_g)变化比较大; 当多肽系统的平均疏水性大于0.45时, 所有的数据几乎汇合到一起形成一条线. 这表明在较小的疏水性时, 多肽系统的形状对正负电荷的排列情况比较敏感; 但是当疏水性大于临界疏水值时, 这种敏感行为逐渐消失. 在图 6(B)中给出了回转半径涨落值与平均疏水性的关系. 数据表明, 当平均疏水性值大于0.45时, 回转半径的涨落几乎不存在了. 这一临界疏水性值与图 2给出结论是一致的. 这个结果侧面反映了在组分依赖的结构转变前后, 静电相互作用所发挥的不同的作用.

图 6

图 6. (A) 多肽的回转半径R_g随着平均疏水性H的变化趋势, 图中不同颜色的数据点分别对应于不同κ值的情况. (B)回转半径的涨落值ΔR_g随着平均疏水性H的变化趋势.

Figure 6. (A) The gyration radius R_g vs. the mean hydrophobicity H for the peptides. The cases with different κ are given in various colors, as indicated by the legend. (B) The fluctuation of the gyration radius ΔR_g vs. the mean hydrophobicity H for the peptides.

下载: 全尺寸图片幻灯片

4. 结论

蛋白质系统内部存在着复杂的各种相互作用. 理解蛋白质内部的各种相互作用及它们之间的竞争是蛋白质物理中的一个重要问题. 为了刻画蛋白质系统中的疏水作用和静电作用发挥的角色, 以谷氨酸、赖氨酸和异亮氨酸三种代表性氨基酸组分出发, 构建一系列随机多肽序列, 利用全原子模型、温度副本交换及蒙特卡洛模拟方法, 研究了无序多肽序列与结构之间的关系. 研究表明, 随着多肽的疏水性增加, 多肽从扩展构象转变到紧密构象. 通过对各种序列变体的研究, 发现疏水相互作用在多肽的构象转变过程中发挥主要作用. 这种结构的转变与无序蛋白到折叠蛋白质转变是一致的, 并揭示了天然蛋白质中蕴含的序列与结构关系的基本物理图像. 此外, 分析疏水作用和静电作用在无序多肽构象转变过程中的贡献, 研究发现疏水作用在组分相关的结构转变过程中占有主导地位, 而静电相互作用在构象扩展的情况下也发挥重要的作用. 值得指出, 目前的研究仅仅是对电中性的无序随机多肽系统的研究, 对含有其他疏水性氨基酸的情况及其序列特征与“液-液相分离”之间关系的研究需要进一步的探索^[45-50]. 此外, 关于格点模型中的无序蛋白等生物大分子“液-液相分离”过程的蒙特卡洛模拟需要进一步开展和探索^{[51, 52]}. 期望本研究结论对基于序列出发的蛋白质序列设计或者蛋白质工程有着重要的指导意义^[51-54].

1. [1]
  Kister, A. E.; Potapov, V. Biochem. Soc. Trans. 2013, 41, 616. doi: 10.1042/BST20120308
2. [2]
  Sadowski, M. I.; Jones, D. T. Curr. Opin. Struct. Biol. 2009, 19, 357. doi: 10.1016/j.sbi.2009.03.008
3. [3]
  Shenoy, S. R.; Jayaram, B. Curr. Protein Pept. Sci. 2010, 11, 498. doi: 10.2174/138920310794109094
4. [4]
  Chu, X.; Gan, L.; Wang, E.; Wang, J. Proc. Natl. Acad. Sci. U. S. A. 2013, 110, E2342. doi: 10.1073/pnas.1220699110
5. [5]
  Daggett, V.; Fersht, A. Nat. Rev. Mol. Cell Biol. 2003, 4, 497. doi: 10.1038/nrm1126
6. [6]
  Daggett, V.; Fersht, A. R. Trends Biochem. Sci. 2003, 28, 18. doi: 10.1016/S0968-0004(02)00012-9
7. [7]
  Dinner, A. R.; Sali, A.; Smith, L. J.; Dobson, C. M.; Karplus, M. Trends Biochem. Sci. 2000, 25, 331. doi: 10.1016/S0968-0004(00)01610-8
8. [8]
  Leelananda, S. P.; Jernigan, R. L.; Kloczkowski, A. J. Comput. Biol. 2016, 23, 400. doi: 10.1089/cmb.2015.0209
9. [9]
  Li, H.; Helling, R.; Tang, C.; Wingreen, N. Science 1996, 273, 666. doi: 10.1126/science.273.5275.666
10. [10]
  Matouschek, A.; Serrano, L.; Fersht, A. R. J. Mol. Biol. 1992, 224, 819. doi: 10.1016/0022-2836(92)90564-Z
11. [11]
  Onuchic, J. N.; Luthey-Schulten, Z.; Wolynes, P. G. Annu. Rev. Phys. Chem. 1997, 48, 545. doi: 10.1146/annurev.physchem.48.1.545
12. [12]
  Schug, A.; Onuchic, J. N. Curr. Opin. Pharmacol. 2010, 10, 709. doi: 10.1016/j.coph.2010.09.012
13. [13]
  Wang, J.; Wang, W. Nat. Struct. Biol. 1999, 6, 1033. doi: 10.1038/14918
14. [14]
  Wang, J.; Wang, W. Adv. Phys. X 2016, 1, 444. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
15. [15]
  Wolynes, P. G. Biochimie 2015, 119, 218. doi: 10.1016/j.biochi.2014.12.007
16. [16]
  Apicella, A.; Marascio, M.; Colangelo, V.; Soncini, M.; Gautieri, A.; Plummer, C. J. J. Biomol. Struct. Dyn. 2017, 35, 1813. doi: 10.1080/07391102.2016.1196151
17. [17]
  Dyson, H. J.; Wright, P. E. Nat. Rev. Mol. Cell Biol. 2005, 6, 197. doi: 10.1038/nrm1589
18. [18]
  Gao, M.; Yang, F.; Zhang, L.; Su, Z.; Huang, Y. J. Biomol. Struct. Dyn. 2018, 36, 1171. doi: 10.1080/07391102.2017.1316519
19. [19]
  Jain, A.; Ashbaugh, H. S. J. Chem. Phys. 2008, 129, 174505. doi: 10.1063/1.3003577
20. [20]
  Kang, W. B.; He, C.; Liu, Z. X.; Wang, J.; Wang, W. J. Biomol. Struct. Dyn. 2019, 37 1956. doi: 10.1080/07391102.2018.1472669
21. [21]
  Khan, S. H.; Jasuja, R.; Kumar, R. J. Biomol. Struct. Dyn. 2017, 35, 2248. doi: 10.1080/07391102.2016.1214086
22. [22]
  Migliaccio, A. R.; Uversky, V. N. J. Biomol. Struct. Dyn. 2018, 36, 1617. doi: 10.1080/07391102.2017.1330224
23. [23]
  Oldfield, C. J.; Dunker, A. K. Annu. Rev. Biochem. 2014, 83, 553. doi: 10.1146/annurev-biochem-072711-164947
24. [24]
  Singh, I.; Singh, S.; Uversky, V. N.; Chandra, R. J. Biomol. Struct. Dyn. 2017, 1. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
25. [25]
  Uversky, V. N.; Oldfield, C. J.; Dunker, A. K. Annu. Rev. Biophys. 2008, 37, 215. doi: 10.1146/annurev.biophys.37.032807.125924
26. [26]
  Yacoub, H. A.; Al-Maghrabi, O. A.; Ahmed, E. S.; Uversky, V. N. J. Biomol. Struct. Dyn. 2017, 35, 836. doi: 10.1080/07391102.2016.1164077
27. [27]
  Uversky, V. N. Protein Sci. 2002, 11, 739. doi: 10.1110/ps.4210102
28. [28]
  Uversky, V. N.; Gillespie, J. R.; Fink, A. L. Proteins 2000, 41, 415. doi: 10.1002/1097-0134(20001115)41:3<415::AID-PROT130>3.0.CO;2-7
29. [29]
  Das, R. K.; Pappu, R. V. Proc. Natl. Acad. Sci. U. S. A. 2013, 110, 13392. doi: 10.1073/pnas.1304749110
30. [30]
  Mao, A. H.; Crick, S. L.; Vitalis, A.; Chicoine, C. L.; Pappu, R. V. Proc. Natl. Acad. Sci. U. S. A. 2010, 107, 8183. doi: 10.1073/pnas.0911107107
31. [31]
  Kang, W. B.; Wang, J.; Wang, W. Acta Phys. Sin. 2018, 67, 058701. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
32. [32]
  Yue, K.; Dill, K. A. Proc. Natl. Acad. Sci. U. S. A. 1995, 92, 146. doi: 10.1073/pnas.92.1.146
33. [33]
  Ashbaugh, H. S.; Asthagiri, D. J. Chem. Phys. 2008, 129, 204501. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
34. [34]
  Ashbaugh, H. S.; Hatch, H. W. J. Am. Chem. Soc. 2008, 130, 9536. doi: 10.1021/ja802124e
35. [35]
  Vitalis, A.; Pappu, R. V. J. Comput. Chem. 2009, 30, 673. doi: 10.1002/jcc.21005
36. [36]
  Vitalis, A.; Pappu, R. V. Annu. Rep. Comput. Chem. 2009, 5, 49. doi: 10.1016/S1574-1400(09)00503-9
37. [37]
  Jiang, P.; Yasar, F.; Hansmann, U. H. J. Chem. Theory Comput. 2013, 9, 3816. doi: 10.1021/ct400312d
38. [38]
  Mitsutake, A.; Okamoto, Y. Phys. Rev. E Stat. Nonlin Soft Matter Phys. 2009, 79, 047701. doi: 10.1103/PhysRevE.79.047701
39. [39]
  Nanias, M.; Czaplewski, C.; Scheraga, H. A. J. Chem. Theory Comput. 2006, 2, 513. doi: 10.1021/ct050253o
40. [40]
  Yoda, T.; Sugita, Y.; Okamoto, Y. Proteins 2007, 66, 846. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
41. [41]
  Kyte, J.; Doolittle, R. F. J. Mol. Biol. 1982, 157, 105. doi: 10.1016/0022-2836(82)90515-0
42. [42]
  Das, R. K.; Crick, S. L.; Pappu, R. V. J. Mol. Biol. 2012, 416, 287. doi: 10.1016/j.jmb.2011.12.043
43. [43]
  Pappu, R. V.; Wang, X.; Vitalis, A.; Crick, S. L. Arch. Biochem. Biophys. 2008, 469, 132. doi: 10.1016/j.abb.2007.08.033
44. [44]
  Jin, F.; Liu, Z. R.; Biophys. J. 2013, 104, 488. doi: 10.1016/j.bpj.2012.12.012
45. [45]
  Ruff, K. M.; Pappu, R. V.; Holehouse, A. S. Curr. Opin. Struct. Biol. 2019, 56, 1. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
46. [46]
  Choi, J. M.; Dar, F.; Pappu, R. V. PLOS Comp. Biol. 2019, 15, e1007028. doi: 10.1371/journal.pcbi.1007028
47. [47]
  Zhou, H. X.; Nguemaha, V.; Mazarakos, K.; Qin, S. B. Trends Biochem. Sci. 2018, 43, 499. doi: 10.1016/j.tibs.2018.03.007
48. [48]
  Dignon, G. L.; Zheng, W. W.; Best, R. B.; Kim, Y. C.; Mittal, J. Proc. Natl. Acad. Sci. U. S. A. 2018, 115, 9929. doi: 10.1073/pnas.1804177115
49. [49]
  Uversky, V. N. Curr. Opin. Struc. Biol. 2017, 44, 18. doi: 10.1016/j.sbi.2016.10.015
50. [50]
  张鹏程, 方文玉, 鲍磊, 康文斌, 物理学报, 2020, 69, 138701. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498Zhang, P. C.; Fang, W. Y.; Bao, L.; Kang, W. B. Acta Phys. Sin. 2020, 69, 138701(in Chinese). http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
51. [51]
  王贵昌, 崔永斌, 孙予罕, 钟炳, 化学学报, 1998, 56, 867. http://www.cnki.com.cn/Article/CJFDTotal-HXXB199809005.htmWang, G. C.; Cui, Y. B.; Sun, Y. H.; Zhong, B. Acta Chim. Sinica 1998, 56, 867(in Chinese). http://www.cnki.com.cn/Article/CJFDTotal-HXXB199809005.htm
52. [52]
  曹达鹏, 汪文川, 段雪, 矫庆泽, 化学学报, 2001, 59, 297. http://www.cnki.com.cn/Article/CJFDTotal-HXXB200102026.htmCao, D. P.; Wang, W. C.; Duan, X.; Jiao, Q. Z. Acta Chim. Sinica 2001, 59, 297(in Chinese). http://www.cnki.com.cn/Article/CJFDTotal-HXXB200102026.htm
53. [53]
  王大成, 蛋白质工程, 化学工业出版社, 北京, 2008, p. 65 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498Wang, D. C. Protein Engineering, Vol. 1, Chemical Industry Press, Beijing, 2008, p. 65(in Chinese). http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498
54. [54]
  邓海游, 贾亚, 张阳, 物理学报, 2016, 65, 178701. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498Deng, H. Y.; Jia, Y.; Zhang, Y Acta Phys. Sin. 2016, 65, 178701(in Chinese). http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=DE20101005498

图 1 (A) 298 K温度时, I₅₀多肽的回转半径随着模拟步数的演化曲线. (B)表示截取了(A)图中0至1.0×10⁶模拟步数内弛豫时间段的曲线.

Figure 1 (A) The gyration radius R_g as function of the simulation steps (MC step) at T＝298 K for I₅₀ peptide, and (B) shows the relaxation process during the first 1.0×10⁶ steps of the simulation.

下载: 全尺寸图片幻灯片

图 2 (A) E₂₀I₁₀K₂₀序列中κ＝0.5比热C_v与温度T关系曲线, 其中峰值对应系统的转变温度T_c. (B)平均转变温度<T_c>与平均疏水性H的关系曲线. (C) 回转半径<R_g>与平均疏水性H的关系曲线.

Figure 2 (A) The specific heat capacity C_v vs. the temperature T for the sequence E₂₀I₁₀K₂₀ with κ＝0.5. The transition temperature T_c corresponds to the position of the peak of the curve. (B) The averaged transition temperature <T_c> vs. the mean hydrophobicity H, and (C) the gyration radius <R_g> vs. the mean hydrophobicity H for electrically neutral EIK systems with different amino-acid compositions.

下载: 全尺寸图片幻灯片

图 3 以平均疏水性(H)和平均净电荷量(NCPR)为序参量的二维相图. 蛋白质仅能出现在粉红色和青色的区域. 青色的三角形区域代表结构紧密的蛋白质. 粉色的多边形区域表示无序蛋白. 这两块区域通过红色的虚线划分. 图中的不同颜色的圆点表示本工作中所有多肽的模拟的平均回转半径的大小.

Figure 3 The phase diagram based on the hydrophobicity (H) and the net charge per residues (NCPR). The region with the pink (or cyan) color corresponds to the compositions of peptides with extended (or compact) conformations. As a reference, the boundary between the IDPs and folded proteins based on bioinformatical analysis is given as the red dashed line. All the simulated peptides are marked on the diagram with dots whose sizes are proportional to the average gyration radii of the peptides.

下载: 全尺寸图片幻灯片

图 4 T＝298 K情况下不同疏水性和电荷分布, 温度副本交换蒙特卡洛模拟的典型构象. 其中赖氨酸, 谷氨酸和异亮氨酸分别用蓝色、红色和灰色表示. 所有的结构都采用PyMOL软件绘图. (A) H＝0.08855, (B) H＝0.38021, (C) H＝0.81771, (D) H＝1.0. 对(A)～(C)而言, 上下两幅子图分别表示κ＝0和κ＝1的序列所对应的结构.

Figure 4 Representative conformations sampled from the simulation trajectories (T＝298 K) for electrically neutral peptides with different hydrophobicity. Here, the lysine (K), glutamate acid (E) and isoleucines (I) are colored in blue, red, and gray, respectively. The conformations are rendered with PyMOL package. (A) H＝0.08855, (B) H＝0.38021, (C) H＝0.81771, (D) H＝1.0. For (A)～(C), the upper and lower subfigures denote peptide sequences with κ＝0 and κ＝1, respectively.

下载: 全尺寸图片幻灯片

图 5 平均残基接触对数目N_c随着疏水性H变化的趋势. 三种不同类型的接触对数分别用不同的颜色区分: 异亮氨酸之间的接触对数目(红色的正方形)、异亮氨酸与带电残基之间的接触对数(黑色的圆形)、带电氨基酸残基之间的接触对数目(绿色的上三角形); 此外, 任意类型的残基接触对总数也在图中(蓝色的下三角形)标出.

Figure 5 The average number of contacts N_c vs. mean hydrophobicity H. We divided all contacts into three different types: isoleucine-isoleucine (red squares), isoleucine-charged residues (black circle), and contacts of charged residue pairs (green upper triangles). The total number of residue contacts is also plotted in the graph (blue down triangles).

下载: 全尺寸图片幻灯片

图 6 (A) 多肽的回转半径R_g随着平均疏水性H的变化趋势, 图中不同颜色的数据点分别对应于不同κ值的情况. (B)回转半径的涨落值ΔR_g随着平均疏水性H的变化趋势.

Figure 6 (A) The gyration radius R_g vs. the mean hydrophobicity H for the peptides. The cases with different κ are given in various colors, as indicated by the legend. (B) The fluctuation of the gyration radius ΔR_g vs. the mean hydrophobicity H for the peptides.

下载: 全尺寸图片幻灯片

Label	Sequence	k	H
sv1	EKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEKEK	0	0.089
sv2	KKKEEEEEEEEEKKKKKKKKKKKKKKEEKKEKKKKKEEEEEEEEKEEEEE	0.5	0.089
sv3	EEEEEEEEEEEEEEEEEEEEEEEEEKKKKKKKKKKKKKKKKKKKKKKKKK	1.0	0.089
sv4	EKEKEKEKEKEKEKEKEKEKEKIIIIIIEKEKEKEKEKEKEKEKEKEKEK	0	0.198
sv5	IEEEKEEKKKKKKKKEEEEEKKKKKKKKKKKKEIIIIEKIEEEEEEEEEE	0.5	0.198
sv6	KKKKKKKKKKKKKKKKKKKKKKIIIIIIEEEEEEEEEEEEEEEEEEEEEE	1.0	0.198
sv7	KIEKIEIEEKIEIKEEKEIEEEKIKEKKKKEEIKEKKKEKIKKEIEKKEE	0	0.271
sv8	EEEEEEEEEEKKKKKKKEIIIIIIIEEEEEKKKKKIIKKKKKKKKEEEEI	0.5	0.271
sv9	EEEEEEEEEEEEEEEEEEEEIIIIIIIIIIKKKKKKKKKKKKKKKKKKKK	1.0	0.271
sv10	IEIEIKIIIEKEIKIEEKEKKEKIEIEIKKKEEKEKEKIIIEKIIEKKKE	0	0.380
sv11	EEIEEKIKKKIKKKKKKIIIIIIKIKKIIIEIKIEEEEEEEEEEEEKKIK	0.5	0.380
sv12	EEEEEEEEEEEEEEEEEIIIIIIIIIIIIIIIIKKKKKKKKKKKKKKKKK	1.0	0.380
sv13	EKEKEIKEIKEKEEKKIEIIKIEIIIKEIKEIIEKIIIKEEKKIIIIIEK	0	0.453
sv14	KIIIKKKIIKKIKKIEEEEEEEEEEIEKKKEKIIIIIIEIKIIIEEIKKI	0.5	0.453
sv15	KKKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEEE	1.0	0.453
sv16	EKEKEKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEKEKEK	0	0.489
sv17	EEEEEEIIIIEEEEEKKKKEEIIIIIIIIIIIIIIIIIIKKKKKKKKKKE	0.5	0.489
sv18	KKKKKKKKKKKKKKIIIIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEEE	1.0	0.489
sv19	EKKIEIIKIKIIEIKEEEEIIKEIIKEIEKIKKIIIEIIIIIIEIKIKII	0	0.563
sv20	KKKKKKKKKIIIEIIIIEIIIIEIIKIKKIIIEIIEEEIEEEIEEIIIII	0.5	0.563
sv21	EEEEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKKKK	1.0	0.563
sv22	EKEKEKEKEKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEKEKEKEKEK	0	0.635
sv23	EEEEKKKKKKKIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIEEEEEEKKK	0.5	0.562
sv24	EEEEEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKK	1.0	0.562
sv25	IKIIEIIKIEIIIIIIIIEKIIIIIIEKEIIIIKIEIKIIIIEKIIIIII	0	0.745
sv26	IEIIKKKKKKIIIIIKIIIIIIIIIEEIIEIEIIIIIIIIEEIIIIIIII	0.5	0.745
sv27	EEEEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKKKK	1.0	0.745
sv28	IIIIIEIIIIIIIIIEIIIIIIKIIIIIEIIIIIIIIKIIIIIIEIKKEK	0	0.817
sv29	IIIIIIIIIIIIIIIIIIIIIIIIIIIEIEIIIEIIIEIIIKKKKIIIKE	0.5	0.817
sv30	EEEEEIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIKKKKK	1.0	0.817
sv31	IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII	-	1.000

下载: 导出CSV

扫一扫看文章

计量

PDF下载量: 19
文章访问数: 7461
HTML全文浏览量: 940

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142