基于地统计学与支持向量回归的QSAR建模

陈渊 袁哲明 周玮 熊兴耀

引用本文: 陈渊, 袁哲明, 周玮, 熊兴耀. 基于地统计学与支持向量回归的QSAR建模[J]. 物理化学学报, 2009, 25(08): 1587-1592. doi: 10.3866/PKU.WHXB20090752 shu
Citation:  CHEN Yuan, YUAN Zhe-Ming, ZHOU Wei, XIONG Xing-Yao. A Novel QSAR Model Based on Geostatistics and Support Vector Regression[J]. Acta Physico-Chimica Sinica, 2009, 25(08): 1587-1592. doi: 10.3866/PKU.WHXB20090752 shu

基于地统计学与支持向量回归的QSAR建模

摘要:

基于主成分分析(PCA)、地统计学(GS)和支持向量回归(SVR), 提出了一种新的定量构效关系(QSAR)个体化预测方法——Weight-PCA-GS-SVR. 其基本思路是: 先以PCA降维并消除自变量间的信息冗余, 继以SVR经非线性主成分筛选去除与因变量无关的主成分, 再以保留主成分计算样本间的加权距离, 然后以高维GS确定公用变程; 每一个待测样本都以自身为中心从训练集中找出加权距离小于公用变程的私有k个近邻, 以SVR训练建模完成个体化预测. Weight-PCA-GS-SVR从行、列两个方向对模型进行了优化, 为自变量提供了一种新的加权方法, 为解决最优k近邻选择难题提供了新的思路, 并具有SVR原来的优点. 经3个化合物活性实例数据集验证, 新方法在所有参比模型中预测精度最高, 且明显优于文献报道结果, Weight-PCA-GS-SVR在QSAR等回归预测领域有较广泛的应用前景.

English

  • 加载中
计量
  • PDF下载量:  1524
  • 文章访问数:  2755
  • HTML全文浏览量:  66
文章相关
  • 发布日期:  2009-07-16
  • 收稿日期:  2009-03-16
  • 网络出版日期:  2009-05-26
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

/

返回文章