叶子青
- 作品数:3 被引量:26H指数:3
- 供职机构:浙江大学化学工程与生物工程学系更多>>
- 发文基金:国家自然科学基金浙江省重点科技计划杭州市科技发展计划项目更多>>
- 相关领域:化学工程医药卫生理学更多>>
- 构建支持向量机-偏最小二乘法为药物构效关系建模被引量:14
- 2006年
- 为研究药物构效关系积累样本数据的过程中,需为小样本建模。此时较易造成过拟合,影响模型的预测性能和稳定性。为此可用偏最小二乘(PLS)法从样本数据中成对地提取最优成分,消除自变量间的复共线性,并有效的降维,然后应用最小二乘支持向量机对成对成分进行非线性回归,并以基于误差修正的策略调整,使之更有效地表达自、因变量间的非线性关系。由此构建为EB-LSSVM-PLS算法,所建模型的预报精度高,稳定性良好。将其应用于新型黄烷酮类衍生物的QSAR建模,效果令人满意,其泛化性能优于其它方法。
- 李剑陈德钊成忠叶子青
- 关键词:最小二乘支持向量机偏最小二乘小样本构效关系泛化性能
- 自适应模糊偏最小二乘方法在药物构效关系建模中的应用被引量:9
- 2005年
- 作为一种局部逼近方法,自适应神经模糊推理系统(ANFIS)适于为药物定量构效关系(QSAR)建模。描述药物分子结构的参数较多,常存在耦合关系,会增加建模难度,并影响模型的预报性能。为此,将ANFIS和偏最小二乘(PLS)相结合,先由PLS从样本数据中提取成分,再由ANFIS实现每对成分间的非线性映射,并基于输出误差进一步修正所提取的成分,使之对因变量具有最优的解释能力,由此构建为EBAFPLS方法。该法已成功地应用于HIV-1蛋白酶抑制剂的QSAR建模,效果良好,显示出很强的学习能力,所建模型的预报性能也优于其它方法。
- 成忠陈德钊吴晓华叶子青
- 关键词:自适应神经模糊推理系统ANFIS定量构效关系非线性映射QSAR
- 基于预处理的决策树在化学数据挖掘中的应用被引量:4
- 2005年
- 化学数据挖掘可从海量数据中提取蕴含的知识,决策树方法是一种重要的挖掘工具。鉴于决策树在处理连续数据上的局限性,本研究提出先进行预处理,将连续属性离散化,通过特征选择删除其冗余量,以此为基础构建决策树。该方法可防止决策树模型“过细”,使之具有良好的预报性能。将此方法应用于两个化学样品分类实例,效果良好。与贝叶斯分析和单一的决策树方法相比,其预报正确率有显著提高,且表达形式直观明确,易于理解和分析,适用于化学分类知识模式的挖掘。
- 李琳陈德钊束志恒叶子青
- 关键词:预处理决策树离散化