代志军
- 作品数:15 被引量:21H指数:3
- 供职机构:湖南农业大学更多>>
- 发文基金:国家教育部博士点基金湖南省自然科学杰出青年基金国家自然科学基金更多>>
- 相关领域:理学生物学医药卫生农业科学更多>>
- 基于逐步非线性回归的血管紧张素转化酶抑制肽QSAR建模被引量:1
- 2022年
- 线性特征选择方法可提升定量构效关系(QSAR)模型的预测能力,但易忽略特征(理化属性)与分子活性间的非线性关系。本文提出基于支持向量回归(SVR)的逐步非线性回归(SSNR)特征选择算法并用于降血压药物血管紧张素转化酶(ACE)抑制肽的QSAR研究。首先以具有不同背景的5组分子描述符分别表征肽序列,以SSNR实施特征选择,再通过智能一致性模型(ICM)对各组描述符对应子模型的预测活性进行加权整合,获得最终活性预测值。在ACE抑制二肽与三肽两个数据上的应用结果表明,SSNR获得的特征子集结合ICM策略可有效提升模型预测能力(二肽的平均Q_(pred)^(2)为0.675±0.002,三肽为0.663±0.013),优于遗传算法-偏最小二乘(0.538±0.049、0.599±0.047)与逐步线性回归(0.583±0.041、0.675±0.010)。最后基于抑制活性已知肽序列预测所有活性未知肽的活性,分析了高活性肽及其氨基酸偏好性,为人工合成潜在高活性ACE抑制肽提供可能的序列组合。
- 周恒巴庆芳袁哲明代志军
- 关键词:定量构效关系支持向量机血管紧张素转化酶抑制肽
- 高维特征非线性快速筛选及其在生物信息学应用
- 特征选择是数据挖掘和模式识别领域的研究热点之一。为了提高对高维数据所建模型的泛化推广能力,有必要去除无关、冗余特征。从m个特征中选取P(P≤m)个最优特征子集理论上有2m种可能,已知这是一个完全多项式非确定性问题,在m较...
- 代志军
- 关键词:基因表达谱蛋白质相互作用支持向量机
- 文献传递
- “互联网+”新引擎助力农业院校创新创业教育改革——来自湖南农业大学的实践与探索被引量:1
- 2020年
- 随着"双创"的整体、持续推进与乡村振兴战略的全面部署,国家对创新创业高质量发展、乡村振兴及创新人才培养进行了顶层设计与定位,为"互联网+农业"背景下的创新创业教育指明了方向。首先分析了目前创新创业教育改革中存在的壁垒;再基于湖南农业大学的实践与探索,创新地提出"互联网+"新引擎助力多维度的农业院校创新创业教育改革途径:普及"互联网+农业"知识,培养学生创新创业意识;建设"互联网+农业"背景下的个性化创新创业课程体系;培养具有"互联网+农业"思维的创新创业教师队伍;夯实具有"互联网+农业"特色的创新创业实践基地。以农业为特色进行探索,将成为农业院校创新创业教育改革取之不尽的源动力。
- 代志军刘晶曹成周玮李兰芝李晓刚
- 关键词:创新创业教育改革农业院校
- 有监督学习关键问题算法创新与应用
- 袁哲明周玮张红燕代志军王立峰陈渊
- 信息与大数据时代并不缺乏数据,缺少的是对数据深入分析、获取知识的有效算法。有监督学习广泛见于生物信息学、模式识别与预测等多个领域。对单因变量、多自变量非纵向数据集(y<,i>,x<,i,j>),i=1,2,…,n;j=1...
- 关键词:
- 关键词:生物信息学有监督学习
- 支持向量回归的改进及其在QSAR中的应用
- 2009年
- 支持向量回归(SVR)存在诸多缺陷。本文基于均方误差(MSE)最小原则与留一法发展了自动筛选最优核函数与自变量的方法,对SVR进行了改进并构建了SVR的基本应用模型,该模型有效性在定量构效关系(QSAR)研究中得到验证。
- 谭泗桥龙陈锋代志军谭显胜林雪梅
- 关键词:支持向量回归解释性
- 基于MADS-box诱饵与蛋白质相互作用的拟南芥花瓣发育分子网络拓展被引量:1
- 2015年
- 阐明花器官发育调控机理具重要的进化、发育和生态学意义。该文以拟南芥(Arabidopsis thaliana)花瓣发育为例,整合蛋白质互作、亚细胞定位、基因芯片和基因功能注释等数据库,通过组建蛋白质互作可信预测模型,获得拟南芥花瓣蛋白质互作网络,以含有MADS-box结构域蛋白为诱饵在网络中进行一级拓展,得到含38个蛋白质和67对互作的拓展网络。基于拓展网络,DAVID基因功能注释表明,多数蛋白质涉及的生物学过程与花发育调控相关;提取到19个候选四元互作,涉及ABCDE模型基因之外的8个基因,其中含MADS-box结构域的AGL16可能是B类基因新成员或其冗余;SEU、LUH、CHR4、CHR11、CHR17和AT3G04960为拟南芥花瓣AP1-AP3-PI-SEP四聚体的候选靶标基因。研究结果为深入解析拟南芥花瓣发育分子调控网络奠定了基础。
- 杨黎孙丛苇代志军何淼袁哲明
- 关键词:拟南芥MADS-BOX蛋白质相互作用
- 多肽一级结构表征与抗菌肽QSAM建模被引量:5
- 2012年
- 从整体上考虑多肽一级结构,提出了3种仅基于多肽氨基酸序列、计算简便、适于不等长肽和可捕获多肽上下文关联特征的多肽新描述子,即地统计学关联(GS-AA531)描述子、多尺度组分与关联(MSCC)描述子和地统计学关联与多尺度组分(GS-AA531-MSC)描述子.将其应用于2个抗菌肽体系(等长肽与不等长肽)的结构表征,并以支持向量回归建立QSAM模型.模型的拟合、留一法及独立测试结果表明,结合特征筛选的新描述子GS-AA531与GS-AA531-MSC的预测精度明显稳定且优于其它参比描述子,在多肽QSAM研究中具有广泛应用前景.
- 苏满秀王立峰代志军袁哲明柏连阳
- 关键词:抗菌肽支持向量回归
- 基于支持向量机的高维特征非线性快速筛选与肽QSAR建模被引量:9
- 2011年
- 以氨基酸的531个物理化学性质参数直接表征肽的结构,基于支持向量回归发展了一种新的高维特征非线性快速筛选方法,将其应用于苦味二肽和血管紧张素转化酶抑制剂2个肽体系的定量序效关系(QSAR)建模,各筛选获得10个意义明确的保留描述子.以保留描述子建立支持向量回归模型,其拟合精度、留一法交叉测试精度和外部预测精度较文献报道结果均有较大幅度提升,优势明显;对所建模型进行了非线性回归显著性测验、单因子相对重要性显著性测验和单因子效应分析,增强了模型的可解释性.新方法在肽、蛋白质QSAR建模等高维数据回归预测领域有广泛应用前景.
- 代志军周玮袁哲明
- 基于序列特征筛选与支持向量回归预测蛋白质折叠速率被引量:1
- 2014年
- 折叠速率预测对阐明蛋白质折叠机理意义重大.本文收集了115条目前已知折叠速率的蛋白质样本(包括二态、多态和混态蛋白),为了较全面地表征蛋白质分子的一级结构信息,提取序列长度、氨基酸残基多尺度组分、成对残基k-space特征与基于残基物理化学性质的地统计学关联总共9357维特征.经改进的二元矩阵重排过滤器和多轮末尾淘汰非线性筛选,获得23个物理化学意义明确的保留特征,建立的非线性支持向量回归模型Jackknife交叉验证的相关系数R=0.95,优于文献报道及其他参比特征选择方法.支持向量回归解释体系表明折叠速率与保留描述符的非线性回归极显著,分析了各保留描述符对折叠速率的影响,结果表明蛋白质折叠速率与序列长度、中短程关联特征、三联体残基组份特征等密切相关.
- 李咏周玮代志军陈渊王志明袁哲明
- 关键词:蛋白质折叠支持向量回归
- 基于支持向量回归的酚类化合物QSAR建模被引量:3
- 2011年
- 目的:采用定量构效关系(QSAR)方法探索酚类化合物的毒性与分子结构参数的关系。方法:基于支持向量回归(SVR)、依均方误差最小原则选择最优核函数,对酚类化合物及其衍生物进行了QSAR研究。结果:不同数据集选取的最优核函数有异,对小样本、非线性等问题,SVR具有较优的稳定性及预测能力,在酚类化合物及其衍生物的QSAR研究中得到了优于原文献方法的独立预测结果。结论:SVR模型具有较好的预测能力,在QSAR及相关研究中可得到更广泛应用。
- 李巍巍代志军谭显胜袁哲明
- 关键词:支持向量回归定量构效关系酚类化合物