国家自然科学基金(60234020)
- 作品数:53 被引量:323H指数:11
- 相关作者:阮晓钢李颖新李建更龚道雄刘全金更多>>
- 相关机构:北京工业大学安庆师范学院清华大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划安徽省教育厅科学研究项目更多>>
- 相关领域:自动化与计算机技术生物学医药卫生电子电信更多>>
- 用多模神经网络预测蛋白质二级结构被引量:11
- 2004年
- 提出了一个由7个BP神经网络组合成的多模神经网络的预测模型,同时给多模神经网络引进了较多的生物进化信息(Evolutionary information),即一方面引入了"profile"编码,这种编码被认为携带了较多的生物信息;另一方面引入了氨基酸之间的"距离"概念.它体现了输入层临近氨基酸的相互联系和影响.对从36个蛋白质提取的4 000个氨基酸的进行了预测研究.结果表明,与文献[1]的预测结果相比,本文的多模神经网络把蛋白质二级结构预测的平均精度从66.1502%提高到68.8903%.
- 孙海军阮晓钢
- 关键词:多模BP神经网络输入层蛋白质二级结构生物信息
- 一个基于基因表达谱的基因逻辑网络模型的建立与应用
- 2007年
- 基因之间除了线性关联作用关系外,还存在着非线性的逻辑关系.用这种逻辑关系构建的生物系统网络模型对研究细胞内的各种生物通路和细胞分子网络非常重要.首先,根据图着色原理确定了基因的低阶和高阶逻辑关系,然后应用结肠癌基因表达谱数据分析了51个癌基因和抑癌基因的逻辑关系,在此基础上构建了结肠癌基因表达的逻辑网络.通过这个网络模型发现了与KEGG数据库中结肠癌通路一致的转化生长因子信号通路,并分析了各生物通路成员之间错综复杂的关系.实验结果表明,基因逻辑网络模型在一定程度上揭示了结肠癌基因和抑癌基因之间并行、分叉等复杂的相互作用关系,反映了结肠癌发病的复杂分子机制,为分子生物医学家提供了一个参考模型.
- 阮晓钢王金莲李辉
- 关键词:结肠癌基因表达谱基因网络图着色
- 编码方式对蛋白质二级结构预测精度的影响被引量:15
- 2005年
- 为了比较在蛋白质二级结构预测中常用的氨基酸序列编码方式的优缺点,借助前向型BP神经网络对正交编码、5位编码、Codon(2种)编码和Profile编码5种氨基酸编码方式进行了对比分析.实验结果显示,用富含"生物进化信息"的Profile编码方式可以得到较高的预测结果,同时也表明,充分利用生物本身所具有的生物信息对提高蛋白质二级结构预测精度是非常重要的.
- 阮晓钢孙海军
- 关键词:蛋白质二级结构神经网络
- 一种基于遗传算法的进化计算模型
- 2005年
- 提出一种基于遗传算法的进化计算模型(ECM).在ECM的种群中,每个成员都根据其适应度值不同程度地影响着种群的进化.ECM定义了个体对进化的影响因子,并以个体的影响因子为参数定义了个体的形成算子.分析表明,ECM是采用算术交叉算子的两父辈遗传算法以及采用频率扫描交叉算子的多父辈交叉遗传算法的推广,形成操作是父代群体编码的凸组合.实验研究显示,ECM具有比经典遗传算法更强的优化计算功能.
- 龚道雄阮晓钢
- 关键词:遗传算法进化计算优化计算
- 氨基酸序列编码对蛋白质二级结构预测的影响
- 本文主要通过运用前向型BP神经网络来比较正交编码、5位编码、Codon(密码子)编码和 Profile编码等4种常用氨基酸序列络编码方式对蛋白质二级结构预测准确度的影响。实验结果表明: 用富含“生物进化信息”的Profi...
- 孙海军阮晓钢
- 关键词:蛋白质二级结构神经网络
- 文献传递
- 基于支持向量机的肿瘤亚型识别被引量:7
- 2004年
- 肿瘤亚型的准确判别对肿瘤的治疗具有重要意义。该文依据肿瘤的基因表达谱,研究了利用支持向量机进行肿瘤亚型识别的方法。该方法以基因蕴含的样本分类信息量为依据首先排除噪声基因,然后采用支持向量机作为分类器进行肿瘤亚型的识别。文章以急性白血病的基因表达谱数据为例,进行亚型识别并同已有的研究成果进行了对比。实验结果表明了该方法的可行性和有效性。
- 李颖新朱云华阮晓钢
- 关键词:支持向量机基因表达谱肿瘤
- 一种肿瘤基因表达数据的知识提取方法被引量:17
- 2004年
- 本文以多发性骨髓瘤的基因表达数据为例 ,利用数据挖掘技术 ,提出了一种针对基因表达数据进行知识发现的方法 .该方法通过计算基因的信息增益 ,结合神经网络 ,找出了特征基因集合 ,最后利用决策树进行特征规则的提取 ,给出了基于多发性骨髓瘤数据样本的产生式规则 ,为生物医学研究提供了一种分析和研究基因表达数据的参考方法 .实验结果表明了该方法的有效性 .
- 李颖新刘全金阮晓钢
- 关键词:DNA芯片基因表达数据挖掘神经网络多发性骨髓瘤
- 提取肿瘤分类特征基因的一种新方法
- 结合基因过滤和启发式k-均值聚类分析,提出一种提取肿瘤分类特征基因的新方法。首先对“信噪比”公式进行改进,对基因排序过滤得到信息基因;然后对信息基因进行启发式k-均值聚类分析降低冗余度,选取每类中到所有基因距离总和最小的...
- 李建更段艳华阮晓钢
- 关键词:微阵列肿瘤分类
- 文献传递
- 急性白血病的基因表达谱分析与亚型分类特征的鉴别被引量:25
- 2005年
- 本研究基于生物信息学理论 ,运用模式识别方法和计算技术 ,对急性白血病的基因表达谱数据进行分析 ,研究急性白血病的亚型识别与分类信息基因选取问题。首先去除无关基因 ,然后利用浮动顺序搜索算法搜索特征空间生成候选特征子集 ,最后以支持向量机作为分类器进行急性白血病的亚型识别 ,并以误识率为依据鉴别出了 5个包含完整分类信息的基因。实验结果表明 ,本研究鉴别出的 5个信息基因能以 10 0 %的正确率准确识别急性白血病亚型。
- 李颖新刘全金阮晓钢
- 关键词:急性白血病生物信息学信息基因基因表达谱
- 基于支持向量机的肿瘤分类特征基因选取被引量:61
- 2005年
- 依据基因表达谱有效建立肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因·针对该问题,在分析肿瘤基因表达谱特征的基础上,研究了肿瘤分类特征基因选取问题·首先,提出了一种新的类别可分性判据以滤除分类无关基因,并采用支持向量机作为分类器进行特征基因分类性能的检验·然后,采用两两冗余分析及基于支持向量机分类模型的灵敏度分析法进行冗余基因的剔除·以急性白血病亚型分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性·
- 李颖新阮晓钢
- 关键词:特征选取支持向量机基因表达谱肿瘤