陈岩
- 作品数:5 被引量:10H指数:3
- 供职机构:杭州电子科技大学自动化学院生物医学工程与仪器研究所更多>>
- 发文基金:国家自然科学基金国家杰出青年科学基金浙江省自然科学基金更多>>
- 相关领域:医药卫生自动化与计算机技术生物学更多>>
- 基于集成类随机森林方法的神经胶质瘤特征基因选择的研究被引量:4
- 2010年
- 神经胶质瘤(glioma)是一种严重的颅内肿瘤疾病,具有高复发率、高死亡率和低治愈率等特点。利用基因微阵列数据识别与神经胶质瘤相关的特征基因,对该疾病的临床诊断和生物医学研究将起到有益的参考和借鉴作用。作者针对神经胶质瘤数据,提出了一种集成类随机森林特征基因选择方法。首先应用有监督奇异值分解对数据进行降维并粗选出基因;其次应用类随机森林特征选择方法选出特征基因。实验结果显示,该方法对分类器的适应性强;对比其他方法,分类率优势明显;更重要的是,在选出的前50个特征基因中有39个基因与神经胶质瘤或肿瘤细胞生物过程存在着密切联系,证实该方法不仅保持了较高的分类率,而且保证了选择的特征基因具有很强的生物学关联意义,具有较高的可行性和实用性。
- 来海锋韩斌厉力华陈岩祝磊代琦
- 关键词:神经胶质瘤肿瘤诊断奇异值分解
- 基于filter-wrapper的两步特征变量提取方法被引量:5
- 2010年
- 特征变量选择是高维数据分类问题的核心,主要有过滤法和缠绕法两种特征变量选择方法。针对"过滤法与分类算法相互独立,不利于对分类性能优化,而缠绕法依赖于分类算法,在高维高噪的数据中容易过拟合"这个问题,为了能有效提取特征变量,提出了一种新的特征提取方法,即filter-wrapper两步法,先通过有监督奇异值分解方法降维去噪,粗选出一部分备选变量;再应用MonteCarlo决策树策略从备选变量中精选出重要的特征变量。通过以典型的高维高噪数据为例验证了该方法,实验结果表明了上述方法的可行性和有效性。
- 陈岩来海锋王清王卫伟
- 关键词:信息增益决策树特征提取
- 基于诊断结果相关性分析的肿瘤基因标志物提取方法
- 2010年
- 目的基于微阵列数据,提出提取肿瘤诊断结果相关的基因标志物。方法混合滤波和缠绕方法,采用奇异值分解,以基因和肿瘤诊断结果的相关强度为主要标准,辨识基因标志物,利用基于信息增益的随机森林法对分类率做辅助修正。本方法在3个公共数据库上和常用分类器上做了测试。结果 MonteCarlo统计实验表明,对于Colon数据集,本文方法在NN,RF分类器上显著优于t-test方法;在Prostate数据集上,本文方法在NB的分类器上显著优于对手,在其他数据集和分类器上本方法优于对手但不显著;而在基因稳定度指标上,本方法普遍优于对手。结论提出1种可以定量的,基于可视化的分析基因和诊断结果相关性的方法,与经典方法相比,本文方法提取的基因不仅具有较强的分类性能和对不同分类算法的适应性,而且在总体上也具有较好的基因稳定度。
- 韩斌陈岩来海锋厉力华祝磊代琦
- 关键词:肿瘤分类基因选择微阵列奇异值分解
- 一种基于有监督奇异值分解和随机森林的卵巢癌磷脂代谢物特征提取方法被引量:3
- 2010年
- 卵巢癌是一种常见的妇科肿瘤,死亡率占各类妇科肿瘤的首位。选取既有较高的分类疾病模式能力又具有生物学关联的特征肿瘤标志物用于肿瘤的诊断是目前研究的重点。本研究针对卵巢癌磷脂代谢物数据的问题,提出了一种融合有监督奇异值分解和基于信息增益的随机森林决策的方法用于特征标志物的选择。首先应用有监督奇异值分解计算各标志物的权重值,并根据权重值粗选出候选标志物;其次应用基于信息增益的随机森林决策理论从候选标志物中选出特征标志物;最后通过SVM分类器测试,分类率高达90%以上。本研究方法与其他常用方法比较具有一定优势,其中一个明显的特点是所选特征标志物不但保持了较高的分类率,而且具有生物学关联意义,从而证实本研究方法具有较高的可行性和实用性。
- 来海锋韩斌厉力华陈岩SUTPHEN Rebecca祝磊代琦
- 关键词:奇异值分解特征提取卵巢癌
- 基于有监督奇异值分解和类随机森林决策方法的肿瘤特征基因筛选研究
- 癌症是影响人类健康的主要疾病之一。DNA基因芯片的出现为人类疾病的诊断和防治开辟了全新的途径,基于DNA基因芯片技术的癌症研究已成为生物信息学研究的热点之一。
目前基因芯片数据的特征选择主要有filter和wrap...
- 陈岩
- 关键词:肿瘤基因芯片特征向量奇异值分解