浙江省大学生科技创新项目(ZX090702006)
- 作品数:4 被引量:3H指数:1
- 相关作者:厉力华韩斌祝磊代琦来海锋更多>>
- 相关机构:杭州电子科技大学南佛罗里达大学更多>>
- 发文基金:浙江省大学生科技创新项目国家自然科学基金国家杰出青年科学基金更多>>
- 相关领域:医药卫生生物学更多>>
- 基于诊断结果相关性分析的肿瘤基因标志物提取方法
- 2010年
- 目的基于微阵列数据,提出提取肿瘤诊断结果相关的基因标志物。方法混合滤波和缠绕方法,采用奇异值分解,以基因和肿瘤诊断结果的相关强度为主要标准,辨识基因标志物,利用基于信息增益的随机森林法对分类率做辅助修正。本方法在3个公共数据库上和常用分类器上做了测试。结果 MonteCarlo统计实验表明,对于Colon数据集,本文方法在NN,RF分类器上显著优于t-test方法;在Prostate数据集上,本文方法在NB的分类器上显著优于对手,在其他数据集和分类器上本方法优于对手但不显著;而在基因稳定度指标上,本方法普遍优于对手。结论提出1种可以定量的,基于可视化的分析基因和诊断结果相关性的方法,与经典方法相比,本文方法提取的基因不仅具有较强的分类性能和对不同分类算法的适应性,而且在总体上也具有较好的基因稳定度。
- 韩斌陈岩来海锋厉力华祝磊代琦
- 关键词:肿瘤分类基因选择微阵列奇异值分解
- 基于磷脂质类数据的早期卵巢癌特征提取研究
- 2010年
- 卵巢癌是目前死亡率最高的妇科疾病之一,而如果得到早期诊断和治疗,卵巢癌患者的存活率可达90%。针对卵巢癌早期诊断问题,基于卵巢癌磷脂质类数据,提出了一种结合缠绕法和过滤法、按照诊断类别相关度挑选特征,然后依据特征标志物的分类率稳定度高低,提取用于诊断早期卵巢癌的特征子集的策略。该方法克服了分类率监督方法忽略生物相关性、依赖分类器易产生过拟合的不足,同时保持了较高的分类率。实验表明,该方法挑选的特征标志物包含更多的分类信息,其分类正确率达到88.9%,且比经典的分类率监督方法和差异表达方法在稳定性能上存在优势。此外,提出的新的标幺化方法去掉了批次差异,获得更好的分类效果,且所选的特征标志物得到生物学关联意义上的支持,具有较高的可信度和实用性。
- 陈淑飞韩斌厉力华Rebecca Sutphen祝磊代琦
- 关键词:卵巢癌稳定度奇异值分解MONTE
- 一种基于有监督奇异值分解和随机森林的卵巢癌磷脂代谢物特征提取方法被引量:3
- 2010年
- 卵巢癌是一种常见的妇科肿瘤,死亡率占各类妇科肿瘤的首位。选取既有较高的分类疾病模式能力又具有生物学关联的特征肿瘤标志物用于肿瘤的诊断是目前研究的重点。本研究针对卵巢癌磷脂代谢物数据的问题,提出了一种融合有监督奇异值分解和基于信息增益的随机森林决策的方法用于特征标志物的选择。首先应用有监督奇异值分解计算各标志物的权重值,并根据权重值粗选出候选标志物;其次应用基于信息增益的随机森林决策理论从候选标志物中选出特征标志物;最后通过SVM分类器测试,分类率高达90%以上。本研究方法与其他常用方法比较具有一定优势,其中一个明显的特点是所选特征标志物不但保持了较高的分类率,而且具有生物学关联意义,从而证实本研究方法具有较高的可行性和实用性。
- 来海锋韩斌厉力华陈岩SUTPHEN Rebecca祝磊代琦
- 关键词:奇异值分解特征提取卵巢癌
- 基于“极少”特征标志物的卵巢癌两步预测模型研究
- 2010年
- 卵巢癌是目前死亡率最高的妇科疾病之一,利用信息学手段挑选特征肿瘤标志物已被广泛用于包括卵巢癌在内的肿瘤分类、诊断研究。但是研究中单纯以提高分类率为指标而忽视敏感性和特异性的均衡,且模型为多变量或者复杂模型,成本过高,不太适合临床应用。为此,提出一种基于"极少"特征标志物的两步预测模型,利用先期提取的多个特征作敏感性和特异性测试,然后构建特征变量的两步预测模型。先用单个变量预测,在一个变量不能得到可靠结果时,才增加另一变量参与模型。实验显示,筛选出的PPE8+LPE4和PPE8+LPC0两对变量组合的敏感性和特异性显著、均衡,变量之间的相关性较小,且分类结果和4个变量的分类结果相当,与9个变量的分类率只差4%~5%。所提出的基于极少特征标志物的两步预测模型结构简单,在保持相同分类效果的前提下大大减少了用于预测的变量,为实际应用提供方便,同时在一定程度上节约了经济成本。
- 陈淑飞韩斌厉力华SUTPHEN Rebecca祝磊来海锋
- 关键词:敏感性特异性卵巢癌