闫晓光
- 作品数:2 被引量:17H指数:1
- 供职机构:哈尔滨医科大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:医药卫生生物学更多>>
- 几种差异基因分析方法及筛选效果的比较被引量:1
- 2008年
- 目的比较六种差异基因筛选方法的使用效果及适用性。方法用Monte-Carlo方法产生不同类型的模拟数据,分别用不同的方法计算、评价其优劣。结果多数情况下SAM法和稳健t检验表现出了最优的筛选能力,SAM-ROC法则表现出更好的稳定性。结论几种方法都能够有效地用于基因筛选,但各自的适应条件不同,综合看SAM法是基因筛选的首选方法,随机森林方法则具有较大的研究价值。
- 赵发林闫晓光李康
- 关键词:微阵列数据基因筛选
- 基因表达数据的随机森林逐步判别分析方法被引量:16
- 2007年
- 目的给出一种新的随机森林算法,它能在建模过程中自动对变量进行筛选,建立“最优”判断模型。方法采用变量重要性评分和逐步迭代算法选择有作用的变量;通过实际基因表达数据考核其应用效果,并使用R语言编程做模拟试验验证其有效性。结果三种疾病基因表达数据的判别模型,在包含很少量的基因情况下便获得了理想的分类效果;模拟试验则显示在类间区分度较大的情况下,随机森林逐步判别分析的效果明显,能有效地将有作用的变量保留在模型中,提高模型的判别效果;在类间区分度不够大的情况下分类效果提高不明显。结论随机森林逐步判别分析可以有效地应用于基因表达数据的基因筛选和分类研究,但要特别注意由随机波动对分析结果造成的影响。
- 武晓岩闫晓光李康
- 关键词:基因表达数据基因筛选