河北省自然科学基金(F2008000895)
- 作品数:2 被引量:12H指数:2
- 相关作者:洪文学孟辉王立强更多>>
- 相关机构:燕山大学更多>>
- 发文基金:河北省自然科学基金国家自然科学基金更多>>
- 相关领域:医药卫生自动化与计算机技术更多>>
- 蛋白质组学质谱数据预处理技术综述被引量:10
- 2009年
- 基于质谱技术的蛋白质组学数据分析,是识别新型生物标记物模式的有效手段。质谱仪检测的数据含有大量潜在信息,但数据很容易被系统误差和噪声污染。蛋白质组学质谱数据预处理的目的在于抑制噪声、数据简约和增加谱可比性等,是增强生物学相关信息的至关重要步骤。只依赖质谱仪中的软件进行数据预处理存在一定局限,需要额外工具辅助。从数据简约、谱线平滑、基线校正、标准化、谱峰提取与量化、谱峰联配等方面介绍典型的预处理技术,对预处理方法存在的问题进行讨论,并就发展趋势进行展望。
- 孟辉洪文学
- 关键词:数据预处理数据质量
- 基于径向坐标可视化的高维数据分析方法被引量:2
- 2010年
- 针对模式分类算法不直观的问题,提出一种基于径向坐标可视化分析高维数据的方法。由最大似然原理估计高维数据的本征维数,用较少的变量结合径向坐标可视化方法对高维数据进行可视化降维分析。在径向坐标中揭示高维数据集中类别和特征间的关系,寻找基于不同特征排列顺序的最优映射,并结合多种机器学习方法对数据集进行分类。应用于UCI数据库中的6个数据集的结果表明,该方法具有较好的可视化和分类效果。
- 孟辉王立强洪文学
- 关键词:可视化高维数据