国家自然科学基金(81172767)
- 作品数:15 被引量:152H指数:7
- 相关作者:李康侯艳武晓岩张涛李贞子更多>>
- 相关机构:哈尔滨医科大学山东大学中国人民解放军第二炮兵总医院更多>>
- 发文基金:国家自然科学基金国家科技支撑计划更多>>
- 相关领域:医药卫生自动化与计算机技术理学更多>>
- 基于偏最小二乘分析的FDR估计研究被引量:1
- 2015年
- 目的基于偏最小二乘模型(PLS)提出一种新的FDR估计方法,并对其准确性进行验证。方法利用偏最小二乘的vip评分筛选变量,结合permutation方法和后退法对筛选结果进行FDR估计。结果模拟实验表明,在变量之间独立时,PLS-FDR方法和三种单变量估计方法都能准确估计FDR;在变量之间存在线性关系时,PLS-FDR方法估计FDR仍然具有无偏性,而三种单变量分析方法则无法准确地进行估计。实例分析表明,PLS-FDR方法对高维数据分析能够提供重要信息。结论在线性数据结构下,使用本文给出的PLS-FDR方法能够得出多变量FDR估计结果。
- 张帆刘晋侯艳李康
- 关键词:偏最小二乘代谢组学
- 基于错分代价的HingeBoost算法在高维数据判别分析中的应用
- 2015年
- 目的探讨基于错分代价的HingeBoost算法在二分类高维数据中分类判别的效果。方法通过模拟试验和实际代谢组学数据分析,对HingeBoost算法、AdaBoost算法、支持向量机、随机森林四种方法进行比较,并用ROC曲线下面积、灵敏度、特异度和错误率评价。结果模拟试验和真实代谢组数据分析显示,HingeBoost算法内部参数错分代价能影响分类结果的判别,在线性结构、同时存在大量噪声变量时分类效果优于其他三种算法。结论 HingeBoost算法将错分代价引入模型,达到减少假阳性错误或假阴性错误的目的,同时有很强的抗噪声能力,适用于高维代谢组学数据分析,值得进一步研究。
- 郭冰李海龙侯艳李康
- 基于小波变换的代谢组色谱指纹图谱的判别分析
- 2013年
- 目的探索小波变换在代谢组学超高效液相色谱信号分析中的作用。方法将卵巢癌和卵巢囊肿的色谱数据使用不同的连续小波基函数和不同尺度变换,随机抽取一定数量的训练数据,采用随机森林(RF)方法进行特征筛选建立模型,最后对测试数据集进行判别分析,计算ROC曲线下面积AUC值。结果经过小波变换预处理后的数据建模分类效果明显优于原始数据,其中墨西哥帽(mexh)小波变换分类效果最好。结论基于小波变换的代谢组特征提取方法能够明显提高模型的判别能力,具有研究价值。
- 孙凤宇李贞子侯艳李康
- 关键词:小波变换色谱
- 代谢组学数据分析的统计学方法被引量:45
- 2014年
- 代谢组学是近年发展快速的一门学科,目前在医学、植物学、微生物学、毒理学、药物研发等诸多领域中得到了广泛的应用。代谢组学研究产生大量的数据,这些数据具有高维、小样本、高噪声等复杂特征。如何从复杂的代谢组学数据中提取出有价值的信息,筛选出潜在的生物标志物成为近年来代谢组学研究的热点和难点。据此,本文针对目前代谢组学数据分析中的常用统计学方法及其研究进展进行介绍。
- 柯朝甫张涛武晓岩李康
- 关键词:代谢组学生物标志物微生物学药物研发植物学毒理学
- OPLS方法的原理及其在代谢组学数据判别分析中的应用被引量:15
- 2014年
- 目的探讨orthogonal projection to latent structures(OPLS)方法的原理、特点及其在代谢组学高维数据分析中的应用。方法通过R语言编程实现OPLS方法,利用模拟试验探索OPLS的特性及适用条件,并通过实际数据进行验证。结果利用一个OPLS预测主成分的模型拟合效果与利用偏最小二乘(PLS)多个主成分的模型拟合效果相同,同时具有较好的判别能力,其得分图的可视化效果优于PLS。结论 OPLS能够有效去除自变量矩阵X中与因变量Y无关的信息,使模型变得简单、易于解释,同时具有较好的可视化效果,可有效地用于代谢组学数据分析中。
- 李俊南侯艳孙凤宇李康
- 关键词:ORTHOGONALPROJECTIONLATENT代谢组学
- 偏最小二乘判别分析交叉验证在代谢组学数据分析中的应用被引量:10
- 2014年
- 近年来,偏最小二乘判别分析(PLSDA)方法在代谢组学研究中得到了广泛的应用,并成为一种标准的高维数据分析方法。PLSDA是一个有监督的学习方法,在分析代谢组学数据时往往由于变量过多而出现过拟合现象。
- 柯朝甫武晓岩侯艳李康
- 关键词:偏最小二乘代谢组学维数
- PLS-DA模型四种诊断统计量在代谢组学应用中的比较被引量:7
- 2014年
- 目的比较PLS-DA模型四种诊断统计量在代谢组学数据分析中的检验效能和稳定性。方法采用双重交叉验证和置换检验的PLS-DA模型验证策略,并分别使用四种诊断统计量对模拟数据和实际数据进行分析。结果AUC统计量较误判数(率)、Q2和DQ2统计量具有更高的检验效能;同时,AUC统计量与其他三种诊断统计量相比较,具有更高的稳定性。结论 AUC统计量是PLS-DA模型验证过程中一种稳定有效的诊断统计量,推荐作为代谢组学研究中进行PLS-DA分析时的首选诊断统计量。
- 柯朝甫武晓岩李康
- 关键词:代谢组学
- 序贯式止血法用于腹腔镜卵巢囊肿剥除术的临床研究被引量:8
- 2013年
- 目的:探讨腹腔镜卵巢囊肿剥除术中采用序贯式止血法对卵巢功能的影响。方法:将100例行腹腔镜卵巢囊肿剥除术患者按照抽签法随机地均分为对照组与观察组,对照组给予传统双极电凝治疗,观察组采取序贯式止血法,靠近卵巢门的髓质出血镜下缝合,远离卵巢门行皮质渗血电凝处理。比较两组患者手术前后雌二醇(Estradiol,E2)、促卵泡激素(Follicle-stimulating hormone,FSH)、促黄体生成素(Luteotropic hormone,LH)及围绝经期综合征发生情况。结果:对照组术前与术后3个月及术后6个月E2、FSH及LH差异均具有统计学意义,观察组手术前后激素水平差异无统计学意义,且观察组术后与对照组术后上述指标差异均具有统计学意义;对照组患者术后月经紊乱、植物神经功能紊乱的发生率分别为14.00%与12.00%,观察组为2.00%及0%,两组差异具有显著的统计学意义。结论:序贯式止血法应用于腹腔镜卵巢囊肿剥除术中影响卵巢功能,效果显著,值得在临床上加以推广并应用。
- 姜彩霞麻莉丁晓萍海宁隋东强
- 关键词:腹腔镜卵巢囊肿剥除术卵巢功能
- 基于bootstrap方法的贝叶斯网络结构学习算法在构建基因调控网络中的应用被引量:3
- 2015年
- 目的探讨基于bootstrap重抽样方法的贝叶斯网络结构学习算法构建网络的性能,并将其应用于卵巢癌基因表达谱数据分析。方法通过模拟实验和实例验证本文给出的算法构建网络的有效性,同时将这种算法应用于构建基因调控网络。结果模拟实验显示,在样本量较小的情况下,基于bootstrap算法构建的贝叶斯网络明显优于普通贝叶斯方法构建的网络;实例分析结果也表明,应用本文的方法能够得到有价值的网络结构。结论应用本文给出的算法能够在样本量较少的情况下得出准确度较高的网络,同时能够给出网络结构中各条边置信度的估计值。
- 李海龙侯艳柯朝甫李康
- 关键词:贝叶斯网络BOOTSTRAP
- 随机梯度boosting算法在代谢组学研究中的应用被引量:6
- 2013年
- 目的探讨随机梯度boosting算法(SGB)对代谢组学数据分类判别和代谢物筛选的效果。方法每一次迭代均根据损失函数最小化原则得出"伪残差",并用最小二乘法对其构建基础分类器(决策树),最终组合各分类器形成随机梯度boosting模型。通过模拟实验和真实代谢组学数据的分析,与Adaboost、RF、SVM三种算法进行比较。结果无论是在模拟条件下还是真实数据中,随机梯度boosting算法的分类准确性都优于其他三种算法。算法可评价各代谢物重要性,有效地筛选出部分代谢物。结论随机梯度boosting算法适用于代谢组学数据研究,对疾病早期诊断、治疗和预后具有重要价值,值得进一步研究和探索。
- 章光明刘晋贾慧珣李康
- 关键词:代谢组学