武振宇
- 作品数:21 被引量:77H指数:6
- 供职机构:复旦大学公共卫生学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家杰出青年科学基金更多>>
- 相关领域:医药卫生生物学自动化与计算机技术文化科学更多>>
- 支持向量机在基因表达数据分类中的应用研究被引量:11
- 2007年
- 目的探讨支持向量机在基因表达数据分类研究中的应用条件和效果。方法使用支持向量机软件包,通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在含有大量无差异表达基因情况下对分类产生的影响。结果对四种疾病的真实基因表达数据的分类取得了良好的效果,模拟试验则显示了支持向量机对分类具有较高的准确性,但随无差异基因数量的增加其分类效果呈明显下降的趋势;在类间分离一定的情况下,差异表达基因数目较多、基因之间具有较高的相关性时,更容易获得好的分类效果。结论支持向量机在解决小样本、非线性及高维问题中表现出许多潜在的优势,可以有效地用于分析基因表达数据的分类问题。
- 武振宇李康
- 关键词:支持向量机基因表达数据
- 临床试验中安慰剂的使用和设置问题被引量:3
- 2008年
- 为保证临床试验的科学性和有效性,通常采用随机、双盲、安慰剂对照的方法,并视其为标准方法。由于临床试验的受试对象是人而不是动物,并且安慰剂效应的本质毕竟是通过无直接药理学作用的物质或改变治疗过程中的氛围达到一定的效果,如何在保证受试者权益的前提下尽可能实现试验的科学性,长期以来一直是一个广为关注和争论的问题。
- 武振宇李康
- 关键词:安慰剂对照药理学作用安慰剂效应受试者权益受试对象
- Boosting算法对卵巢癌代谢组数据的应用研究被引量:4
- 2012年
- 目的应用Boosting算法建立模型,对卵巢癌和非卵巢癌(卵巢囊肿和子宫肌瘤)患者的尿液代谢组数据进行分析,提取出具有生物学意义的代谢组分,为卵巢癌的早期诊断及疾病机理提供线索。方法将决策树与Boosting算法相结合,对患者的临床样品代谢组数据进行分析,并对代谢组分进行逐步筛选,得到鉴别卵巢癌患者的重要代谢组分。结果由Boosting模型得到的排序靠前的10个差异代谢组分,能够将卵巢癌与对照组患者进行较好的判别分类,其ROC曲线下面积达到了0.944。结论 Boosting模型可以有效地应用于卵巢癌代谢组数据,在保证较高的分类正确率的同时可以得到对分类起作用的重要的代谢组分。
- 武振宇贾慧珣朱骥
- 关键词:代谢组学BOOSTING
- 结直肠癌患者第二原发恶性肿瘤流行病学特征分析
- 2024年
- 目的了解中国结直肠癌患者第二原发恶性肿瘤的特征及分布情况,为结直肠癌患者的后续随访、监测和健康管理提供依据。方法收集1996—2015年在复旦大学附属肿瘤医院进行诊治的所有结直肠癌患者数据,分析比较不同年龄、性别、部位结直肠癌患者的第二原发恶性肿瘤的流行病学特征。采用R 4.2.2进行统计学分析。结果共纳入7890例结直肠癌患者,其中226例(2.86%)患者患有第二原发恶性肿瘤,且接受化疗(3.40%)和第一原发部位为结肠癌(3.33%)的患者第二原发恶性肿瘤发病比例更高。肺是最常见的第二原发恶性肿瘤部位(20.35%),其他易感部位依次为结肠、乳腺、胃、前列腺、直肠、甲状腺和肾等。第二原发恶性肿瘤与结直肠癌的中位间隔时间为3.25年,肺、甲状腺、结肠、前列腺、乳腺和肾的第二原发恶性肿瘤与结直肠癌的中位间隔时间为2~4年,直肠和胃的第二原发恶性肿瘤与结直肠癌的中位间隔时间为5.5~6年。结论第二原发恶性肿瘤在接受化疗和第一原发部位为结肠癌的患者中发生比例更高,且主要发生在肺、消化系统和泌尿生殖系统。各部位的中位间隔时间约为初始结直肠癌诊断后的2~6年,需在此期间内对第二原发恶性肿瘤易感部位进行密切监测。
- 郭星灵袁晶徐海峰武振宇
- 关键词:结直肠癌流行病学特征健康管理
- 反安慰剂效应在临床试验中的研究被引量:2
- 2012年
- 临床工作中,患者在服药后有时会出现一些不良反应,其中有些是由于药物的特殊药理作用导致的,但也有一些属于非特异性的不良反应。近些年来,随着对安慰剂效应研究的逐步深入,人们越来越注意到,"意识"在不良反应的发生中也起到了重要的作用,即反安慰剂效应的作用。本文将从几个不同方面阐述反安慰剂效应的作用及影响因素,并讨论应如何认识、处理临床治疗和临床试验中反安慰剂效应的问题。
- 武振宇贾慧珣
- 关键词:药物不良反应
- 高维数据特征提取方法SAM-SVM的应用研究
- 2011年
- 目的 探讨SAM与支持向量机相结合(SAM-SVM)的方法在高维数据中的变量筛选效果.方法采用R语言编程,根据SAM算法,按照变量重要性排序,通过支持向量机分类模型验证其筛选效果.经过多次迭代满足收敛条件时,自动选择"最优"模型.将该方法应用于真实高维数据考核其应用效果,并通过模拟试验验证其有效性.结果对3种疾病的真实高维基因表达数据分别采用上述方法进行变量筛选,均取得了良好的效果,模拟试验也显示使用筛选后的变量再利用支持向量机进行分类判别,具有较高的准确性.结论基于SAM的支持向量机逐步判别方法在解决小样本、非线性及高维问题中表现出许多潜在的优势,可以有效地用于分析高维基因表达数据的特征提取问题.
- 贾慧珣武振宇
- 关键词:支持向量机基因表达数据SAM特征提取
- 临床新药试验中非劣效性检验界值的确定方法被引量:7
- 2008年
- 侯艳武振宇李康
- 关键词:非劣效性新药试验界值试验药物
- 基于主成分分析-Logistic回归方法的人体农兽药化学污染物残留与高胆固醇血症关系的研究
- 2023年
- 目的基于主成分分析-Logistic(PCA-Logistic)回归组合分析策略探索人体农兽药化学污染物残留与高胆固醇血症之间的关系。方法研究数据来源于“降低成年超重者营养相关慢性病风险的适宜身体活动量研究”2018—2019年调查数据。选择有人口学信息、体格测量和血清农兽药化学污染物及血脂检测等数据的496名成年居民作为研究对象。采用常规Logistic与PCA-Logistic分别建立回归模型分析高胆固醇血症的危险因素,利用受试者工作特征曲线下面积(AUC)评价模型判别效果。结果PCA-Logistic回归分析结果显示对高胆固醇血症具有显著影响的农兽药化学污染物包括呋喃它酮、2-乙基己基二苯基磷酸酯(EHDPP)、全氟己烷磺酸(PFHxS)和4-氯苯氧乙酸(4-CPA)。PCA-Logistic回归模型对高胆固醇血症预测性能(AUC=0.736)优于常规Logistic回归模型的预测性能(AUC=0.695)。结论呋喃它酮、EHDPP、PFHxS、4-CPA等农兽药化学污染物残留是影响高胆固醇血症的重要危险因素,PCA-Logistic回归分析方法可有效应用于探索农兽药化学污染物残留与高胆固醇血症的关联性分析。
- 李梦梦牛然宋琪哲苏畅王惠君张兵武振宇
- 关键词:高胆固醇血症主成分分析
- 新药临床试验中安慰剂的使用与伦理思考被引量:7
- 2009年
- 新药临床试验中使用安慰剂是一个颇具争议的问题。结合国内外的研究情况,通过具体实例阐述了安慰剂的作用和机理,并讨论如何解决临床试验中与安慰剂设置有关伦理学的问题,旨在为我国临床试验制定相应的指导原则和标准提供参考。
- 范昕武振宇
- 关键词:新药临床试验安慰剂医学伦理
- 基于随机森林方法的常见人体中农兽药及化学污染物暴露与高尿酸血症的关联性研究
- 2023年
- 目的探索高尿酸血症(HUA)的影响因素,尤其是农兽药及化学污染物暴露与高尿酸血症的关联,分析机器学习方法对于农兽药及化学污染物暴露数据的分析效果。方法根据2018—2019年在石家庄和杭州进行的“降低成年超重者营养相关慢性病风险的适宜身体活动量研究”,分别采用传统Logistic回归和随机森林(RF)建立基本人口学变量和农兽药及化学污染物暴露对HUA发病的预测模型。模型区分效果由ROC曲线下面积(AUC)进行评估。结果RF结果显示,对HUA影响重要程度排名前5的因素依次为多西环素、4-氯苯氧乙酸酯、呋喃他酮、咪鲜胺和全氟癸酸浓度。RF模型的区分效果显著高于传统Logistic回归模型(AUC分别为0.934和0.735)。结论多西环素、4-氯苯氧乙酸酯、呋喃他酮、咪鲜胺和全氟癸酸、饮酒史、居住地为杭州、甘油三酯≥2.26 mmol/L等可能是HUA的危险因素。RF模型适用于农兽药及化学污染物暴露数据的分析,且较常规Logistic回归模型对于鉴别HUA患者具有显著提升的区分能力。
- 宋琪哲黄聪慧李梦梦苏畅王惠君张兵武振宇
- 关键词:高尿酸血症化学污染物LOGISTIC回归