梁启浩
- 作品数:3 被引量:3H指数:1
- 供职机构:江南大学理学院更多>>
- 发文基金:江苏省普通高校研究生科研创新计划项目国家自然科学基金更多>>
- 相关领域:理学自动化与计算机技术更多>>
- 基于粒度空间的最优聚类指标研究被引量:1
- 2018年
- 本文在粒度空间理论的基础上,进行了基于粒度空间的最优聚类模型研究.具体包含以下三个内容:首先提出了基于类内偏差和类间偏差获取数据分层结构的优化聚类指标,进一步建立最优聚类模型,证明了该模型解的存在性,并给出了相应的算法;其次将发生在1902~2015年间同时含有HA与NA蛋白的甲型HIN1流感病毒序列作为实验数据库,应用本文提出的优化模型和算法构建了流感病毒蛋白系统的第一级结构和第二级结构,基于距离中心最近原理建立了签名病毒选取的优化模型,挑选签名病毒蛋白,并构建H1N1流感病毒的核心进化树;最后基于距离中心最近原则构建分类器以验证本文方法的有效性.实验结果表明:应用本文方法处理甲型H1N1流感病毒可得到非常好的分类结果,且正确率达到93.25%.这些为基于大数据的信息处理提供一整套全新的处理方法.
- 唐旭清梁启浩李阳
- 关键词:粒度空间多层结构
- 基于功率谱的蛋白质序列特征提取新方法被引量:1
- 2018年
- 采用分层聚类和熵评价方法进行基于功率谱的蛋白质序列特征提取新方法研究。具体包含以下3个内容:首先,基于经典的HP模型给出了氨基酸序列的数值序列表达;其次,采用离散傅里叶变换方法获取蛋白质序列的特征频谱,构造12维特征向量;最后,利用分层聚类法获取蛋白质序列的分层结构。这种新方法将基于功率谱的DNA序列特征提取方法推广到蛋白质序列上。通过基于19条动物线粒体脱氢酶亚基1和亚基4,以及11条β珠蛋白等3组数据的分层结构比较实验,结果表明,新方法在数据系统的分层结构的信息提取上优于基于功率谱的DNA序列分析方法。因此,新方法对确定未知基因的结构与功能有重要的生物意义。
- 梁启浩李阳唐旭清
- 关键词:DNA序列功率谱分层聚类蛋白质序列
- 基于功率谱的流感病毒蛋白质序列结构分析被引量:1
- 2017年
- 基于经典HP模型,本文采用离散傅里叶变换获取蛋白质特征,利用分层聚类方法进行蛋白质序列的结构分析。其目的是将自动信号频谱分析技术与层次聚类方法相结合,并应用到蛋白质序列结构分析中。通过流感病毒HA和NA蛋白质序列的实验结果表明:应用该方法可得到非常好的分类结果。这些研究为基于大数据的蛋白质序列的自动信息提取和结构分析提供基础。
- 梁启浩李阳唐旭清
- 关键词:流感病毒离散傅里叶变换分层聚类蛋白质序列