中央高校基本科研业务费专项资金(2009ZM0189)
- 作品数:6 被引量:15H指数:2
- 相关作者:韦佳马千里刘利蔡先发杨创新更多>>
- 相关机构:华南理工大学惠州学院广东药学院更多>>
- 发文基金:中央高校基本科研业务费专项资金广东省自然科学基金广东省科技攻关计划更多>>
- 相关领域:自动化与计算机技术生物学医药卫生一般工业技术更多>>
- 边信息传播修正的半监督维数约减方法被引量:1
- 2011年
- 现有基于边信息的半监督维数约减算法大都是直接将保留边信息和数据拓扑结构的目标函数相加,因此数据拓扑结构中的错误连接不会因已知的边信息而得到修正.提出通过边信息传播及修正机制将边信息融入到数据拓扑结构图中的方法,从而在保留边信息的同时保留更为真实的数据拓扑结构信息.实验结果表明本文所提出的算法较之其它算法,对数据降维后用于分类时可取得较高的准确率,且算法对创建的KNN图中的参数K最具鲁棒性.
- 刘利韦佳马千里
- 关键词:半监督学习维数约减
- 一种改进距离的局部线性嵌入算法的基因表达谱数据分类被引量:2
- 2011年
- 针对基因表达谱样本数据少、维度高、噪声大的特点,维数约减十分必要。由于基因表达谱数据是以一种高维非线性的向量存在,传统的降维方法使得一些本质维数较低的高维数据无法投影到低维空间中,为此本文引入一种改进距离的局部线性嵌入(LLE)算法对其进行降维。由于原始的LLE方法对近邻个数参数非常敏感,为了增强算法对近邻参数的鲁棒性,文中提出了一种改进距离来度量样本点之间的距离,从而降低了样本点分布不均匀对算法的影响。实验结果表明,改进距离的LLE方法能够有效地提取分类特征信息,并能够在保持较高的分类正确率的前提下大幅度地降低基因数据的维数。
- 蔡先发韦佳文贵华李洁
- 关键词:局部线性嵌入特征提取
- 用于带边信息人脸数据的半监督维数约减算法被引量:1
- 2011年
- 提出了一种基于测地线距离的半监督维数约减算法,并将其用于带边信息的人脸数据的维数约减,此算法可以充分利用边信息和数据点之间的测地线距离,从而在保留边信息的同时保留更为真实的数据拓扑结构信息。在人脸数据库上的实验结果表明,本文所提出的算法对数据降维后用于分类时可取得比其他算法更高的准确率,且对创建的KNN图中的参数K最具鲁棒性。
- 刘利刘萍萍韦佳
- 关键词:测地线距离
- 基于流形学习的图像检索研究进展被引量:5
- 2010年
- 基于内容的图像检索是当前研究的热点,然而由于"语义鸿沟"问题而限制其检索能力的提高.而流形学习可以利用图像数据库中的数据,以及和用户交互的反馈信息获得用户的语义概念,从而提高检索性能.本文鉴于流形学习在图像检索中表现出的有效性,分析了近几年将流形学习应用到基于内容图像检索中的算法,从归纳和转导角度将相关内容分为两个类别,针对每个类别总结分析了相关算法,并总结了有待进一步研究的问题.
- 刘利韦佳马千里
- 关键词:流形学习流形排序
- 基于PCA和LDA方法的肿瘤基因表达谱数据分类被引量:2
- 2014年
- 目的基因芯片技术对医学临床诊断、治疗、药物开发和筛选等技术的发展具有革命性的影响。针对高维医学数据降维困难及基因表达谱样本数据少、维度高、噪声大的特点,维数约减十分必要。基于主成分分析(principal component analysis,PCA)和线性判别分析(1inear discriminant analysis,LDA)方法,有效解决了基因表达谱数据分类问题,并提高了识别率。方法分别引入PCA和LDA方法对基因表达谱数据进行降维,然后用K近邻(K-nearest neighbor,KNN)作为分类器对数据进行分类,并分别在乳腺癌和卵巢癌质谱数据上。结果在两类癌症质谱数据上应用PCA和LDA方法能够有效提取分类特征信息,并在保持较高分类正确率的前提下大幅度降低医学数据的维数。结论利用维数约减的方法对癌症基因表达谱数据进行分类,可辅助临床医生发现新的疾病特征,提高疾病诊断的正确率。
- 李志文蔡先发韦佳周怡
- 关键词:主成分分析线性判别分析维数约减
- 基于局部重构与全局保持的半监督判别分析方法被引量:5
- 2010年
- 为克服线性判别分析(LDA)只能利用有标记样本的缺点,提出一种基于局部重构与全局保持的半监督判别分析(LRGPSSDA)方法.LRGPSSDA通过最小化局部重构误差来确定邻域图的边权值,在保持数据集局部结构的同时保持其全局结构,具有对邻域参数的选择不敏感、所得投影子空间的维数不受样本类别数的限制等特点.相较现有的半监督判别分析方法(如SDA和UDA),LRGPSSDA的分类性能更好.在YaleB和CMUPIE标准人脸库上的实验结果验证了该算法的有效性.
- 韦佳杨创新马千里余国先
- 关键词:半监督学习