胡小生
- 作品数:19 被引量:88H指数:6
- 供职机构:佛山科学技术学院更多>>
- 发文基金:佛山市科技发展专项基金佛山市产学研专项基金国家级星火计划更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论更多>>
- 一种两层加权融合的排序算法
- 2012年
- 当前排序学习算法在学习时将样本集中的所有查询及其相关文档等同对待,忽略了查询之间以及其相关文档之间的差异性,影响了排序模型的性能。对查询之间的差异进行分析,同时考虑文档排序位置造成的资料被检视概率不同的差异特性,提出了一种两层加权融合的排序方法。该方法为每一个查询及其相关文档建立一个子排序模型,在此过程中,对文档赋予非对称权重,然后通过建立新的损失函数作为优化目标,利用损失函数调节不同查询产生损失之间的权重,最终实现多查询相关排序模型的加权融合。在标准数据集LETOR OHSUMED上的实验结果表明,所提方法在排序性能上有较大提升。
- 胡小生钟勇
- 关键词:信息检索
- 一种基于功能的可控委托模型
- 2012年
- 委托是RBAC模型需要支持的重要安全策略。针对现有RBAC委托模型在支持细粒度和权限传播可控性上存在的不足,提出一个基于功能的可控委托模型FBCDM,给出了模型的形式化定义和表示。该模型提供灵活的委托粒度、支持时间约束、强制委托约束和细粒度的自主委托约束,保证了多步委托过程中的收敛性和可控性。委托过程的日志记录增强了委托安全性。
- 胡小生
- 关键词:访问控制
- 基于加权聚类质心的SVM不平衡分类方法被引量:4
- 2013年
- 不平衡数据分类是机器学习研究的热点问题,传统分类算法假定不同类别具有平衡分布或误分代价相同,难以得到理想的分类结果.提出一种基于加权聚类质心的SVM分类方法,在正负类样本上分别进行聚类,对每个聚类,用聚类质心和权重因子代表聚类内样本分布和数量,相等类别数量的质心和权重因子参与SVM模型训练.实验结果表明,该方法使模型的训练样本具有较高的代表性,分类性能与其他采样方法相比得到了提升.
- 胡小生钟勇
- 关键词:不平衡数据分类支持向量机
- 基于模拟随机流的Markov图聚类方法研究
- 2013年
- 总结图聚类几种主要算法,在此基础上详细介绍了一种较新的图聚类算法——基于模拟随机流的M arkov图聚类算法(M CL),该算法是基于流这种自然现象的一种简单优美算法,应用在生物信息学网络聚类中比较高效。由于该算法具有运行速度慢、聚类数目过多的缺点,因此又介绍了一种改进的M CL算法——R-M CL算法。
- 温菊屏胡小生
- 关键词:转移概率矩阵
- 教育信息化绩效评价问卷信度与效度分析被引量:14
- 2010年
- 调查研究项目设计出调查问卷后,在大规模铺开使用前,需要取得一定量的数据对问卷进行信度及效度评估。对项目研究组设计的教育信息化绩效评价问卷进行了信度及效度分析。检验方法为,在佛山市52所中小学中进行问卷调查并收集数据,然后根据权重计算绩效分值,再检验其信度、效度系数。结果显示,问卷信度系数为0.806~0.931;效度分析4份问卷共同度均高于0.4,所提取因子能解释总方差60%以上。问卷信度、效度均较高,能反映教育信息化绩效指标水平。
- 张润晶张又又胡小生岑健林胡铁生
- 关键词:教育信息化绩效评价信度分析
- 基于边界样本选择的支持向量机加速算法被引量:5
- 2017年
- 针对支持向量机(Support Vector Machine,SVM)处理大规模数据集的学习时间长、泛化能力下降等问题,提出基于边界样本选择的支持向量机加速算法。首先,进行无监督的K均值聚类;然后,在各个聚簇内依照簇的混合度、支持度因素应用K近邻算法剔除非边界样本,获得最终的类别边界区域样本,参与SVM模型训练。在标准数据集上的实验结果表明,算法在保持传统支持向量机的分类泛化能力的同时,显著降低了模型训练时间。
- 胡小生钟勇
- 关键词:支持向量机聚类
- 一种基于无监督聚类和度量学习的迁移学习方法
- 本发明涉及一种基于无监督聚类和度量学习的迁移学习方法,先准备源域样本D<Sub>S</Sub>和目标域样本D<Sub>T</Sub>;再使用主成份分析方法降低全部样本的维度;然后对源域样本D<Sub>S</Sub>进行无...
- 易长安顾艳春王东李晓东胡小生何志敏
- 改进随机子空间与决策树相结合的不平衡数据分类方法
- 2013年
- 提出一种改进随机子空间与C4.5决策树算法相结合的分类算法。以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出。实验结果表明,该方法对少数类和多数类均具有较高的识别率。
- 胡小生
- 关键词:不平衡数据分类决策树
- 校园网的组播应用研究被引量:7
- 2006年
- IP组播能够向多点传送信息流,它能够更好地节约网络带宽,提高网络效率。本文阐述IP组播技术原理、校园网组播部署和组播管理、以及校园网组播应用存在的问题。
- 胡小生
- 关键词:IP组播校园网
- 一种基于聚类提升的不平衡数据分类算法被引量:6
- 2014年
- 不平衡数据分类是机器学习研究领域中的一个热点问题。针对传统分类算法处理不平衡数据的少数类识别率过低问题,文章提出了一种基于聚类的改进AdaBoost分类算法。算法首先进行基于聚类的欠采样,在多数类样本上进行K均值聚类,之后提取聚类质心,与少数类样本数目一致的聚类质心和所有少数类样本组成新的平衡训练集。为了避免少数类样本数量过少而使训练集过小导致分类精度下降,采用少数过采样技术过采样结合聚类欠采样。然后,借鉴代价敏感学习思想,对AdaBoost算法的基分类器分类误差函数进行改进,赋予不同类别样本非对称错分损失。实验结果表明,算法使模型训练样本具有较高的代表性,在保证总体分类性能的同时提高了少数类的分类精度。
- 胡小生张润晶钟勇
- 关键词:不平衡数据分类K均值聚类ADABOOST