中央高校研究生科技创新基金(CDJXS11180013) 作品数:5 被引量:20 H指数:3 相关作者: 张玉芳 熊忠阳 王勇 刘明 舒万里 更多>> 相关机构: 重庆大学 更多>> 发文基金: 中央高校研究生科技创新基金 重庆市自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
不平衡数据集上的文本分类特征选择新方法 被引量:8 2011年 针对不平衡数据集上进行文本分类,传统的特征选择方法容易导致分类器倾向于大类而忽视小类,提出一种新的特征选择方法 IPR(integrated probability ratio)。该方法综合考虑特征在正类和负类中的分布性质,结合四种衡量特征类别相关性的指标对特征词进行评分,能够更好地解决传统特征选择方法在不平衡数据集上的不适应性,在不降低大类分类性能的同时提高了小类的识别率。实验结果表明,该方法有效可行。 张玉芳 王勇 熊忠阳 刘明关键词:不平衡数据集 文本分类 结合对数似然比的领域本体概念和关系的提取 被引量:5 2013年 本体学习已成为计算机领域的一个研究热点,目前本体学习的研究重点在于概念及关系的提取。针对现有学习方法准确率不高,提出一种结合对数似然比(Log-Likelihood Ratio,LLR)的本体学习方法,采用对数似然比计算概念与领域及概念与概念之间的相关性,将其应用到概念与关系提取中。实验结果表明,结合对数似然比的学习方法能够有效改进概念和关系提取的准确度。 张玉芳 舒万里 熊忠阳关键词:本体学习 对数似然比 新的文本分类特征选择方法研究 被引量:7 2013年 特征降维是文本分类过程中的一个重要环节。在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法。实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果。 张玉芳 王勇 刘明 熊忠阳关键词:特征降维 文本分类 Markov逻辑网在基于信任的推荐系统中的应用 2012年 基于信任的推荐系统是利用信任的实体进行项目推荐,然而信任是一个复杂的概念,对信任进行传播和预测是一项重要的任务。提出了用一种统计关系模型——Markov逻辑网来表示信任的传递性质,讨论了Markov逻辑网的理论模型,通过其推理算法预测信任关系,实验结果表明,在基于信任的推荐系统中Markov逻辑网方法比MoleTrust方法在推荐精度和解决冷用户问题上有更好的效果。 熊忠阳 刘明 王勇 张玉芳 唐蓉君关键词:MARKOV逻辑网 信任 推荐系统 统计关系学习 Markov逻辑网在迁移学习中的应用 2011年 为充分利用过期训练数据和数据结构相关性进行新领域的学习,提出一种基于Markov逻辑网的迁移学习方法。该方法对源域与目标域的谓词进行自动映射后,通过自我诊断、结构更新和新公式挖掘3个步骤对映射结构进行优化,使之更适用于目标域数据。实验结果证明,与传统的机器学习方法相比,该方法使概率推理所获结果的准确率更高,所需的学习时间与训练数据更少。 熊忠阳 舒方俊 张玉芳 孔润关键词:MARKOV逻辑网 自动映射 一阶逻辑