菅小艳
- 作品数:18 被引量:57H指数:4
- 供职机构:太原师范学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学理学电子电信更多>>
- 基于朴素贝叶斯的文本分类被引量:4
- 2013年
- 朴素贝叶斯是一种用于不确定性推理的方法,其原理简单,但是适用性却很强。将朴素贝叶斯用在文本分类中。在传统的文本分类方法的基础上,对文本特征的选择做了改进,通过实验,达到了比较满意的效果。
- 菅小艳崔彩霞
- 关键词:朴素贝叶斯分类器文本分类
- 基于HMM的农作物信息抽取
- 本文以因特网(中国北方农业信息网等网站)上的种子资源作为语料资源,采用聚类的方法,生成训练语料,得到领域的主题集:通过训练主题和主题之间的关系,建立了针对水稻农作物的HMM模型。利用viterbi算法为未标注文本中的小句...
- 菅小艳郑家恒
- 关键词:主题信息抽取HMM
- 文献传递
- 基于不完整数据的EM算法初值选取被引量:3
- 2010年
- 不完整数据是实际中经常遇到的问题.在对这种数据进行分类或统计时,由于缺乏一些数据,结果则往往不尽人意.对缺失数据给定一个初值,通过实验发现,在给定初值的情况下,会得到比较满意的结果.
- 菅小艳
- 关键词:不完整数据EM算法初值
- 一种改进的句子相似度计算方法
- 句子相似度计算在中文信息处理中有若非常广泛的应用。本文采用农作物种子信息文本,对句子进行深入的研究,通过对《同义词词林》的扩充,提出一种基于扩展的句子相似度的计算。该方法结合语料的特点,不仅考虑了句子间的公共子串,而且兼...
- 菅小艳郑家恒
- 关键词:句子相似度词义聚类
- 文献传递
- 基于HMM模型的农作物信息抽取方法研究
- 近年来,随着计算机和互联网技术的迅猛发展,各领域信息量呈指数级增长。如何高效获取有用信息成为有效利用信息的关键。信息抽取是指从自然语言文本中识别特定类型的事件或关系的信息,并将这些信息格式化输出。从而免去了人工查找的繁琐...
- 菅小艳
- 关键词:信息抽取HMM模型聚类农作物
- 文献传递
- 基于特征词的农作物文本的句子聚类
- 2008年
- 聚类算法在中文信息处理领域有着广泛的应用.文章采用农作物种子信息文本,旨在通过将语料中的句子聚类,从而抽取种植农作物的有用信息.文章采用特征词的方法,利用特征词将句子聚类,通过实验达到了比较满意的效果.
- 菅小艳
- 关键词:聚类K-MEANS贝叶斯特征词
- 农作物信息抽取系统的设计与实现被引量:5
- 2006年
- 研究了特定领域的文本的信息抽取,主要考虑了文本分布的观点。首先从未标注的语料中学习主题和主题间的关系,然后把它应用在同领域的文本信息抽取。经测试,其信息抽取的效果有所提高。
- 郑家恒菅小艳
- 关键词:主题信息抽取聚类K近邻
- 地方高校计算机类专业“算法与数据结构”实践教学改革被引量:13
- 2016年
- 针对地方高校计算机类专业"算法与数据结构"实践教学的现状,分析"算法与数据结构"实践教学改革实施的原因,提出适合地方高校计算机类专业"算法与数据结构"实践教学的改革方案,经过这几年的教改试验,得出该实践教改方案的可行性和有效性。
- 崔彩霞菅小艳庞天杰
- 关键词:算法与数据结构实践教学课程设计CDIO
- 不平衡数据集上的Relief特征选择算法被引量:15
- 2016年
- Relief算法为系列特征选择方法,包括最早提出的Relief算法和后来拓展的ReliefF算法,核心思想是对分类贡献大的特征赋予较大的权值;特点是算法简单,运行效率高,因此有着广泛的应用。但直接将Relief算法应用于有干扰的数据集或不平衡数据集,效果并不理想。基于Relief算法,提出一种干扰数据特征选择算法,称为阈值-Relief算法,有效消除了干扰数据对分类结果的影响。结合K-means算法,提出两种不平衡数据集特征选择算法,分别称为K-means-ReliefF算法和K-means-Relief抽样算法,有效弥补了Relief算法在不平衡数据集上表现出的不足。实验证明了本文算法的有效性。
- 菅小艳韩素青崔彩霞
- 关键词:RELIEF算法RELIEFF算法不平衡数据集
- 高校计算机专业学生动手能力培养初探被引量:2
- 2009年
- 通过分析当前高校计算机专业学生能力差的原因,提出如何通过改革我们的教学方法和手段,从而提高学生的动手能力,以培养社会需要的计算机人才。
- 菅小艳
- 关键词:教学方法