陈思睿
- 作品数:6 被引量:13H指数:2
- 供职机构:兰州理工大学计算机与通信学院更多>>
- 发文基金:甘肃省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的文本分类方法的研究
- 文本分类是自然语言处理的一个重要研究方向,它可以有效的解决信息杂乱的现象,并有助于用户发现所需的信息.特征选择和权值函数是文本分类的核心,通过对经典的TF-IDF函数和互信息特征选择方法的研究,指出了它们现存的不足,进而...
- 张永陈思睿杨志勇
- 关键词:文本分类权值函数自然语言处理
- 文献传递
- 特征选择方法的研究和改进被引量:4
- 2006年
- 目前大部分特征选择方法都是基于对每个特征按照一定的算法进行重要性赋值,然后选取一定数目的特征作为最后的类别中心向量.针对由于初始特征过多而造成分类精度不高和分类时间过长的缺点,引进了粗糙集中的依赖度函数对特征的重要性进行标定,从而解决了特征过多造成的缺点.最后通过实验验证了该算法,证明该方法是可行的.
- 张永陈思睿杨志勇贾桂霞
- 关键词:属性约简
- 基于粗糙集的Web日志缺省规则获取研究
- 文章主要研究了Web用户的访问行为.Web日志是一个很不完全且存在多样性特点的数据集,在获取决策规则的过程中经常会出现不一致、不完全规则的情况.利用粗糙集理论在处理不完全知识上的特有优势,把重要的用户行为特征值离散化作为...
- 杨志勇张永陈思睿
- 关键词:WEB日志粗糙集WEB挖掘数据挖掘
- 文献传递
- 基于粗糙集的特征选择方法的研究被引量:7
- 2006年
- 文本自动分类是指将文本按照一定的策略归于一个或多个类别中的应用技术。文本分类是文本挖掘的基础,而特征选择又是文本分类中的核心。论文分析了以前特征选择方法中由于特征数目过多而造成分类时间和精度不高的缺点,提出了一种基于粗糙集的特征选择方法,其特点是以特征在文本分类中的重要性对特征进行选择。最后通过实验验证了该算法,证明该方法是可行的。
- 陈思睿张永杨志勇
- 关键词:属性约简文本挖掘
- 一种改进的文本分类方法的研究
- 文本分类是自然语言处理的一个重要研究方向,它可以有效的解决信息杂乱的现象,并有助于用户发现所需的信息。特征选择和权值函数是文本分类的核心,通过对经典的TF-IDF函数和互信息特征选择方法的研究,指出了它们现存的不足,进而...
- 张永陈思睿杨志勇
- 关键词:文本分类权值函数
- 文献传递
- 一种基于关联模式的完全决策规则的提取方法被引量:2
- 2006年
- 针对基于粗糙集理论提取完全的决策规则是NP难问题,提出一种获取统计意义下的完全的简化规则的算法.该算法结合关联规则挖掘方法和粗糙集方法的优点,从决策表中提取出具有一定支持度和可信度阈值的决策规则,具有实际的应用意义.通过实例验证了算法的有效性.
- 贾桂霞张永陈思睿
- 关键词:数据挖掘关联规则粗糙集APFIORI算法决策表