刘昌钰
- 作品数:6 被引量:36H指数:2
- 供职机构:四川大学计算机学院计算机科学系更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金山西省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于潜在语义分析的BBS文档Bayes鉴别器被引量:25
- 2004年
- 电子公告栏 (BBS)的滥用是一种以信息污染为特色的社会问题 ,对BBS文档进行鉴别已成为信息安全重要内容之一 .该文融合了数据挖掘技术、数理统计技术和自然语言理解技术 ,提出了基于潜在语义分析与Bayes分类的BBS文档鉴别方法 :利用自然语言处理技术从训练文档中抽取典型短语集 ;通过潜在语义分析进行典型短语同义归约 ,应用关联规则采掘技术提高典型短语间的独立性 ;用Bayes分类器对BBS文档进行鉴别 .该文还对影响系统的关键参数进行了大量的讨论和测试 ,实验表明该方法对于BBS文档的鉴别是可行而有效的 .
- 刘昌钰唐常杰于中华杜永萍郭颖
- 关键词:关联规则BAYES分类潜在语义分析BBS
- 潜在语义索引在数据挖掘中的应用
- 该文首次在数据挖掘任务中应用潜在语义索引技术,为BBS文档鉴别开辟了一条崭新的途径.该文主要工作有:(1)对BBS环境进行了系统分析,并针对BBS的特点引入了多种高级技术,实现了一个高实时性的BBS鉴别原型系统LBBDM...
- 刘昌钰
- 关键词:数据挖掘潜在语义索引自然语言处理BBS
- 文献传递
- 基于潜在语义分析与Bayes分类的BBS文档鉴别
- 为了解决BBS环境中的鉴别问题,本文融合了自然语言理解技术和概率统计方法的优点,提出了一种潜在语义分析与Bayes分类的BBS文档鉴别方法.
- 刘昌钰郭颖唐常杰翟静李海宏
- 关键词:自然语言理解潜在语义分析BAYES分类
- 文献传递
- 基于语料的动态获取专业词汇方法初探被引量:9
- 2002年
- 以上的最新信息为语料资源,提出了一种基于语料动态获取专业词汇的方法,即通过专业核心词汇和核心模式抽取语料库中Internet的同类专业词汇,并由语料的规模和算法的循环次数动态控制获取的词汇数量,最终得到专业词汇词典,满足专业领域信息处理需求。
- 郑家恒杜永萍刘昌钰
- 关键词:自然语言理解信息处理语料专业词汇
- 基于自然语言理解和发信人聚类的电子邮件鉴别
- 在过滤非友善文件方面,由于没有考虑到各成分之间的语义关系,易出错,本文提出了一种基于自然语言理解的新的鉴别技术对理解邮件各句子的含义,进行邮件过滤.
- 郭颖刘昌钰唐常杰胡蓉陈敏敏
- 关键词:自然语言理解聚类
- 文献传递
- 基于Web数据采掘的个性化远程教学树被引量:1
- 2000年
- 为了高效地建立个性化远程教学树 ,本文分析了朴素个性化算法的不足 ,提出了多层Web访问对象概念 ,并给出了形成多层主题树的算法、通过个性化数据采掘 ,建立个性化远程教学树 ,最后通过实验验证了算法的有效性。
- 唐常杰殷华蓓刘昌钰郭颍张天庆
- 关键词:数据采掘