万接喜
- 作品数:5 被引量:9H指数:2
- 供职机构:南京大学信息管理学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金教育部人文社会科学重点研究基地度重大研究项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 基于特征翻译和潜在语义标引的跨语言文本聚类实验分析被引量:3
- 2014年
- 【目的】通过多组实验来分析跨语言文本聚类中的基于特征翻译和潜在语义标引性能、注意事项和发展方向。【方法】从有关双语站点选取2 736篇中英文对齐的双语新闻语料,以基于特征翻译和潜在语义标引这两种方法分别进行文本聚类实验,并进行各自召回率、准确率、F值的对比。【结果】基于特征翻译的方法处理相对简单,能明显提升多语言文本的聚类效果;基于潜在语义标引的方法由于方法自身在时间和空间复杂度以及其他固有缺陷,最终结果差强人意。【局限】样本丰富度有待进一步扩展,期待在高性能计算环境下对LSI方法进行更全面的实验。【结论】基于特征翻译的方法需进一步提高翻译系统的性能,而LSI方法则需要解决计算复杂度、K值选取等问题。
- 邓三鸿万接喜王昊刘喜文
- 民族学期刊引用网络分析被引量:3
- 2011年
- 文章以CSSCI 2003-2007年民族学来源期刊的引文数据为研究对象,采用引文分析法对民族学期刊的引用数据进行了分析,勾勒出民族学期刊内部的引用网络、民族学与其它学科之间的引用网络,以此来发现民族学领域内期刊之间互引关系以及民族学与其它学科的互引关系。
- 万接喜
- 关键词:引文分析期刊学术影响民族学CSSCI
- 基于混合策略的英汉双语新闻聚类研究被引量:2
- 2013年
- 英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的聚类结果。
- 韩普万接喜王东波
- 基于混合策略的英汉双语新闻自动聚类研究
- 英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,本文对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的...
- 韩普万接喜王东波谢靖
- 文献传递
- 多语言文本聚类研究
- 随着互联网的进一步发展和普及,以及全球化趋势的进一步深化,互联网上各语种的信息资源呈现出爆炸式的增长。信息时代,信息意味着机会,意味着成败。人们迫切希望从巨量的网络资源中迅速、准确的获取自己感兴趣和有价值的信息。多语言文...
- 万接喜
- 关键词:文本挖掘
- 文献传递