国家社会科学基金(05BTQ021)
- 作品数:11 被引量:122H指数:6
- 相关作者:侯汉清杜慧平仲云云刘华梅黄建年更多>>
- 相关机构:南京农业大学上海师范大学天津农学院更多>>
- 发文基金:国家社会科学基金国家社会公益研究专项计划南京农业大学SRT基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 简便易行的机编词表软件——MultiTes被引量:4
- 2007年
- 在实际使用的基础上,本文介绍一种国外流行的、简便易用的机编词表软件——MultiTes 2005 Pro。作者详述了该软件的主要功能、结构、界面和使用方法,并进行了简要的评价。
- 杨俊梅刘俊侯汉清
- 关键词:叙词表编制
- 《中国分类主题词表》(第二版)评介被引量:6
- 2006年
- 从规模和性能上对《中国分类主题词表》新旧两个版本进行了测评和比较,分析了新版词表的优点和不足,并提出一些改进建议。参考文献8。表7。
- 侯汉清李华
- 关键词:《中国分类主题词表》
- Tag分类基本问题探究被引量:28
- 2008年
- 作为Web2.0技术的核心,Tag的应用越来越广泛,Tag的分类功能也越来越受重视,但是对于Tag分类的探讨依然付之阙如。作为一种新型的分类方法,Tag的来源多种多样,既有直接来源,也有间接来源。Tag分类采用了3种技法,分别是自由分类、自动归类、自动聚类,它可以应用于背景资料的阅读、分类订阅、邮件过滤、文件管理等领域,目前正对多次分类、交叉分类和动态链接等多个问题探索和研究。
- 黄建年侯汉清
- 关键词:标签
- 电子政务主题词表的自动构建研究
- 2008年
- 电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。
- 仲云云侯汉清杜慧平
- 关键词:电子政务叙词表
- 文献分类法自动映射系统的构建——以《中国图书馆分类法》与《杜威十进分类法》为例被引量:20
- 2006年
- 实现文献分类法之间的互操作是信息组织和检索的迫切需要。目前在国内外大多数分类法之间互操作研究项目中,基本上是采用人工判断的方法来建立类目映射关系。笔者认为,《中国图书馆分类法》(CLC)和《杜威十进分类法}(DDC)的类目表达的整体概念可以分解成多个概念因素,整体相似可以建立在部分相似的基础上,可通过计算类目概念因素的相似度得到类目整体概念之间的相似度。在CLC与DDC自动映射系统中,类目表达的概念可以分解成类名词、注释词、下位词、上位词,根据相似值最大原则对概念因素进行配对,通过配对概念的加权,实现类目之间相似度的自动计算。根据类目相似值、类目对应概念因素(即对应词)的差额、相等概念因素(即等价词)的类别3个参数制订了详细的类目映射规则。本文还介绍了CLC与DDC自动映射系统的结构、功能和使用。
- 戴剑波侯汉清
- 关键词:图书分类法互操作中国图书馆分类法杜威十进分类法
- 基于词表和N-gram算法的新词识别实验被引量:9
- 2007年
- 目前未登录词问题仍然很大程度上影响着自动标引和信息检索的效率。本文提出了一种选择期刊论文的题名和摘要作为训练语料,利用N-gram算法切分和停用词典等过滤筛选的非专名的新词识别方法。该方法主要分为两步:先进行N元切分,保存关键词候选集并统计词频;然后进行一系列的过滤,主要有词频阈值限定、前停后停词典过滤、相邻词比较、子父串比较、抽词词典和过滤词典的过滤,最后进行人工判别。对实验结果的测评表明这一方法是简便易行的。训练语料可以不用全文,只用题名和摘要;在新词识别上,摘要可以代替题名。
- 曹艳杜慧平刘竟侯汉清
- 关键词:未登录词新词识别
- 领域本体的半自动构建方法研究被引量:20
- 2007年
- 人机协作的半自动构建本体是目前较为理想的模式。借鉴软件工程中的领域建模、图书馆学中的分类学和本体学习的方法论,由领域专家给出领域的上层知识模式,通过机器学习技术从领域语料库中学习等级关系和相关关系为知识工程师提供参考,将专家的自顶向下和机器学习的自底向上的结果结合起来构建本体。半自动构建领域本体的关键技术在于领域概念的获取和组织,用共现统计算法、关联规则算法、隐含语义索引、Hopfield联想算法获取相关关系,用聚类算法、字面成族、模式匹配获取等级关系,从而完成领域类模型的构建。
- 何琳杜慧平侯汉清
- 关键词:本体
- 近十年情报检索语言互操作研究进展被引量:12
- 2006年
- 词表的兼容互换问题成为信息领域的一个研究热点。本文回顾了国内外近10年来情报检索语言互操作的研究状况,重点介绍了国外HILT、Renardus、HEREIN、CAMed、UMLS、Unfamiliar Metadata等几个研究项目,并总结了实现情报检索语言互操作的几种方法。
- 刘华梅侯汉清
- 关键词:情报检索语言互操作分类表叙词表映射