教育部人文社会科学研究基金(09YJA870005) 作品数:14 被引量:100 H指数:8 相关作者: 王宇 刘凡儒 刘淼 孔胜 段晓丽 更多>> 相关机构: 大连理工大学 中国环境管理干部学院 更多>> 发文基金: 教育部人文社会科学研究基金 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 文化科学 自动化与计算机技术 语言文字 更多>>
高校图书馆文献资源结构指标体系实证研究 被引量:5 2012年 阐述高校馆藏文献资源结构指标体系的构建与权重计算,并基于国内22所高校图书馆的问卷数据进行实证研究,剖析研究型大学群与普通高校群之间的差距及关键影响因子。 刘凡儒 杨海芳 张承伟关键词:德尔菲法 主成分分析法 基于正文特征及网页结构的主题网页信息抽取 被引量:10 2012年 Web正文信息抽取是信息检索、文本挖掘等Web信息处理工作的基础。在统计分析了主题网页的正文特征及结构特征的基础上,提出了一种结合网页正文信息特征及HTML标签特点的主题网页正文信息抽取方法。在将Web页面解析成DOM树的基础上,根据页面DOM树结构获取正文信息块,分析正文信息块块内噪音信息的特点,去除块内噪音信息。实验证明,这种方法具有很好的准确率及召回率。 段晓丽 王宇 谷静 刘玮楠关键词:正文抽取 近年来我国图书馆学研究热点与发展趋势——基于共被引分析 被引量:8 2013年 以CSSCI收录的1998-2012年间我国图书馆学研究领域的1 682篇学术论文为基础,综合运用频次统计、论文同被引等文献计量分析方法,同时将因子分析和社会网络分析运用其中,以期探寻过去15年间我国图书馆学研究领域的研究主题分布状况和核心作者的影响力情况,并以可视化的方法揭示该领域的研究热点,预测我国图书馆学未来的发展趋势。 连少华 王宇关键词:作者共被引分析 社会网络分析 图书馆学 基于HNC理论的词语相似度计算 被引量:10 2014年 该文运用自然语言处理的概念层次网络(Hierarchical Network of Concepts,HNC)理论提出了一种词语相似度计算方法。该方法利用HNC理论词汇层面联想的概念表述体系,根据HNC映射符号的编码规则和符号映射理论,综合概念内涵、概念外部特征、概念类别和组合符号来计算词语的相似度,并与基于知网的词语相似度算法和人工的主观判断的相似度进行了比较分析。实验结果表明,该方法能够较好地反映词语之间的语义差别,与人的直观判断基本一致,是一种有效可行的方法。 吴佐衍 王宇关键词:概念层次网络 语义相似度 中文信息处理 基于模糊层次分析法的研究型大学馆藏文献资源结构指标模型的研究 被引量:3 2012年 根据研究型大学图书馆馆藏文献资源结构的特点,运用模糊层次分析法(FAHP)确定结构指标体系的指标权重,提出了可量化的图书馆馆藏文献资源结构指标模型,最后通过实证分析证明了该模型在图书馆馆藏文献资源结构建设过程中的有效性和可行性。 刘凡儒 杨海芳 林红岩关键词:模糊层次分析法 影响高校图书馆文献采访质量的要素分析 被引量:1 2011年 通过对影响图书馆文献采访质量要素的简单分析,提出了影响高校图书馆文献采访质量的几个方面问题以及提高文献采访质量应采取的几点措施,以确保图书馆文献采访工作高质量地完成,更好地为高校的教学和科研提供文献信息服务。 刘凡儒基于句子相似度的文本主题句提取算法研究 被引量:12 2011年 文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段。为了解决现有文本主题句提取中一些局部主题容易被忽略的问题,本文提出一种"先分割,再提取"的思想。首先将文本表示为句子的线性序列,句子表示为词的线性序列,并对每个句子都预处理为含有实词的词汇链,然后基于知网(Hownet)计算相邻句子相似度。基于句子相似度,采用文本分割技术将文本分为多个关于子主题的句子包,通过句子关系图对这些句子包进行主题句提取。最后选用不同的语料库,设计进行了可接受性测试,实验结果验证该算法是可行、有效地。 孔胜 王宇关键词:句子相似度 文本分割 基于主题词提取的国内自然语言处理研究现状分析 被引量:4 2013年 选取中文自然语言处理领域相关期刊文献为初始数据集,将文献本身关键词和改进的主题词提取技术得到的文献内主题词相结合,作为反映文献研究领域的领域特征词。然后运用共词分析法和聚类分析法,揭示了中文自然语言处理的研究结构和脉络,为更好地把握中文自然语言处理的研究现状和发展趋势奠定了基础。 王宇 邵洪雨关键词:自然语言处理 词频分析 主题词提取 共词分析 一种基于知识元的期刊文献知识仓库构建 被引量:9 2013年 构建期刊文献知识仓库是为用户提供知识服务的基础。文章在知识元库的基础上设计了一种期刊文献知识仓库的构建架构,并设计了知识抽取方法以及知识仓库的存储结构。在期刊文献知识仓库的基础上设计了针对期刊文献的知识检索系统,从而为用户提供简单的期刊文献知识服务。 王宇 刘淼关键词:知识元 知识仓库 基于主题句的期刊文献知识元库构建 被引量:17 2012年 构建期刊文献知识元库是构建期刊文献知识元仓库进而为用户提供期刊文献知识检索的核心和基石。针对期刊文献资源提出了一种基于六元组表示期刊文献知识元的方法,并将期刊文献的主题句作为期刊文献知识元内容的表示;简单介绍了期刊文献知识元库的概念及其构建的基本思路;在基于知网的句子相似度算法的基础上设计了针对期刊文献知识元的提取方法;在提取的期刊文献知识元的基础上设计了一种基于主题句的期刊文献知识元库构建方法。 刘淼 王宇关键词:知识元链接 主题句