您的位置: 专家智库 > >

教育部人文社会科学研究基金(09YJA870005)

作品数:14 被引量:100H指数:8
相关作者:王宇刘凡儒刘淼孔胜段晓丽更多>>
相关机构:大连理工大学中国环境管理干部学院更多>>
发文基金:教育部人文社会科学研究基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:文化科学自动化与计算机技术语言文字更多>>

文献类型

  • 14篇中文期刊文章

领域

  • 8篇文化科学
  • 5篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇相似度
  • 3篇抽取
  • 2篇语言处理
  • 2篇知识元
  • 2篇图书
  • 2篇图书馆
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇网络
  • 2篇网页
  • 2篇文本
  • 2篇句子相似度
  • 2篇概念层次网络
  • 2篇HNC理论
  • 2篇层次网络
  • 1篇德尔菲
  • 1篇德尔菲法
  • 1篇新闻
  • 1篇新闻网
  • 1篇新闻网页

机构

  • 14篇大连理工大学
  • 1篇中国环境管理...

作者

  • 11篇王宇
  • 3篇刘凡儒
  • 2篇孔胜
  • 2篇杨海芳
  • 2篇段晓丽
  • 2篇刘淼
  • 1篇邵洪雨
  • 1篇张承伟
  • 1篇刘玮楠
  • 1篇贾生
  • 1篇谷静
  • 1篇林红岩

传媒

  • 2篇情报杂志
  • 2篇计算机工程与...
  • 1篇情报科学
  • 1篇现代情报
  • 1篇图书情报工作
  • 1篇图书馆论坛
  • 1篇图书馆理论与...
  • 1篇情报学报
  • 1篇现代图书情报...
  • 1篇情报理论与实...
  • 1篇图书馆学刊
  • 1篇中文信息学报

年份

  • 2篇2014
  • 3篇2013
  • 4篇2012
  • 3篇2011
  • 2篇2010
14 条 记 录,以下是 1-10
排序方式:
高校图书馆文献资源结构指标体系实证研究被引量:5
2012年
阐述高校馆藏文献资源结构指标体系的构建与权重计算,并基于国内22所高校图书馆的问卷数据进行实证研究,剖析研究型大学群与普通高校群之间的差距及关键影响因子。
刘凡儒杨海芳张承伟
关键词:德尔菲法主成分分析法
基于正文特征及网页结构的主题网页信息抽取被引量:10
2012年
Web正文信息抽取是信息检索、文本挖掘等Web信息处理工作的基础。在统计分析了主题网页的正文特征及结构特征的基础上,提出了一种结合网页正文信息特征及HTML标签特点的主题网页正文信息抽取方法。在将Web页面解析成DOM树的基础上,根据页面DOM树结构获取正文信息块,分析正文信息块块内噪音信息的特点,去除块内噪音信息。实验证明,这种方法具有很好的准确率及召回率。
段晓丽王宇谷静刘玮楠
关键词:正文抽取
近年来我国图书馆学研究热点与发展趋势——基于共被引分析被引量:8
2013年
以CSSCI收录的1998-2012年间我国图书馆学研究领域的1 682篇学术论文为基础,综合运用频次统计、论文同被引等文献计量分析方法,同时将因子分析和社会网络分析运用其中,以期探寻过去15年间我国图书馆学研究领域的研究主题分布状况和核心作者的影响力情况,并以可视化的方法揭示该领域的研究热点,预测我国图书馆学未来的发展趋势。
连少华王宇
关键词:作者共被引分析社会网络分析图书馆学
基于HNC理论的词语相似度计算被引量:10
2014年
该文运用自然语言处理的概念层次网络(Hierarchical Network of Concepts,HNC)理论提出了一种词语相似度计算方法。该方法利用HNC理论词汇层面联想的概念表述体系,根据HNC映射符号的编码规则和符号映射理论,综合概念内涵、概念外部特征、概念类别和组合符号来计算词语的相似度,并与基于知网的词语相似度算法和人工的主观判断的相似度进行了比较分析。实验结果表明,该方法能够较好地反映词语之间的语义差别,与人的直观判断基本一致,是一种有效可行的方法。
吴佐衍王宇
关键词:概念层次网络语义相似度中文信息处理
基于模糊层次分析法的研究型大学馆藏文献资源结构指标模型的研究被引量:3
2012年
根据研究型大学图书馆馆藏文献资源结构的特点,运用模糊层次分析法(FAHP)确定结构指标体系的指标权重,提出了可量化的图书馆馆藏文献资源结构指标模型,最后通过实证分析证明了该模型在图书馆馆藏文献资源结构建设过程中的有效性和可行性。
刘凡儒杨海芳林红岩
关键词:模糊层次分析法
影响高校图书馆文献采访质量的要素分析被引量:1
2011年
通过对影响图书馆文献采访质量要素的简单分析,提出了影响高校图书馆文献采访质量的几个方面问题以及提高文献采访质量应采取的几点措施,以确保图书馆文献采访工作高质量地完成,更好地为高校的教学和科研提供文献信息服务。
刘凡儒
基于句子相似度的文本主题句提取算法研究被引量:12
2011年
文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段。为了解决现有文本主题句提取中一些局部主题容易被忽略的问题,本文提出一种"先分割,再提取"的思想。首先将文本表示为句子的线性序列,句子表示为词的线性序列,并对每个句子都预处理为含有实词的词汇链,然后基于知网(Hownet)计算相邻句子相似度。基于句子相似度,采用文本分割技术将文本分为多个关于子主题的句子包,通过句子关系图对这些句子包进行主题句提取。最后选用不同的语料库,设计进行了可接受性测试,实验结果验证该算法是可行、有效地。
孔胜王宇
关键词:句子相似度文本分割
基于主题词提取的国内自然语言处理研究现状分析被引量:4
2013年
选取中文自然语言处理领域相关期刊文献为初始数据集,将文献本身关键词和改进的主题词提取技术得到的文献内主题词相结合,作为反映文献研究领域的领域特征词。然后运用共词分析法和聚类分析法,揭示了中文自然语言处理的研究结构和脉络,为更好地把握中文自然语言处理的研究现状和发展趋势奠定了基础。
王宇邵洪雨
关键词:自然语言处理词频分析主题词提取共词分析
一种基于知识元的期刊文献知识仓库构建被引量:9
2013年
构建期刊文献知识仓库是为用户提供知识服务的基础。文章在知识元库的基础上设计了一种期刊文献知识仓库的构建架构,并设计了知识抽取方法以及知识仓库的存储结构。在期刊文献知识仓库的基础上设计了针对期刊文献的知识检索系统,从而为用户提供简单的期刊文献知识服务。
王宇刘淼
关键词:知识元知识仓库
基于主题句的期刊文献知识元库构建被引量:17
2012年
构建期刊文献知识元库是构建期刊文献知识元仓库进而为用户提供期刊文献知识检索的核心和基石。针对期刊文献资源提出了一种基于六元组表示期刊文献知识元的方法,并将期刊文献的主题句作为期刊文献知识元内容的表示;简单介绍了期刊文献知识元库的概念及其构建的基本思路;在基于知网的句子相似度算法的基础上设计了针对期刊文献知识元的提取方法;在提取的期刊文献知识元的基础上设计了一种基于主题句的期刊文献知识元库构建方法。
刘淼王宇
关键词:知识元链接主题句
共2页<12>
聚类工具0