国家社会科学基金(11AZD090)
- 作品数:20 被引量:233H指数:10
- 相关作者:夏立新王忠义程秀峰邓三鸿石义金更多>>
- 相关机构:华中师范大学南京大学湖北民族大学更多>>
- 发文基金:国家社会科学基金湖北省自然科学基金江苏省自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术社会学经济管理更多>>
- 基于关联规则的高校图书馆微博关注趋势分析被引量:7
- 2014年
- 介绍基于API和基于Python爬虫的页面解析两种不同的微博数据获取方法和流程,同时对新浪微博中的高校图书馆关注数据进行关联分析。提出微博的一次关注、二次关注以及多次关注的关联现象,对相关图书馆微博进行一次和二次关注关联规则的挖掘,发现高校图书馆微博经过不断地传递关注,最终形成其微博关注独有的特点以及基于微博关注的高校图书馆微博信息之间的传播模式。
- 程秀峰李重阳陈莉玥
- 关键词:关联规则
- 基于词词关联矩阵改进的模糊检索研究(一)——模糊集合检索系统中词词关联矩阵构造的策略和时机选择被引量:2
- 2013年
- 通过模糊集合检索模型的规范描述,本文首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的“囚徒困境”:检索效率的提升引起了系统效率的下降。之后针对“囚徒困境”,从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决“囚徒困境”的思路和技术手段。最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式。根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢。
- 夏立新叶光辉程秀峰
- 关键词:囚徒困境
- 基于DHC的数字图书馆深层关联数据创建与发布研究被引量:4
- 2015年
- 为解决数字图书馆深层关联数据的创建与发布问题,借助DHC的相关原理和方法,提出一种基于DHC的数字图书馆深层关联数据创建与发布架构。该架构一方面能够充分利用计算机的计算能力,另一方面也充分发挥了人的认知能力在数字图书馆深层关联数据创建和发布中的优势。而后,依据该架构搭建并实现了一个基于DHC的数字图书馆深层关联数据创建和发布平台,从实证的角度论证了该架构的合理性和科学性。
- 王忠义夏立新石义金郑森茂
- 关键词:数字图书馆
- 数据集内关联数据自动创建方法研究被引量:6
- 2014年
- 为解决数据集内关联数据自动创建问题,采取推导传递法,借助多阶知识发现的理论,提出一种数据集内关联数据的自动创建方法。具体来说,主要是借助Falcon这一关联数据搜索引擎对数据集内的各列进行基于RDF三元组的共现检索,达到表内各列关联发现的目的,进而解决数据集内部关联数据的自动创建问题,并进行了实证研究,通过对实验结果的分析,在一定程度上证明了本文提出的数据集内关联数据自动创建方法的可行性和科学性。
- 王忠义夏立新郑路石义金
- 关键词:关联数据共词分析知识发现
- 面向中文图书的自动标引模型构建及实验分析被引量:2
- 2013年
- 针对中文图书关键词自动标引问题,引入条件随机场机器学习算法,通过对大量已有的中文图书手工关键词标引数据进行训练和学习,生成包含序列实体之间语义关系和规则特征的标注模型,并利用该标注模型进行机器预测,自动抽取出图书关键词。主要解决两个问题:鉴于条件随机场模型的参数选择会影响到系统的标注性能,从多个角度进行对比实验,确定针对中文图书关键词标引这一特定问题的条件随机场模型的最佳参数集合;探讨不同的观察特征对关键词标引的影响,通过实验论证4个能够有效提高标引性能的观察特征。最终建立起面向中文图书的最佳关键词标引模型。
- 王昊邹杰利邓三鸿
- 关键词:条件随机场关键词标引特征函数
- 云环境下数字图书馆知识管理研究被引量:17
- 2015年
- 为提高数字图书馆知识管理的能力和服务水平,本文在对云计算的相关技术和理论进行深入分析的基础上,首先,指出云环境下的知识管理是一种向用户直接提供知识服务产品的集成管理,而后,在这一思路的指导下,借助于云计算的相关技术,探索了云环境下数字图书馆知识管理的一般流程及其实施过程,以为提高数字图书馆的知识管理能力提供相应的指导。
- 王忠义夏立新王伟军
- 关键词:云计算数字图书馆知识管理知识服务
- 基于特征翻译和潜在语义标引的跨语言文本聚类实验分析被引量:3
- 2014年
- 【目的】通过多组实验来分析跨语言文本聚类中的基于特征翻译和潜在语义标引性能、注意事项和发展方向。【方法】从有关双语站点选取2 736篇中英文对齐的双语新闻语料,以基于特征翻译和潜在语义标引这两种方法分别进行文本聚类实验,并进行各自召回率、准确率、F值的对比。【结果】基于特征翻译的方法处理相对简单,能明显提升多语言文本的聚类效果;基于潜在语义标引的方法由于方法自身在时间和空间复杂度以及其他固有缺陷,最终结果差强人意。【局限】样本丰富度有待进一步扩展,期待在高性能计算环境下对LSI方法进行更全面的实验。【结论】基于特征翻译的方法需进一步提高翻译系统的性能,而LSI方法则需要解决计算复杂度、K值选取等问题。
- 邓三鸿万接喜王昊刘喜文
- 社区图书馆用户体验模型与服务优化被引量:3
- 2016年
- 社区图书馆作为重要文化基础设施,在提高居民科学与文化素质,弘扬社会主义精神文明,促进社区建设方面具有重要功能。本文从我国社区图书馆发展现实出发,以提高社区图书馆服务水平为目标,在用户体验的视角下,运用脚本分析法构建了社区图书馆读者体验的过程,提出了社区图书馆用户体验模型与相关假设,在实证研究的基础上,运用结构方程方法,对模型进行了检验,并提出了相关社区图书馆服务优化的建议与措施。
- 段钊庹唯译孔媛
- 关键词:用户体验
- 基于词词关联矩阵改进的模糊检索研究(二)——叙词表控制下词间关联度的改进算法被引量:8
- 2013年
- 传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题。本文结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型。实证分析表明,新算法有助于提升系统的检索效率。本文首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法。最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响。
- 夏立新程秀峰叶光辉
- 关键词:叙词表
- 基于语义的馆藏资源深度聚合模型探析被引量:14
- 2013年
- "信息孤岛"和"资源超载"现象在当今馆藏数字资源建设中普遍存在,这种因资源的海量、多样性和异构性,在一定程度上制约了资源的利用与建设.为了缓解此类压力,需要对数量巨大的异构馆藏资源进行聚合与重组,本文提出了基于语义的馆藏资源聚合模型,更好地满足用户的各种信息需求,进而提高了馆藏资源的利用率.
- 李劲程秀峰宋红文张华
- 关键词:语义馆藏资源