常颖聪
- 作品数:6 被引量:143H指数:4
- 供职机构:南京农业大学信息科学技术学院更多>>
- 发文基金:国家社会科学基金江苏省社会科学基金江苏省“青蓝工程”基金资助项目更多>>
- 相关领域:文化科学生物学自动化与计算机技术更多>>
- 不同标引策略下的文本主题表达质量比较研究被引量:2
- 2014年
- 标引词的选择直接影响期刊文献检索的查全率与查准率,不同的标引源由于所承载文本内容的不同,其所确定的标引词又有所不同。本文分别选取不同权重下的全文、摘要、首尾段和关键句群作为标引源,采用自动抽词标引算法进行主题表达能力测评,通过设置不同的测评指标从不同角度对标引结果进行比较分析,重点讨论不同的标引策略、标引源的权重分配、文本长度、抽词词典规模等多种因素对主题表达质量的影响。通过定量比较,本文发现待标引语料与标引策略之间存在一定的相关关系,对全文文本进行二次加工、加强语义支持工具的建设仍然是提高主题标引质量的有效措施。
- 何琳常颖聪
- 关键词:标引质量
- 科研人员数据共享意愿研究被引量:53
- 2014年
- 科研人员作为科学数据的生产、使用和管理者,是否积极倡导并参与数据共享将直接影响到科学数据公开获取的进程和发展。相对于国外来自期刊杂志、基金管理委员会各界等对数据共享数据管理的规定,国内尚没有完善的数据共享政策,数据共享还没有得到普及。文章引入意向影响模型理论TPB和TAM建立科学数据共享意愿模型,研究影响科研人员数据共享行为意愿的因素,采用问卷调查的方法进行数据采集,利用AMOS17.0对假设进行了验证,结果显示态度、主观规范是直接影响因素,感知行为控制、感知风险、感知有用性为间接影响因素。最后根据对验证结果的具体分析,对如何促进科研人员数据共享提出了建议。
- 何琳常颖聪
- 关键词:数据共享结构方程模型计划行为理论技术接受模型
- 基于中介词典的网络图书分类体系映射研究被引量:2
- 2012年
- 采用以《中国图书馆分类法》为中介词典的兼容映射思想,根据向量空间模型原理构造映射函数,分别对当当网、卓越亚马逊、京东商城三个网上书店的网络图书分类体系与《中国图书馆分类法》进行类目相似度的映射,并根据类目相似值制订详细的类目映射关系规则。通过对映射关系进行横向及纵向分析,为未来的网络分类体系构建提出建议,最后指出本研究的不足及下一步需要改进的工作。
- 何琳常颖聪周百超杨波
- 关键词:网络分类体系《中国图书馆分类法》映射
- 基于关联数据的科学数据组织研究被引量:15
- 2016年
- 文章在对科学实验数据建立描述模型的基础上,通过对相关的科学实验描述本体的复用和扩展,构建以科学实验描述本体为基础的科学数据组织模式。采用RDF格式存储科学实验相关元数据,深入挖掘和揭示了科学数据中各类资源对象的语义内涵与关联关系,将与科学实验数据相关的科研机构、文献数据库以及科研成果等外部信息进行有效语义关联,建立了动态的、开放的科学实验数据知识组织模式。
- 庄倩常颖聪何琳徐潇洁乔粤陈雅玲
- 关键词:关联数据本体科学数据元数据
- 国内外科学数据出版研究进展被引量:63
- 2014年
- 立足科研人员、科研机构、期刊杂志3个方面,对科学数据出版的发展现状进行阐述,分析各方对科学数据出版的态度以及科学数据出版在科学交流中的影响,总结数据仓储、机构库和期刊自行发表3种主要出版模式,并分析科学数据出版过程中所面临的元数据、隐私保护、组织技术、出版机制以及知识产权等关键问题,最后针对数据出版的发展完善提出建议。
- 何琳常颖聪
- 关键词:科学数据出版模式出版现状
- 科学实验数据元数据模型构建研究——以植物学基因表达实验为例被引量:11
- 2015年
- [目的 /意义]科学实验数据组织现状混乱、丢失现象频繁,严重阻碍科学数据的保存、复用以及公开获取,因此构建规范的科学实验元数据模型对实验数据的组织、保存、检索、复用等有重大的现实意义。[方法 /过程]首先通过文献调研对现有科学实验元数据集进行总结;其次以植物学基因表达实验为例,通过用户访谈对实验室数据组织现状以及实验操作流程、特点等进行调查总结,初步构建植物学基因表达实验元数据描述方案;最后通过德尔菲法对元数据元素集进行打分、评估、筛选、确立。[结果 /结论]构建基于科学实验数据生命周期的植物学基因表达实验元数据模型,能够完整描述包含实验设计、实验数据等在内的科学实验基础信息,同时包括科研成果、数据访问等信息;基于该元数据模型不仅便于科学实验数据的组织,还有利于科学实验数据公开获取以及科研成果的追溯,为不同类型科学数据语义化关联提供支撑。
- 常颖聪何琳
- 关键词:元数据模型数据组织