于倩倩 作品数:26 被引量:110 H指数:8 供职机构: 中国科学院文献情报中心 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家社会科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 医药卫生 电子电信 更多>>
基于分布式技术的科技文献大数据平台的建设研究 被引量:10 2021年 【目的】解决海量篇级文献的存储与在线访问、大规模数据治理和服务性能低的问题,建设科技文献大数据平台。【方法】以分布式技术为基础,分析科技大数据特点及服务导向,结合服务器、网络等硬件资源条件,采用共租部署策略,设计了"5+2"整体架构的科技文献大数据平台。【结果】建成PB级科技文献大数据平台,数据存储量达到200TB,文献实体量达3.2亿条,实体关系量达60亿条,基于MapReduce的元数据处理性能提高3倍,形成了基于微服务的知识服务架构。【局限】该平台未设计完整的流式处理流程,不能满足增量数据即时响应的需求。【结论】本文建设的科技文献大数据平台已支撑中国科学院文献情报中心知识发现平台、慧科研等产品体系,取得较好的线上服务效果,提升了对科技文献数据的处理计算与服务能力。 常志军 钱力 谢靖 谢靖 张鹄 吴振新 王颖 王永吉关键词:分布式存储 分布式计算 数据仓库 一种面向多实体的隐式知识图谱表示的方法及装置 本发明公开了一种面向多实体的隐式知识图谱表示的方法及装置,涉及数据处理技术领域,包括:定义每个实体的特征字段,以及根据所述每个实体的特征字段确定特征值;根据所述每个实体的特征字段与所述特征值获得实体识别工具;根据所述实体... 常志军 钱力 谢靖 王玉菊 王颖 于倩倩基于主题模型和情感分析的话题交互数据观点对抗性分析 被引量:8 2020年 【目的】研究面向开放网络社区话题交互数据的对抗性观点挖掘方法。【方法】构建基于情感分析和主题模型的观点情感对抗性挖掘模型。通过该模型,考虑知乎社区、话题、交互数据等特征,加入交互数据筛选和关键词筛选,以知乎AlphaGo话题为例进行实证研究。【结果】本文方法可有效挖掘观点及其情感对抗性。研究发现在AlphaGo话题讨论中,"挺AlphaGo"和"反AlphaGo"的对抗性显著。"挺AlphaGo"的主要表现有人类智慧、比赛、能力,"反AlphaGo"的主要表现有AI产品及其产品、理解能力。【局限】仅针对AlphaGo主题进行实证分析,在模型泛化性验证上有待提高。【结论】本文方法具有可操作性和可解释性,可挖掘交互数据潜在的对抗性信息,从而使观点挖掘的结果更具针对性,为情报分析、观点挖掘提供借鉴。 徐红霞 于倩倩 钱力关键词:情感分析 基于ORCID iD的多系统交互研究与实践 被引量:3 2017年 对国内外基于ORCID i D的多系统交互方式进行分析,详细介绍i Author服务平台中基于ORCID i D多系统交互的实现方法和实现效果。i Author服务平台通过ORCID i D与期刊投稿系统、数据库检索系统、机构仓储等系统无缝集成,有效地促进ORCID i D在中国学术生态系统中的应用。 黄永文 于倩倩 张建勇冠状病毒研究态势分析 被引量:10 2020年 2019年底,一种新型冠状病毒在武汉引起发热性呼吸道疾病(COVID-19),并在我国境内及周边国家持续蔓延,对人类流行病的防控提出了新的要求。基于文献计量学方法梳理了冠状病毒的研究进展,从全球视角对主要研发国家/地区、核心研究机构和热点研究方向进行了分析,旨在揭示冠状病毒的诊断、预防和治疗的研究态势,以期为当前科研联合攻关提供参考。 巩玥 廖青云 于倩倩 史志祥 陈菁 张宇辉 赵光慧关键词:冠状病毒 严重急性呼吸综合征 直播技术在图书馆领域的应用及发展 被引量:5 2021年 当新媒体遇上5G,如何将线下工作转至线上开展?打破空间壁垒,为读者提供更优质的服务将成为未来图书馆发展的重点,直播技术为图书馆线上工作提供契机。文章选取42所双一流高校图书馆、32所省级公共图书馆作为代表进行调研,从直播的数量、内容、对象、时间和平台及效果反馈等方面进行剖析。调研发现,目前图书馆直播服务中存在无规划、平台散乱、渠道单一等问题,文章针对性地提出整改对策,以期为之后同类服务的开展提供借鉴。 杨敏 于倩倩关键词:图书馆 直播 面向科学数据保存的科学数据评价指标体系研究 被引量:3 2021年 [目的/意义]科学数据保存是科学数据共享利用的前提,是科学数据高质量、高效率服务的基础。[方法/过程]文章在调研国内外理论研究和实践进展的基础上,根据影响科学数据保存的因素遴选出一批指标,再通过专家调查法对指标体系进行完善,构建“面向科学数据保存的科学数据评价指标体系”,指标体系包含“法定因素”“重用价值”“数据可靠性”等8个一级指标,“法律要求”“特殊学术价值”“数据准确性”等32个二级指标。最后,运用层次分析法对指标权重进行测算。[结果/结论]文章为中国科学数据管理工作提出积极推动科学数据管理立法,提升科研水平、规范学术伦理、提高科学数据质量,发展数据存储与安全技术、推动科学数据共享与长期保存等3条建议。 孟银涛 赵蕾霞 于倩倩关键词:层次分析法 场景驱动下组合多维度服务要素的先进制造业科技服务体系研究 周毅 纪姗姗 刘峥 于倩倩 张建勇不同科研场景对数字信息资源的依赖性分析 被引量:4 2014年 文章分析了新型学术交流模式、e-Science、数据密集型科研等不同科研场景对数字信息资源的依赖,并提出应对策略。新型学术交流模式主要依赖于数字资源的开放关联、组织描述、深度开放以及免费共享;e-Science主要依赖于数字资源的元数据描述、内容存储关联等多种服务,并且资源依赖具有学科特征;数据密集型科研主要依赖于海量科学数据资源以及多类型软件工具类资源等。针对学术交流模式的变革提出信息资源的多样化建设尤其是开放科学数据的建设,并嵌入到学术交流过程中;针对e-Science的发展,提出把开放信息资源建设嵌入到科研环境中,关注不同学科对信息资源的需求特点;针对数据密集型科研,提出加强工具类资源的建设,提供与数据相关的更多服务等。 于倩倩 贾茹 黄金霞关键词:基础设施 美国大学图书馆战略规划分析及启示 被引量:13 2020年 图书馆战略规划是图书馆的纲领,对未来发展起着引领与指导作用。当前,国内高校图书馆战略规划的整体水平还不高,文章对美国的10所大学图书馆进行网络调研,对4所大学图书馆进行实地调研,并在此基础上对战略规划文本和访谈资料进行内容分析,得出美国大学图书馆战略规划主要在资源与服务、教学科研支持、服务社区、团队建设、全球合作、对新领域学习6个方面具有较强优势。国内高校图书馆应在保持战略规划稳定、公开战略规划文本并突出战略规划重点、关注新领域发展和保持图书馆创新力、图书馆新技术应用4个方面进行提升,以提高高校图书馆教学科研服务保障水平。 孟银涛 于倩倩