刘自强
- 作品数:8 被引量:182H指数:7
- 供职机构:山东理工大学科技信息研究所更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 面向情报研究的文本语义挖掘方法述评被引量:7
- 2016年
- 【目的】对主要的文本语义挖掘方法及其在情报研究中的应用进行综述分析。【文献范围】集中选择近10年国内外主流的文本语义挖掘方法在情报研究领域的应用以及少数此前的代表性研究和文本语义挖掘方法的进展研究。【方法】分别概括介绍词、句子和篇章粒度的文本语义挖掘方法、算法,并通过主题演化和技术挖掘领域的实际应用进行方法剖析。【结果】文本语义挖掘方法与传统的情报分析方法相比,主要弥补了两个缺陷:侧重于分析结构化的数据,无法处理多种异构的数据源;分析停留在统计语法层面,没有深入到文本的语义信息。【局限】仅对主流的文本语义挖掘方法以及在科学研究领域的应用进行综述分析,研究不全面。【结论】文本语义挖掘方法弥补了传统情报分析方法的不足,是情报研究方法的重要发展方向,随着方法的成熟,下一步研究重点是外部语义资源的丰富。
- 赵冬晓王效岳白如江刘自强
- 关键词:情报分析
- 多维度视角下学科主题演化可视化分析方法研究——以我国图书情报领域大数据研究为例被引量:68
- 2016年
- 探测、识别某学科领域研究主题的演化过程并进行可视化分析,对于掌握研究现状和发展趋势具有重要意义。学科主题演化是一个复杂过程,存在多种变量,如主题强度、结构和内容等,目前研究主要以单一维度进行可视化分析,信息负荷过大,存在感知局限性。本文提出多维度视角下学科主题演化可视化分析方法:通过人工标注方法对关键词进行语义角色分类,利用Fast Unfolding算法识别出具有语义特征的学科主题;利用余弦相似度计算公式计算学科主题相似度判定演化关系;构建多维度学科主题演化分析模型,并设计了三种创新性的科学知识图谱,进行学科主题强度、结构和内容三个维度的可视化分析,通过相互作用可以帮助快速消化、理解信息和精炼分析结果,有效地分析学科主题演化的复杂过程。通过对我国图书情报领域近10年大数据研究的实证分析,证明该方法具有可行性和有效性。
- 刘自强王效岳白如江
- 关键词:语义角色标注可视化
- 多维主题演化分析模型构建与实证研究被引量:14
- 2017年
- [目的/意义]分析科研主题的复杂演化过程,能够帮助学者及时把握研究热点、研究前沿和发展趋势,然而目前主题演化相关研究主要从单一维度进行演化分析。[方法/过程]文章构建了基于主题热度、状态和演化路径3个维度的主题演化分析模型,以碳纳米管研究领域为例进行了实证研究,首先对相关科技文献数据进行采集、预处理,并利用PLDA模型进行主题识别,然后基于多维主题演化分析模型,结合可视化技术,构建了多个维度的科学知识图谱,分析了主题热度、演化状态、宏观演化脉络和微观演化路径,清晰地描绘了碳纳米管领域的主题演化脉络、趋势。[结果/结论]研究结果表明,多维主题演化分析模型能够准确分析主题演化生命周期的复杂过程。
- 刘自强王效岳白如江
- 关键词:多维度主题识别可视化实证研究
- 中外图情领域大数据近十年(2007-2016)研究现状与发展趋势分析被引量:12
- 2018年
- 【目的/意义】为揭示中外图书情报领域对大数据研究的现状和发展趋势,挖掘研究热点主题及其演化过程。【方法/过程】文章统计分析了近十年图情领域大数据研究的论文发文数量、核心机构和核心作者等指标,采用文本数据挖掘的方法识别出不同领域时期的研究热点主题,并分析了随时间的推移研究主题的演变情况。此外,论文还对比分析了中外图情领域研究主题的相关性和差异性,展现出中外图情领域对大数据研究的联系和区别。【结果/结论】随着时间的发展,中外大数据研究主题趋于相似。大数据研究主题的趋势向着研究主题多元化,结构层次鲜明化的方向发展,在未来几年将会有更多新颖的研究主题产生。
- 陈军营白如江王效岳刘自强
- 关键词:大数据热点主题数据挖掘
- 语义分类的学科主题演化分析方法研究——以我国图书情报领域大数据研究为例被引量:17
- 2016年
- [目的 /意义]学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法 /过程]提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果 /结论]通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。
- 刘自强王效岳白如江
- 关键词:可视化
- 基于基金项目数据的研究前沿主题探测方法被引量:37
- 2017年
- [目的 /意义]根据基金项目数据的特点,提出基于基金项目数据的研究前沿主题探测方法,以期识别出前瞻价值更高的研究前沿,为研究前沿识别相关研究提供借鉴思路。[方法/过程]首先,基于PLDA模型识别蕴含在基金项目文本中的研究主题;然后基于主题-文档矩阵建立主题和基金项目文档的映射关系,在此基础上,利用主题的资助时间、资助金额和中心性指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;最后,利用主题演化可视化分析方法,对研究前沿主题进行演化分析,以预测其发展趋势。[结果 /结论]研究结果表明,该方法可以根据基金项目数据的特点识别出蕴含在其中的研究前沿主题,并且能够分析研究前沿主题的分裂、融合等演化过程。
- 王效岳刘自强白如江徐路路陈军营
- 关键词:指标体系可视化
- 主题演化视角下的国际情报学研究热点与前沿分析被引量:15
- 2017年
- 探测分析情报学领域的研究热点、前沿,对于专家学者进行科研选题、构建学科知识体系具有重要的意义,但是目前研究中以相对孤立的关键词进行分析预测,难以详细、准确地分析情报学发展趋势。文章以SCI收录的6种情报学核心期刊2010—2015年间所刊载的论文为研究对象,基于主题演化分析方法探测、识别国际情报学研究热点与前沿及其发展趋势;基于简单中心算法识别各个子时期的研究主题,然后通过计算向心度、密度以确定各子时期主题自身以及不同主题之间的内、外关联,进行子时期主题关联分析;然后利用Jaccard系数计算相邻子时期主题相似度,构建主题演化路径,进行主题演化分析,识别国际情报学研究热点与前沿。主题演化分析结果表明:定量与定性分析相结合的趋势进一步加强(协作分析、跨学科分析等);借鉴、改进目前模糊集、粗糙集和神经网络等新兴信息技术提升情报分析的准确性、效率,将会是未来几年国际情报学发展的重要发展方向。
- 刘自强岳丽欣王效岳白如江
- 关键词:情报学
- 基于时间序列模型的研究热点分析预测方法研究被引量:27
- 2016年
- 文章提出一种基于时间序列模型的研究热点评价与预测方法。利用关键词词频排序、热点关键词群构建和时间序列模型分析等方法,对CNKI收录的以竞争情报为关键词的近10年期刊论文的关键词进行处理,分析梳理了近10年竞争情报领域的研究现状,运用关键词群分析、社会网络分析和时间序列模型分析预测其研究热点的发展趋势。最后将2015年作为预测目标进行预测,将预测结果与实际数据对比,实验结果证明该方法是可行有效的。
- 刘自强王效岳白如江
- 关键词:时间序列模型关键词