毛进
- 作品数:85 被引量:734H指数:17
- 供职机构:武汉大学信息管理学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家自然科学基金创新研究群体项目更多>>
- 相关领域:文化科学自动化与计算机技术经济管理政治法律更多>>
- 创新型企业的论文与专利关联性研究——以基因工程领域为例被引量:6
- 2023年
- 科学与技术具有双向互惠、协同发展的特征。当前研究多从领域发展视阈探究科学与技术间的关联模式及相互作用,而较少从特定创新主体出发分析两者关联。论文和专利分别是科学与技术的代表性产出,本文以基因工程领域为例,构建以论文和专利为节点的创新型企业科学—技术关联网络,结合知识网络分析方法,整合节点语义特征与网络结构特征,揭示创新型企业科学与技术的关联性。结果表明:(1)在创新能力更强的企业中,科学向技术的转化程度更高,但科技规模过大会导致转化速度降低;(2)相比跨企业的科技关联,创新型企业内部的科技关联更具优势,科学到技术的知识流动速度更快,且创新能力更强的企业能够在更广泛的科技领域产生关联;(3)创新型企业科学与技术关联的领域多样性与领域平衡性和企业的异质性能力相关,而领域平衡性仅与领域多样性有关。本研究能够为创新型企业开展基础科学研究、促进科技创新提供管理启示。
- 陈茜陈茜毛进李纲
- 关键词:创新型企业基因工程
- 基于用户标签网络的Web知识推送研究
- 在Web2.0时代,互联网已成为人类可利用的具有丰富知识资源的宝库,然而“知识过载”、“知识迷航”等问题也困扰着用户。个性化知识推送已成为解决这类问题的一种重要策略。在Web2.0网站中,社会化标签系统使得用户能够对自身...
- 毛进
- 关键词:社会化标签系统用户兴趣模型
- 词汇位置功能视角下的交叉领域知识生长研究被引量:1
- 2023年
- 挖掘记载科学知识的交叉领域文献,可以探究交叉领域形成和发展中的知识流动和知识创造规律。本文依据词汇在交叉领域文献中的位置功能,提出了“文献空间观”和交叉领域知识生长过程模型,包括知识吸纳、知识内化和知识创新三大环节,进而构建一种全文本分析方法框架实现对交叉领域知识生长过程的量化分析。以生物信息学领域作为案例开展了实证分析,研究结果发现,知识内化与知识吸纳高度相关,数量差距约6倍,但变化趋势相同;领域知识创新第一次高峰出现时间晚于知识吸纳和内化4年左右;随着学科不断成熟,即时内化率保持相对稳定,总内化率降低,新增吸纳知识的内化时滞降低,内化知识激发知识创新的效率越来越高。本文所提出的面向交叉领域知识生长的全文本分析方法框架,能够丰富学术文献全文本内容分析方法体系。
- 操玉杰王施运毛进李纲
- 关键词:知识计量跨学科研究
- 医学信息检索中一种基于概念的查询相关模型被引量:4
- 2014年
- 人工赋予的主题词,如医学数据库中的医学主题词(MeSH),能够揭示文档的概念或主题。现有的信息检索方法还未能充分地利用这些知识资源,将其整合到检索模型之中将对信息检索具有重要帮助。本文提出一种基于概念的查询相关模型(Relevance Model),在该模型中将MeSH视为概念。提出一种方法估计相关概念的语言模型,即概念语言模型。首先,从伪相关反馈文档中识别出相关概念,再借助于概念语言模型估计最终的查询相关模型。该模型可应用两种概率估计的抽样方法,全局环境方法和本地环境方法。实验运行在Ohsumed和Genomics数据集上,本地环境方法在Ohsumed数据集上的性能相对于查询似然模型具有显著性提升,同时本模型也匹敌于经过调优的查询相关模型(RM3)。
- 李纲毛进芦昆
- 关键词:MESH医学信息检索
- 微信群内部信息交流的网络结构、行为及其演化分析——基于会话分析视角被引量:21
- 2018年
- 微信群内部存在着复杂的会话结构,涉及不同的网络群体、用户行为及交互方式,揭示和把握微信群内部信息交流的网络结构、行为特征以及演化规律对认识微信用户信息行为具有重要的研究意义。本文在网络社群理论和会话分析理论的基础上,运用社会网络分析和内容分析方法对不同目标需求的微信群中信息交流网络的拓扑结构特征、用户特征量分布、信息交互类型以及演化规律性进行分析。研究显示:不同类型微信群中的消息分布具有较强聚集性,部分成员主导微信群中的信息交流,用户生成内容(UGC)存在较大不平衡,群成员参与微信群聊的积极性是影响群消息分布的决定因素;微信群中的信息交流更多是一种"有限度"和"碎片化"的会话形式,会话结构存在话题"无限漂移"和话语"无限流动"的特征;成员在群中观点的表达受群体压力、群类型以及与其他成员之间熟悉度、信任度的影响,表现为一种"沉默螺旋"状态;微信群会话过程是由话题的延续、迁移、转换及回逆构成,同一话题的演化也表现出启动、保持、沉默及终结的生命周期。
- 巴志超李纲毛进徐健
- 关键词:会话分析网络行为
- 面向多领域的词汇复杂度评估研究
- 2024年
- 【目的】探索集成不同语料库的方式,从而提升评估词汇复杂程度的综合表现。【方法】提出一种多领域词汇复杂度评估模型,通过特征泛化模块适应各种领域,在下游微调任务中学习词汇复杂度预测,通过特征融合模块探索手工特征与神经网络深度特征的组合意义。【结果】在LCP-2021数据集上,本文模型相较于公开的现有最优结果,Pearson系数、MAE、MSE指标分别提升0.014 8、0.001 7、0.000 4,Spearman系数和R2系数的表现则下降0.003 8、0.025 5;集成手工特征后没有明显变化;二次迁移到CWI-2018数据集,本文模型在三个领域上的MAE指标,相较公开的基线结果分别提升0.008 6、0.020 9、0.017 4。【局限】采用向量拼接集成手工特征和深度特征,未能充分融合不同类型特征;设计特征泛化模块时的算法选择具有一定局限性;可以进一步尝试构建综合数据集。【结论】集成不同语料库,有助于提升模型在新领域下的整体评估效果。
- 李纲黄建飞毛进
- 关键词:词汇复杂度
- 学术论文的社交媒体可见性预测研究被引量:3
- 2020年
- 【目的】基于学术论文的多维特征,对其在社交媒体推特上的可见性进行预测,分析影响论文社交媒体可见性的重要因素。【方法】将论文的推特总提及量作为其社交媒体可见性类别标签,从论文、作者和期刊三个方面构建学术论文特征框架,构建基于分类的论文社交媒体可见性预测模型。在糖尿病论文数据集上进行实验,对比算法性能并识别特征的重要性。【结果】LightGBM算法的性能最佳,准确率达到0.70,能够有效预测论文的社交媒体可见性。学术论文的三类特征均对其社交媒体可见性产生影响,其中期刊相关的三种特征影响较为显著,期刊年均影响因子的重要性位列第一。【局限】仅针对糖尿病相关论文在推特中的可见性进行预测,未探究其他学科领域的论文在多个社交媒体平台的可见性。【结论】集成学习的方法预测论文的社交媒体可见性是最有效的,期刊相关特征对学术论文社交媒体可见性的影响最为显著。
- 李纲管为栋马亚雪毛进
- 关键词:学术论文社交媒体
- 融合多维特征的学术文献下载行为预测研究被引量:6
- 2021年
- [目的/意义]学术文献下载行为是科研人员文献检索行为的重要一环,对其预测的研究有助于深度理解科研人员检索行为,为学术资源检索平台优化检索结果、重构排序提供依据,从而提升检索系统的服务质量。[方法/过程]构建用户学术文献下载行为的多维特征体系,在机器学习算法基础上构造基于查询相关性和基于用户行为的子分类器,并采取加权策略构建学术文献下载行为预测混合模型。[结果/结论]实验结果表明,随机森林算法在两种分类器上均取得最佳性能;相较于仅基于查询相关性特征训练的模型,混合模型的准确率提高了2.3%,F1值提升了1.3%。在混合模型中,基于用户行为的子分类器拥有更高权重;"下载量""是否采用专业/高级检索"和"发表时间"特征的贡献度较大。
- 谢豪吴雪华陈茜唐晶白云毛进
- 关键词:混合模型
- 基于社会化标签网络的细粒度用户兴趣建模被引量:19
- 2011年
- 针对目前由社会化标签抽取用户兴趣模型过程中存在的问题,在借鉴社会网络分析的基础上,提出构建网站层次和用户层次的社会化标签网络对用户产生的社会化标签进行序化,进而分别得到反映主题领域的社会化标签使用文档和用户标签网络,通过两者相似度的计算形成细粒度用户兴趣模型。实验结果能够验证该模型的科学性。
- 易明毛进邓卫华
- 基于文献聚类的国内外知识传播研究主题分析被引量:3
- 2014年
- 利用Endnote、Refviz等文献管理软件以Web of Science、CNKI收录的国内外知识传播研究论文为对象进行文献聚类分析。研究发现:学者们在实际研究过程中自然"涌现"出了四个主题,体现了当前知识传播研究的内容特征和方法特征,对于学术界进一步推进知识传播研究具有重要参考价值。
- 易明操玉杰邓卫华毛进
- 关键词:知识传播主题分析