马建霞 作品数:97 被引量:924 H指数:17 供职机构: 中国科学院 更多>> 发文基金: 中国科学院西部之光基金 国家自然科学基金 国家社会科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 环境科学与工程 更多>>
基于BiLSTM-IDCNN-CRF模型的生态治理技术领域命名实体识别 被引量:15 2021年 在生态治理技术领域中,有大量的文献数据没有得到充分的开发与利用。提出基于字嵌入的BiLSTM-IDCNN-CRF模型,结合BiLSTM网络和IDCNN网络获取到的不同粒度的特征。在生态治理技术数据集中取得的F1值为0.7207,均高于现有主流模型取得的成绩。实验验证了字嵌入方法的有效性和模型的性能,同时也为其他文本书写规范不统一且专业性较强的领域命名实体识别提供了思路。 蒋翔 马建霞 马建霞关键词:命名实体识别 自然语言处理 神经网络 基于专利的中国沙漠化治理技术分析 被引量:4 2018年 以3 824组简单专利族为数据基础,揭示国内沙漠化治理技术类别分布和主要领域。通过阅读专利摘要或全文内容,采用自下而上的聚类方法将当前专利划分为沙漠化判断、治沙、沙产业3个大类,监测与评价、科研仪器、生物治沙、机械治沙、化学治沙、综合治沙、农业、工业、第三产业和综合性利用10个中类,更细分至机械沙障等31个小类。根据专利数量认定的4大主要技术领域为沙区药用食用植物资源的种植(45%)、植物资源精深加工(9. 68%)、各种农林机具加工机械及配件(10. 3%)和机械沙障(13. 91%),占总量的78. 89%,专利领域分布集中。对主要技术领域采用内容分析法,提取植物、加工制品、机械、沙障等的信息进行了详细分析,并指出目前专利技术中的尚待发展之处,可为全面认识中国沙漠化治理技术提供专利视角的参照。 宁宝英 马建霞 姜志德 陈春 张欣利 鲁景亮关键词:沙漠化治理 基于主成分分析的西北五省区专利资源布局评价 被引量:3 2014年 在构建区域专利资源评价指标体系,并对西北五省区的专利资源布局分析的基础上,通过主成分分析方法对各省区的专利综合实力进行评价,结果表明,从专利资源基本情况看,近10年,陕西专利申请量最大,各省区的创新主体有差异。各省区专利资源技术领域在IPC小类上,重点专利资源布局具有相似性;从专利数量、质量、价值和区域布局方面构建的区域专利资源评价指标体系能较好的分析对比区域专利资源,同时,主成分分析方法能较客观地对区域专利资源综合实力进行评价。 王鹏龙 马建霞 任珩关键词:指标体系 主成分分析方法 沙漠科学研究野外采样区时空分布特征探索性分析——以JAE期刊出版论文为例 被引量:2 2016年 沙漠科学研究工作开展过程中涉及众多与地理位置紧密相关的试验区、采样点等信息。本文选择了Elsevier出版发行、SCI收录的生态环境类国际知名期刊《Journal of Arid Environments》(JAE)在2009年1月至2015年10月间出版的科技文献中以沙漠科学研究为主题的论文,采集其研究区或采样点的地理位置信息,同时结合著录者资料及作者关键词等相关信息,探索分析了沙漠科学研究在特定时间维度的演变轨迹与空间维度上的分布特征。结果显示,研究采样多选择在中低海拔地区,野外取样从沙漠边缘地带逐步向腹地区域深入,且随时间推移其范围呈扩张趋势。这一工作从文献计量学的角度为科研工作者宏观把握沙漠研究的区域选择变化趋势提供了参考。 李娜 鲁景亮 马建霞 李恒吉关键词:文献计量学 SEEKSpace-基于DSpace的环境与生态科学知识积累平台 本文首先对SEEKSpace的功能需求进行了分析,明确了SEEKSpace的主要功能和服务需求.接下来,对以DSpace为基础进行SEEKSpace运行和服务平台建设的主要任务和过程进行了讨论,包括DSpace的本地化、... 祝忠明 马建霞 常宁 李富强 刘勋关键词:数字图书馆 学科知识库 文献传递 数字图书馆环境下基于OpenURL的开放式链接框架研究 被引量:12 2003年 通过比较数字图书馆环境下基于DOI的CrossRef和基于OpenURL的SFX的开放链接框架,着重分析基于OpenURL的开放链接框架的思想、OpenURL的语法,实现对符合用户背景的服务所依赖的CookiePusher机制。并介绍基于DOI的CrossRef和基于OpenURL的集成的开放链接框架的试验。 马建霞关键词:OPENURL SFX DOI CROSSREF 用户画像建模技术在学科服务中的应用探讨 被引量:7 2019年 为更好地服务学科用户,满足其日益专业化、复杂化的信息需求,在已有大量用户数据的基础上,试图引入用户画像建模这一技术对当前的学科服务模式做出改善.本文从多个方面分析该技术应用于学科服务的可行性与必要性,详细描述构建学科用户画像模型的各个流程,并对完成建模后的应用场景予以举例说明.该技术通过对学科用户数据的深度挖掘分析,可为用户提供更加精准、高效的学科服务,推动学科服务向更深层次迈进. 马管 李娜 李娜关键词:学科用户 学科服务 网络科普与西部大开发 本文论述了网络科普与西部大开发.科普工作是一个系统工程,要适应知识经济时代对科普工作的要求,必须加强科普能力的建设.利用网络进行科普就是科普创新的一个尤为重要的方面. 孙成权 马建霞关键词:网络科普 西部大开发 科普工作 知识经济 文献传递 Jfactor及其与传统文献计量指标的关系 2015年 [目的/意义]研究基于开放式引文数据库提出的新型期刊评价指标Jfactor以及其与传统文献计量学指标的关系,分析Jfactor的特点,并对我国期刊评价提出启示。[方法/过程]结合统计学方法,利用SPSS软件对高能物理领域期刊的指标数据进行相关性分析,主要包括Jfactor与impactfactor、5-yearimpactfactor、eigenfactorscore,同时将指标之间作比较研究。[结果/结论]相关分析结果表明,Jfactor与impactfactor相关性最强,其次是5-yearimpactfactor,与eigenfactorscore的相关性相对最弱。相对于impactfactor,Jfactor的计算数据更加透明,而且充分考虑了开放数据对论文引用的影响,对我国期刊评价具有重要的研究价值。 鲍玉芳 马建霞基于就业市场需求的我国情报人才培养探讨 被引量:12 2017年 [目的/意义]研究当前就业市场对情报的需求情况,探讨情报学研究生的就业方向,为情报学人才培养机构及研究生提供应对策略和建议。[方法/过程]使用爬虫技术获取中文招聘网站中与情报有关的招聘信息,采用文本处理和统计分析方法从企业维度和职位信息维度对当前就业市场中关于情报和情报学专业的需求进行对比分析。[结果/结论]发现我国就业市场中各行各业存在大量的情报需求,对情报学的认知偏低,与情报学研究生就业范围的局限形成明显对比。[局限]数据获取样本范围为三大综合性招聘网站,时间跨度为两个月,后续研究应当增加研究的样本。 王文娟 马建霞关键词:情报学 招聘广告 文本挖掘