胡正银 作品数:62 被引量:389 H指数:14 供职机构: 中国科学院文献情报中心成都分馆 更多>> 发文基金: 中国科学院西部之光基金 国家自然科学基金 国家创新方法工作专项 更多>> 相关领域: 文化科学 自动化与计算机技术 医药卫生 经济管理 更多>>
基于“主语-谓语-宾语”三元组的知识发现研究——以诱导多能干细胞领域为例 被引量:6 2017年 本文提出基于"主语-谓语-宾语(Subject-Predication-Object,SPO)"三元组的生物医学领域知识发现框架,对该框架的关键技术和实施流程进行研究。首先,基于UMLS语料库,利用Sem Rep工具从生物医药文献中抽取SPO三元组;其次,基于领域知识组织体系,结合自定义词表和清洗规则对SPO进行清洗和筛选;再次,利用Net Miner分别绘制以Subject和Object为中心节点,Predication为边的语义网络图;最后,结合专家解读,实现领域知识发现。本文以诱导多能干细胞领域为例进行实证研究。结果显示,SPO三元组可细粒度地揭示科技文献的知识内容,基于SPO的语义网络能直观地支持领域知识发现,该框架具有兼容、高效、易实施等优点。 隗玲 胡正银 庞弘燊 覃筱楚 郭红梅 方曙关键词:知识发现 知识组织 语义网络 面向趋势预测的热点主题演化分析方法研究 被引量:20 2020年 【目的】从外部数量特征和内部文本特征两个层面,构建科学的数理模型和内容预测模型,进而对热点研究主题演化趋势进行预测分析。【方法】基于LDA模型进行主题识别并构建主题时间序列,结合均值与线性回归拟合确定热点主题;利用ARIMA模型和Word2Vec模型从主题强度和主题内容两个层面预测分析热点主题趋势。【结果】对美国干细胞领域进行实证研究,筛选出造血干细胞移植技术、癌症干细胞和干细胞抑制作用、干细胞诱导分化、衍生配子技术、造血干细胞5个热点主题并预测其发展趋势。【局限】基于Word2Vec模型对主题内容趋势进行分析主要以单个词汇为基础,解读过程中可能存在歧义。【结论】与人工解读为主的主题趋势预测分析方法相比,本研究所提方法能在一定程度上提高预测分析的效率与科学性。 岳丽欣 刘自强 胡正银关键词:热点主题 ARIMA模型 基于本体的知识检索系统框架设计研究 被引量:1 2009年 本文阐述了基于本体的知识检索系统的构建模式和设计思想,并对系统的构建方案进行了解析和探索研究。 冯微峰 胡正银 房俊民关键词:本体 知识检索 面向TRIZ的专利技术三元组抽取研究与应用 2024年 【目的】针对专利技术三元组自动抽取的准确性和效率不高的问题,研究专利技术三元组抽取的模型,以提升个性化、细粒度、多维度的深度抽取与语义关联的准确性。【方法】针对技术问题、解决方案、技术功能与技术效果等4个技术主题维度,提出基于WeakLabel-Bert-BiGRU-CRF模型的抽取方法,使用宏平均等指标进行模型评估。【结果】选择石墨烯能量存储应用领域专利作为数据集,实验结果表明,相比于Bert-BiGRU-CRF模型,所提模型针对三元组抽取的宏平均超过0.8,进一步减轻了数据标注的工作量,抽取效果更好。【局限】所提模型需要领域专家和专利情报分析人员共同参与数据标注,标注质量的不同会对应用效果产生影响。【结论】基于WeakLabel-Bert-BiGRU-CRF模型,研建对应的原型系统,以便后续进一步使用与推广专利技术三元组抽取方法,在科技文献知识挖掘领域也有较广泛的应用前景。 刘春江 李姝影 方曙 胡正银 钱力关键词:TRIZ 科学数据“东数西算”组织机制与传输模式研究 2023年 【目的】科学数据“东数西算”是“东数西算”工程的重要组成部分,其顺利实施需要众多机构协同合作。研究其组织机制与传输模式,凝练出科学的技术方案,归纳典型的示范案例,对促进科学数据“东数西算”具有重要意义。【方法】本文首先从组织机制的角度分析了科学数据处理的3种模式,然后探讨了科研联盟模式下基于联盟链理论的科学数据传输模型构建,最后结合基于科研联盟模式与科学数据传输模型开展的科学数据“东数西算”具体实践,总结开展科学数据“东数西算”的相关经验。【结果】科研联盟模式可以整合现有资源促进科学数据流通,可溯源的数据传输模型使各机构在确认权责利益时有据可循。【结论】建立科学的组织机制与传输模式能够减少科学数据“东数西算”过程中的资源投入,提高数据传输效率,促进科学数据安全流通与高效利用。 方肖 胡正银 韩锐 郑亮关键词:科学数据 融合知识图谱与大语言模型的文献复杂知识对象抽取方法 本发明公开了一种融合知识图谱与大语言模型的文献复杂知识对象抽取方法,属于数据挖掘领域,包括步骤:S1,领域知识图谱构建;S2,大语言模型微调;S3,复杂知识对象抽取:利用知识图谱来构建提示prompt,通过步骤S1中模式... 陈文杰 胡正银 卢颖 石栖基于发明专利现状的我国技术创新能力分析 被引量:17 2007年 技术创新能力评价的一个重要方面是发明专利的产出情况。本文从全国总体和区域情况两个角度,研究了我国发明专利产出情况,包括专利密度、专利经济力、创新技术分布、合作化程度等情况,并探讨了产学研在我国技术创新上的贡献力构成情况,从量化角度直观地描绘了中国技术创新能力的现状。 陈云伟 杨志萍 方曙 文奕 胡正银 邓勇 王春关键词:技术创新 面向TRIZ的领域专利技术挖掘系统设计与实践 被引量:15 2017年 [目的 /意义]针对面向TRIZ的专利技术深度、精准挖掘的需求,设计并开发一套领域专利技术挖掘系统。[方法 /过程]首先,归纳面向TRIZ的专利技术挖掘的具体需求,分析现有工具的不足。其次,提出领域专利技术挖掘系统的体系结构,总结其关键技术及解决方案。最后,开发一套面向TRIZ的领域专利技术挖掘原型系统,并进行大口径光学元件(LAOE)领域专利技术挖掘实践。[结果 /结论]该系统基于SAO(subject-action-object)三元组与简单知识对象,集成文本挖掘技术构建细粒度、多维度的领域技术索引,实现领域知识棱镜、面向TRIZ的语义检索与专利可视化分析功能,可以支持深度、精准的专利技术挖掘应用。 胡正银 刘春江 隗玲 杨宁 徐源 许海云 文奕大数据视角下技术机会分析研究综述 被引量:1 2023年 为减少技术机会分析所需的时间和成本,更快地探索与发现技术机会以支撑相关战略规划,全面系统总结分析大数据视角下技术机会的内涵、热点应用场景和分析方法,基于Web of Science、中国知网中文期刊数据库获取相关中英文文献392篇,根据文献质量评估标准,通过略读、筛选、精读、补充重要文献等步骤,深度解析精选论文内容,梳理研究热点、空白与前沿。结果发现,技术机会发现与识别方法正在借助大数据分析形成一套系统、规范化的研究范式。研究对象上,专利技术创新机会不再局限于热点、空白点、孤立点、离群点等单一界定方式,其知识表示方法在融入技术创新需求中逐步完善与拓展;数据源来上,多源异构数据提供动态、实时、多元化研究视角,应用场景从回顾性的趋势监测转向未来需求的技术预测与风险评估,但支撑产业和企业实际需求的研究仍较少;分析方法上,组合运用文献计量、社会网络分析与大数据分析,方法创新由单一特征的同质网络向融合特征的异构网络发展,所挖掘的技术细粒度越来越高。最后针对目前研究存在的主要问题,提出充分利用多源信息的多维性和功能的多元化,在综合应用各类方法提高定量分析效度的基础上,面向问题与需求开发“规则+统计+知识库+交互”大数据智能创新工具,结合专家专业知识完善技术机会对象特征、性能指标,从而更深入地揭示技术机会细节,更好地支撑企业、国家的科技战略规划。 李姝影 胡正银 隗玲 刘春江 方曙关键词:数据分析 大数据 技术创新 有机太阳能电池领域的实验方案智能推荐方法及系统 本发明公开了一种有机太阳能电池领域的实验方案智能推荐方法及系统,属于数据挖掘领域,包括:S1,实验方案知识建模与知识抽取;S2,实验方案知识图谱构建:以SPO三元组为基础,构建有机太阳能电池领域实验方案知识语义网络;S3... 韩涛 胡正银 陈文杰 张凯 石栖