刘斌
- 作品数:3 被引量:14H指数:3
- 供职机构:武汉大学计算机学院软件工程国家重点实验室更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于词向量的专利自动扩展查询研究被引量:5
- 2017年
- 专利检索与普通的文本检索有着极大的不同,专利文本包括权利声明、摘要、全文等不同部分,自然不能简单地将普通文本的检索方法应用到专利检索当中来。专利检索通常面临着召回率低下的问题,首先,由于专利文本具有极强的专业性,有着复杂的术语表达方式,用户输入的关键词通常无法明确捕捉到检索意图,导致检索结果不理想。其次,专利撰写时有意识地制造与众不同的词汇,导致相关专利无法被检索到。目前有很多的研究方法都旨在提高专利检索的召回率,但是仍然有许多问题有待解决,检索效果有待改善。提出了一个基于词向量的专利自动扩展查询方法,在词向量的基础上,构建一个关键词查询网络,通过稠密子图发现算法来寻找扩展词集合,提高扩展词的有效性。在CLEF-IP 2012数据集的基础上进行了充分的实验,实验结果表明,本文提出的算法能够保证扩展词集获取的灵活性和有效性,同时能进一步提高专利检索的召回率。
- 刘梦兰刘斌刘斌
- 关键词:扩展查询
- 支持技术创新的专利检索与分析被引量:6
- 2016年
- 介绍了目前专利检索和分析的主要研究工作,包括专利的可检索性、技术现状检索和相关性检索方法等,以及专利地图分析、新颖度分析和Patent Dom专利分析框架等分析方法。最后基于深度学习的思想,讨论了新一代的支持技术创新的专利检索方法、专利论文检索方法以及专利趋势分析方法。
- 刘斌刘斌冯岭王飞
- 对象代理数据库的双向指针存储优化方法被引量:3
- 2018年
- 在对象代理数据库中,提出了两个新的概念:代理对象和代理类.一个对象可以有一个或多个代理对象,该对象也被称为代理对象的源对象.代理对象可以从其源对象中选择性继承属性和方法,也可以扩展定义代理类自己的属性和方法.代理对象继承自源对象的属性称为虚属性,虚属性不实际存储其值,而是在查询时根据源对象的实属性值计算得到.对象代理数据库利用双向指针表来实现源对象和代理对象之间的这种关联,双向指针表中每一条记录包含两个字段,分别对应于源对象ID和代理对象ID.当存在多层代理关系时,查询代理对象需要对双向指针表执行多次查询操作,因而查询效率往往不是很好.文中针对代理对象查询效率低的问题进行了深入研究,发现其主要原因是双向指针表中具有相同代理类和源类的数据分布在不同的磁盘块中,查询双向指针表时需要多次I/O操作.基于此,文中首先设计新的对象代理数据库中空闲空间分配策略,在原有的空闲空间管理策略中加入新的索引信息,使得当需要添加记录时不仅使用空闲空间管理模块FSM查找空闲空间大小一个条件,而且结合使用索引中指定的聚簇信息寻找具有合适空闲空间的磁盘块,然后读取目标磁盘块到内存中,并将双向指针表中的元组以源类和代理类为单位进行分类写入磁盘块,从而实现基于代理关系的双向指针表的聚簇存储.同时针对具体的应用场景,文中根据数据库模式中代理层次信息、用户查询频率等因素设计一个I/O查询代价模型,利用该模型计算各级代理类与源类聚簇之后的查询代价,从而选择出一种查询代价最小,性能最优的聚簇策略,使得能够最大限度的减少I/O次数,提高代理对象的查询效率.实验结果表明,该聚簇方法在真实数据集上的优化效果比未优化平均提高15%以上,比已有的双向指针表的优化方�
- 胡聪睿刘斌刘斌王飞王飞
- 关键词:对象代理数据库