宋宝燕
- 作品数:202 被引量:482H指数:12
- 供职机构:辽宁大学更多>>
- 发文基金:国家自然科学基金辽宁省教育厅高等学校科学研究项目辽宁省博士科研启动基金更多>>
- 相关领域:自动化与计算机技术经济管理机械工程文化科学更多>>
- 四分支链式结构金融区块链存储方法
- 一种四分支链式结构金融区块链存储方法,首先构建四分支链式结构金融区块链三元账本结构,数据存储在四分支链式结构的区块体中,根据不同的存储环境采用三元模式进行数据存储:全聚合存储、多单元存储、全分割存储,通过数据分流并行存储...
- 王俊陆刘强宋宝燕丁琳琳单晓欢李冬
- 工业数据仓库设计方法及其在质量分析中的应用被引量:9
- 2001年
- 提出一种建立工业数据仓库的基本方法 ,并结合某大型钢铁企业的具体情况 ,给出一种数据仓库系统的实现方案 ,讨论了数据仓库在企业产品质量分析中的应用。实践证明 ,数据仓库可为企业的经营管理提供全面、准确的数据 ,可在改进产品性能、提高产品质量方面发挥重要作用。
- 嵇晓鲍玉斌常钊宋宝燕于戈
- GPE:一种基于图模型的NFS有意义结果确定模型
- XML非完全结构查询(NFS)是在缺乏完整的XML文档结构信息情况下的重要查询手段。针对图模型下的NFS有意义结果判断问题,在PE模型基础上提出一种基于图的有意义结果判断模型GPE;针对标签歧义性和复杂的结构语义,GPE...
- 李晓光宋宝燕
- 关键词:NFSXML图模型
- 文献传递
- 面向金融领域事件抽取的篇章级长文本数据预处理方法及系统
- 本发明涉及面向金融领域事件抽取的篇章级长文本数据预处理方法及系统,属于大数据与人工智能技术领域,该方法包括以下步骤:1)选取金融事件的类型,并根据不同的金融事件类型定义事件元素;2)从互联网上公开数据源获取各类金融事件的...
- 李冬雷智磊纪婉婷宋宝燕单晓欢王俊陆
- 文献传递
- 一种基于众包的skyline-join查询处理方法
- 一种基于众包的skyline‑join查询处理方法,首先,在数据不缺失的数据表内对数据进行过滤,根据数据属性,过滤掉各个属性内被支配的数据元组;其次,针对数据属性值缺失的数据表,在不同的属性上,先根据此表的已知属性建立偏...
- 丁琳琳张晓脱乃元刘亮宋宝燕
- 一种基于Hadoop的大规模图最短路径查询方法被引量:2
- 2016年
- 图的最短路径查询作为图论的经典问题,广泛应用于现实世界的许多应用中.然而随着图的规模日益增大,传统单机环境下的查询算法已无法满足大规模图的处理需求.为解决上述问题,提出基于Hadoop的大规模图最短路径查询方法(D-CH方法):首先利用经典的图分割算法(CNM算法)将存储于Hadoop分布式文件系统(HDFS)中的大规模图进行分割,给出了适于后续算法的标记分割结果;然后将查询区分为分割后子图内查询和子图间查询,基于MapReduce编程模型分别给出相应的并行化查询处理算法.实验结果表明,D-CH方法对大规模图的最短路径查询具有良好的执行效率.
- 宋宝燕张瑞浩单晓欢段琼琼
- 关键词:HADOOPMAPREDUCE图分割最短路径分布式
- 融合实体信息和时序特征的问答式事件检测方法
- 2024年
- 针对现有问答方法在处理触发词歧义性问题上的不足,提出一种融合实体信息和时序特征的问答式事件检测方法EDQA-EITF。构建一种基于RoBERTa的问答框架,增强模型的语义表示能力;通过在模型输入序列中显示地添加实体、实体类型等先验信息,进一步帮助模型根据句子的上下文语境对触发词进行分类;采用最小门控循环单元(minimal gated unit,MGU)和Transformer编码器对输入序列中的时序依赖关系进行建模,提升模型对于句子的语义关系、句法结构的阅读与理解能力。公共数据集上的实验结果表明,所提方法在进行事件检测时具有更优的性能,有效缓解了触发词的歧义性问题。
- 马宇航宋宝燕丁琳琳鲁闻一纪婉婷
- 关键词:先验信息TRANSFORMER
- RFID事件流上一种扩展意义的子查询共享方法被引量:2
- 2012年
- 提出一种扩展意义的子查询共享方法.该方法针对多复合事件查询共享后存储的问题,提出了复合事件图作为查询的内部表示;针对操作符不同、操作数相同的子查询共享不足的问题,通过分析不同复合事件查询、分析各种操作符之间的关系,提出了小事件的概念、并基于此给出了复合事件查询改写的规则和性质、小事件共享的方法以及共享的实现策略,实现了扩展意义的子查询共享.最后通过与典型算法的对比实验验证了本文所提方法的有效性.
- 宋宝燕娄慧贞唐敏惠新华于戈
- 关键词:RFID
- 基于滑动窗口语义的聚集计算方法
- 针对滑动窗口聚集查询问题,提出了一种基于滑动窗口语义的聚集计算方法——链树(linked-tree)算法.该算法把滑动窗口逻辑分层,记录层次内数据统计信息,具有很高的执行速度;同时,所需的内存量不与窗口大小直接相关,可以...
- 苏东宋宝燕杨兴华欧征宇于亚新于戈
- 关键词:跳数
- 文献传递
- 大规模标签图中的动态Top-K兴趣子图查询
- 2018年
- 针对传统算法由于时间或空间复杂度过高而难以实现规模大且动态变化情况下标签图的Top-K子图查询问题,提出一种适用于大规模标签图的动态Top-K兴趣子图查询方法 DISQtop-K。该方法建立了包括节点拓扑结构特性(NTF)索引和边特性(EF)索引的图拓扑结构特性(GTSF)索引,利用该索引可有效剪枝过滤不满足限制条件的无效节点及边;基于GTSF索引提出了多因素候选集过滤策略,通过对查询图候选集进一步剪枝以获得较少的候选集;考虑到图的动态变化可能对匹配结果产生影响,提出了Top-K兴趣子图匹配验证方法——DISQtop-K,将匹配验证过程分为初始匹配和动态修正两个阶段,以尽可能保证查询结果的实时、准确。大量实验结果表明,相比RAM、RWM算法,DISQtop-K方法的索引创建时间较短且占用空间较少,能有效处理大规模标签图中的动态Top-K兴趣子图查询。
- 宋宝燕贾春杰单晓欢丁琳琳丁兴艳