丁琳琳 作品数:26 被引量:28 H指数:2 供职机构: 辽宁大学信息学院 更多>> 发文基金: 国家自然科学基金 辽宁省博士科研启动基金 辽宁省教育厅高等学校科学研究项目 更多>> 相关领域: 自动化与计算机技术 理学 环境科学与工程 文化科学 更多>>
基于改进哈夫曼编码的大规模动态图可达查询方法 图数据能够有效描述现实生活中各类事物之间的复杂关系,随着社交网络分析、生物信息网络分析等新兴应用的涌现和计算机技术的飞速发展,图的规模迅速增长,并且频繁更新,使得对大规模动态图数据的处理需求愈加迫切。可达查询是图数据管理... 丁琳琳 李正道 纪婉婷 宋宝燕融合实体信息和时序特征的问答式事件检测方法 2024年 针对现有问答方法在处理触发词歧义性问题上的不足,提出一种融合实体信息和时序特征的问答式事件检测方法EDQA-EITF。构建一种基于RoBERTa的问答框架,增强模型的语义表示能力;通过在模型输入序列中显示地添加实体、实体类型等先验信息,进一步帮助模型根据句子的上下文语境对触发词进行分类;采用最小门控循环单元(minimal gated unit,MGU)和Transformer编码器对输入序列中的时序依赖关系进行建模,提升模型对于句子的语义关系、句法结构的阅读与理解能力。公共数据集上的实验结果表明,所提方法在进行事件检测时具有更优的性能,有效缓解了触发词的歧义性问题。 马宇航 宋宝燕 丁琳琳 鲁闻一 纪婉婷关键词:先验信息 TRANSFORMER 基于平面图覆盖的大规模图可达查询处理 语义网络、社交网络、生物信息网络等新兴应用的涌现及普及,使得图数据的规模不断增大,针对大规模图数据的研究成为当今的研究热点和难点.可达查询是图数据处理中频繁使用的基础性查询,一些复杂的查询能够分解成包含多个可达查询的操作... 丁琳琳 李雪城 王大军 宋宝燕面向时空数据区块链的对等网络(P2P)通信机制 被引量:2 2023年 在传统区块链中,节点与节点之间是对等的,区块链网络中的所有节点组成了一个全分布式非结构化的对等网络(P2P),即随机网络.节点之间采取泛洪的方式进行通信,泛洪通信机制存在单点信息爆炸、可控性差、容易形成泛洪循环等缺点,节点间通信效率低.针对这些缺点,本文在时空数据区块链网络中,依据节点类别及节点间的通信需求,基于chord算法提出了一种结构化的对等网络(P2P)通信机制——NC-chord.首先,确定网络中的节点类别以及不同节点间的通信需求;然后,依据不同节点间的通信需求在节点之间建立结构化通信网络,同时建立节点路由信息.实验表明,本文所提结构化P2P通信机制NC-chord在节点通信效率方面,较随机网络有了较大提升. 丁琳琳 华亚洲 陈泽 王俊陆关键词:结构化P2P 节点聚类 基于改进哈夫曼编码的大规模动态图可达查询方法 被引量:6 2017年 随着社交网络分析、生物信息网络分析等新必应用的涌现和计算机技术的飞速发展,图的规模迅速增长,并且频繁更新,使得对大规模动态图数据的处理需求愈加迫切.现有的面向大规模动态图的可达查询研究成果较少,尚存在索引压缩困难以及图结构待优化等问题.本文提出了一种支持大规模动态图的基于改进哈夫曼编码的可达查询处理方法(Huffman-based Label Reachability,HuffLR).该方法首先对预处理图进行结构上的两次压缩,得到双压缩图;其次,基于双压缩图提出一种前缀label索引,该索引能够有效表达节点问的可达关系;最后,提出双压缩图的演进和可达查询处理及优化算法,主要包括边的插入与删除、节点的插入与删除.实验表明,本文提出的基于改进哈夫曼编码的大规模动态图可达查询处理方法具有良好的可行性和有效性. 丁琳琳 李正道 纪婉婷 宋宝燕关键词:动态图 哈夫曼编码 EBSN中基于用户特征的社交事件规划与饥饿问题处理 被引量:1 2020年 社交事件发布参与平台越来越受到人们的关注,其主要功能是为对某个社交事件感兴趣的用户规划适合的社交活动.现有社交事件平台贪婪规划方法通常假设每个用户可以参与限定个数的事件,解决参加限定个数事件引起的时空冲突,但方法中没有考虑用户的特征,导致用户规划顺序不合理,同时,现有方法也没有考虑如何解决因资源占用出现用户无法获取事件的情况,导致用户对社交平台满意度下降.为解决上述问题,本文通过用户空闲时间与用户平均速度双重约束条件,提出一种基于用户特征的社交事件规划与饥饿问题处理方法,该方法首先提取用户特征排序的同时,结合贪心算法和Skyline思想再次排序,确定用户最佳处理顺序,在此基础上,针对社交网络事件规划中可能出现的用户饥饿问题提出救济算法,消除兴趣值不敏感的饥饿用户,在总效用值下降最小的前提下,保证了用户对社交网站的最大满意度.实验表明,本文提出的规划算法能够有效地进行社交事件规划并解决用户饥饿问题. 张翰林 丁琳琳 王俊陆 宋宝燕关键词:饥饿问题 大规模标签图中的动态Top-K兴趣子图查询 2018年 针对传统算法由于时间或空间复杂度过高而难以实现规模大且动态变化情况下标签图的Top-K子图查询问题,提出一种适用于大规模标签图的动态Top-K兴趣子图查询方法 DISQtop-K。该方法建立了包括节点拓扑结构特性(NTF)索引和边特性(EF)索引的图拓扑结构特性(GTSF)索引,利用该索引可有效剪枝过滤不满足限制条件的无效节点及边;基于GTSF索引提出了多因素候选集过滤策略,通过对查询图候选集进一步剪枝以获得较少的候选集;考虑到图的动态变化可能对匹配结果产生影响,提出了Top-K兴趣子图匹配验证方法——DISQtop-K,将匹配验证过程分为初始匹配和动态修正两个阶段,以尽可能保证查询结果的实时、准确。大量实验结果表明,相比RAM、RWM算法,DISQtop-K方法的索引创建时间较短且占用空间较少,能有效处理大规模标签图中的动态Top-K兴趣子图查询。 宋宝燕 贾春杰 单晓欢 丁琳琳 丁兴艳基于平面图覆盖的大规模图可达查询处理 被引量:1 2015年 随着语义网络、社交网络、生物信息网络等新兴应用的涌现及普及,图数据的规模不断增大,针对大规模图数据的研究成为当今的研究热点和难点。可达查询是图数据处理中频繁使用的基础性查询,一些复杂的查询能够分解成包含多个可达查询的操作集合,其高效处理具有重要意义。针对大规模图的可达查询,提出了一种基于平面图覆盖的大规模图可达查询处理方法。首先给出了一种基于平面图覆盖的可达标签索引方法(planar graph cover based reachability labeling index method,PGCL)。该方法将最优树作为预处理应用于平面图覆盖,通过最优树创建、最优树分解以及树分解平面化处理,得到有向无环图(directed acyclic graph,DAG)的平面图覆盖,最大限度地保留了原图的可达性信息,从而基于覆盖顶点创建二维标签,用于压缩可达传递闭包。设计了基于PGCL的可达查询算法,有效实现了大规模图的可达查询。通过大量实验证明了提出的查询方法在保证查询的高效性情况下,更好地压缩了传递闭包,提高了可达查询的处理效率。 段雨晴 李世峰 丁琳琳MapReduce环境下面向用户偏好的top-k连接查询处理方法 2017年 随着互联网技术的迅猛发展和大数据时代的来临,面向海量数据的top-k连接查询返回组合得分最大(或最小)的k个连接结果,能够广泛应用到商业模式预测、用户需求分析、商品营销统计等领域.然而,在实际应用中,不同的用户对参与连接的数据表中的某些维度往往会有不同的要求,进而产生了不同的用户偏好.为了选出符合用户偏好的连接结果,需要针对用户偏好对连接后的结果进行筛选.因此,本文针对不同用户在查询时有各自不同偏好的问题,提出了在MapReduce环境下基于用户偏好的top-k连接查询处理方法.首先,在预处理阶段将两表进行连接操作;其次,提出利用skyline技术求解用户偏好的方法,通过分区间支配关系及虚拟最小点的判定,过滤不满足用户偏好的元组;最后,再通过打分函数找到需要的top-k连接查询结果.大量实验表明,本文提出的基于用户偏好的top-k连接查询处理方法能够有效满足用户偏好,具有良好的有效性和扩展性. 丁琳琳 李晓燕 韩百硕 刘思平 宋宝燕关键词:MAPREDUCE 用户偏好 SKYLINE 基于HBase与Netty的煤矿微震时序大数据存储优化 2023年 在当前智能煤矿场景中,大量煤矿微震传感器所产生的时序数据呈爆炸式增长,进而对现有的存储系统及性能都有了更高的要求。目前已经存在基于分布式列族数据库HBase能够存储工业时序大数据的实例,但是由于没有考虑到特定业务场景中数据的特征关联问题,现有的策略仍然无法较好地满足煤矿微震波形时序数据的特定存储需求。针对上述问题,基于分布式存储系统HBase,利用煤矿微震波形时序数据的特征,提出了基于HBase与Netty的煤矿微震时序大数据存储性能优化(CM^(2) TS-HBase),分成四个部分,分别为数据采集层、数据预处理层、数据中转层以及数据存储层。其中,数据采集层分为离线部分与实时部分,离线部分即存储在数据中心硬盘中的历史微震时序数据文件,实时部分即部署在某煤矿的多个微震波形传感器通过网络实时地向数据预处理层进行数据缓冲;数据预处理层实现对波形时序数据的文件进行对齐、解析以及序列化操作。根据煤矿微震波形时序数据特征提出了适用于微震波形时序数据的HBase数据表结构、预分区策略以及主键优化策略,有效地解决了数据存储过程中出现的数据热点问题以及数据分散问题;数据中转层提出了基于Netty与Redis的数据转发中间件平台为整个存储体系提供异步处理机制,较好地解决了高并发存储问题;数据存储层是基于分布式数据库HBase作为存储体系的底层存储媒介。最终根据真实数据集的存储耗时证明了相较于原生存储方法(HBase API)与基于金融时序数据存储优化(FTBase),CM2T S-HBase在煤矿微震时序数据的存储性能有了明显提高。 丁琳琳 王智涵 顾英豪 王凯璐 包鑫阳关键词:时序数据