李男 作品数:6 被引量:28 H指数:4 供职机构: 中国人民解放军信息工程大学 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
数据集成中XML模式和关系模式映射模型研究 被引量:11 2009年 针对数据集成遇到的数据交流难问题,文章首先介绍了XML技术的优势,并就如何利用其优势来解决XML文档和关系数据库之间的数据转换问题进行了分析。进一步研究了XML和关系数据库之间的基本映射方法,在此基础上建立了XML模式和关系模式之间双向映射的模型,并给出了模型的实现。 黄根平 郭绍忠 陈海勇 李男关键词:数据集成 映射模型 XML模式 基于中间表示规则替换的二进制翻译中间代码优化方法 被引量:4 2021年 动态二进制翻译在实现多源到多目标的程序翻译过程中,为屏蔽不同源平台间的硬件差异引入中间代码,采用内存虚拟策略进行实现,但同时带来中间代码膨胀问题。传统的中间代码优化方法主要采用对冗余指令进行匹配删除的方法。将优化重点聚焦在针对特殊指令匹配的中间表示规则替换上,提出了一种基于中间表示规则替换的二进制翻译中间代码优化方法。该方法针对中间代码膨胀所呈现的几种典型情景,描述了中间表示替换规则,并将以往应用在后端代码优化上的寄存器直接映射策略应用在此处。通过建立映射公式,实现了将原来的内存虚拟操作替换为本地寄存器操作,从而降低了中间代码膨胀率。使用SPEC CPU2006测试集进行了实验,验证了此优化方法的正确性和有效性。测试用例在优化前和优化后的执行结果一致,验证了优化方法的正确性;优化后测试用例的中间代码平均缩减率达到32.59%,验证了优化方法的有效性。 李男 庞建民关键词:动态二进制翻译 中间代码 结合上下文和依存句法信息的中文短文本情感分析 被引量:6 2023年 依存句法分析旨在从语言学的角度分析句子的句法结构。现有的研究表明,将这种类似于图结构的数据与图卷积神经网络(Graph Convolutional Network,GCN)进行结合,有助于模型更好地理解文本语义。然而,这些工作在将依存句法信息处理为邻接矩阵时,均忽略了句法依赖标签类型,同时也未考虑与依赖标签相关的单词语义,导致模型无法捕捉到文本中的深层情感特征。针对以上问题,提出了一种结合上下文和依存句法信息的中文短文本情感分析模型(Context and Dependency Syntactic Information,CDSI)。该模型不仅利用双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)提取文本的上下文语义,而且引入了一种基于依存关系感知的嵌入表示方法,以针对句法结构挖掘不同依赖路径对情感分类任务的贡献权重,然后利用GCN针对上下文和依存句法信息同时建模,以加强文本表示中的情感特征。基于SWB,NLPCC2014和SMP2020-EWEC数据集进行验证,实验表明CDSI模型能够有效融合语句中的语义以及句法结构信息,在中文短文本情感二分类以及多分类中均取得了较好的效果。 杜启明 李男 刘文甫 杨舒丹 岳峰关键词:句法结构 上下文信息 融合显隐式反馈协同过滤的差分隐私保护算法 被引量:5 2021年 由于协同过滤推荐算法依赖用户的数据,因而存在很大的隐私泄露风险。差分隐私保护技术可提供严格的隐私保护效果,但目前大多数基于差分隐私的推荐算法没有考虑隐式反馈数据,针对该问题,提出了一种新的基于差分隐私保护的协同过滤推荐算法。首先对隐式反馈矩阵进行矩阵分解,得到用户和物品的隐式特征向量;然后把得到的隐式特征向量融合到显式反馈模型求解中,通过在模型求解过程中加入均值扰动和梯度扰动,使算法满足ε-差分隐私保护;最后应用此算法预测评分,并在MovieLens数据集上对算法进行有效性评价。实验结果表明,所提算法能在推荐结果的准确性和用户的隐私保护之间实现有效的平衡。 孙道柱 李男 杜启明 刘文甫关键词:隐式反馈 矩阵分解 基于Tsallis熵的近似差分隐私K-means算法 被引量:2 2023年 利用K-means算法对用户信息进行聚类时,存在隐私泄露的风险。差分隐私保护技术可提供严格的隐私保护,但目前大多数满足差分隐私的K-means算法在处理多维数据时,存在随机选择质心和噪声添加不均衡的问题,因而导致聚类结果不理想。为此,本文提出一种基于Tsallis熵的近似差分隐私K-means算法。针对质心选择的随机性问题,提出Tsallis熵对属性赋权的策略来优化对象间的欧氏距离,然后对比各对象到唯一随机初始质心的赋权欧式距离来确定其余初始质心,使算法在减少随机选择初始质心的同时,提高模型准确率;在此基础上,针对噪声添加不均衡的问题,提出一种能够平衡信噪比的隐私预算分配策略,然后对迭代质心加入高斯扰动,使算法在不增加计算复杂度的情况下满足(ε,δ)-差分隐私保护,同时提升扰动结果的准确性;最后在四个真实数据集上对算法进行有效性评价。实验结果表明,所提出的算法能够在保证用户隐私安全的同时实现高效用的聚类。 杨舒丹 李男 郑文娟 杜启明关键词:TSALLIS熵 K-MEANS聚类 基于链队列的网格作业处理环境 2012年 用户提交的作业请求在网格作业处理环境中将被封装成作业对象,并依次被解析、调度、资源选择和提交。设计并实现了一种基于链队列的新型网格作业处理环境,由预处理队列、调度队列、资源选择队列和提交队列构成的一个链队列结构采用多线程技术,将作业处理流程划分成若干阶段,由控制中心统一管理作业对象在链队列中的操作。 李男 陈海勇 赵莹 毕勇华关键词:多线程