禹龙 作品数:105 被引量:267 H指数:9 供职机构: 新疆大学 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 博士科研启动基金 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 理学 更多>>
基于堆栈降噪自编码的维吾尔语事件共指关系识别 2018年 结合维吾尔语的语言特点,基于堆栈降噪自编码(SDAE),提出一种新的维吾尔语事件共指关系识别方法。将维吾尔语事件两两构成候选事件对,抽取事件基本属性、触发词、事件距离等9项特征,利用Word Embedding富含语义信息的特性,将其计算得到的维吾尔语事件触发词语义相似度作为特征之一,训练SDAE模型,将SDAE的输出作为softmax层的输入,从而分类完成维吾尔语事件共指关系识别任务。实验结果表明,与浅层机器学习模型支持向量机相比,基于深度学习机制的SDAE模型更适用于维吾尔语事件共指关系识别任务,并提升了识别性能。 王淑媛 田生伟 禹龙 冯冠军 艾山吾买尔 李圃 赵建国关键词:维吾尔语 语义相似度 计算机网络教学低成本实验方案的研究与实践 被引量:1 2006年 文章介绍了几种经济实用的计算机网络实验方案,经教学实践证明效果良好。 田生伟 禹龙关键词:计算机网络 基于纹理指纹与活动向量空间的Android恶意代码检测 被引量:6 2018年 为了进一步提高恶意代码识别的准确率和自动化程度,提出一种基于深度学习的Android恶意代码分析与检测方法。首先,提出恶意代码纹理指纹体现恶意代码二进制文件块内容相似性,选取33类恶意代码活动向量空间来反映恶意代码的潜在动态活动。其次,为确保分类准确率的提高,融合上述特征,训练自编码器(AE)和Softmax分类器。通过对不同数据样本进行测试,利用栈式自编码(SAE)模型对Android恶意代码的分类平均准确率可达94.9%,比支持向量机(SVM)高出1.1个百分点。实验结果表明,所提出的方法能够有效提高恶意代码识别精度。 罗世奇 田生伟 禹龙 于炯 孙华关键词:恶意代码 基于DCNNs-LSTM模型的维吾尔语突发事件识别研究 被引量:3 2018年 结合对维吾尔语语言的特点分析,该文提出一种基于深度卷积神经网络(deep convolutional neural networks,DCNNs)联合长短期记忆网络(long-short term memory,LSTM)实现的维吾尔语文本突发事件识别方法。该方法提取突发事件包含六大特征块,并在特征集中引入富含词汇语义及上下文位置关系的Word Embedding,利用DCNNs对黏着性语言特征抽象化的学习能力抽取事件句中的高阶局部特征,以此作为LSTM网络的输入,利用其对于事件句中抽象含义序列关系的捕获特性获取全局特征,训练Softmax分类器完成维吾尔语突发事件的识别任务。该方法在维吾尔语突发事件识别中的准确率达到80.60%,召回率81.39%,F值80.99%。实验结果表明,与不同层数的DCNNs和独立的LSTM网络相比,DCNNs-LSTM模型更具备挖掘隐含上下文深层语义信息的能力,对Word Embedding特征项的引入有效地提高了模型识别性能。 黎红 禹龙 田生伟 吐尔根.依布拉音 赵建国关键词:维吾尔语 WORD EMBEDDING 维吾尔语意见挖掘关系抽取研究 被引量:1 2013年 在分析维吾尔语词性规则和语法特征的基础上,以维吾尔语评论性语句为研究语料,提出了一种基于Bootstrapping算法的意见挖掘关系抽取方法。在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词-意见词对;迭代结束后,对于主题-意见词对为空的评论语句,使用最近匹配算法抽取主题-意见词对;用并联模式和否定模式对抽取的主题-意见词对进行扩展和修正。关系抽取的最终目标是为每一个评论性语句建立一个或多个二元组<主题词,意见词>,并使主题词和意见词一一对应。实验结果表明了该方法在关系抽取上的有效性。 段祥超 禹龙 田生伟 吐尔根.依布拉音 艾斯卡尔.艾木都拉关键词:维吾尔语 关系抽取 维吾尔语评论文本主题抽取研究 2013年 主题抽取是意见挖掘的核心任务之一。该文面向维吾尔语评论文本,针对显式主题和隐式主题,提出了一种陈述级的主题抽取方法。该方法采用GLR-Cascaded LDA模型抽取段落级的局部主题、篇章级的全局主题,建立全局—局部主题关系,并将这些关系对应到每个意见陈述中;然后运用Bootstrapping和模式匹配的方法进行显式陈述的主题抽取;最后使用隐式主题推断算法推断隐式陈述的主题。主题抽取的最终目标是为每个意见陈述建立意见陈述—主题四元组。实验结果证明了该方法在主题抽取任务中的有效性。 禹龙 田生伟 黄俊关键词:主题抽取 维吾尔语 基于双层模型的维吾尔语突发事件因果关系抽取 被引量:11 2014年 针对传统事件因果关系识别覆盖范围小和人工标注代价高等不足,提出了一种基于双层模型的维吾尔语突发事件因果关系抽取方法.该方法采用分治思想,将因果关系抽取问题转化为对事件序列的两次模式识别标注.采用Bootstrapping算法,在第一次模式识别时,标注因果关系的语义角色,并将标注的语义角色标签作为新的特征传递给第二层模式识别,用于因果关系边界标注.该方法用于维吾尔语突发事件显式因果关系的抽取准确率为85.39%,召回率为77.53%,证明了本文提出的方法在维吾尔语主题突发事件因果关系抽取上的有效性和实用性. 钟军 禹龙 田生伟 吐尔根.依布拉音关键词:因果关系 维吾尔语 突发事件 BOOTSTRAPPING 深度学习的维吾尔语语句隐式情感分类 被引量:5 2016年 传统情感分类研究须手工标注情感特征,未考虑语料中词语间深层语义关系,且不能对隐式情感语句进行分类的弊端,为此提出基于深度学习的维吾尔语语句隐式情感分类算法。通过word2vec获得每个词语的向量表示,用于表示语料中词语间的深层语义关系;将词向量与词性特征线性组合,产生句子的向量表示;利用栈式自编码,从大规模无标注隐式情感向量表示中自动学习特征,通过softmax分类器完成维吾尔语语句分类。该方法准确率达到90%以上,验证了深度学习在隐式情感分类任务上的有效性。 李冬白 田生伟 禹龙 艾斯卡尔.艾木都拉 吐尔根.依布拉音关键词:维吾尔语 基于深度信念网络的CYP450 2C9抑制性分类 被引量:3 2019年 细胞色素P450 2C9 (Cytochrome P450 2C9)是人体肝脏中重要的代谢酶,参与多种药物代谢,约占CYP450蛋白总量的15%~20%。利用深度学习思想,提出基于深度信念网络DBN (Deep Belief Network)的CYP450 2C9抑制性分类模型。实验选用13 000个化合物作为数据集,采用Pub Chem和MACCS分子指纹进行分子结构表征。利用DBN的半监督学习方式从预处理后的特征中学习更本质的特征表示,避免人工提取特征的过程,实现CYP450 2C9的抑制性分类。实验结果表明:在同等条件下,DBN相比于SVM和ANN具有明显优势,平均分类准确率为80.6%,灵敏度(SE)为86.9%,特异性(SP)为66.2%,对药物筛选和新药研发具有积极意义。 李自臣 史新宇 史新宇 禹龙 田生伟 王梅关键词:CYP450 分子指纹 支持向量机 人工神经网络 基于Bi-LSTM的维吾尔语人称代词指代消解 被引量:3 2018年 针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LSTM的输入,挖掘维吾尔语隐含的上下文语义层面特征;其次对维吾尔语人称代词指代现象进行探索,提取针对人称代词指代研究的24个hand-crafted特征;然后利用多层感知器(multilayer perception,MLP)融合Bi-LSTM学习到的上下文语义层面特征与hand-crafted特征;最后使用融合的两类特征训练softmax分类器完成维吾尔语人称代词指代消解任务.实验结果表明,充分利用两类特征的优势,维吾尔语人称代词指代消解的F1值达到76.86%.实验验证了Bi-LSTM与单向LSTM、浅层机器学习算法的SVM和ANN相比更具备挖掘隐含上下文深层语义信息的能力,而hand-crafted层面特征的引入,则有效提高指代消解性能. 田生伟 秦越 禹龙 吐尔根.依布拉音 冯冠军关键词:指代消解 维吾尔语 自然语言处理