卡哈尔江·阿比的热西提
- 作品数:10 被引量:20H指数:3
- 供职机构:新疆大学更多>>
- 发文基金:国家自然科学基金新疆维吾尔自治区重点实验室开放课题基金国家语委科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种用于术语管理及抽取的分析方法
- 本发明公开了一种用于术语管理及抽取的分析方法,该方法包括如下步骤:S1.创建维吾尔语倒排索引;S2.输出创建好的维吾尔语倒排索引文件;S3.检查创建的维吾尔语倒排索引文件的准确性;S4.加密维吾尔语倒排索引;S5.检查加...
- 卡哈尔江·阿比的热西提米尔夏提·力提甫吐尔根·依布拉音阿里木·库尔班王路路买合木提·买买提吴浩
- 文献传递
- 一种基于深度学习的维吾尔文命名实体识别方法
- 本发明公开了一种基于深度学习的维吾尔文命名实体识别方法,该方法包括如下步骤:(1)对维吾尔文本进行分词,对词分别进行字符提取和音节切分;(2)用双向LSTM网络对提取的字符分别获得前向和反向字符向量,并将它们拼接到一起形...
- 买合木提·买买提艾山·吾买尔吐尔根·依布拉音王路路卡哈尔江·阿比的热西提
- 文献传递
- 基于Bi-LSTM-CRF模型的维吾尔语词干提取的研究被引量:6
- 2019年
- 词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、不切分和歧义切分等问题,这些问题导致词干提取质量不高,对后续任务的性能影响较大。因此该文提出了基于Bi-LSTM-CRF的维吾尔语词干提取模型,将字符作为最小切分单位,选取维吾尔语字符特征、音类特征以及语音特征为候选特征,结合模型进行实验。实验表明,该文提出的Bi-LSTM-CRF模型在维吾尔语词干提取任务上,F1值达到了88%,在融入手工提取的候选特征之后,F1值提高了1.8个点,有效提高了词干提取的准确性,缓解了上述问题带来的影响。
- 古丽尼格尔·阿不都外力吐尔根·依布拉音卡哈尔江·阿比的热西提王路路
- 关键词:维吾尔语词干提取
- 基于Kinect的命名实体标注工具的研究与实现
- 2018年
- 目前语料库构建是自然语言处理技术的基础工作。但是通过传统的鼠标键盘进行长期操作对标注人员身体带来了一定的负面影响。为了避免鼠标键盘操作的弊端,将Kinect人体动作和命名实体标注工作有机结合,研究实现了基于Ki-nect的命名实体标注工具。实验结果表明,该工具不仅改善了标注人员标注方式,提高了标注效率。
- 阿里木·库尔班阿地拉吐热尼萨·麦麦提明解文琴吐尔根·依布拉音卡哈尔江·阿比的热西提
- 关键词:KINECT维吾尔语语料库建设
- 乌兹别克语词干提取算法的比较研究被引量:2
- 2020年
- 黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大。现有的乌兹别克语词干提取任务仍依赖基于规则的方法,且实验效果不太理想。该文将乌兹别克语词干提取任务视为序列标注问题进行处理,以字符为最小单位进行切分,分别构建了基于条件随机场(CRF)和门控循环单元网络(Bi-GRU)的乌兹别克语词干提取模型。实验结果表明,基于序列标注的乌兹别克语词干提取模型与基于规则的方法相比不仅降低了人工成本,而且在性能方面有较为显著的提升。
- 吾买尔江·买买提明古丽尼格尔·阿不都外力买合木提·买买提卡哈尔江·阿比的热西提吐尔根·依布拉音
- 关键词:词干提取
- 基于实例的汉维—维汉双向机器翻译系统的研究
- 机器翻译(Machine Translation)是指用计算机自动地将一种人类语言转换成另一种人类语言,例如将维吾尔语译成汉语或者将汉语译成维吾尔语。在不同策略的翻译方法中,基于实例的机器翻译方法避免了复杂的深层次的语法...
- 卡哈尔江·阿比的热西提
- 关键词:句子相似度计算维吾尔语
- 文献传递
- 维吾尔语-汉语量词短语的神经机器翻译被引量:3
- 2019年
- 针对语料不足引起的维吾尔语-汉语量词短语翻译性能不佳及歧义量词的翻译结果乱等问题,提出基于多编码器多解码器的维吾尔语-汉语量词短语神经机器翻译方法。将汉语语料进行自动处理和筛选,收集包含量词的维吾尔语-汉语量词短语语料,使用多编码器多解码器结构,搭建具有更强生成能力的多编码器多解码器维汉神经机器翻译模型。计算BLEU值得到了36.41,并通过对比实验结果,验证了所提方法的有效性。
- 阿依古丽·哈力克卡哈尔江·阿比的热西提艾山·吾买尔吐尔根·依布拉音
- 一种基于长篇科学文献的关键词抽取方法
- 本发明提供一种基于长篇科学文献的关键词抽取方法。对科学文献的单词进行统计,统计字数长度在8000‑40000字,人工统计时间在10‑60分钟,将长篇科学文献进行分块处理,再对文档进行标记并用词性Part‑Of‑Speec...
- 郑媛殷俊买合木提·买买提卡哈尔江·阿比的热西提
- 一种改进的维吾尔语句子相似度计算方法
- 在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较接近...
- 卡哈尔江·阿比的热西提吐尔根·依布拉音姚天昉艾山·吾买尔艾山·毛力尼亚孜
- 关键词:维吾尔语句子相似度计算方法词干提取
- 文献传递
- 融合词性特征的中文句子相似度计算方法被引量:6
- 2020年
- 为解决近年来使用依存分析等语法信息计算句子相似度存在的手工标注代价较大、自动标注准确率低影响性能等问题,结合现有的句子相似度算法,提出两种方法融合词性特征计算句子相似度。在高精度的自动词性标注基础上,方法一通过词性信息调整不同词性的单词对句子相似度的影响,方法二使用词性信息选择句子中较为关键的单词进行计算。对比实验中,方法一在实验任务中取得了最高的准确率,方法二具有较优的准确率和较快计算速度,实验结果表明了两种方法的有效性。
- 吴浩艾山·吾买尔卡哈尔江·阿比的热西提王路路王路路
- 关键词:句子相似度词性语义