艾孜尔古丽
- 作品数:50 被引量:61H指数:6
- 供职机构:新疆师范大学计算机科学技术学院更多>>
- 发文基金:国家自然科学基金新疆维吾尔自治区自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 现代维吾尔语动词词汇语义词典构建研究
- 2017年
- 语义网是知识的概念化和形式化以及相应的推理,并且它和人工智能有着深厚的渊源关系^([1])。调查研究发现,缺乏维吾尔语动词在语义上的研究成果将阻碍维吾尔语言学、计算语言学和维吾尔语信息处理的工作质量^([2])。本论文在现有的维吾尔语语法信息资源基础上,主要研究现代维吾尔语语义分类与词汇语义、维吾尔语媒体语料的筛选、现代维吾尔语动词语义框架等内容,并构建现代维吾尔语同义词、近义词、反义词词汇表^([3]),探索现代维吾尔语同义词、反义词与近义词之间的关系规则库、现代维吾尔语动词语义知识库构建方法、开发现代维吾尔语动词语义词典。
- 阿斯古力.艾山艾孜尔古丽玉素甫.艾白都拉
- 关键词:现代维吾尔语语义学动词
- 现代维吾尔语词干词类标注标记集验证性研究被引量:2
- 2015年
- 以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。
- 艾孜尔古丽米尔夏提玉素甫.艾白都拉
- 关键词:词类标注
- 现代维吾尔语句子成分分析技术研究
- 2015年
- 句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分析算法;探索现代维吾尔语谓语的识别算法设计、其他句子成分的识别、自动界定预测算法等研究现代维吾尔语句子成分分析问题;解决现代维吾尔语句子成分分析系统实现、实验数据分析等现代维吾尔语句子成分分析问题。
- 努尔艾合买提.艾买提艾孜尔古丽玉素甫.艾白都拉
- 关键词:信息处理维吾尔语短语结构句子成分
- 基于多头注意力的电网调度领域命名实体识别被引量:2
- 2023年
- 针对电网调度领域实体识别准确率较低的问题,提出一种融合多头注意力机制和双向长短时记忆网络的电网调度领域中文命名实体识别方法。利用词向量表示电网调度语音识别后语句,并将生成的词向量序列输入双向长短时记忆网络(BiLSTM)挖掘其上下文语义特征,引入多头注意力机制重点关注文本中的实体词,挖掘其隐藏特征,同时通过条件随机场(CRF)计算序列标签的联合概率标注出实体识别结果。根据电网调度语音识别后文本特点自建标注数据集,并将电网调度语音识别文本中的命名实体细粒度划分为参数、设备、操作、系统、组织5个类别进行实验。其结果表明,该方法对电网调度领域实体识别具有更高的准确率和召回率,且F1值可达到93.63%,切实解决了电网调度领域实体识别任务中标注数据稀少和精度较低的问题,有助于电网调度领域知识图谱的构建。
- 毛宏亮艾孜尔古丽陈德刚
- 关键词:电网调度知识图谱
- 现代维吾尔语语言监测中词频与词种分析技术研究
- 社会的发展变化,语言生活也在不断地发展变化。语言监测是客观描写语言、掌握语言发展动态、进行语言规划的必要手段。本文以现代维吾尔语词频与词种分析技术为手段,小学、初中维吾尔语文教材词频表作为研究对象,对用词分布情况进行研究...
- 艾孜尔古丽阿里木·木拉提玉素甫·艾白都拉
- 基于网站用词调查的现代维吾尔语词长研究被引量:9
- 2012年
- 首先陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;其次按词长排序的前20个最长的词情况,介绍词语长度分布;在此基础上分析词干长度分布、常用纯词干长度分布及常用去尾词干长度分布;最后介绍平均词干、词长统计与分析结果。
- 玉素甫.艾白都拉艾孜尔古丽祖丽皮亚
- 关键词:网络媒体
- 现代维吾尔语人名汉字音译转写关键技术研究被引量:1
- 2014年
- 改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。
- 阿力木.木拉提艾孜尔古丽玉素甫.艾白都拉
- 关键词:维吾尔语自动翻译
- 现代维吾尔语动词标记集验证性研究
- 2014年
- 维吾尔语词性标注是维吾尔语短语分析和句法分析必不可少的环节及其信息处理研究的重要工作,对维汉词典提供很好的基础。本论文首先介绍了词性标注的重要性及其它在自然语言信息处理工作中的作用,然后进行了现代维吾尔语动词语法语义相结合的动词词性标注标记集验证性研究,跟现有的现代维吾尔语动词标注标记集规范进行了比较,验证和补充,最后进行统计找出了每一种动词的词种数和频次。
- 努尔加玛力.沙依提艾孜尔古丽玉素甫.艾白都拉
- 关键词:维吾尔语动词
- 现代维吾尔语常用词统计关键技术研究被引量:8
- 2014年
- 本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术,现代维吾尔语数据分析技术进行了研究;研制了现代维吾尔语常用词候选表,从词语的使用频度和词语的分布两方面对词语进行了基本考察,将维吾尔语词语的"词种数、频次、频率、文本数、词长"作为常用词候选表的依据。
- 艾孜尔古丽努尔艾合买提玉素甫.艾白都拉
- 关键词:现代维吾尔语语料库
- 基于语言资源理念的维吾尔语有声数据库构建研究被引量:1
- 2011年
- 本文主要阐述了维吾尔语言资源有声数据库构建的目的和方法,以新疆维吾尔语言和方言有声资源为研究对象,研究整理有限区域维吾尔语言分布情况以及方言分布情况,绘制详细、准确、可传至后代的多媒体语言地图,开发维吾尔语有声数据库资源管理平台,为维吾尔语动态流通有声语言数据库打下良好基础。
- 齐向伟玉素甫.艾白都拉艾孜尔古丽
- 关键词:维吾尔文语言资源