您的位置: 专家智库 > >

教育部“新世纪优秀人才支持计划”(NCET-10-0969)

作品数:27 被引量:84H指数:6
相关作者:艾斯卡尔艾木都拉艾克白尔帕塔尔易晓芳艾斯卡尔·艾木都拉孟祥涛更多>>
相关机构:新疆大学乌鲁木齐职业大学清华大学更多>>
发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术电子电信天文地球更多>>

文献类型

  • 27篇期刊文章
  • 2篇会议论文

领域

  • 22篇自动化与计算...
  • 6篇电子电信
  • 1篇天文地球

主题

  • 26篇维吾尔
  • 16篇维吾尔语
  • 10篇维吾尔文
  • 7篇语音
  • 5篇文本
  • 4篇音节
  • 4篇语音合成
  • 4篇元音
  • 3篇元音和谐
  • 3篇声学
  • 3篇手写
  • 3篇双音
  • 3篇双音节
  • 3篇双音节词
  • 3篇情感
  • 3篇联机手写
  • 3篇分词
  • 2篇塞音
  • 2篇声学分析
  • 2篇手写识别

机构

  • 29篇新疆大学
  • 3篇乌鲁木齐职业...
  • 2篇清华大学
  • 2篇武汉大学
  • 2篇新疆师范大学
  • 1篇重庆邮电大学
  • 1篇中国科学院自...

作者

  • 21篇艾斯卡尔艾木...
  • 4篇艾克白尔帕塔...
  • 4篇艾斯卡尔·艾...
  • 3篇易晓芳
  • 1篇李凯
  • 1篇维尼拉·木沙...
  • 1篇吐尔地·托合...
  • 1篇李志军
  • 1篇姜锐
  • 1篇杨燚
  • 1篇刘成林
  • 1篇孟祥涛
  • 1篇张恒

传媒

  • 6篇清华大学学报...
  • 5篇计算机工程与...
  • 5篇通信技术
  • 3篇计算机工程
  • 2篇计算机工程与...
  • 2篇第十三届全国...
  • 1篇模式识别与人...
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇高技术通讯
  • 1篇中文信息学报
  • 1篇电脑知识与技...

年份

  • 4篇2017
  • 3篇2015
  • 6篇2014
  • 12篇2013
  • 4篇2012
27 条 记 录,以下是 1-10
排序方式:
基于改进SRG法的叠加维吾尔文字提取算法
2014年
如何自动选取种子点的位置是基于区域生长法分割文字的关键问题。该算法通过横向线段检测算子提取出文字条中所有的横向线段;统计线段在饱和度、亮度上像素点的分布,根据统计分布使用Otsu法提取出纯净的文字基线,将它作为区域生长种子点的位置;通过生长法则分割文字。实验在四类不同的背景集中测试算法,其中花卉测试集的字母提取率达到72.31%。
杨燚祖丽菲亚.卡哈尔艾斯卡尔艾木都拉
关键词:维吾尔文字图像分割HSI空间OTSU法
基于连通域特征的维吾尔手写文本行分割被引量:6
2014年
针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,该方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。
易晓芳卡米力.木依丁艾斯卡尔艾木都拉
关键词:维吾尔文
基于着色处理的维吾尔文手写文本行分割被引量:4
2013年
针对维吾尔文手写体文本中行分割问题,该文根据维吾尔文字包含区分字母的诸多点笔画和附加部分的特点,对文字主体笔画部分采用分段式前景涂抹算法,并将涂抹后图像的前景部分进行细化运算,通过细化线条与原图像的叠加、着色处理获取主体文本区域定位;然后通过重心辐射扫描的方法,解决了剩余细小笔画的文本行归附问题。实验结果表明:该文方法与常见的水平投影、分段式投影与基于涂抹方法相比具有更好的行分割效果。
艾斯卡尔艾木都拉易晓芳卡米力.木依丁
关键词:维吾尔文着色处理
组合特征的联机手写维吾尔字母识别被引量:1
2013年
通过分析维吾尔文字母自身的书写特点,为了进一步提高识别率,在原先的外围轮廓特征基础上,再提取了附加笔划形状特征、字母上下左右密度比例特征、笔画数特征以及主体部分和附加部分的位置关系特征,进行了诸多特征有效组合下的字母识别实验。其中,最高识别率达到了75.7%,比原先在单个特征下的识别率提高了近10个百分点。这表明,不同特征的有效组合是可行的,而且具有继续研究的潜力。
祖丽菲亚.卡哈尔玛依热.依布拉音艾斯卡尔艾木都拉地里木拉提.吐尔逊
关键词:联机手写识别
基于频繁模式挖掘的维吾尔文智能组词方法被引量:6
2012年
以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特点,将无先验知识的模式挖掘问题转化为特定模式的匹配问题,提出了一种快速高效的频繁模式挖掘算法,来获取语义完整的维吾尔文词。实验结果表明,通过该算法获取的维吾尔文词,在结构上是稳定的,语义上是完整而独立的。
吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉
关键词:分词组词
基于互信息的维吾尔文自适应组词算法被引量:6
2013年
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。
吐尔地.托合提艾克白尔帕塔尔艾斯卡尔.艾木都拉
关键词:维吾尔文互信息组词
一种结合GAAC和K-means的维吾尔文文本聚类算法被引量:5
2013年
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分依赖性及不稳定性缺点以及GAAC的高计算复杂性,提出了一种结合GACC和K-means的维吾尔文聚类算法。本算法分两步完成聚类操作,首先是GAAC模块从少量文本集中获取最优的初始类中心,然后是K-means模块对大量文本集进行快速聚类。实验结果表明,新算法在聚类准确率和时间复杂度上都有了显著的提高。
吐尔地.托合提艾海麦提江.阿布来提米也塞.艾尼玩艾斯卡尔艾木都拉
关键词:维吾尔文文本聚类
维吾尔语浊塞音的声学特征分析被引量:1
2013年
该文从实验语音学的角度出发,利用"维吾尔语语音声学参数库",选择其中包含浊塞音b、d、g的466个单音节及多音节词,对其声学参数进行统计分析,归纳了其共振峰、音强、时长、嗓音起始时间和无声段的分布模式。根据语音学的规律对各浊塞音的声学特点进行了深入研究,通过分别对浊塞音发生清化和保持原来浊特点时的特征参数同其对立清塞音相应的特征参数进行对比,探讨了浊塞音的清化现象。该文用实验数据证明了浊塞音清化时会表现出清塞音特征,并获得了区分浊塞音的诸多声学参数。
艾斯卡尔.艾木都拉赛尔达尔.雅力坤祖丽皮亚.阿曼地里木拉提.吐尔逊
关键词:维吾尔语时长音强
基于层次化结构的语言模型单元集优化被引量:5
2017年
对于大词汇量语音识别系统,适当选择基本单元至关重要。虽然以词为基本单元时避免了词边界的确定等复杂过程,但很多派生类结构中(如黏性语言),词比较长,而且很多文字(如中文、日文等)不需要词边界,因而在自然语言处理应用中没有选取基本单元集的固定模式。该文以维吾尔语大词汇量语音识别系统为例,研究基于各个层次化粒度单元的语音识别系统。通过比较各种层次化单元集为基础的语音识别结果,分析错误识别模式,收集被误判的单元序列作为在2层单元序列结构中择优的训练样本库。比较各种单元集的优缺点,提出一种能平衡长单元集和短单元集优点的方法。实验结果表明:该方法不仅可以有效提高语音识别准确率,也大大缩减了词典容量。
米吉提.阿不里米提艾克白尔帕塔尔艾斯卡尔.艾木都拉
关键词:语音识别语言模型层次化结构维吾尔语
基于不同关键词提取算法的维吾尔文本情感辨识
2017年
该文在研究不同的关键词提取方法的基础上,针对维吾尔语文本中的生气、高兴等常见情感类型进行情感辨识研究。结合维吾尔文本句子中的情感表达特点,用TextRank、稀疏判别分析(sparse discriminant analysis,SDA)和稀疏支持向量机(sparse support vector machine,Sparse SVM)等提取方法得到具有代表性的关键词集,并基于这些关键词集进行特征提取和情感模型构造。该文从电影电视剧中演员的维吾尔语台词、小说等文本中选取含有生气和高兴2种情感文本的句子,构造实验数据集并验证所提出的文本情感倾向性分析方法的有效性。实验结果表明:该文用多种方法所提取的关键词集都能有效地对维吾尔语文本句子进行情感分类,尤其是基于Sparse SVM的稀疏性分析的关键词提取方法在少量关键词语集上能有效地进行较高准确率的情感分类。
赛牙热.依马木热依莱木.帕尔哈提艾斯卡尔.艾木都拉李志军
关键词:情感识别维吾尔语
共3页<123>
聚类工具0