国家自然科学基金(61063043)
- 作品数:4 被引量:7H指数:1
- 相关作者:房鼎益南江刘骋昊王靖亚更多>>
- 相关机构:新疆警官高等专科学校新疆大学西北大学更多>>
- 发文基金:国家自然科学基金新疆维吾尔自治区重点实验室开放课题基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合形态特征的最大熵维吾尔语词性标注被引量:1
- 2015年
- 根据维吾尔语黏着型的特点,以及形态化单词和频率进行统计分析之后的结果,为解决因单词形态而导致的数据稀疏问题和兼类词标注的问题,提出了维吾尔文的融合词干、词缀等形态特征的基于最大熵的词性标注模型。在通用的词性标注模型的基础上,构造了相应的词性标注特征模版,并设计了它的特征函数。实验结果分析表明,最大熵模型可以较好地处理维吾尔文词性标注的问题,其中词缀特征对提高兼类词和未登录词的词性标注有着十分显著的效果,与其他只用词形的词性标注系统相比准确率比以前提高了2.64%,达到了96.85%。
- 帕力旦.吐尔逊房鼎益
- 关键词:维吾尔语词性标注词缀最大熵特征提取
- 基于Google Web API的单机版维文元搜索引擎技术研究被引量:6
- 2011年
- 随着Internet的发展,基于多种文字信息的维文信息也越来越多。为了获取有用的维文Web信息,必须要创建符合维文信息检索需求的搜索引擎。文章从分析维文文字的多种性、编码的多样性以及维文Web表示的特殊性等问题的基础上,探讨如何利用Google Web API来实现基于维文信息的单机版元搜索引擎。
- 亚森.艾则孜迪里夏提.买买提如先故力.阿布都热西提
- 关键词:搜索引擎维文代码转换GOOGLEAPI
- 基于决策树算法的P2P蠕虫检测模型构建
- 2013年
- P2P蠕虫是现在网络蠕虫主流传播形式之一,P2P技术应用范围的扩展更是为其迅速传播和扩散提供了便利的条件。这是由于P2P技术自身特点和缺陷造成的,也是由于现有P2P蠕虫的检测预警机制的不健全所造成的。利用数据挖掘中的决策树算法,构建一种P2P蠕虫检测模型,以增加P2P蠕虫被检测出来的机率和对未知文件的预警机制,从而减少P2P蠕虫所带来信息网络安全问题,并通过实验验证了该方法的可行性。
- 刘骋昊王靖亚亚森.艾则孜
- 关键词:P2P蠕虫决策树算法DETOURS