您的位置: 专家智库 > >

乔亚男

作品数:14 被引量:22H指数:2
供职机构:西安交通大学电子与信息工程学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 9篇期刊文章
  • 5篇会议论文

领域

  • 13篇自动化与计算...
  • 1篇文化科学

主题

  • 9篇信息检索
  • 3篇查询
  • 2篇文本
  • 2篇相似度
  • 2篇向量
  • 2篇向量空间
  • 2篇向量空间模型
  • 2篇谐音
  • 2篇新词
  • 2篇计算机
  • 2篇计算机应用
  • 2篇核心词
  • 2篇词性
  • 1篇信息需求
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇噪音数据
  • 1篇指令集
  • 1篇随机场
  • 1篇随机场模型

机构

  • 14篇西安交通大学
  • 2篇南京大学
  • 2篇第四军医大学...

作者

  • 14篇乔亚男
  • 9篇齐勇
  • 6篇侯迪
  • 2篇范亚平
  • 1篇史椸
  • 1篇刘跃虎
  • 1篇王晓
  • 1篇方舟
  • 1篇王换招
  • 1篇万迪昉
  • 1篇李孟超

传媒

  • 2篇西安交通大学...
  • 2篇中国科技论文...
  • 1篇模式识别与人...
  • 1篇电子学报
  • 1篇南京大学学报...
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇2008全国...
  • 1篇2010年全...

年份

  • 1篇2016
  • 1篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2011
  • 1篇2010
  • 5篇2009
  • 2篇2008
  • 1篇2005
14 条 记 录,以下是 1-10
排序方式:
具有孤立项过滤的信息检索查询词的分析方法
2009年
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立项,在分析查询词临近性之前预先进行孤立项过滤,使之不参与QTP统计量的计算,由此减小了过分强调临近性对查准率的影响.实验结果表明,对于词汇相似度差异比较显著的查询,进行孤立项过滤的查询词临近性分析方法的平均检索精确度比传统分析方法提高14%.
乔亚男齐勇侯迪
关键词:信息检索词汇相似度
高阶信息检素问题相关研究进展被引量:1
2009年
提出高阶信息检索问题这一概念,将多种信息检索的深层次问题统一在1个框架内,给出了词汇共现、语义查询扩展和统计语言模型3个高阶信息检索问题统一解决模型的技术基础,对高阶信息检索问题相关的研究进展进行了阐述,展望了高阶信息检索的发展趋势。
乔亚男齐勇侯迪
关键词:计算机应用
一种基于N-Gram和拼音相似度的微博新词识别方法
博为主要载体的网络新词具有数量多、口语化、不严谨、波动性强的特点.根据这些特点和网络新词的产生规律,提出了使用规则和N-Gram的网络新词提取方法,通过拼音和中文词语搭配库建立网络新词和现有词汇的映射关系,从而实现对网络...
韩彦昭乔亚男耿萌萌万迪昉
关键词:新词识别
文本信息检索实验方法研究被引量:1
2009年
阐述了信息检索研究领域的现状和进行信息检索研究所需的重要实验方法。在介绍了信息检索系统的架构和常见的信息检索研究方向的基础上,对信息检索研究实验的3要素:数据集、实验平台和创新算法进行了详细说明,并对实验平台Lemur和Lucene的异同点做了重点分析。
乔亚男齐勇侯迪
关键词:计算机应用信息检索
一种高稳定性词汇共现模型被引量:2
2009年
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性.
乔亚男齐勇侯迪
基于条件随机场模型和文本纠错的微博新词词性识别研究被引量:7
2016年
针对微博数据特点,采用降噪算法和条件随机场模型对微博数据进行词性标注,并对其中比重较大的谐音词使用贝叶斯方法进行词性二次纠正.首先利用新浪平台API和爬虫获取原始微博数据,再根据噪音特点人工制定规则进行降噪.由于条件随机场在中文词性标注中特征提取的优势,使用条件随机场模型对降噪后的微博语料词性标注.在此基础上,利用微博语料中谐音词比重较大的特点,将微博词语转化为拼音,根据贝叶斯方法计算得到谐音词的原生词候选,再根据词语的上下文建立谐音词和原生词映射,并利用原生词的词性已知的性质,对谐音词进行词性纠错.实验结果表明,该方法可以较好地标注微博未登录词,词性标注准确率达到95.23%.
韩彦昭乔亚男范亚平李孟超万迪昉
关键词:条件随机场噪音数据
指令分层过滤体系在通用CPU模拟器设计中的应用被引量:5
2005年
该文提出了一种新的指令集模板格式----指令分层过滤体系,解决了传统指令集模板格式适用面较窄以及特殊情况下效率较低的问题,并使用该方法设计了一个可定制的通用CPU模拟器GSim。
乔亚男王换招方舟
关键词:模拟器指令集
查询语义图辅助的信息检索性能预测模型
查询性能预测技术试图在进行费时的实际信息检索之前对特定查询的性能进行预测,以便根据预测结果在不影响查询所代表的信息需求的基础上对查询进行调整,提高最终检索结果的精确度。针对传统查询性能预测模型没有考虑查询词间语义关系的问...
乔亚男齐勇
关键词:信息检索核心词
文献传递
一种基于权重矩阵的临近词检索问题解决框架
传统的信息检索模型假设查询中的关键词之间是并列关系,但用户的需求往往应该被抽象为一系列的关键词组,组内的关键词间具有更为紧密的语义关系,这就是本文中定义的临近词检索问题。本文提出了基于权重矩阵的临近词检索问题解决框架,该...
乔亚男齐勇侯迪王晓
关键词:信息检索向量空间模型
文献传递
查询词相似度加权的邻近性检索方法被引量:2
2013年
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成"平行概念效应",影响邻近性检索方法的性能.文中提出一种查询词相似度加权的邻近性检索方法.该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息.实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应.
乔亚男刘跃虎齐勇
关键词:信息检索语义相似度信息需求
共2页<12>
聚类工具0