国家自然科学基金(60773087)
- 作品数:10 被引量:195H指数:6
- 相关作者:姚天昉刘全升刘军黄高辉宋鸿彦更多>>
- 相关机构:上海交通大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉语意见型主观性文本标注语料库的构建被引量:10
- 2009年
- 汉语意见型主观性文本是目前自然语言处理中的一个研究热点。该文介绍了汉语意见型主观性文本标注语料库构建方面的一些经验,讨论了设计和建设语料库方面的几个重要问题,包括语料的选取、标注、存储、检索和统计,以及语料库相关工具的设计等。汉语意见型主观性文本标注语料库与普通的语料库相比,其特点在于深度标注了主观性文本的词性、句法、语义和意见元素等信息,忠实记录了主观性文本的语言现象。汉语意见型主观性文本标注语料库的构建为人们分析和研究汉语主观性文本提供了有力的资源支持。
- 宋鸿彦刘军姚天昉刘全升黄高辉
- 关键词:计算机应用中文信息处理语料库
- 基于Wikipedia的语义相关度计算被引量:11
- 2010年
- 在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语义相关度。实验结果表明,该方法的斯皮尔曼等级相关系数可达到0.77。
- 刘军姚天昉
- 关键词:语义相关度领域知识
- 一种网络非规范汉语词汇的识别方法
- 随着即时通信软件的普及,网络非规范词汇广泛出现在各种主观性文本中。在传统的文本挖掘中,这种非规范词汇都被视为噪音。事实上,这些非规范词汇经常存在于用户表达个人意愿的句子中。如果我们能够正确识别这类词汇,就能为意见挖掘提供...
- 姚天昉张霄凯
- 关键词:网络评论预处理
- 文献传递
- 汉语意见型主观性语句类型分析
- 目前,意见挖掘已经成为文本挖掘的一个热门研究方向,其主要研究对象是意见型主观性语句。本文首先介绍了汉语意见型主观性语句的定义和特点,并依据三种分类标准.即主题和情感的形式、数量以及对应关系,对汉语意见型主观性语句的类型进...
- 黄高辉姚天昉刘全升
- 关键词:词汇层句法层语义层
- 文献传递
- 汉语情感问题类型分类研究被引量:1
- 2011年
- 随着网络搜索引擎技术的飞速发展,对于问答系统的需求愈发迫切。而问答系统处理问题的第一步就需要分辨情感问题和非情感问题并对情感问题进行分类。该文首先分析了当前问答系统和问题分类领域的研究现状,总结了一些存在的问题。然后针对情感问题从三个方面进行分类。在语义层面,提取了三个关键词;在语法层面,通过规则的制定,将其分成五种疑问句类型;在领域层面,通过搜索引擎的相关网页数量来进行判断。再对综合上述三个方面所开发出的测试系统进行分析。实验结果表明:对于情感问题的分类,从三个层面进行分析比较全面。
- 李婷玉葛正荣姚天昉
- 关键词:情感问题问答系统自然语言处理
- 基于关联度模型的文本倾向性检索研究
- 观点检索,是指利用信息检索与情感分析等技术,寻找针对主题的观点评论等信息。是主题检索与倾向型分析相结合的工作。观点检索的研究已经成为国际上研究的一大热点。本文在研究了信息检索理论与文本倾向性分析技术等基础上,结合国内外关...
- 刘全升姚天昉
- 关键词:信息检索文本挖掘
- 文献传递
- 汉语意见型主观性文本类型体系的研究被引量:6
- 2008年
- 主观性文本是一种描述个人想法、情感和意见等的非约束性文本。它与主要描述以事实为主的客观性文本在内容和结构上有很大的不同。意见型文本是包含有意见元素(意见持有者、意见陈述范围、意见主题和意见情感)的一种主观性文本,它大量出现在网上的电子公告板、论坛和博客等媒介中,受到广泛的关注,并成为研究意见挖掘方法和技术的语料。该文介绍了主观性文本的定义及其与客观性文本的差异,同时着重讨论了意见型文本的定义、特点、类型体系及其在意见挖掘技术中的应用。
- 刘全升姚天昉黄高辉刘军宋鸿彦
- 关键词:计算机应用中文信息处理
- 基于关联度模型的文本倾向性检索研究被引量:5
- 2011年
- 该文在研究了信息检索理论与文本倾向性分析技术等的基础上,结合国内外关于观点检索的相关研究,提出了基于关联度的文本观点检索算法。它综合考虑了主题检索过程中的查询扩展、文本检索相关度、文本倾向性强度和检索主题与文本情感的关联度等对观点检索最后结果的影响。该算法从理论上考虑了观点检索不同因素之间的相互影响问题。通过对COAE2008观点检索子任务的实验数据进行实验,结果表明:该文提出的基于关联度的观点检索算法可以取得较好的效果。
- 刘全升姚天昉
- 关键词:文本挖掘
- 汉语意见型主观性文本类型体系的研究
- 主观性文本是一种描述个人想法、情感和意见等的非约束性文本。它与主要描述以事实为主的客观性文本在内容和结构上有很大的不同。意见型文本是包含有意见元素(意见持有者、意见陈述范围、意见主题和意见情感)的一种主观性文本。它大量出...
- 刘全升姚天昉黄高辉刘军宋鸿彦
- 文献传递
- 意见时空元素的研究
- 2011年
- 为了满足新应用需求,该文将时空元素引入到意见模型中。在此基础上,提出了意见重要因子的概念,分析了时间重要因子的计算公式,对手机和汽车论坛的来源重要因子进行了实验。在时空元素的应用上,对汽车评论进行了趋势挖掘,探讨了意见趋势的挖掘方法和实验评估方法。
- 刘军姚天昉仇伟