魏晶晶
- 作品数:37 被引量:82H指数:5
- 供职机构:福建江夏学院电子信息科学学院更多>>
- 发文基金:国家自然科学基金福建省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术理学文化科学机械工程更多>>
- 结合主动学习的多记录网页属性抽取方法被引量:1
- 2016年
- 属性抽取可分为对齐和语义标注两个过程,现有对齐方法中部分含有相同标签不同语义的属性会错分到同一个组,而且为了提高语义标注的精度,通常需要大量的人工标注训练集.为此,文中提出结合主动学习的多记录网页属性抽取方法.针对属性错分问题,引入属性的浅层语义,减少相同标签语义不一致的影响.在语义标注阶段,基于网页的文本、视觉和全局特征,采用基于主动学习的SVM分类方法获得带有语义的结构化数据.同时在主动学习的策略选择方面,通过引入样本整体信息,构建基于不确定性度量的策略,选择语义分类预测不准的样本进行标注.实验表明,在论坛、微博等多个数据集上,相比现有方法,文中方法抽取效果更好.
- 魏晶晶廖祥文陈巧灵马飞翔陈国龙
- 关键词:属性抽取语义分类
- 数据流上约束的子空间Skyline计算
- 2008年
- 在数据流环境下,此前有关Skyline计算的研究涉及到滑动窗口上全空间Skyline的维护或子空间Skyline的计算,未考虑到满足约束条件的子空间Skyline计算。在首次研究数据流上约束的子空间Skyline渐进计算问题中,给出了具有良好渐进性的约束的子空间Skyline计算算法—CSSC,该算法首先通过增量维护滑动窗口中元组之间的非多余支配关系来计算约束的Skyline,然后在此基础上,将文献[8]中介绍的子空间Skyline计算方案引入到约束条件下,从而实现约束的子空间Skyline的计算。
- 魏晶晶林锦贤
- 关键词:数据流SKYLINE计算
- 基于词对齐模型的中文评价对象与评价词抽取被引量:4
- 2016年
- 提出一种基于统计机器翻译的思想抽取评价对象与评价词的方法。该方法利用词对齐模型抽取评价对象与评价词之间的关系,并结合词共现信息等特征来估计两者关系的强度。建立一张二分图刻画评价关系,并加入领域相关性度量,利用随机游走算法迭代计算候选评价对象与评价词的置信度。在COAE2011任务3的语料上进行试验验证。结果表明,利用词对齐模型抽取评价对象与评价词可以有效提高准确度,抽取出更多的评价对象与评价词。
- 陈兴俊魏晶晶廖祥文简思远陈国龙
- 关键词:评价对象抽取
- 融合用户观点的社会影响力分析
- 2017年
- 社交媒介已经成为了一种分享交换信息的重要平台,识别出其中影响力高的用户已经广泛地应用于推荐系统、专家识别、广告投放等应用。该文提出了一种受限张量分解方法,其能识别出给定主题下影响力高的用户,同时保持其影响力的极性分布(例如正面、中性、负面)。该方法通过拉普拉斯矩阵引入用户主题相似性约束,控制张量分解过程,使用分解结果计算用户影响力得分。实验结果表明,该方法在社会影响力分析中的性能优于OOLAM、TwitterRank等基准算法,并具有良好的可扩展性。
- 陈畅魏晶晶廖祥文林柏钢陈国龙
- 关键词:张量分解拉普拉斯矩阵
- Twitter中的情绪传染现象被引量:6
- 2016年
- 在Twitter中是否存在情绪传染现象是社会科学中一个待解决的问题。首先通过LIWC2007获取了包含106 641个用户的Tw itter社交网络中所有用户的情绪时间序列,然后采用一系列的单位根检验证明了相关时间序列的平稳性,通过格兰杰因果检验,在预测用户情绪值的回归式中加入了用户关注好友过去时间的情绪值作为自变量,并采用统计假设检验的方法证明了该自变量的系数不为0,从而说明了用户的情绪会显著地被其关注好友过去的情绪所影响,即用户关注好友的情绪是用户情绪的格兰杰原因。用同样的方法证明了用户情绪并不是用户关注好友情绪的格兰杰原因,由于社交选择现象是一种双向关系,所以该结果是由情绪传染现象造成的。此外,通过统计分析发现Twitter中绝大部分单向关注好友都是非熟人,而绝大部分双向关注好友都是熟人。格兰杰因果检验的结果说明了人们的情绪既会被熟人的情绪所传染,也会被非熟人的情绪所传染。
- 张少群魏晶晶廖祥文简思远陈国龙
- 关键词:TWITTER社交网络格兰杰因果检验
- 一种用于度量主流情感信息的中文情感文摘系统及方法
- 本发明涉及一种用于度量主流情感信息的中文情感文摘系统及方法,该系统包括:评论数据预处理模块,用于抽取评论数据中每个句子包含的各个评价对象及其对应的评价短语,转化为由评价对象及其对应的情感强度等级构成的单位,建立与各个评价...
- 陈国龙廖祥文潘敏郭文忠魏晶晶
- 文献传递
- 基于多任务联合学习的论辩挖掘被引量:4
- 2019年
- 现有的论辩挖掘工作大多针对单个数据集建模,忽视数据集不同时可能存在的特征变化情况,导致模型的泛化性能较差.因此,文中提出基于多任务学习的论辩挖掘方法,将多个数据集的论辩挖掘任务进行联合学习.首先融合多个任务的输入层表示,通过卷积神经网络和高速神经网络获取词级别和字符级共享参数,联合任务相关特征输入栈式双向长短记忆网络,利用多个论辩挖掘任务之间的关联信息并行训练,最终由条件随机场得到序列标注结果.在6个不同领域的数据集上的实验表明,文中方法在Macro-F1值上有所提升,由此验证方法的有效性.
- 廖祥文倪继昌魏晶晶魏晶晶吴运兵
- 关键词:多任务学习神经网络
- 一种中文微博客的热点话题检测方法
- 本发明涉及一种中文微博客的热点话题检测方法,包括以下步骤:(1)首先基于一定的垃圾过滤规则对垃圾微博进行过滤;(2)对分布在微博中的关键字进行初步聚合,得到初步表示话题的词集合;检索各条微博最相似的前k条微博,然后利用检...
- 陈国龙廖祥文郭德清郭文忠魏晶晶
- 文献传递
- 数据流上约束的子空间skyline计算
- 在数据流环境下,此前有关Skyline计算的研究涉及到滑动窗口上全空间Skyline的维护或子空间Skyline的计算,未考虑到满足约束条件的子空间Skyline计算.在首次研究数据流上约束的子空间Skyline渐进计算...
- 魏晶晶林锦贤
- 关键词:数据流支配关系
- 文献传递
- 基于评论关系图的垃圾评论者检测研究被引量:3
- 2015年
- 提出一种基于评论关系图的产品垃圾评论者检测方法.该方法考虑了评论者、评论、商店以及回复者之间的关系,构造出四者的评论关系图,根据评论真实度获得评论者的可信度,从而检测出产品垃圾评论者.实验结果表明,与未考虑可信回复者特征的识别方法相比,本文方法的准确率提升了4%.
- 林秀娇魏晶晶刘月廖祥文