刘晶
- 作品数:49 被引量:83H指数:4
- 供职机构:中南民族大学计算机科学学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金湖北省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理政治法律更多>>
- 微博平台上的僵尸用户探测方法
- 本发明属于社交网络上可信度研究体系中的用户可信度的研究范畴,涉及一种微博平台上的僵尸用户探测方法,建立模型解决微博平台上的僵尸用户的探测问题,把僵尸用户的探测这一抽象的问题,与用户可信度的评估问题紧密的结合起来,通过建立...
- 李石君王峰余伟甘琳杨莎王俊刘晶丁永刚
- 文献传递
- 子句级别的自注意力机制的情感原因抽取模型被引量:1
- 2021年
- 情感原因抽取(ECE)是情感分析领域的一项重要子任务,旨在识别给定文档中某种情绪表达所对应的原因.现有的一些工作将该任务定义为子句分类任务,关注了文档和子句之间的联系,而忽略情感描述子句与情感原因子句的直接语义联系,同时存在标签不平衡问题,使得情感原因子句位置难以定位.因此,提出了一个基于子句的自注意力机制同时结合了子句相对位置关系的神经网络模型去寻找情感原因子句.为了更加突显句子的局部特征,利用卷积神经网络抽取每个子句的上下文特征.模型首先使用双向长短期记忆网络编码子句信息,融合子句位置特征后,利用自注意力机制计算情感原因子句和情感描述子句之间的语义信息,并结合子句局部上下文特征,抽取情感原因子句.在基于新浪城市新闻的情感原因抽取中文数据集上,查全率R达到83.83%,优于目前的基线方法.
- 覃俊孟凯刘晶廖立婷毛养勤
- 关键词:卷积神经网络
- 基于利用BERT不同层信息的微调策略的对话状态追踪
- 2023年
- 在对话状态追踪任务中,BERT在训练下游任务时往往会选择模型的最后一层来做分类,尽管这样做的性能也非常出色,但是这种做法往往忽略了BERT的其他层包含的语义信息.在BERT的微调策略方法上,探究了BERT层数选择对任务结果的影响.为了缓解Dropout在训练和推理过程中产生的不一致性问题,引入了R-Drop正则模块对网络输出预测进行正则约束.实验结果表明:用注意力机制对拼接后的BERT的12层输出进行特征权重的微调,提高了对语义信息的特征表达能力,在数据集上Woz2.0上比只采用最后一层进行句子分类的BERT-Base效果更好.
- 叶正傅灵覃俊刘晶
- 微博平台上的关键传播路径和中心节点的探测方法
- 本发明属于复杂网络研究体系中社交网络上信息传播影响力的研究范畴,涉及一种微博平台上的关键传播路径和中心节点的探测方法,解决微博平台上的微博广告传播流上的中心节点的探测问题,把中心节点的探测这一抽象的问题,与复杂网络中的最...
- 李石君王峰李宇轩余伟刘晶丁永刚
- 文献传递
- VDOD:一种基于KD树的分布式离群点检测算法被引量:2
- 2018年
- 针对大数据的数据量大、维数高的特征,论文提出了一种新型的分布式离群点检测算法-VDOD。在数据预处理阶段,提出了基于方差的数据划分方法,划分过程中建立KD树,通过KD树将数据均匀地分配到各个计算节点;在离群点检测阶段,通过R树进行批量过滤。最后,基于真实数据集和人工数据集验证了VDOD算法的有效性。实验结果表明,相对于现有算法,文中算法可以显著提高计算效率并大幅降低网络开销。
- 李子茂骆庆刘晶
- 关键词:分布式离群点检测大数据KD树
- 基于文档顺序与多模态模型的金融票据信息抽取
- 2024年
- 目前的文档信息抽取方法大多针对简单的文档,在抽取包含背景干扰和结构复杂的金融票据时效果不佳。针对复杂金融票据中实体关系难以正确匹配的问题,提出了顺序重构方法和LayoutLMv3-GRU信息抽取模型。构建背景复杂的金融票据数据集,利用文本、布局和图像三个模态进行信息抽取。利用Layout-Parser工具,设计排序模块,使文本信息按照上下文关系排序,并把空间距离较远且逻辑关系较近的单词进行重新的排列组合。通过结合改进的LayoutLMv3模型与GRU网络,使模型的准确率进一步提升。并在公共数据集FUNSD与自建的复杂金融数据集进行实验。结果表明,该方法的F1值比LayoutLM3模型提升2.37%。尤其在自建的复杂金融数据集上,模型F1值达到了88.36%,验证了该方法在抽取复杂票据信息时的优越性与处理各种文档时的通用性。
- 覃俊林宇亭刘晶刘晶刘洲
- 关键词:金融票据信息抽取多模态
- 基于社交网络大规模行为数据的用户关系研究被引量:3
- 2016年
- 用户关系是构成微博社会网络的基础。用户关系的分析可以帮助更好地研究社会网络的构成、消息传播模式等多个方面。对超过百万用户的海量微博数据进行分析处理,利用信息论理论分析比较用户微博行为的特点,构建用户活跃交互网络并观察交互网络的动态性,分析社交网络用户群体的在线行为模式及特点。实验表明在微博的交互活动中,用户的直接交互关系相对稳定,不因时间的变化而变化,而用户的转发对象会不断地变化,即用户实际关注的群体是动态变化的。
- 刘晶李琳李石君
- 关键词:社会网络用户行为
- 基于Web时态对象模型的过时网页信息自动发现方法
- 本发明是基于Web时态对象模型的过时网页信息自动发现方法,属于数据质量的研究范畴,涉及时态Web、网络信息质量评估、时态信息的语义理解与抽取、时态信息的约束与推理、网页信息一致性自动排检等技术领域,主要针对因时态不一致而...
- 李石君杨莎甘琳余伟王俊刘晶丁永刚王峰
- 人本管理中的激励机制设计研究
- 刘晶
- 关键词:人本管理激励机制
- 基于微博行为数据的不活跃用户探测被引量:2
- 2015年
- 随着微博注册用户的增长,探测不活跃账号,自动判定用户活跃度有重要的商业价值。该文提出了一种自动检测算法并通过实验验证。算法核心是提出的影响用户活跃度的4个判定因子,可由用户行为计算得到。算法包含用户活跃度概率层次模型(ADPHM)和用户评分模型(USM)。ADPHM模型计算用户是不活跃用户的概率;USM模型计算用户活跃度得分。实验数据集包含了新浪微博2 316 281个用户信息和141 322 019条微博内容。实验结果表明,该算法能在线性时间复杂度下自动检测出不活跃账号,完善用户可信度评估体系。
- 刘晶王峰胡亚慧李石君
- 关键词:活跃度自动识别社交网络