刘喜平 作品数:100 被引量:414 H指数:11 供职机构: 江西财经大学 更多>> 发文基金: 国家自然科学基金 江西省自然科学基金 江西省教育厅科学技术研究项目 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 自然科学总论 更多>>
基于多通道层次图注意力网络的开放事件抽取方法与系统 本发明提出一种基于多通道层次图注意力网络的开放事件抽取方法与系统,该方法包括:获取给定文档,根据给定文档建立得到文档句法依存树;基于文档句法依存树,依次按照调整依存结构、关联缺省成分、添加序列顺序以及关联祖先结点与后代结... 万齐智 万常选 胡蓉 刘德喜 刘喜平文献传递 基于事件社会网络推荐系统综述 被引量:7 2021年 基于事件社会网络(event-based social network,简称EBSN)是一种结合了线上网络和线下网络的新型社会网络,近年来得到了越来越多的关注,已有许多国内外重要研究机构的研究者对其进行研究并取得了许多研究成果.在EBSN推荐系统中,一个重要的任务就是设计出更好、更合理的推荐算法以提高推荐精确度和用户满意度,其关键在于充分结合EBSN中的各种上下文信息去挖掘用户、事件和群组的隐藏特征.主要对EBSN推荐系统的最新研究进展进行综述.首先,概述EBSN的定义、结构、属性和特征,介绍EBSN推荐系统的基本框架,并分析EBSN推荐系统与其他推荐系统的区别;其次,对EBSN推荐系统的主要推荐方法和推荐内容进行归纳、总结和对比分析;最后,分析EBSN推荐系统的研究难点及其发展趋势,并给出总结. 廖国琼 蓝天明 黄晓梅 陈辉 万常选 刘德喜 刘喜平关键词:推荐系统 矩阵分解 图模型 社会网络用户心理健康自动评估研究综述 被引量:2 2021年 心理健康问题正迅速成为世界范围内最严重和最普遍的公共卫生问题之一。社会网络的兴起与普及带来大量与社会网络用户心理状态相关的数据。近年来,利用社会网络数据自动评估检测用户心理健康的研究吸引着越来越多的学者,取得了不少成果,但未见对这些成果进行总结分析的工作。该文对社会网络用户心理健康自动评估的相关文献进行评述:在现有文献基础上总结归纳了心理健康自动评估的概念及界定;从评估任务、社会网络数据集构造、评估用到的特征等方面概述了社会网络用户心理健康自动评估的国内外研究现状;比较分析了现有自动评估方法的特点,包括基于特征工程的方法和基于深度学习的方法;总结了现有研究存在的问题和面临的挑战,包括评估性能问题、数据质量问题、隐私伦理问题、原因抽取问题和自动干预问题等。未来的研究应该结合其他数据流,并需要患者、临床医生和数据科学家之间开展更大的合作,以使机器学习在心理健康问题的原因提取、预防疏导等方面得到新的应用。 李静 李静 刘德喜 万常选 刘喜平 鲍力平 邱祥庆关键词:社会网络 心理健康 基于双向事件完全图的文档级事件联合抽取方法及系统 本发明提供了一种基于双向事件完全图的文档级事件联合抽取方法及系统,该方法包括:根据各样本事件类型与论元角色之间的关系,构建三元组关联关系;根据标注语料中各事件记录信息中的词语和三元组关联关系,构建样本双向事件完全图;分别... 万齐智 万常选 胡蓉 刘德喜 刘喜平基于模型融合的男频和女频网络小说分析 网络小说根据目标读者的性别可以分为男频小说和女频小说.由于目标群体不同,男频和女频小说在很多方面具有不同的特征.目前对于男频和女频小说的分析大都停留在定性分析,定量分析很少,总体来说缺乏客观性和数据支撑.本文利用机器学习... 刘喜平 李艳丽 熊丽媛关键词:文本分类 一种基于财务数据的分析评论文本生成方法 本发明公开了一种基于财务数据的分析评论文本生成方法,涉及财务数据处理技术领域,采用互联网上公开的上市公司财务报表和对应的专业分析评论构建研究语料库;对语料库中的数据表格和评论文本进行预处理,搭建神经网络文本生成模型,训练... 刘喜平 谈锐 万常选 刘德喜文献传递 基于逐步集成多层注意力的事件表示学习方法及系统 本发明提出一种基于逐步集成多层注意力的事件表示学习方法及系统,该方法包括:获取文本中词语的结点嵌入表示,利用文本生成词语依存树及词语短语树,并构建词语‑短语依存树以及短语‑结构依存树,以词语的结点嵌入表示作为初始输入,采... 万齐智 万常选 刘德喜 刘喜平 胡蓉检索式自动问答研究综述 被引量:15 2021年 自动问答是人工智能和自然语言处理领域的一个研究热点,它最初是为了满足人们快速、准确地获取信息的需求,随着技术的发展,现有的自动问答模型大多无领域限制、可接收文本和语音输入.检索式自动问答是自动问答的重要技术路线,虽然近年来取得了丰硕的成果,但对这些成果进行总结分析的综述类文献或者比较早期、没有纳入新的成果,或者聚焦于某一个单独领域、没有从整体上进行总结分析.本文对问答模型的分类、技术方法、数据集和评价指标进行了比较全面的综述.首先,介绍自动问答的分类方法以及典型类型,总结了不同类型问答模型的特点以及常用的技术方法;然后,以检索式问答模型为主要对象,讨论常用的三类方法,分析了各类方法的特点以及难点,针对不同的难点,总结归纳了现有的改进技术;随后,介绍了检索式自动问答现有的评价方法和数据集;最后,总结现有方法存在的问题,并探讨了检索式自动问答将来的发展趋势和可能的挑战. 赵芸 刘德喜 万常选 刘喜平 廖国琼关键词:神经网络 数据集 增强语义表示的中文金融评价要素抽取 被引量:1 2022年 中文金融评价文本是了解金融行情和判断金融行业繁荣程度的主要载体,对其中的评价要素进行抽取和分析可以在一定程度上的帮助决策者做出判断.传统的抽取方法更侧重于寻找规则,工作量大,且在句子复杂或者不规范的情况下,难以充分考虑句子的句法特征.为了解决该问题,本文构建BBG-BMC模型,利用基于图自注意力机制的混合词编码模型BBG(BERT-BiLSTM-GAT)进行词语编码,在经典的BiLSTM-CRF模型中增加自注意力机制(BiLSTM-多头自注意力机制-CRF,BMC)进行序列标注.该模型的特点是:1)通过图自注意力网络(GAT)建模并利用词语之间的句法依存关系,增强词语语义学习;2)融合词语的上下文信息、词语的局部语义信息、词语之间的句法关系信息,弥补金融词汇在BERT预训练模型上语义表示不够充分的问题;3)对评价单元的三要素<评价对象、情感程度、评价词>联合抽取,扩大评价单元抽取的应用场景;4)使用序列标注的评价单元抽取思想,以混合词编码(BBG)、双向长短期记忆网络(BiLSTM)、条件随机场(CRF)与多头自注意力机制(MHSA)为组件,提升评价单元抽取效果.在中文金融文本数据集上对BBG-BMC模型进行评测,结果表明,本文的模型比最先进的模型BiLSTM-CRF取得了6.75%的F1值提升. 陈启 刘德喜 万常选 刘喜平 鲍力平基于计量风格学的小说质量分析 被引量:2 2019年 从计量风格学的角度来对小说文本进行比较研究。目前对小说文本的研究以定性为主,很少有定量的;以主观分析的居多,客观实证分析的较少。采集涉及网络小说和经典小说的225部小说作品,分成3个作品集,分别对应"优秀"、"良好"和"较差"的作品。对于每个作品,提取篇幅、词性、节奏、词汇量等方面的特征,基于这些特征,构造决策树、神经网络、贝叶斯等分类模型,由此来发现3个作品集之间的关键差异。研究发现,3个作品集在计量风格统计特征上有着较为明显的区别;对于不同的作品集,不同的特征具有不同的区分度。 李艳丽 李宛蓉 廖欣 李静娟 汤露 刘喜平关键词:文本分析 小说文本