张仰森
- 作品数:224 被引量:813H指数:15
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家自然科学基金北京市属高等学校人才强教计划资助项目教育部重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字经济管理更多>>
- 基于层次分析的微博用户信息可信度模型被引量:2
- 2015年
- 对于网络微博用户可信任性的问题,通过对爬取的所有源语料进行有目的的预处理,得到具有规范格式的用户数据,并从用户信息数据中,选择性的提取用户信息的完整度、活跃度、交际广度、传播力度四项指标组成指标体系;然后利用设计的层次分析法(AHP)结构模型,实现了对指标的权重系数数值确定,进而计算与统计用户的权威性。最终完成对用户可信度模型的构建。实验表明,该模型对微博用户的可信度评测方面有较好的准确性。
- 张涛张仰森刘清松
- 关键词:权威性层次分析法
- 问题生成研究综述被引量:3
- 2021年
- 问题生成是给定文本,自动生成内容通顺、语义相关的自然语言问题。问题生成可应用于教育领域的阅读理解、辅助问答系统和对话系统,因此近年来引起了研究者的广泛关注和兴趣。该文对问题生成的相关研究进行了综述。首先阐释了问题生成的研究意义与应用场景,继而简略概述了基于规则的问题生成方法,然后从输入文本是句子/段落、有/无答案信息等不同角度全面阐述了基于神经网络的问题生成模型。该文还介绍了问题生成的评价方法,分析讨论了现有工作的不足,并展望了未来可能的研究方向。
- 吴云芳张仰森
- 关键词:神经网络模型
- 融合语义与问题关键信息的多阶段注意力答案选取方法
- 本发明公开了融合语义与问题关键信息的多阶段注意力答案选取方法,该方法包括两个阶段,第一阶段为:获取候选答案LSTM双向输出的语义表示,利用问题的关键信息对候选答案的语义表示进行注意力加权更新,将加权更新后的候选答案语义表...
- 张仰森王胜黄改娟
- 一种基于情感计算与多头注意力机制的负面新闻识别方法
- 本发明公开了一种基于情感计算与多头注意力机制的负面新闻识别方法,涉及网络舆情监测技术领域,解决的技术问题是如何解决客观性负面新闻难以识别的问题,包括如下具体步骤:(1)对网络新闻文本数据进行采集和预处理;(2)建立并扩充...
- 张仰森周炜翔黄改娟
- 文献传递
- 最大熵建模方法中一种改进的特征选择算法
- 本文对应用最大熵原理建立语言模型的特征选取方法提出了改进,即先利用特征模板从训练样本中获得候选特征集,再应用频次与平均互信息相结合的方法从候选特征集中选取特征.改进后的方法在选择特征时,对候选特征集中出现频次大于某一限值...
- 张仰森曹元大
- 关键词:语言建模自然语言处理
- 文献传递
- 中文文本自动校错系统中知识库及其构造方法研究被引量:6
- 2004年
- 阐述了在中文文本校错系统研究和实现过程中 ,面向文本错误查找与纠错建议产生的语言知识获取及知识库构建的思想及其实现算法 .针对数据稀疏问题探讨了查错知识库的存取技术 ,针对不同错误源 ,重点研究了相似码词典、字驱动双向词典和骨架键词典的构造方法 .基于所构建的知识库而实现的中文文本校错系统 。
- 张仰森曹元大徐波
- 关键词:知识获取
- 基于LDA模型和多层聚类的微博话题检测被引量:15
- 2016年
- 随着微博这一新兴社交媒体的广泛应用,以微博为背景的相关研究不断涌现,其中基于微博的话题检测是当前研究的热点之一。结合微博文本的相关特点,文中提出了一种基于LDA模型和多层聚类的微博话题检测方法。首先,通过LDA模型对微博数据建模并提取特征;其次,利用改进的Single-Pass聚类和层次聚类对微博数据进行聚类,从而发现热点话题。通过在大规模微博数据上进行话题检测实验,通过LDA建模比通过TF-IDF进行特征选择和权重计算效果好;改进的Single-Pass聚类能够处理第一遍Single-Pass聚类未处理的微博,提高了初步聚类的精度,并且为下一步层次聚类减少了时间;多层聚类的聚类效果在准确率、召回率和F值三方面均比单一聚类算法的聚类效果好。显然,文中的话题检测方法是可行的,也是有效的。
- 刘红兵李文坤张仰森
- 关键词:LDA模型层次聚类
- 一种基于情景建模和卷积神经网络的微博个性化推荐方法
- 本发明提供一种基于情景建模和卷积神经网络的微博个性化推荐方法,首先从时间和地域两个维度对用户进行情景建模,提取用户的时间情景模式和地域情景模式;然后,构建情景模式相似度计算方法对用户的情景模式进行扩展,捕捉用户感兴趣的情...
- 张仰森周炜翔黄改娟陈若愚尤建清魏文杰
- 汉语词义自动标注研究软件平台的设计与实现
- 词语义项标注在自然语言处理领域占有重要地位.词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大.为更好地研究这些问...
- 张仰森俞士汶段惠明吴云芳
- 关键词:知识获取
- 文献传递
- 一种基于知识图谱的web日志异常行为识别方法
- 为提高对网络DNS服务器日志分析的能力,本发明综合多种技术,创新性的提出了构建面向域名解析系统的知识图谱。首先,应用域名解析、权威域名服务器、别名解析、自治系统等原理设计了基于aiohttp和dig技术相结合的自动化爬虫...
- 张仰森黄改娟段瑞雪陈若愚胡昌秀
- 文献传递