您的位置: 专家智库 > >

北京市自然科学基金(4132067)

作品数:27 被引量:249H指数:9
相关作者:梁循杨小平周小平张海燕朱建林更多>>
相关机构:中国人民大学淮阴师范学院北京大学更多>>
发文基金:北京市自然科学基金国家自然科学基金教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 25篇期刊文章
  • 3篇会议论文

领域

  • 21篇自动化与计算...
  • 7篇经济管理
  • 2篇文化科学

主题

  • 8篇向量
  • 5篇支持向量
  • 5篇支持向量机
  • 5篇向量机
  • 4篇用户
  • 4篇情感分析
  • 3篇情感词典
  • 3篇中文
  • 3篇网络
  • 3篇金融
  • 2篇多核
  • 2篇多核支持向量...
  • 2篇信息熵
  • 2篇随机场
  • 2篇条件随机场
  • 2篇文本分类
  • 2篇午间
  • 2篇金融领域
  • 2篇决策支持
  • 2篇决策支持系统

机构

  • 28篇中国人民大学
  • 3篇淮阴师范学院
  • 2篇北京大学
  • 1篇北京联合大学
  • 1篇宁夏大学
  • 1篇上海交通大学
  • 1篇中国科学院
  • 1篇中华女子学院
  • 1篇北京建筑大学

作者

  • 20篇梁循
  • 7篇周小平
  • 6篇杨小平
  • 4篇张海燕
  • 3篇朱建林
  • 3篇张永俊
  • 2篇马跃峰
  • 2篇李志宇
  • 2篇张凯军
  • 2篇陈忠阳
  • 2篇李亚平
  • 2篇马超
  • 2篇齐金山
  • 2篇倪志豪
  • 2篇王怡
  • 2篇张中夏
  • 2篇徐静
  • 1篇张悦
  • 1篇王明明
  • 1篇陈默

传媒

  • 5篇中文信息学报
  • 3篇自动化学报
  • 3篇中国管理科学
  • 2篇数据采集与处...
  • 2篇北京理工大学...
  • 2篇计算机工程与...
  • 2篇计算机科学
  • 1篇计算机学报
  • 1篇计算机工程
  • 1篇计算机应用研...
  • 1篇软件学报
  • 1篇计算机系统应...
  • 1篇电子商务

年份

  • 2篇2019
  • 5篇2017
  • 5篇2016
  • 4篇2015
  • 10篇2014
  • 2篇2013
27 条 记 录,以下是 1-10
排序方式:
马氏距离多核支持向量机学习模型被引量:6
2014年
支持向量机是统计机器学习中的一种重要方法,被广泛地应用于模式识别、回归分析等问题。但一般支持向量机未考虑样本的总体分布,降低了支持向量机的泛化能力。针对该问题,提出一种马氏距离支持向量机学习模型,考虑总体样本的分布,并将该模型扩展到多核学习模型。通过数学方法将欧式距离核矩阵转化为马氏距离核矩阵,降低模型的实现难度。实验结果证明,该模型不仅保持了欧式距离多核学习模型的原有性质,且具有更好的分类精确度。
张凯军梁循
关键词:欧氏距离支持向量机核函数线性判别分析
基于支持向量机的上市公司午间公告新闻自动阅读与决策支持系统
随着互联网和信息技术的不断发展,投资者获得相关信息的渠道日益丰富,方式也愈加便捷。互联网的膨胀带来了海量的非结构化数据,如新闻、微博等等,如何利用这些信息从而进一步为投资者提供决策支持成为近年来的研究热点。本文从午间公告...
马超梁循
关键词:关键词提取支持向量机决策支持
文献传递
融入内部语义关系对文本分类的影响研究被引量:3
2016年
为了在不加入外部语义知识的前提下改善向量空间模型的文本分类效果,通过挖掘语料库内部蕴含的词间关系和文本间关系,并以不同的方式融入原始的词文本矩阵,然后选择常用的SVM和KNN算法,在领域性较强的法律语料库和领域性较宽泛的新闻语料库上进行文本分类的对比实验。实验证明,加入词间关系和文本间关系通常能有效改善文本分类的效果,但是对不同的分类方法和领域特征有不同的影响,在实际应用中应该区别对待。
朱建林杨小平彭鲸桥
关键词:向量空间模型文本分类语义挖掘特征矩阵
基于内容信任的Web信息可信度验证方法研究被引量:6
2014年
Web已经成为人们获取信息的重要来源,但Web上的信息并不都是真实可信的.因此,如何帮助用户快速判断Web上大量信息的可信性成为一个亟待解决的问题.文中提出一种基于内容信任的方法用以验证Web信息的可信程度.采用条件随机场模型进行Web信息的主题提取,利用提取的主题在Web上搜集候选证据,并利用时效性、主题相关度等特征验证候选证据的可靠性,最后进行可信度计算.实验结果表明提出的方法对评价Web信息的内容可信度是有效可行的.
徐静杨小平柳增
关键词:WEB信息条件随机场
基于属性主题分割的评论短文本词向量构建优化算法被引量:6
2016年
从词向量的训练模式入手,研究了基于语料语句分割(BWP)算法,分隔符分割(BSP)算法以及属性主题分割(BTP)算法三种分割情况下的词向量训练结果的优劣。研究发现,由于评论短文本的自身特征,传统的无分割(NP)训练方法,在词向量训练结果的准确率和相似度等方面与BWP算法、BSP算法以及BTP算法具有明显的差异。通过对0.7亿条评论短文本进行词向量构建实验对比后发现,该文所提出的BTP算法在同义词(属性词)测试任务上获得的结果是最佳的,因此BTP算法对于优化评论短文本词向量的训练,评论短文本属性词的抽取以及情感倾向分析等在内的,以词向量为基础的应用研究工作具有较为重要的实践意义。同时,该文在超大规模评论语料集上构建的词向量(开源)对于其他商品评论文本分析的应用任务具有较好可用性。
李志宇梁循周小平
关键词:相似度计算
腾讯微博的内容生成模式分析
2015年
随着Web 2.0时代网络技术的快速发展,社交类网站用户大规模增加。该文选取腾讯微博近两万名用户,抓取了他们所有的微博数据,对腾讯微博的用户内容生成模式进行分析和研究。我们从微博用户贡献分析、基于时间的用户活跃度分析以及微博影响三个角度出发,对微博的数量、微博的原创与转发、微博发布的周模式与日模式、微博转发影响力以及对影响微博转发的因素进行研究。总结出微博用户内容生成的一些特点,如用户内容贡献呈现一种"90-10"规则,不同类型的用户有着不同的"微博风格",微博用户每日微博发布数有着明显的周模式与日模式等。相关分析结论对于进一步深化研究微博的用户内容生成模式具有一定参考意义。
李亚平曹润童露梁循倪志豪
基于微博表情符号的情感词典构建研究被引量:17
2014年
基于微博表情符号,提出一种自动构建情感词典的方法.从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库.对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统计每个情感词在正向和负向语料库中出现的次数,计算情感词的卡方统计值获得情感强度,根据情感词在正负微博文本中出现的概率判定情感词的倾向性,进而生成情感词典.这是一种全新的思路.以人工标注的情感词典为基准数据,实验结果表明,本文方法标注情感词的准确率在80%左右,在情绪词强度阈值θ为20、30时,生成情感词典综合F值最好,达到了82%以上.
桂斌杨小平张中夏肖文韬
关键词:表情符号情感词典语料库
基于CRF模型的网络新闻主题线索发掘研究被引量:6
2017年
为了准确挖掘出同一主题的大量网络新闻的线索发展脉络,该文提出了一种基于条件随机场模型的网络新闻主题线索发掘方法。首先,根据新闻主题线索句的识别规则提取出相关特征,并应用到条件随机场模型中提取出主题线索句;然后,按照时间顺序构建原始线索链;最后,对语义相近的原始线索链进行合并处理,获得最终的新闻主题发展脉络。实验结果表明,该方法在主题线索句识别上有较好的效果,最终得到的主题线索脉络能够较清晰地展现新闻发展趋势。
徐静杨小平
关键词:条件随机场
基于在线评级和评论的评价者效用机制研究被引量:22
2016年
互联网中对产品和服务的评价越来越受到重视,因为评价能够消除消费者的不确定性,辅助其做出购买决策。大多数在线购物网站中用户的评价包括评级和评论。现有的评价反馈系统和评价研究往往只单独关注评价者之间的评级或评论,而忽略了两者之间的有机统一。评价者的评级并不一定反映评价者的真实评价,很多评价者更倾向于选择评论文本来表达自己的真实情感。本文以从淘宝网抓取的852071条评价数据为基础,通过分析评价者评级和评论之间的不一致性,结合RFM模型,考虑评级和评论两种信息形成的评价效用,提出了RFMA模型来计算评价者的总体评价效用。并据此对好的与不好的评价者进行区分,进一步为消费者的购买决策提供支持。通过对评价者的总体分析可以得出,本文提出的机制更加具有可用性和有效性。
施晓菁梁循孙晓蕾
关键词:评价者
基于全路径相似度的大规模层次分类算法
2019年
为快速准确地实现大规模层次分类问题,提出词类区分度概念,并以此作为计算类向量的基础。基于类向量,以改进的Rocchio算法计算待分类文本与目标类的相似度,候选出N个最可能的目标类别;根据目标类别的层次拓扑结构,计算待分类文本与N个目标类别的全路径相似度,确定分类类别。实验结果表明,该方法分类效果优于传统算法,其基于文本类全路径相似度的策略明显改善了单纯基于词类区分度的分类算法。
朱建林陈忠阳张永俊孙存一
关键词:文本分类
共3页<123>
聚类工具0