您的位置: 专家智库 > >

国家社会科学基金(13BTJ005)

作品数:4 被引量:12H指数:3
相关作者:王和勇黄晓宇陈康梁冰蔡文学更多>>
相关机构:华南理工大学中国电信股份有限公司中山大学更多>>
发文基金:国家社会科学基金国家自然科学基金国家高技术研究发展计划更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 3篇文化科学
  • 1篇自动化与计算...

主题

  • 2篇主题发现
  • 1篇信息增益
  • 1篇序列数据
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇指标体系
  • 1篇时间序列
  • 1篇时间序列数据
  • 1篇时序数据
  • 1篇图模型
  • 1篇评分
  • 1篇中文
  • 1篇中文分词
  • 1篇主题
  • 1篇维数
  • 1篇向量
  • 1篇向量机
  • 1篇矩阵
  • 1篇矩阵分解
  • 1篇聚类

机构

  • 4篇华南理工大学
  • 1篇中山大学
  • 1篇中国电信股份...

作者

  • 3篇王和勇
  • 1篇李磊
  • 1篇潘嵘
  • 1篇蔡文学
  • 1篇梁冰
  • 1篇陈康
  • 1篇黄晓宇
  • 1篇崔蓉

传媒

  • 1篇现代情报
  • 1篇图书情报工作
  • 1篇情报杂志
  • 1篇软件学报

年份

  • 3篇2015
  • 1篇2014
4 条 记 录,以下是 1-4
排序方式:
微群核心用户挖掘的关联规则方法的应用被引量:3
2014年
提出将关联规则方法应用到微群核心用户挖掘中,选取新浪微群作为具体实验对象,分别利用关联规则方法、主流的社交网络方法和常用的评价指标体系方法对采集到的真实微群数据集进行对比分析,验证模型的有效性。同时发现常用的评价指标体系方法需要根据微群的具体问题进行调整,而关联规则方法可自动处理,说明关联规则方法具有普适性。
王和勇蓝金炯
关键词:核心用户关联规则SNA指标体系
面向海量高维数据的文本主题发现被引量:2
2015年
针对潜在语义分析(LSA:Latent Semantic Analysis)方法在海量高维数据中的制约,提出K均值聚类的LSA方法(KLSA):通过利用K均值聚类对主题词进行预处理,将主题词降到相对低维空间后再使用LSA方法;选取新浪微博文本数据作为具体研究对象,通过实验证明了所提出的方法能够在确保模型分类效果条件下,很好地满足海量高维数据对LSA方法计算速度的敏感要求。
王和勇蓝金炯
关键词:海量数据高维数据LSAK均值聚类
面向时序数据的矩阵分解?被引量:4
2015年
研究一类特殊的矩阵分解问题:对由多个对象在一组连续时间点上产生的数据构成的矩阵R,寻求把它近似地分解为两个低秩矩阵U和V的乘积,即R?UT?V.有为数众多的时间序列分析问题都可归结为所研究问题的求解,如金融数据矩阵的因子分析、缺失交通流数据的估计等.提出了该问题的概率图模型,进而由此导出了其约束优化模型,最终给出了模型的求解算法.在不同的数据集上进行实验验证了该模型的有效性.
黄晓宇潘嵘李磊梁冰陈康蔡文学
关键词:矩阵分解时间序列数据概率图模型
在线用户评论的主题发现研究被引量:3
2015年
在线用户评论是电子商务网站中的一个重要板块,找出在线用户评论的关注点有利于网站、商家及时有效地查看用户的反馈信息。本文在对在线用户评论进行分词的基础上,分别使用拉普拉斯评分(LS,Laplacian Score)及信息增益(IG,Information Gain)对所得到的分词结果进行文本主题挖掘,并使用支持向量机(SVM,Support Vector Machine)进行分类精度的检验。实证结果表明,主题选择的结果是有效的,分类的效果与选择的关键词个数和核函数有关。
王和勇崔蓉
关键词:中文分词主题发现信息增益支持向量机
共1页<1>
聚类工具0