浙江省自然科学基金(Y1100176)
- 作品数:4 被引量:55H指数:3
- 相关作者:谌志群王荣波徐宁王小华嵇宇更多>>
- 相关机构:杭州电子科技大学更多>>
- 发文基金:浙江省自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 面向词计算的模糊约束重译
- 2012年
- 对词计算第三步模糊约束重译进行了研究。指出了候选词汇对应的模糊子集和结果约束中的模糊子集之间的贴近度和包容度在获取可信重译结果中的重要性。给出了分离算子的概念并设计了一个满足要求的分离算子。在此基础上定义了包容度的概念并给出了重译指数的计算公式。提出了一种基于重译指数计算的模糊约束重译方法。最后用实例说明了该方法的有效性。
- 谌志群王荣波姚金良
- 关键词:词计算贴近度
- 基于主题演化图的网络论坛热点跟踪被引量:22
- 2013年
- 网络热点话题检测与跟踪已成为舆情分析领域的前沿研究课题,具有广阔应用前景。本文研究基于主题演化图的网络论坛(BBS)热点跟踪问题。在采用共词分析和bisecting K-means聚类算法检测BBS热点话题基础上,提出了一个综合考虑话题帖子篇数与帖子热度的热点话题关注度计算方法。然后给出了一个基于相对熵的热点话题语义距离计算方法。最后通过构造主题演化图实现BBS热点话题的自动跟踪。在由实际BBS论坛数据构成的测试集上的实验表明,本文提出的方法是有效的。
- 谌志群徐宁王荣波
- 关键词:网络论坛网络舆情
- 基于句法分析和二次贝叶斯模型的受限域问题分类被引量:3
- 2012年
- 针对受限域的特殊性,提出了一种基于句法分析和二次贝叶斯模型的问题分类的新方法。该方法首先利用浅层句法分析的结果,抽取问题的主干部分和疑问词及其附属成分作为分类的特征,大大减少了噪声;然后,提出一种适用于受限域问题分类的改进的二次贝叶斯分类模型,并利用这一模型进行了大量的实验。实验结果表明了这一方法在受限域内的有效性,大类与小类问题的平均分类精度分别达到了89.66%和84.13%。
- 嵇宇王荣波谌志群
- 关键词:问答系统句法分析
- 基于共词分析的文本主题词聚类与主题发现被引量:34
- 2011年
- 文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。
- 王小华徐宁谌志群
- 关键词:共词分析TF-IDFK-MEANS主题