您的位置: 专家智库 > >

国家自然科学基金(61003152)

作品数:2 被引量:10H指数:2
相关作者:朱巧明洪宇姚建民冯艳卉唐伟更多>>
相关机构:苏州大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇新事件检测
  • 1篇数据挖掘
  • 1篇自动抽取
  • 1篇网页
  • 1篇关系抽取
  • 1篇WEB数据挖...
  • 1篇抽取

机构

  • 2篇苏州大学

作者

  • 2篇姚建民
  • 2篇洪宇
  • 2篇朱巧明
  • 1篇唐伟
  • 1篇冯艳卉
  • 1篇仓玉

传媒

  • 1篇中文信息学报
  • 1篇智能计算机与...

年份

  • 1篇2013
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
基于时序话题模型的新事件检测被引量:3
2011年
新事件检测(NewEventDetection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。初步实验发现,构成事件的一项重要属性是事件发生的特定时间,因此时间是区分不同事件的重要标志。为此,提出时序话题模型(TemporalTopicModel,简称TTM)。TYM将话题和报道切分为若干对应不同时间表达式的事件。其中,时间表达式描述事件发生的特定时间。TTM基于时间表达式在话题中出现的频率和增长率,估量对应时间表达式的事件作为种子事件或相关新颖事件的概率。此外,时间表达式的频率与增长率也用于衡量事件在相关性匹配中权重。在此基础上,NED依赖时间特性快速遏制不同时间发生的事件匹配,并借助种子事件和新颖事件调整相关性判定的权重分配。
仓玉洪宇姚建民朱巧明
关键词:新事件检测
网页中商品“属性—值”关系的自动抽取方法研究被引量:7
2013年
商品属性及其对应值的自动挖掘,对于基于Web的商品市场需求分析、商品推荐、售后服务等诸多领域有重要的应用价值。该文提出一种基于网页标题的模板构建方法,从结构化网页中抽取完整的商品"属性—值"关系。该方法包含四个关键技术:1)利用商品网页标题构建领域相关的属性词包;2)基于预设分隔符细化文本节点;3)结合领域商品属性词包获取种子"属性—值"关系;4)结合网页布局信息和字符信息来筛选与构建模板。该文的实验基于相机和手机两个领域展开,获得94.68%的准确率和90.57%的召回率。
唐伟洪宇冯艳卉姚建民朱巧明
关键词:WEB数据挖掘
共1页<1>
聚类工具0