郝娟
- 作品数:10 被引量:4H指数:1
- 供职机构:华东师范大学更多>>
- 发文基金:上海市科委重大科技攻关项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合干扰词上下文特征的中文命名实体识别研究
- 现有识别中文命名实体方法多依赖其自身结构特点,并且嵌套命名实体的识别还没有引起足够的重视,另外,广泛类型实体识别几乎没有研究,如产品品牌、新闻媒体等。基于此,本文提出了融合干扰词上下文特征的中文命名实体识别算法。该算法用...
- 郝娟
- 关键词:特征匹配算法
- 文献传递
- 一种基于多用户上下文识别的IPTV节目推荐方法
- 本发明公开了一种基于多用户上下文识别的IPTV节目推荐方法,通过对节目观看时间的聚类分析,得到用户观看时间相对集中的时间段,计算用户在不同时间段内的节目偏好,分析不同时间段间的节目偏好相似度,合并观看节目较为相似的时间段...
- 杨燕王智谨郝娟黄保荃陈昊裴逸钧
- 文献传递
- 一种上下文感知的IPTV节目推荐方法
- 本发明提供一种上下文感知的IPTV节目推荐方法,包括步骤:a.根据用户的观看记录,计算用户对已观看节目的隐式评分,以及与每个评分对应的置信度和上下文权值;b.针对每个用户和节目,根据上下文初始化用户向量和节目向量;c.对...
- 杨燕崔永利陈昊李明耀郝娟黄保荃
- 文献传递
- 一种基于多用户上下文识别的IPTV节目推荐方法
- 本发明公开了一种基于多用户上下文识别的IPTV节目推荐方法,通过对节目观看时间的聚类分析,得到用户观看时间相对集中的时间段,计算用户在不同时间段内的节目偏好,分析不同时间段间的节目偏好相似度,合并观看节目较为相似的时间段...
- 杨燕王智谨郝娟黄保荃陈昊裴逸钧
- 文献传递
- 一种采用上下文特征匹配的中文机构名简称识别系统
- 本发明公开了一种采用上下文特征匹配的中文机构名简称识别系统,该系统首先训练得到干扰词上下文特征与机构名上下文特征的相交特征集以及机构名独有特征集;然后利用这些特征对机构名简称进行识别;最后通过建立干扰词表与扩展操作,对机...
- 杨静郝娟潘云裴逸钧杜泽宇
- 文献传递
- 一种利用中文在线资源实现远程监督人物关系抽取的方法
- 本发明公开了一种利用中文在线资源实现远程监督人物关系抽取的方法,该方法首先利用Web上已经通过半人工化方式形成的在线百科网站自动构建知识库,以获取尽可能全面且准确的关系类型及其人物关系实例。接着提取语料库中所有共现的人名...
- 杨静潘云郝娟杨辰翌黄保荃
- 文献传递
- 一种基于内容相关度和社交影响力的微博服务专家定位方法
- 本发明提供了一种基于内容相关度和社交影响力的微博服务专家定位方法,包括步骤:a.抽取微博服务中的潜在语义主题;b.计算微博用户在各个主题下的社交影响力;c.对每次查询,确定微博服务用户在待查询关键字下的专业度;d.根据微...
- 杨燕张波郝娟黄保荃潘云杜泽宇
- 文献传递
- 一种上下文感知的IPTV节目推荐方法
- 本发明提供一种上下文感知的IPTV节目推荐方法,包括步骤:a.根据用户的观看记录,计算用户对已观看节目的隐式评分,以及与每个评分对应的置信度和上下文权值;b.针对每个用户和节目,根据上下文初始化用户向量和节目向量;c.对...
- 杨燕崔永利陈昊李明耀郝娟黄保荃
- 文献传递
- 一种利用中文在线资源实现远程监督人物关系抽取的方法
- 本发明公开了一种利用中文在线资源实现远程监督人物关系抽取的方法,该方法首先利用Web上已经通过半人工化方式形成的在线百科网站自动构建知识库,以获取尽可能全面且准确的关系类型及其人物关系实例。接着提取语料库中所有共现的人名...
- 杨静潘云郝娟杨辰翌黄保荃
- 采用上下文特征匹配的中文机构名简称识别被引量:4
- 2015年
- 现有识别机构名简称的方法多依赖全称,也依赖简称的组成形式.针对这两个问题,提出一种采用上下文特征匹配的机构名简称识别方法.本文提出的上下文特征分为机构名独有特征和干扰词与机构名相交特征,每一个特征赋予一个错误率权重,在不同错误率范围内,采用上下文特征匹配算法识别机构名简称.还通过建立干扰词表和扩展操作,进一步提高了识别的准确率与召回率.实验中,本文方法在封闭数据集上的F值达到92.23%.利用封闭数据集训练的特征和干扰词,在开放测试集上的F值取得70.28%.最后,与依赖全称生成简称的识别方法进行对比,本文方法识别出有匹配全称的简称和无匹配全称的简称,比依赖全称的识别方法有更好的效果.
- 郝娟杨静
- 关键词:特征匹配算法