何正焱
- 作品数:5 被引量:1H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种快速序列标注方法
- 本发明提供一种快速序列标注方法,属于语言信息处理领域。所述方法基于随机梯度下降(SGD)在线学习算法,适合大规模语料训练;在训练过程中,针对特征频率,对二阶海森矩阵采用对角化近似,即:利用特征频率高低对对角元素赋予不同权...
- 王厚峰何正焱
- 商品品牌名称挖掘被引量:1
- 2012年
- 百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识,能够弥补普通词典词汇覆盖面小的缺点。在商品品牌名称挖掘中,该文提出了发现新的品牌名称的基于图模型的半指导方法。利用百度百科中词条间的相关关系和开放分类,该文使用不同的准则计算词条间的相似度,结合词条和分类的关联性,分类与分类之间的关联性,使用标记传播算法,在130万个词条上进行了品牌名称的挖掘,取得了较好地效果。
- 何正焱王厚峰
- 关键词:半监督学习图算法
- 实体消歧关键技术研究
- 实体消歧旨在解决文本中广泛存在的名称歧义问题,在语义化搜索、问答系统、知识库扩充、异构知识库融合等领域有着广泛的应用。如果存在包含实体定义的知识库,实体消歧将文本中的实体名链接到知识库中对应的实体项。由于存在大量的重名现...
- 何正焱
- 关键词:知识库
- 商品品牌名称挖掘
- 百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识。在商品品牌名称抽取的挖掘中,我们提出了发现新的品牌名称的基于图模型的半指导方法。利用百度百科中词条间的相关关系和开放分类,我们使用不同的准则计算...
- 何正焱王厚峰
- 关键词:半监督学习图算法
- 文献传递
- 一种快速序列标注方法
- 本发明提供一种序列标注方法,属于语言信息处理领域。所述方法基于随机梯度下降(SGD)在线学习算法,适合大规模语料训练;在训练过程中,针对特征频率,对二阶海森矩阵采用对角化近似,即:利用特征频率高低对对角元素赋予不同权重,...
- 王厚峰何正焱
- 文献传递