林自芳
- 作品数:3 被引量:20H指数:2
- 供职机构:福州大学数学与计算机科学学院更多>>
- 发文基金:福建省科技创新平台建设项目福建省教育厅科技项目福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进位置成词概率的新词识别被引量:3
- 2011年
- 提出了一种基于改进位置成词概率的新词识别算法.该算法在位置成词概率的基础上,结合新词内部模式的特征提出了改进的位置成词概率,然后再综合互信息、邻接类别等统计量对新词进行识别.采用小说语料进行测试,实验结果表明该算法在一定程度上能有效提取新词.
- 林自芳蒋秀凤
- 关键词:汉语新词
- 基于词内部模式的中文新词识别研究被引量:1
- 2011年
- 提出了一种基于支持向量机的中文新词识别算法.该算法结合新词内部模式以及词长等提出了基于词内部模式的改进字符位置似然概率,并综合新词的邻接类别等特征对新词进行识别.经过小说语料测试,实验结果表明:该算法的微F1值为0.583 3,宏F1值为0.775 7,分别比不考虑词内部模式的基准算法提高约63%和30%.
- 廖祥文林自芳陈水利
- 关键词:中文新词支持向量机
- 基于词内部模式的新词识别被引量:17
- 2010年
- 提出一种基于词内部模式的新词识别算法,该算法在重复串查找的基础上,结合词内部模式的特征提出改进位置成词概率和首尾单字成词概率的加权,依次判断互信息、邻接类别等统计量,对新词进行识别。通过不同的实验对比发现,该算法在一定程度上能有效提取新词。
- 林自芳蒋秀凤