张劲松
- 作品数:3 被引量:29H指数:3
- 供职机构:上海理工大学光电信息与计算机工程学院更多>>
- 发文基金:上海市教育委员会重点学科基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 回溯正向匹配中文分词算法被引量:17
- 2009年
- 在最大匹配法(The Maximum Matching Method)的基础上,提出了一种回溯正向匹配(The Backtracking Matching Method)的中文分词方法。该方法首先对待切文本进行预处理,将文本分割成长度较短的细粒度文本;利用正向匹配、回溯匹配和尾词匹配来有效发现歧义字段;利用长词优先兼顾2词簇的方式对交集型歧义字段进行切分。最后对该算法进行的定性分析说明了该方法的先进性,从随机抽取大量语料实验结果上证明了该方法的有效性。
- 张劲松袁健
- 关键词:中文分词最大匹配法交集型歧义
- 二次回溯中文分词方法被引量:3
- 2009年
- 在最大匹配法(MM)的基础上,提出了二次回溯中文分词方法。该方法首先对待切文本进行预处理,将文本分割成长度较短的细粒度文本;利用正向匹配、回溯匹配、尾词匹配、碎片检查来有效发现歧义字段;利用长词优先兼顾二词簇的方式对交集型歧义字段进行切分,并对难点的多链长交集型歧义字段进行有效发现和切分。从随机抽取的大量语料实验结果上证明了该方法的有效性。
- 袁健张劲松马良
- 关键词:中文分词交集型歧义
- 一种有效预防点击欺诈的策略被引量:10
- 2009年
- 网络广告中,点击欺诈愈演愈烈,使得搜索引擎企业以及点击付费模式遭到质疑。点击欺诈已经成为阻碍网络广告业健康发展的一大顽疾。针对网络广告业发展所面临的困境,提出一种基于图形验证码的预防点击欺诈策略。该策略能有效屏蔽类似于木马点击器软件的欺诈点击,有效屏蔽浏览者偶然的无意识的无效点击,显著降低人工欺诈点击的效率。
- 袁健张劲松马良
- 关键词:点击付费光学字符识别验证码