张龙凯
- 作品数:6 被引量:14H指数:2
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 文本摘要问题中的句子抽取方法研究被引量:10
- 2012年
- 抽取式摘要是从正文中按照一定策略抽取重要句子组成摘要。该文提出了一种句子抽取方法。基本思想是将句子的抽取看作序列标注问题,采用条件随机场模型对句子进行二类标注,根据标注结果抽出句子以生成摘要。由于不在摘要中的句子的数量远大于摘要中的句子数量,标注过程倾向于拒绝将句子标注为摘要句,针对此问题该文引入了修正因子进行修正。实验表明该方法具有较好地效果。
- 张龙凯王厚峰
- 关键词:文本摘要句子抽取条件随机场
- 基于条件随机场与Web数据的缩略语预测被引量:3
- 2012年
- 缩略语在自然语言中被广泛使用。因其是新词的重要来源之一,成为了自然语言处理领域的一大问题。该文以汉语为对象,研究了从完整形式预测缩略语形式的方法。首先,使用条件随机场模型对完整形式进行序列标注,生成缩略语候选集合。再利用搜索引擎获取网络数据,并通过不同策略利用网络数据对各候选依次评估,结合各项评估分数进行重排序,选择最终的缩略语结果。实验结果表明,增加Web信息之后,缩略语预测的准确率可以提高约五个百分点。
- 焦妍王厚峰张龙凯
- 关键词:缩略语CRF模型网页数据
- 一种基于深度神经网络与多标记分类的病句检测方法
- 本发明提供一种基于深度神经网络与多标记分类的病句检测方法,该方法的核心是先对句子进行词法分析、句法分析,在此基础上抽取基层特征,包括词特征,词关系特征等;然后,利用深度神经网络学习抽象的特征表示,以获得不同错误与特征之间...
- 王厚峰张龙凯
- 文献传递
- 一种基于文档词汇特征变化的突发事件检测方法
- 一种基于文档词汇特征变化的突发事件检测方法。包括:利用计算机从新闻网站上的时政新闻报道中爬取指定时间段的新闻文章;对每一个文档进行预处理,包括汉语词切分和词性标注;留下内容词,过滤掉其它词;获取前面k年与目标文档相同时间...
- 王厚峰张龙凯
- 文献传递
- 文本摘要中的句子抽取方法研究
- 抽取式摘要是从正文中按照一定策略抽取重要句子组成摘要。本文提出了一种句子抽取方法。基本思想是将句子的抽取看作序列标注问题,采用条件随机场模型对句子进行二类标注,根据标注结果抽出句子以生成摘要。由于不在摘要中的句子的数量远...
- 张龙凯王厚峰
- 关键词:文本摘要句子抽取条件随机场
- 文献传递
- 现代汉语“对象格”自动识别研究被引量:1
- 2014年
- 在中文语义角色标注体系中,"对象格"作为汉语语法体系的"自产物",有着区别于其他语义角色的句法和语义的特征。讨论"对象格"的语义特征及相关语义角色标注间的纠结现象,提出了面对自然语言处理的"对象"语义角色标注流程图,并进行了相关实验验证。
- 汪梦翔王厚峰刘扬张龙凯
- 关键词:语义角色