陈敬
- 作品数:6 被引量:3H指数:1
- 供职机构:苏州大学自然语言处理实验室更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 社交网络中用户年龄识别方法研究
- 社交网络数据的自动化分析是自然语言处理、社交网络分析等领域的重要研究课题。用户年龄属性识别是社交分析中的一项基本研究任务,该任务旨在通过用户在网上发布的文本信息或者用户社交信息确定用户准确的年龄或者所属的年龄段。准确识别...
- 陈敬
- 关键词:社交网络半监督学习混合模型
- 基于双通道LSTM的用户年龄识别方法
- 2017年
- 传统的年龄回归方法不能学习深层次信息,因此利用能充分挖掘上下文关系信息的深度学习方法来识别用户的年龄。具体而言,提出了一种基于LSTM的年龄回归方法,其能够学习长期依赖关系即建立输入值之间的长相关联系。采用了两种不同的特征,即文本特征和社交特征。为了有效地区分这两种特征,充分利用这两种特征之间的信息,进一步提出了基于双通道LSTM的年龄回归方法,具体实现是在神经网络中加入Merge层,将LSTM分别产生的文本特征表示和社交特征表示结合进行集成学习以充分学习文本特征和社交特征间的联系。实验结果表明,基于双通道LSTM的年龄回归方法能够有效地区分文本特征和社交特征,并且较单个LSTM方法能够取得更好的年龄回归性能。
- 陈敬李寿山周国栋
- 关键词:文本特征
- 一种事件触发词识别方法及系统
- 本发明公开了一种事件触发词识别方法,利用所述最大熵识别模型对所述测试样本中的事件触发词进行识别,得到识别结果;其中,所述最大熵识别模型的获取包括:获取原始语料样本的词特征,词性特征,实体信息特征和依存关系特征;获取所述词...
- 陈敬李寿山周国栋
- 文献传递
- 混合分类/回归模型的用户年龄识别方法
- 2017年
- 年龄分类方法和年龄回归方法是年龄识别任务的主要方法.这两种方法各自具有其自身的优越性.例如:年龄分类方法能够灵活利用机器学习中的区分式模型,而年龄回归方法的主要优势是能够捕捉不同年龄之间的联系.为了能同时利用分类方法和回归方法的优势,本文提出了一种混合分类/回归模型(混合模型)用于用户年龄识别.具体而言,我们首先基于长短时记忆(long short-term memory,LSTM)模型分别构建年龄分类模型和回归模型用于年龄识别;在此基础上,将年龄分类结果与年龄回归结果进行线性融合作为年龄识别的最终结果.实验结果表明本文提出的混合模型能够有效提升年龄识别任务的性能.
- 陈敬李寿山王晶晶周国栋
- 关键词:混合模型自然语言处理
- 基于联合学习的跨语言事件识别方法被引量:2
- 2017年
- 事件识别,包括事件触发词识别和分类,是事件抽取任务中的基础问题.为了利用较为丰富和完善的英文事件语料库来帮助完成中文事件抽取任务,提出了一种基于联合学习的跨语言事件识别方法,即利用源语言的标注语料对目标语言的测试语料进行事件识别.利用机器翻译及词对齐技术来保持源语言和目标语言的语言一致性和标注信息一致性.挑选合适的特征组合,使用最大熵分类模型分别实现触发词的识别和分类.通过整数线性规划的联合学习模型将二者结合在一起,加之局部约束和全局约束条件,对结果进行优化处理.实验结果表明,使用源语言的语料及其翻译语料叠加的双语语料时,所用方法可以取得较好的效果.
- 严倩陈敬王礼敏李寿山
- 关键词:跨语言整数线性规划