宋丽
- 作品数:6 被引量:30H指数:2
- 供职机构:南京师范大学文学院更多>>
- 发文基金:国家自然科学基金国家科技支撑计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于中文AMR语料库的非投影结构研究被引量:2
- 2018年
- 非投影结构是指依存树上的词语节点与原句中的词语序列出现错位的现象,对于句法分析器的影响较大,在语言理论上也有较大研究价值。在世界多种语言的依存树或图库上,都发现了含有非投影结构的句子,并对比展开了相关研究。而汉语的非投影结构尚未得到重视,语料库构建过程中也因遵循了投影性原则而缺乏对非投影结构的标注。该文基于概念对齐版的中文AMR语料库,在10 149句语料上统计出带有非投影结构的句子比例为31.62%,其三种主要类型为模态词提升、话题化和成分分离,并提出了相应的自动分析方案,以提高中文AMR自动分析效果。
- 闻媛宋丽吴泰中李斌周俊生曲维光
- 关键词:语义分析中文信息处理
- 基于认知属性库的原型范畴研究
- 原型范畴是认知科学研究中的重要理论,使用属性来区分范畴中心成员及边缘成员有着较强的解释力,但该理论一直缺乏基于频率信息的属性数据支撑。本文借助认知属性库的23万条数据,对原型理论研究中经常讨论的“鸟”、“水果”、“交通工...
- 李斌宋丽银思琪王萌
- 关键词:语义分类语义计算
- 基于认知属性库的原型范畴研究被引量:3
- 2016年
- 原型范畴是认知科学研究中的重要理论,使用属性来区分范畴中心成员及边缘成员有着较强的解释力,但该理论一直缺乏基于频率信息的属性数据支撑。该文借助认知属性库的23万条数据,对原型理论研究中经常讨论的"鸟"、"水果"、"交通工具"等范畴的典型成员和非典型成员进行分析验证。认知属性库的数据显示,在汉语中,"鸟"的典型成员是"麻雀"、"燕子"等,和"鸟"具有较多的共同属性;而"企鹅"、"鸵鸟"则只共享了"鸟"很少的属性,且缺少关键的属性"飞"。大体上验证了原型理论的观点。同时,我们也发现"小鸟"的属性特别丰富,具有典型成员的特性。在进一步观察了"水果"和"交通工具"两个范畴后,我们探讨了范畴的跨类现象,进而从数学模型上区分了树结构的层次分类体系和图结构的范畴化体系。
- 李斌宋丽银思琪曲维光王萌
- 关键词:语义分类语义计算
- 融合概念对齐信息的中文AMR语料库的构建被引量:22
- 2017年
- 作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的AMR语料库。该文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从CTB中选取了6 923句进行人工标注,形成中文AMR语料库,统计得到图和环的比例分别为48%和1%,以及利用对齐信息才能获取的非投影句的比例32%,为中文AMR的理论和自动分析研究奠定基础。
- 李斌闻媛宋丽卜丽君曲维光薛念文
- 关键词:语义图句子语义语言知识库
- 特斯尼耶尔《结构句法基础》的要点梳理及简评被引量:1
- 2017年
- 法国语言学家特斯尼耶尔被称为配价语法和现代依存文法的创始人,奠定其创始人地位的就是他的著作《结构句法基础》,然而国内对该书介绍甚少。本文对该书的要点进行梳理,简要介绍了其中的重要理论,并分析了其优缺点。
- 宋丽
- 关键词:结构句法依存文法配价语法
- 面向中文抽象语义表示的复句研究综述被引量:2
- 2018年
- 抽象语义表示(AMR)是一种新型的句子语义表示方式.中文AMR在英文AMR的基础上,针对汉语特点,增加了复句逻辑语义关系的表示.中文AMR以句子为基本标注单位,以层次结构树形式表示各分句间的逻辑关系.由于允许论元共享,因此在树结构基础上形成图结构,从而对复句的语义表示更加完整全面.为了进一步研究中文AMR,对目前复句关系研究现状、复句及篇章关系资源的建设进行了综述,指出目前研究存在的问题,并提出将来工作研究的方向.
- 魏庭新曲维光曲维光宋丽
- 关键词:复句