朱琦
- 作品数:3 被引量:13H指数:1
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 对外汉语教学领域话题语料库的研究与构建被引量:12
- 2015年
- 对外汉语教学领域,教材上的课文通常围绕一个话题展开,话题是教学内容的集中体现,也与词汇、语法等不同层面的语言知识间有着密切关联。该文基于大规模教材语料库研究教学话题分类体系,设计了一个包含四个一级话题、23个二级话题和246个三级话题的三层话题框架,并据此对197册汉语经典教材中的5 457个文段进行了人工标注及校对,构建了一个规模约12万句的面向对外汉语教学的话题语料库。为了更好地服务于汉语教学及相关研究工作,还抽取、计算了文段的语法点和新HSK词语等级信息,作为话题标注的补充维度加入资源库,以期为汉语教学领域的教师、研究者及教材编写者提供较为全面的话题信息参考。
- 胡韧奋朱琦杨丽姣
- 关键词:对外汉语语料库
- 以新HSK考题和经典对外汉语教材为语料基础的情感句分析
- 2015年
- 对外汉语教学的目标是培养学生的交际能力,句子情感信息的理解和表达是初级阶段交际能力培养的重要内容。以国家汉办公布的新HSK试卷文本和6套经典对外汉语教材为语料基础,以句子为单位,对语料的情感信息进行人工标注,计算情感句在不同类型语料中的分布,并进行了对比分析。结果显示,句子中显示积极评价态度、表达"吃惊/怀疑"、"关心"情感类别的频率最高,分别为38.62%、10.18%、9.31%,在情感句中非常显著。此外,还从每个情感句中抽取了情感词、短语和句式,分析其组合方式以及分布规律,发现在表达消极的情感时,多使用"否定词+积极情感词"的表达方式,相关数据和结论可为汉语国际教育领域情感句研究以及新HSK备考提供参考。
- 王敬朱琦
- 关键词:情感分析
- 中文信息处理评测资源建设现状与问题研究被引量:1
- 2016年
- 自然语言处理任务复杂,并且涉及庞大的数据量,需要在同一数据集上进行可重复的测试来比较不同研究方法的优劣。因此,技术评测一直都是自然语言处理技术发展的重要驱动。本研究从多维度调研了国内影响力较大的自然语言处理技术评测,并同国际上的评测语言资源在语料来源、语料规模、语料库建设方法等进行了对比分析,总结了国内评测语言资源存在的不足,分析了评测语言资源的建设方向和发展趋势。
- 朱琦王敬
- 关键词:评测语言资源中文信息处理