朱学锋
- 作品数:49 被引量:431H指数:11
- 供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学自然科学总论更多>>
- 参照生成词库理论对动名兼类现象再讨论被引量:7
- 2020年
- 词的兼类问题及其处理策略是历久弥新的现代汉语词类研究中重要而又困难的课题之一。文章简要介绍汉语语法学界关于兼类的研究,然后参照生成词库理论,对其中最受关注的动名兼类现象再次进行讨论。根据陆俭明教授从汉语教学需要出发对兼类词下的定义,认识到字形和读音相同的动词与名词互为兼类词的条件是它们互为语义角色。文章还从语义层面论述了名动词不处理为动名兼类的合理性。文章在融合语法研究与语义研究方面是一个尝试,最后提出与兼类相关的一些语言学问题及语言工程任务。
- 俞士汶朱学锋刘扬
- 关键词:兼类词语义角色
- 计算机辅助编制机器辞典
- 1989年
- 本文总结了笔者开发用于自动翻译和自然语言处理的机器辞典的实践经验。利用软件技术,建立了一个良好的界面,可以方便地录入日文汉字与假名、可以大大压缩录入的信息量、可以自动生成日语词汇的某些词法信息、可以自动生成汉语词汇的检索特征,从而提高了辞典管理的自动化程度,取得了良好的效果。
- 朱学锋
- 关键词:日文汉字日语词汇软件技术自动词自然语言理解四字词
- 中文缩略语还原技术初探
- 缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究也是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语(简称)的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本文的工作...
- 支流朱学锋段慧明俞士汶
- 关键词:自然语言处理缩略语
- 文献传递
- 综合型语言知识库及其前景被引量:8
- 2011年
- 北京大学计算语言学研究所自1986年起,历时25年建成综合型语言知识库(CLKB)。CLKB包括6个语言知识库、10项规范与标准、基础软件工具集和4个应用系统,它们相互支撑,形成一个有机整体。CLKB的系列化的语言知识涵盖词、词组、句子、篇章各单位和词法、句法、语义各层面,从汉语向多语言辐射,从通用领域深入到专业领域。尽管CLKB已形成阶段性成果,但它仍在发展中。该文重点介绍CLKB的语言知识库,也探讨其发展方向。
- 俞士汶穗志方朱学锋
- 关键词:自然语言处理计算语言学综合型语言知识库
- 面向自然语言理解的汉语虚词研究
- 当进行自然语言理解研究时,首先把指称概念的实词放在首要地位是理所当然的,但虚词在句子、谈话、篇章中表达意义的作用也不能轻视。本文探讨虚词在汉语理解研究中的价值及其研究方法,倡议建设与北大计算语言学研究所的其他语言知识库可...
- 俞士汶朱学锋刘云
- 关键词:自然语言理解现代汉语虚词
- 文献传递
- 成语知识库及“以”在成语中的词类—义项分布
- 2018年
- 本文研究基于以下两个数据基础:(1)北京大学计算语言学研究所研制的汉语成语知识库;(2)基于《古今汉语字典》建立的单字词“以”的知识数据库.从成语知识库中抽取出含“以”的成语,整理后有427个.对“以”标注词类和义项,并按照“以”在成语中的位置进行统计,得到“以”与位置相关的词类—义项分布.这项成果可以在文本机器理解及语文学习中得到应用.本文还初步探讨了古今汉语的一些变化.
- 俞士汶朱学锋王治敏
- 关键词:成语词类
- 《汉语高频词语法信息词典》的研制被引量:4
- 2004年
- 北京大学计算语言学研究所自 2 0 0 3年 1月起承担了国家重点基础研究973项目《汉语高频词语法信息词典》的研制任务 ,至 2 0 0 3年 9月已完成。本文详细介绍《汉语高频词语法信息词典》
- 朱学锋张化瑞段慧明俞士汶
- 关键词:综合型语言知识库
- 大型电子词典的计算机辅助管理
- 大型电子词典的研制开发、可能需要较长的时间和不断的修订.如何有效地维护各个版本之间的数据一致性就成为一个很关键的问题。本文通过对数据进行自动比较,以直观的方式显示其变化情况,使校对者能够把注意力集中在发生了变化的部分,工...
- 张化瑞俞士汶朱学锋
- 关键词:电子词典辅助管理计算词典学
- 文献传递
- 语文现代化与信息技术(论文提要)被引量:1
- 2005年
- 俞士汶朱学锋
- 关键词:汉语拼音方案语言文化提要信息网络时代信息技术
- 北京大学现代汉语语料库基本加工规范(续)被引量:33
- 2002年
- 北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉 ,更广泛地向专家、同行征询意见 ,以便进一步修订。
- 俞士汶段慧明朱学锋孙斌
- 关键词:词语切分词性标注汉字处理系统