您的位置: 专家智库 > >

黄居仁

作品数:32 被引量:191H指数:8
供职机构:香港理工大学更多>>
发文基金:国家自然科学基金香港特区政府研究资助局资助项目国家社会科学基金更多>>
相关领域:语言文字自动化与计算机技术文化科学电子电信更多>>

文献类型

  • 22篇期刊文章
  • 8篇会议论文

领域

  • 17篇语言文字
  • 13篇自动化与计算...
  • 1篇电子电信
  • 1篇文化科学

主题

  • 9篇语言
  • 8篇知识本体
  • 8篇汉语
  • 8篇本体
  • 7篇语料
  • 7篇语料库
  • 6篇中文
  • 4篇语言学
  • 3篇信息处理
  • 3篇隐喻
  • 3篇映射
  • 3篇语言资源
  • 3篇知识
  • 3篇通感
  • 3篇情绪
  • 3篇中文信息
  • 3篇中文信息处理
  • 3篇自动抽取
  • 3篇现代汉语
  • 3篇计算机

机构

  • 29篇香港理工大学
  • 5篇中央研究院
  • 4篇北京大学
  • 4篇台湾大学
  • 3篇苏州大学
  • 2篇香港浸会大学
  • 2篇国立台北大学
  • 2篇台湾中央研究...
  • 1篇北京师范大学
  • 1篇鲁东大学
  • 1篇南京师范大学
  • 1篇东吴大学
  • 1篇西南财经大学
  • 1篇山东大学
  • 1篇中国社会科学...
  • 1篇国立台湾师范...
  • 1篇国立政治大学

作者

  • 30篇黄居仁
  • 6篇李寿山
  • 6篇李逸薇
  • 4篇刘洪超
  • 2篇董思聪
  • 2篇周亚民
  • 1篇刘欢欢
  • 1篇安可思
  • 1篇谢舒凯
  • 1篇王萌
  • 1篇侯仁魁
  • 1篇李洪政
  • 1篇俞士汶
  • 1篇钟晓芳
  • 1篇王世昌
  • 1篇苏艳
  • 1篇高伟
  • 1篇陈韵竹
  • 1篇赵青青
  • 1篇陈永祥

传媒

  • 8篇中文信息学报
  • 5篇当代语言学
  • 2篇中国语文
  • 1篇语言教学与研...
  • 1篇计算机工程与...
  • 1篇语言战略研究
  • 1篇云南师范大学...
  • 1篇华文教学与研...
  • 1篇语言学论丛
  • 1篇中国社会语言...
  • 1篇全国第八届计...
  • 1篇第十届全国计...

年份

  • 1篇2022
  • 3篇2019
  • 4篇2018
  • 1篇2017
  • 2篇2016
  • 2篇2015
  • 1篇2014
  • 7篇2013
  • 4篇2010
  • 4篇2009
  • 1篇2005
32 条 记 录,以下是 1-10
排序方式:
汉字知识的形式表达被引量:2
2013年
汉字的知识本体和形式表达的研究不仅有助于计算机处理汉语,更能够突显汉字的特色和丰富知识内涵。本文旨在说明如何在计算机建立汉字知识,以及如何用形式语言表达汉字知识。与过去的汉字数据库不同的是,本研究以语意网的形式语言描述汉字的知识,希望能够对这方面的研究有所启发。汉字知识的形式表达内容包括:字形外在结构和演变的描述、意符与声符的描述、字形内在结构的描述、字义与衍生词的描述、异体字关系的描述、字音演变的描述、时间的描述,其中,意符和字义皆与IEEE建议上层共享知识本体(SUMO)对应,作为汉字知识的上层知识。本研究采用的形式语言是OWL-DL,有助于汉字知识与其他知识本体分享知识。
周亚民黄居仁
语言特区中创新形式的限度被引量:10
2019年
语言特区中的语言创新,除了句法创新之外,还包括词法、词汇语义、音系和文字等层面的创新。所有的创新形式都具有各自的限度,必须遵守相应的规律。具体来说,句法创新无法突破普遍语法,一定能够在其内部得到解释;词法创新无法突破词法框架,所有词都可于其中获得定位;词汇语义创新无法突破知识本体,必须位于其概念关系架构之中;音系创新无法突破音位组配规则,只能选择规则允许的音节;文字创新无法突破造字法则,均需以有限的几种造字方法为依据。各种规则法则构建出了系统网络,而语言创新只能发生在网络中的空缺位置上,是有规律、有限度、可预测的。
董思聪黄居仁
关键词:普遍语法知识本体造字法
众包策略在语言资源建设中的应用被引量:3
2016年
众包概念可从众包策略、众包策略的实现方法以及众包策略的实现案例三个层面来理解。众包策略的要义在于借助互联网以公开招募的形式汇聚众智众力解决问题。语言资源建设包括本体语言资源建设和派生语言资源建设两项主要内容。众包在语言资源建设中可用于语言数据的采集和加工、语言生活舆情调查、为语言资源建设提供资金和设施支持、促进语言资源建设的宣传推广和语言资源建设社会力量的培育。众包为多、快、好、省、可持续地进行语言资源建设提供了可能。土耳其机器人在语言资源建设中有着广泛的应用空间,是目前众包策略运用于语言资源建设的最具操作性和最为成熟的实现方法。
黄居仁王世昌
关键词:众包语言资源
现代汉语通感隐喻的映射模型与制约机制被引量:14
2018年
基于定量与定性相结合的方法,本文系统地考察了现代汉语中的通感隐喻现象,归纳出了现代汉语形容词的通感映射模型。与此同时,本文发现:1)现代汉语的通感映射规律,与西方学者提出的英语的通感映射规律并不完全一致,因而对通感隐喻具有跨语言普遍映射模型的假说提出了挑战;2)现代汉语的通感隐喻受到感觉体验性程度和感觉显著性程度这两个认知因素的制约。
赵青青黄居仁
关键词:通感隐喻
基于序列标注模型的情绪原因识别方法被引量:8
2013年
情绪原因识别是情绪分析中的一个重要研究任务。该任务旨在自动分析出导致某一情绪发生的原因描述。该文将情绪原因识别任务建模为序列标注模型,即将情绪词相关的子句当成序列,进而整体标注出哪些属于原因子句。具体实现中,我们使用条件随机场(CRF)模型进行求解,并结合了基本词特征、词性特征、距离特征、上下文特征及语言学特征等多种特征进行原因识别。实验结果表明,所采用的这些特征对于原因识别都有一定帮助,特别是上下文特征。此外,我们发现在使用类似特征集合的情况下,序列标注模型能够获得比分类模型更好的识别效果。
李逸薇李寿山黄居仁高伟
兼顾汉语语言特色的语言信息化建设研究
本文从语言理论与语言信息应用兼顾,人机相辅相成以及知识的累积、创造与突破这三个重要观点出发,深入探讨分析词库小组各项研究成果及其影响力。重点在中研院词库小组在汉字、词知识库、语料库、句法树库等领域建构语言资源时兼顾语言学...
黄居仁陈克健高照明
关键词:语言资源语料库
兼顾汉语语言特色的语言信息化建设研究
2016年
本文从语言理论与语言信息应用兼顾,人机相辅相成以及知识的累积、创造与突破这三个重要观点出发,深入探讨分析词库小组各项研究成果及其影响力。重点在中研院词库小组在汉字、词知识库、语料库、句法树库等领域建构语言资源时兼顾语言学理论,语言事实及信息处理要求的研究方法。并讨论这个研究方法在学术与应用上的意义与影响,特别是研究成果对汉语语言资源政策与标准化的可能启发。
黄居仁陈克健高照明
关键词:语言资源语料库
重庆方言的语缀“之”及语缀的分类问题被引量:1
2019年
重庆方言的"之"可以用于谓词性成分之前,表示极高程度、强烈情感和夸张意味。以往研究均据其语义表达,将它处理为程度副词。但是,经过比较分析发现,它与程度副词在语音、句法、语用等方面均存在本质性的差异,实为一种作用于句法层面的黏着成分—语缀。它的来源是古汉语主谓之间的"之"。在分类方面,"之"应属于Zwicky(1977)系统中的黏着词,或者具备Klavans(1982)系统中的首—前—前语缀参数值。Zwicky的分类系统存在一定问题,其后续发展也间接给汉语语缀研究带来了一些困难。相比之下,Klavans的分类系统也许是一个更优的选择,而且可能为未来汉语语缀的类型学研究提供重要的工具。
董思聪黄居仁
关键词:重庆方言语缀
通感、隐喻与认知——通感现象在汉语中的系统性表现与语言学价值被引量:23
2019年
本文旨在结合汉语的特点,提出一种基于语料库的实证性研究方法,用于对汉语通感的系统性考察,并且论证汉语通感重要的语言学研究价值。本文发现:1)通感在汉语中具有系统性的表现,既在文学化的语言中使用,又在日常语言中普遍存在,既是一种历时的词义演变机制,又是一种存在于汉语多个层面的共时语言结构;2)在语言学理论方面,汉语通感对通感具有跨语言普遍映射模型这一假设提出了挑战,而为通感属于隐喻的子类,受制于普遍认知规律这一假设提供了新的证据;3)通感可以为认知领域中身体体验性理论和脑科学领域中联觉现象的研究提供借鉴,因而在跨学科研究视角下同样具有重要的价值。
赵青青熊佳娟黄居仁
关键词:通感隐喻语言学价值跨学科研究
基于Stacking组合分类方法的中文情感分类研究被引量:44
2010年
情感文本分类(简称情感分类)是一种面向主观信息分类的文本分类任务。目前,由于其广泛的应用前景,该任务在自然语言处理研究领域中得到了普遍关注,相继出现多种用于情感文本分类的有监督的分类方法。该文具体研究四种不同的分类方法在中文情感分类上的应用,并且采用一种基于Stacking的组合分类方法,用以组合不同的分类方法。实验结果表明,该组合方法在所有领域都能够获得比最好基分类方法更好的分类效果。从而克服了分类方法领域依赖的困境(不同领域需要选择不同基分类方法才能获得更好的分类结果)。
李寿山黄居仁
关键词:计算机应用中文信息处理情感分类组合分类器
共3页<123>
聚类工具0