江铭虎
- 作品数:60 被引量:179H指数:7
- 供职机构:清华大学人文学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术电子电信语言文字哲学宗教更多>>
- 一种可变字表的实时语音识别系统
- 1993年
- 本文介绍一种可变字表模块的实时语音识别系统,该系统适用于中词汇表的任意字表大小及字表内容,可应用于工业、军事、交通、医学及办公室语音输入及信函打印等。实践表明,该系统具有硬件接口成本低、抗噪声能力强、实时识别率高、使用灵活方便等优点,便于推广应用。
- 江铭虎张保轩
- 关键词:元音识别
- 维吾尔语形态复杂词汇的神经表征和处理机制研究——以心理语言学研究结论为证据被引量:2
- 2015年
- 通过心理语言学的词汇判断实验范式来研究维吾尔语屈折词和派生词在大脑心理词典中的表征及存储形式。实验一是维吾尔语屈折词的表征及加工研究,实验二是维吾尔语派生词的表征及加工研究。实验一的行为实验结果揭示人脑加工维吾尔语屈折词时需要对它进行形态分析。实验二的行为数据却显示派生词和单语素词的加工过程是相同的。本文实验结果显示维吾尔语派生词、屈折词的加工形式是彼此独立和不同的过程,维吾尔语屈折词是分解加工,而派生词进行整体加工。
- 阿布都克力木.阿布力孜江铭虎姚登峰哈里旦木.阿布都克里木艾山吾买尔
- 关键词:派生词维吾尔语
- 基于EfficientDet网络的细粒度吸烟行为识别被引量:4
- 2022年
- 在实际场景中,因香烟目标过于微小且特征不明显,现有的目标检测算法难以区分类烟物与香烟,导致吸烟行为识别效果差。提出一种基于弱监督细粒度结构与EfficientDet网络的吸烟行为识别算法。采用Edge Boxes算法检测图像块的特征边缘,通过非极大值抑制对边缘进行筛选,形成候选区域块。构建包含物体级筛选器和局部级筛选器的细粒度两级注意力模型,其中物体级筛选器使用改进的EfficientDet网络滤除候选区域的背景噪声,以分类前景物体及特征较强的候选区域,并在局部级筛选器中使用通道注意力卷积块对候选区域进行聚类,筛选出得分最高的像素块。通过融合物体级筛选器与局部级筛选器得到的结果,以准确识别吸烟行为。在BUU-Smoke数据集上的实验结果表明,该算法的吸烟行为识别准确率为93.10%,误检率为3.6%,并且具有较优的鲁棒性和泛化能力。
- 张洋姚登峰姚登峰江铭虎
- 关键词:吸烟行为
- 甲骨文字库与智能知识库的建立
- 本文介绍了用于计算机处理的甲骨文字库、句法分析和综合智能知识库的建立方法以及计算机甲骨文辅助辨识分析的工作原理,论述了计算机信息处理技术在甲骨文研究中的重要作用。目前我们的字库已收入三千多甲骨文字,可采用区位码和拼音输入...
- 江铭虎廖盼盼张博严峻丁晔
- 关键词:甲骨文字库
- 文献传递
- 口语对话系统中的语句主题提取被引量:2
- 2004年
- 语句的主题提取是口语对话系统中话语分析部分的工作。目前的口语对话系统大多将自然语言处理的重点放在语法和语义平面,而忽视了对上下文语境的分析,该文提出一种基于规则的语句主题提取方法,通过自底向上与自顶向下两种分析器完成主题与用户意图的提取,为系统的自然语言生成提供更准确的领域知识,从而大大提高了系统的整体性能。
- 王彬江铭虎
- 关键词:主题提取口语对话系统自然语言理解
- 中国手语信息处理述评
- 为了能够有效地对中国手语进行信息处理,需要针对中国手语的特性提出相应的信息处理方案。本文根据国内外的研究进展情况,从基于规则和基于语料库的角度,讨论了中国手语信息处理过程中遇到的有关问题,并提出可借鉴的中国手语信息处理技...
- 姚登峰江铭虎阿布都克力木.阿布力孜李晗静哈里旦木.阿布都克里木夏娣娜
- 关键词:中国手语信息处理
- 中国日语学习者在母语词汇识别过程中的二语激活
- 2024年
- 本研究结合行为实验方法和事件相关电位技术,深入探究词汇识别过程中母语到二语方向的激活情况。两组中国日语学习者参与实验,分别完成词汇书写形式判断任务和语义相关性判断任务。统计结果显示,两组受试在面对启动词为汉日同形异义词时,均产生了显著的脑电效应。值得注意的是,汉日同形异义词的二语语义仅在语义相关性判断任务中得到了激活。这一发现凸显了跨语言激活的任务依赖性。通过对比不同实验条件下的激活结果,本研究不仅解释了语言选择性与非选择性之间的争议,也证实了不同语言词汇间的相互激活现象,对揭示双语活动规律具有重要意义。
- 杨思琴江铭虎
- 关键词:词汇跨语言同形异义词
- 双语者加工汉语母语语义时对英语的ERP激活效应的研究被引量:3
- 2016年
- 本研究采用ERP实验,以被试的反应时间、错误率和脑电成分N400为参考因素,探索高级双语者在加工第一语言时是否自动检索第二语言。结果显示,内隐的英语首发音条件引起的效应没有体现在反应时间上。在ERP实验结果中,被试在判断语义相关的词语时,大脑语言区域的N400在词语英译首发音一致与否的情况下差异不显著;而判断语义无关的词语时,N400在该条件下显著。实验结果分析表明,高级双语者在深度加工第一语言时,大脑可能无意识地检索第二语言。
- 杨思琴江铭虎
- 关键词:ERP语义N400
- 基于多种知识的盲文翻译的研究被引量:7
- 2000年
- 盲文到汉字的转换研究 ,分为盲文到拼音和拼音到汉字的转换研究。论文通过引入音码表 ,很好地解决了盲文到拼音转换中的歧义问题。对于拼音到汉字的转换 ,采用Markov模型 ,使用平滑算法解决此模型中的数据稀疏问题 ,并且对通常使用的字级别二元模型的平滑算法进行了改进以适应词级别二元模型。为每一个拼音句子建立一个拼音到汉字转换多部图 ,并在此转换多部图中使用 Viterbi算法搜索一条具有最大似然度的汉语句子 ,或使用 N - Best算法搜索具有头 N大似然度的 N个汉语句子。同时研究了从 1选到 N选的转换判据 ,以进行自动的 N - Best转换。实验表明 ,盲文到汉字转换系统的转换正确率为 94.38% ,若剔除专有名词 ,转换正确率还可上升 2个百分点。对 N - Best搜索算法的测试表明 5选正确率比 1选正确率提高了
- 江铭虎朱小燕夏莹谭刚包塔
- 关键词:拼音汉字
- 基于规则和统计相结合的方法处理甲骨文信息
- 分词和词性标注是计算机处理甲骨文信息的基础。在现阶段,建立起一个成熟的、带有词法语法标注信息的甲骨文语料库是极其困难的,这也给运用统计方法处理甲骨文信息带来了不便。本文介绍了甲骨文电子化的基本情况和甲骨文字典的建设情况;...
- 蔡慧颖江铭虎
- 关键词:甲骨文自动分词词性标注语料库
- 文献传递