您的位置: 专家智库 > >

国家自然科学基金(61171114)

作品数:12 被引量:50H指数:4
相关作者:刘颖姚登峰江铭虎刘志丽李晗静更多>>
相关机构:清华大学北京联合大学更多>>
发文基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术文化科学文学语言文字更多>>

文献类型

  • 12篇期刊文章
  • 1篇会议论文

领域

  • 8篇自动化与计算...
  • 3篇文化科学
  • 1篇语言文字
  • 1篇文学

主题

  • 2篇对齐
  • 2篇音译
  • 2篇语言
  • 2篇人名
  • 2篇网络
  • 2篇相似度
  • 2篇聚类
  • 2篇计算机
  • 2篇红楼
  • 2篇红楼梦
  • 2篇翻译
  • 2篇《红楼梦》
  • 1篇短句
  • 1篇虚词
  • 1篇音位
  • 1篇英汉
  • 1篇语法
  • 1篇语法信息
  • 1篇语言产生
  • 1篇语言模型

机构

  • 11篇清华大学
  • 2篇北京联合大学

作者

  • 8篇刘颖
  • 3篇姚登峰
  • 2篇江铭虎
  • 2篇李晗静
  • 2篇刘志丽
  • 1篇滕祥东
  • 1篇鲁彦娟
  • 1篇姜巍
  • 1篇李惠
  • 1篇阿布都克力木...
  • 1篇杨晓芳
  • 1篇王楠
  • 1篇李启隆

传媒

  • 4篇中文信息学报
  • 2篇计算机工程与...
  • 1篇红楼梦学刊
  • 1篇计算机工程
  • 1篇现代图书情报...
  • 1篇计算机教育
  • 1篇绥化学院学报
  • 1篇现代语言学

年份

  • 1篇2017
  • 1篇2016
  • 3篇2015
  • 6篇2014
  • 1篇2013
  • 1篇2012
12 条 记 录,以下是 1-10
排序方式:
基于熵模型的英汉人名对齐被引量:1
2016年
该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主要错误给出了可能的解决方案。
刘颖曹项
关键词:熵模型词典
基于汉语音位发音想象的脑机接口研究被引量:8
2014年
该文提出了一个基于汉语音位发音想象的脑机接口系统框架,使得受试者使用脑机接口系统时能更加自然和流畅.三名受试者参与了本实验研究,实验过程中受试者被要求想象四个汉语元音和四个辅音音位的发音部位及语音发音,以及一个不作想象任务的控制条件,同时记录其脑电数据.在数据处理阶段,本文对采集到的头皮脑电数据进行了频域、时域、空域分析,以提取出音位发音想象效应最优化的特征向量用于提高每两个条件间的配对分类效果.实验结果表明,音位发音想象效应的最优脑电频段为2~10Hz,时段为刺激呈现后300~500ms,头皮空间分布主要集中在感觉运动皮层区域.音位发音想象任务和控制条件相比具有较高的分类正确率,最高可达83%,为基于音位发音想象的汉语脑机接口系统研究提供了理论基础.此外,刺激材料间的Jaccard距离和分类正确率的高度相关性表明,音位发音想象任务可被视为复杂的发音器官运动想象任务,并且可由人脑感觉运动皮层区域的脑电信号来解码预测.
杨晓芳江铭虎
关键词:脑机接口
基于文本聚类的语言韵律和节奏风格特征挖掘被引量:5
2014年
该文以朱自清、汪曾祺和刘亮程的散文作品为语料,旨在从文本的韵律和节奏出发,采用文本聚类的方法来挖掘出新的能够代表作品风格的特征。实验表明,以句末用字韵母的n元组合、分句句长的n元组合、标点符号和整句句长作为风格特征,能成功地将这三位作家的作品区分开来。其中刘亮程句尾韵的舌位高于汪、朱二人,朱自清对韵脚的选择不如刘、汪二人丰富。汪曾祺的分句长最短,且最为讲究句式长短的对齐;刘亮程兼顾长短句的交错,节奏更富于变化;朱自清的句长变化最为平稳。
贺湘情刘颖
关键词:韵律节奏文本聚类
最大熵模型和BP神经网络的短句对齐比较被引量:4
2015年
利用最大熵模型和BP神经网络对《史记》古文与现代文译文的平行语料进行短句对齐研究。最大熵模型将短句长度、短句对齐模式和共现汉字特征相结合来对平行语料进行短句对齐;BP神经网络则把短句长度、短句位置和共现汉字特征相结合来对平行语料进行短句对齐。实验结果表明:同时考虑短句长度、短句对齐模式和共现汉字3个特征的最大熵模型,短句对齐的准确率和召回率是最高的;并且最大熵模型的准确率和召回率高于BP神经网络。
刘颖王楠
关键词:最大熵模型BP神经网络《史记》
基于语言模型和特征分类的抄袭判定被引量:2
2013年
信息时代作者版权的保护问题已受到越来越多的关注。针对部分小说存在的文本大面积相似问题,提出基于语言模型和特征分类的方法。统计文本二元~六元的语言模型并且绘制拓扑图,通过计算重合概率和词性比来分析词语的重合程度和语法信息,在此基础上利用主成分分析和随机森林的方法,进行分类判别。机器学习的结果表明,该方法能够有效地鉴别小说是否存在抄袭现象。
李惠刘颖
关键词:语言模型语法信息主成分分析
无障碍理念下聋人高等教育课程建设的研究被引量:2
2014年
信息无障碍是为方便人们,尤其是方便残障人群的学习生活而发展起来的更加人性化的先进技术理念。为跟上国际IT行业的发展趋势,同时针对国内就业形势和企业人才需求,国内高校在构建计算机课程中应普及无障碍教学理念。北京联合大学率先在国内把软件测试技术作为无障碍课程建设试点,继而成功开发了整合无障碍技术的计算机课程群。无障碍技术成为学生就业新增的一项技能,呈现出学生、企业和社会都受益的良好局面,为国内高校普及无障碍教学理念和计算机课程整合无障碍技术提供了借鉴。
姚登峰滕祥东鲁彦娟李晗静刘志丽
关键词:计算机
Compared the Classified Ability and Associative Memory Performance for Some Neural Networks
A simplified learning algorithm of RBF network is derived in detail. Then RBF network is compa1 red with feed ...
Zhenfu JiangRenkui HouMinghu Jiang
基于网络搜索的英汉人名翻译
2017年
该文利用搜索引擎从网络中挖掘英语人名的中文翻译。该方法综合利用翻译辅助词、英中人名共现规则、音译相似度和翻译概率。首先,利用搜索引擎从互联网上搜索英文人名的中文翻译候选。把汉语人名标注结果、翻译辅助词、英中人名共现规则和英文人名的发音音节长度结合起来提取翻译候选词。翻译辅助词有助于搜索与英文人名更相关的信息,英中人名共现规则和发音音节长度进一步缩小英文人名的翻译范围,使得英文人名的翻译搜索符合人名共现规律和发音规律。然后,根据音译相似度和翻译概率对候选词进行排序。人名翻译的绝大部分是根据发音翻译过来的,音译相似度是帮助判断两个词在发音上的相似性。翻译概率从统计上判断两个词互为翻译的可能性。实验结果表明,翻译辅助词、规则、音译相似度和翻译概率都有助于提高人名翻译的正确率。
刘颖曹项
关键词:人名翻译
计算机课程整合无障碍技术的实践探索被引量:3
2014年
从计算机课程整合无障碍技术的教学实践出发,以软件测试技术课程的试验求证和扩展应用作为教学课题研究的主要内容,以无障碍教育理念为指导,探讨以信息无障碍为主线的教学体系构建研究和教学实践应用,在分析传统计算机课程体系核心能力的基础上,提出构建"整合无障碍技术的教学体系"的整体思路,阐述把无障碍实训体系融入到传统教学计划中的实践探索。
姚登峰李晗静李启隆刘志丽
关键词:计算机
统计机器翻译中翻译规则抽取
2012年
对齐短语是决定统计机器翻译系统质量的核心模块。提出基于短语结构树的层次短语模型,这是利用串-树模型的思想对层次短语模型的扩展。基于短语结构树的层次短语模型是在双语对齐短语的基础之上结合英语短语结构树抽取翻译规则,并利用启发式策略获得翻译规则的扩展句法标记。采用翻译规则的统计机器翻译系统在不同数据集上具有稳定的翻译结果,在训练集和测试集的平均BlEU评分高于短语模型和层次短语模型的BLEU评分。
刘颖姜巍
关键词:统计机器翻译翻译规则抽取
共2页<12>
聚类工具0