公共文化服务平台

基于熵模型的英汉人名对齐被引量：1: 2016年; 该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主要错误给出了可能的解决方案。; 刘颖曹项; 关键词：熵模型词典

基于汉语音位发音想象的脑机接口研究被引量：8: 2014年; 该文提出了一个基于汉语音位发音想象的脑机接口系统框架,使得受试者使用脑机接口系统时能更加自然和流畅.三名受试者参与了本实验研究,实验过程中受试者被要求想象四个汉语元音和四个辅音音位的发音部位及语音发音,以及一个不作想象任务的控制条件,同时记录其脑电数据.在数据处理阶段,本文对采集到的头皮脑电数据进行了频域、时域、空域分析,以提取出音位发音想象效应最优化的特征向量用于提高每两个条件间的配对分类效果.实验结果表明,音位发音想象效应的最优脑电频段为2～10Hz,时段为刺激呈现后300～500ms,头皮空间分布主要集中在感觉运动皮层区域.音位发音想象任务和控制条件相比具有较高的分类正确率,最高可达83％,为基于音位发音想象的汉语脑机接口系统研究提供了理论基础.此外,刺激材料间的Jaccard距离和分类正确率的高度相关性表明,音位发音想象任务可被视为复杂的发音器官运动想象任务,并且可由人脑感觉运动皮层区域的脑电信号来解码预测.; 杨晓芳江铭虎; 关键词：脑机接口

基于文本聚类的语言韵律和节奏风格特征挖掘被引量：5: 2014年; 该文以朱自清、汪曾祺和刘亮程的散文作品为语料,旨在从文本的韵律和节奏出发,采用文本聚类的方法来挖掘出新的能够代表作品风格的特征。实验表明,以句末用字韵母的n元组合、分句句长的n元组合、标点符号和整句句长作为风格特征,能成功地将这三位作家的作品区分开来。其中刘亮程句尾韵的舌位高于汪、朱二人,朱自清对韵脚的选择不如刘、汪二人丰富。汪曾祺的分句长最短,且最为讲究句式长短的对齐;刘亮程兼顾长短句的交错,节奏更富于变化;朱自清的句长变化最为平稳。; 贺湘情刘颖; 关键词：韵律节奏文本聚类

最大熵模型和BP神经网络的短句对齐比较被引量：4: 2015年; 利用最大熵模型和BP神经网络对《史记》古文与现代文译文的平行语料进行短句对齐研究。最大熵模型将短句长度、短句对齐模式和共现汉字特征相结合来对平行语料进行短句对齐;BP神经网络则把短句长度、短句位置和共现汉字特征相结合来对平行语料进行短句对齐。实验结果表明:同时考虑短句长度、短句对齐模式和共现汉字3个特征的最大熵模型,短句对齐的准确率和召回率是最高的;并且最大熵模型的准确率和召回率高于BP神经网络。; 刘颖王楠; 关键词：最大熵模型 BP神经网络《史记》

基于语言模型和特征分类的抄袭判定被引量：2: 2013年; 信息时代作者版权的保护问题已受到越来越多的关注。针对部分小说存在的文本大面积相似问题，提出基于语言模型和特征分类的方法。统计文本二元～六元的语言模型并且绘制拓扑图，通过计算重合概率和词性比来分析词语的重合程度和语法信息，在此基础上利用主成分分析和随机森林的方法，进行分类判别。机器学习的结果表明，该方法能够有效地鉴别小说是否存在抄袭现象。; 李惠刘颖; 关键词：语言模型语法信息主成分分析

无障碍理念下聋人高等教育课程建设的研究被引量：2: 2014年; 信息无障碍是为方便人们,尤其是方便残障人群的学习生活而发展起来的更加人性化的先进技术理念。为跟上国际IT行业的发展趋势,同时针对国内就业形势和企业人才需求,国内高校在构建计算机课程中应普及无障碍教学理念。北京联合大学率先在国内把软件测试技术作为无障碍课程建设试点,继而成功开发了整合无障碍技术的计算机课程群。无障碍技术成为学生就业新增的一项技能,呈现出学生、企业和社会都受益的良好局面,为国内高校普及无障碍教学理念和计算机课程整合无障碍技术提供了借鉴。; 姚登峰滕祥东鲁彦娟李晗静刘志丽; 关键词：计算机

Compared the Classified Ability and Associative Memory Performance for Some Neural Networks: A simplified learning algorithm of RBF network is derived in detail. Then RBF network is compa1 red with feed ...; Zhenfu JiangRenkui HouMinghu Jiang

基于网络搜索的英汉人名翻译: 2017年; 该文利用搜索引擎从网络中挖掘英语人名的中文翻译。该方法综合利用翻译辅助词、英中人名共现规则、音译相似度和翻译概率。首先,利用搜索引擎从互联网上搜索英文人名的中文翻译候选。把汉语人名标注结果、翻译辅助词、英中人名共现规则和英文人名的发音音节长度结合起来提取翻译候选词。翻译辅助词有助于搜索与英文人名更相关的信息,英中人名共现规则和发音音节长度进一步缩小英文人名的翻译范围,使得英文人名的翻译搜索符合人名共现规律和发音规律。然后,根据音译相似度和翻译概率对候选词进行排序。人名翻译的绝大部分是根据发音翻译过来的,音译相似度是帮助判断两个词在发音上的相似性。翻译概率从统计上判断两个词互为翻译的可能性。实验结果表明,翻译辅助词、规则、音译相似度和翻译概率都有助于提高人名翻译的正确率。; 刘颖曹项; 关键词：人名翻译

计算机课程整合无障碍技术的实践探索被引量：3: 2014年; 从计算机课程整合无障碍技术的教学实践出发,以软件测试技术课程的试验求证和扩展应用作为教学课题研究的主要内容,以无障碍教育理念为指导,探讨以信息无障碍为主线的教学体系构建研究和教学实践应用,在分析传统计算机课程体系核心能力的基础上,提出构建"整合无障碍技术的教学体系"的整体思路,阐述把无障碍实训体系融入到传统教学计划中的实践探索。; 姚登峰李晗静李启隆刘志丽; 关键词：计算机

《红楼梦》计量风格学研究被引量：20: 2014年; 从计量风格学的角度出发,采用定量统计与定性分析相结合的方法,对《红楼梦》进行研究,并对前八十回与后四十回的差异进行考察:前八十回在一字词及数词、量词的使用频率上高于后四十回,二字词、名词、动词、副词、助词、语气词的使用频率以及平均词长和词长变化程度低于后四十回;所选的四十一个虚词、前三百个高频词也有明显的差异。前八十回相对于后四十回,长词较少、文本可读性更强,语言变化更少,使用文言虚词更多,更加注意细节描写;同时,用词的连贯性更强。; 刘颖肖天久; 关键词：虚词高频词词类

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(61171114)