孟凡博
- 作品数:7 被引量:17H指数:2
- 供职机构:清华大学深圳研究生院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字电子电信更多>>
- 汉语重音的凸显度分析与合成被引量:1
- 2015年
- 重音是重要的语调特征,重音合成技术可以提高语音的自然度和表现力。针对重音的局部凸显性,该文提出了声学特征凸显度的表示方法,分析了不同韵律位置(韵律词首、中、尾,韵律短语首、中、尾等)重音音节的声学特征凸显度,发现在韵律单元末(韵律词末音节和韵律短语末韵律词)的重音其基频最大值凸显度要低于非韵律单元末重音,提出了基于声学特征凸显度的非线性的重音声学参数生成算法,解决了传统重音声学参数线性修改算法的修改幅度不足或过大的问题。采用该算法建立了基于隐Markov模型的支持重音合成的语音合成系统。实验表明,该系统可以有效合成带有重音的语音,提高了合成语音的自然度和表现力。
- 孟凡博吴志勇贾珈蔡莲红
- 关键词:合成技术重音语音合成系统隐MARKOV模型声学特征韵律短语
- 高保真活动图像实时传输的H.264优化策略被引量:1
- 2008年
- 为了将H.264(运动图像专家组与视频编码专家组共同制定的新一代图像压缩标准)应用于高保真活动图像传输,该文通过改进H.264的"帧间预测"策略算法,定义一个新的运动复杂测度来表示一帧的运动复杂度,并将这种测度应用到H.264中来进行视频压缩。实验结果表明:改进后的算法将H.264的编码速度提高30.71%,同时,保持了压缩图像的数据总量,即图像质量,在保证图像质量的前提下得到了编码速度的提高。
- 王昊戴梅萼刘小康吴照人孟凡博叶银
- 关键词:帧间预测
- 多站点远程实时视频传输与控制系统被引量:7
- 2008年
- 为了实现远程监控图像的清晰,并保障系统的实时性和可靠性,需要高效率和高质量地进行视频压缩,无差错地进行快速网络传输,有效地进行命令控制。通过优化最新的H.264视频编码算法,设计有效的传输方案和引入自适应的传输机制来解决远程活动图像传输系统中存在的清晰、实时、高效、可靠性问题。实验结果表明:改进后的算法较原有的T.264编码方案速度提高了30%以上,设计的传输策略在保障传输速度的同时,能有效地适应不同的网络环境。在系统中引入的几个关键技术对远程视频传输系统提供了有力的支持。
- 刘小康戴梅萼王昊吴照人孟凡博叶银
- 关键词:应用软件视频编码视频传输远程控制
- 英语焦点重音声学参数分析与建模
- 本文针对英语焦点重音表达的特点,提出了一种从中性语音到含有焦点语音的转换方法。数据分析表明,中性语音到焦点语音各音节声学特征的变化与该音节与焦点的相对位置有关。因此以音节为单位,本文根据音节与焦点的相对位置,将焦点语音的...
- 孟凡博蒙美玲蔡莲红
- 关键词:基频时长
- 文献传递
- 文本褒贬倾向判定系统的研究被引量:8
- 2009年
- 为了满足当今对评论性信息进行分析的需要,本文设计并实现了一个基于关键词模板的文本褒贬倾向判定系统.本系统定义了关键词类别、建立了关键词库、关键词模板库,并设计了模板匹配算法和文本褒贬倾向值算法,对测试文本进行关键词及模板匹配进而判断测试文本的褒贬倾向.本文还对文本褒贬倾向判定系统进行了测试,并在集内测试取得了较好的效果.进一步分析结果表明在语料充足的条件下,本系统可以更有效的判定文本的褒贬倾向.
- 孟凡博蔡莲红陈斌吴鹏
- 关键词:文本关键词匹配
- 多模态、多语种的语音、语言交互的研究与应用
- 蒙美玲蔡莲红吴志勇张申杨鸿武黄嘉豪崔丹丹曹光琦徐俊许佩瑜叶振兴贾珈王永鑫李煜智孟凡博卢伟杰徐英进陶霖密袁春钟玉琢刘宇翔
- 本项目属于计算机人机语言交互领域,针对多语种多模态言语交互,主要研究语言的分析与理解、表现力可视语音合成、口语对话等技术与应用。 主要科技内容如下: 1.建立了支持多语种统一的语言、语音处理框架,实现了自然语言处理与...
- 关键词:
- 关键词:多语种多模态
- 基于决策树的英语焦点语音转换
- 2013年
- 焦点是语言表达的重要方式,焦点重音是重要的韵律特征,实现中性语音到焦点语音的转换可以提高语音的表现力。该文提出了声学特征局部凸显度的表示方法,分析了由中性语音到焦点语音,焦点单词所属音节声学特征变化与中性语音相应音节声学特征局部凸显度的相关性,提出了一种基于决策树的英语焦点语音的转换模型。该模型采用决策树对训练语料进行聚类,所用上下文包括音节与焦点单词的相对位置以及音节在韵律结构(如韵律短语、韵律词等)中的位置。在此基础上,提出了一种基于局部凸显度的中性语音到焦点语音声学特征变化的预测算法。采用该算法后,客观实验中声学特征变化平均绝对值误差降低到0.08,主观实验表明本文提出的模型的转换语音具有更好的焦点表达效果和自然度。
- 孟凡博吴志勇蒙美玲贾珈蔡莲红
- 关键词:语音转换声学特征韵律结构