王永生
- 作品数:20 被引量:39H指数:4
- 供职机构:同济大学出国培训学院更多>>
- 发文基金:上海市自然科学基金国家高技术研究发展计划教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术经济管理语言文字社会学更多>>
- 英语语音合成中基于有限泛化法的字素切分规则的机器学习被引量:2
- 2005年
- 在英语语音合成中,由于英语有着几乎无限多的词汇,因此不可能创建包含所有词汇的词库。对于未包含在词库中的英语单词,通过“字母转换成音素(L2P)”算法自动生成其音标是一个最好的解决办法。而L2P首要的任务就是字素切分。为此,文中提出了一种有限泛化法(FGA)的机器学习算法,用于进行字素切分规则学习。用于学习的词典库有27 040个单词,其中90%的词用于规则学习,剩下的10%用于测试。经过10轮交叉验证,学习实例和测试实例的平均实例切分正确率为99.84%和97.88%,平均单词切分正确率为99.72%和96.35%;平均规则数为472个。
- 王永生柴佩琪
- 关键词:语音合成
- 德语字素音素转换学习语料库的自动生成算法
- 2008年
- 提出了一种基于迭代的有限状态转录机的字素音素转换学习语料库的自动生成算法,针对一个德语单词及其音标进行基于形态规则和语音规则的迭代,最终将字素和音素完全一一对应起来。经过抽样测试,算法的正确率可以达到98.6%。
- 王永生
- 关键词:语音合成语料库
- 自动获取不同义项的相似词算法
- 2015年
- 词汇相似度广泛应用于自然语言处理的多个领域。然而词汇相似度的计算一般都是基于词而不是基于词的义项来进行的。针对这种情况,提出一种相似词的分类算法。算法首先采用PMImax工具来计算目标词的相似词,然后以Word Net的义项为参照,采用一种改进后的Lesk算法自动将这些相似词按照不同的义项进行分类,每一类相似词只跟对应的义项相似。实验结果表示,该算法的分类正确率可达到84.27%。
- 王永生
- 关键词:词汇相似度WORDNET
- 基于语块的英语文语转换系统的韵律生成方法
- 2007年
- 为预测英语文语转换(Text-to-Speech,TTS)系统中韵律生成模块的韵律边界,通过在中间短语、语调短语和语句后分别插入不同长度的停顿,产生使合成语音具有与真人语音类似的韵律结构.通过采用基于语块的中间短语切分,以中间短语为基本单位,生成一个语调短语边界预测的学习语料库,然后采用转换式学习法进行标注学习,从而实现韵律边界的切分.在对真人语料库进行测试的实验中,标注正确率达到81.32%,通过在学习中增加语调短语音节数和标点符号的约束规则,可进一步提高标注正确率.
- 王利王永生
- 关键词:文语转换自然语言处理
- 德汉机器翻译中的语义消歧策略被引量:4
- 1998年
- 本文首先分析了德语中的语义歧义现象,然后提出了几种借助配价和语义信息进行消歧的策略。这些策略目前都已应用于同济大学开发的TJTITR德汉机器翻译系统中。实践证明,它们不仅较好地解决了机器翻译中的语义歧义问题。
- 王永生柴佩琪卫蔚
- 关键词:机器翻译动词配价德语汉语
- 德汉机器翻译中的兼类问题处理
- 1997年
- 本文首先分析了德语中的各种兼类现象,然后提出了处理兼类问题的几种策略。这些策略目前都已应用于同济大学开发的TJTITR德汉机器翻译系统中。实践证明,它们不仅较好地解决了机器翻译中的兼类问题,而且大大提高了系统运行的效率。
- 王永生柴佩琪卫蔚
- 关键词:机器翻译德语汉语
- 英文文语转换系统中基于形态规则和机器学习的重音标注算法被引量:2
- 2008年
- 在英文TTS系统中,未登录词的重音标注是除字音转换外另一个十分重要的环节。由于主重音的重要性要远远大于次重音,且主重音的情况要比次重音的情况简单一些,因而将主重音的标注与次重音的标注分开进行。主重音的标注采用形态规则和机器学习相结合的标注算法;而次重音的标注完全通过机器学习算法来进行。经过10轮交叉验证,主重音的平均标注正确率为94.4%,次重音的平均标注正确率为86.9%,总的标注正确率为83.6%。
- 王永生李梅
- 关键词:文语转换未登录词
- 英语语音合成中基于约束树的音节切分算法
- 2005年
- 在基于单元选择的英语语音合成中,音节切分是非常重要的一环。这主要是因为英语词汇的无限性,且存在大量的 多音节词,因而许多情况下,我们不得不从音节的角度来合成语音。为此,本文提出了一种基于约束树的音节切分算法,通过应用 形态规则约束、韵律规则约束及音位规则约束,从而最终切分出所有音节。在实施音位规则约束时,我们提出了一种基于音位结 构树的子算法。训练样本和测试样本的切分正确率分别为99. 13%和98. 55%。
- 王永生柴佩琪曾令平
- 关键词:语音合成音系学
- 免疫粒子群算法在混流装配线排序中的应用被引量:13
- 2011年
- 混流装配线上的产品投产排序是影响装配线生产效率的重要因素。建立以最小化装配线总闲置-超载成本为优化目标的装配线排序模型,采用粒子群算法来解决混流装配线的投产排序问题。考虑到基本粒子群算法易陷入局部最优解的问题,引入免疫算法思想对其进行改进,根据抗体亲和性与浓度值的计算,及时进行粒子的替换以维持种群的多样性,防止粒子过早收敛于局部极值。利用某汽车零部件制造企业装配线的数据进行试验计算,并与其他方法相比较,仿真结果说明该方法可以有效、快速地解决装配线排序问题。
- 郑永前王永生
- 关键词:混流装配线粒子群算法免疫
- 德语语音合成中的字音转换研究被引量:1
- 2009年
- 字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。
- 王永生
- 关键词:字音转换