国家自然科学基金(60533030) 作品数:28 被引量:77 H指数:5 相关作者: 尹宝才 孙艳丰 马建平 孔德慧 陈华鸿 更多>> 相关机构: 北京工业大学 中山大学 哈尔滨工业大学 更多>> 发文基金: 国家自然科学基金 国家杰出青年科学基金 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 建筑科学 更多>>
Viterbi和DTW算法的关系分析——在非特定人手语识别中的应用 被引量:7 2010年 在经典的模式识别理论中,Viterbi算法代表了统计概率的模式匹配算法,而DTW算法代表了模版匹配的模式匹配算法,它们之间是否存在关系至今尚无定论.为了找到这两种算法之间的关系,在"类别隶属度"是广义概率的假设前提下,应用模糊数学的理论在Viterbi算法与DTW算法之间建立起联系.首先,提出了利用模糊数学的贴近度把DTW算法的"距离"向Viterbi算法的"概率"转化的通用贴近度表达式,并对通用贴近度表达式给出了理论上的证明.其次,应用DTW的通用贴近度表达式重估HMM参数,建立DTW算法与Viterbi算法之间的模糊贴近度关系,并为此提出了δ-ε算法,得到基于数据帧的类似于HMM的参数重估形式.然后,为了确保建立DTW算法与Viterbi算法之间的模糊贴近度关系的正确性,以定理的形式给出了相应的证明.再次,通过设定的DTW贴近度表达式对HMM参数重估的过程中,发现了DTW贴近度的重估参数与HMM重估参数之间存在着的模糊关系,以定理的形式对这种模糊关系加以证明.最后,依据上述定理提出了Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法,以定理的形式对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法的正确性加以证明,并将对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法应用于非特定人手语的识别.实验表明,把DTW算法的路径搜索策略以概率的形式引进到Viterbi算法中,能够以削减候选词集的方式部分消除非特定人手语识别的误识,从而提高大词汇量情况的下非特定人手语识别的识别率和速度. 倪训博 赵德斌 姜峰 程丹松关键词:VITERBI算法 DTW算法 隐MARKOV模型 基于n边形折叠的网格简化算法 被引量:4 2008年 提出在三角网格中利用多个三角形组合及检索n边形(n为正整数)的规则,并提出一种具有相似折叠规律的n边形折叠的网格简化算法,该算法以n边形折叠为基本简化操作,并以二次误差作为误差度量,每次n边形折叠操作可以减少n-1个顶点以及2(n-1)个三角形,n越大达到某一简化目标所需的折叠次数越少,因此简化速度也可能越快.通过选取适当的n值及新顶点位置,新算法可以转化成顶点删除、边折叠及三角形折叠3种已知的几何元素删除算法,因此也可以视做为基于二次误差度量的几何元素删除简化算法的总括算法.最后分别对几种n取值情况列举实验数据,说明该算法的有效性. 陈华鸿 罗笑南 凌若天 马建平关键词:网格简化 基于脚本驱动的普适终端手语交互系统设计 手语是聋哑人群获得信息最重要最自然的途径。通过普适终端用三维手语动画向聋哑人群提供信息服务,可以突破传统交互媒介的时空限制,达到随时随地的信息交互。本文提出了一种适应终端需求的手语动画脚本及其流式传输方法,并设计实现了一... 曹顺艇 王建民 龚武明关键词:脚本 文献传递 基于统计模型的中国手语合成韵律研究 2009年 为了提高手语合成系统的可懂度,获取更为方便真实的人机交互方式,采用基于统计模型的中国手语韵律研究方法,即通过跟踪视频中手语动作,分析手语表达的韵律特征来提取手语韵律参数.并针对手语表达中肢体关节部位的不同贡献,分别对腕关节和肘关节进行了独立韵律研究.实验结果表明,通过基于统计模型的韵律研究方法可以有效得到韵律参数变化特征,并可以通过手语合成系统进行韵律特征的模拟. 尹宝才 康亮 孔德慧关键词:统计模型 韵律研究 虚拟人建模 一种基于双重学习模型的可视语音合成系统 2009年 为了在可视语音合成中获得更具有真实感的口型动画,提出了一种基于双重学习模型的合成方法.通过隐马尔可夫模型和遗传算法相结合的方法,可以更好地学习出语音特征与可视特征间的映射关系.该模型能去除传统语音识别领域在对大样本语音空间提取语音特征时的冗余信息,达到更好的可视语音预测效果.另外,在口型特征的表示上提出了一种基于面部动画参数特征点的几何特征表示,不仅对在不一致的光照条件下获得的训练样本有较好的鲁棒性,能更好地表征口型本身变化,而且与传统的主成分分析特征相比,具有较小的向量维数,提高了训练和合成速度. 孙艳丰 林仙平 尹宝才 贾熹滨关键词:遗传算法 隐马尔可夫模型 语音合成 特征提取 语音处理 语音识别 人脸特征点跟踪及夸张人脸动画系统 被引量:1 2008年 为了研究视频中人脸特征点的跟踪问题,根据人脸特征点的不同特征,提出了不同的跟踪方法.对于眉都等特征点,利用光流跟踪方法,用拉普拉斯金字塔图代替了通常的灰度图作为光流输入图,减少了累积误差,提高了光流跟踪的准确性;对于嘴部特征点,将光流与弹性图匹配相结合,通过光流预先得到大致位置,减小了弹性图匹配时的搜索范围,提高了跟踪速度;对于眼部特征点,采用图像二值化方法进行跟踪.通过MPEG-4机制将跟踪到的运动数据克隆到系统根据真实人脸特点生成的夸张人脸上进行动画,具有很强的娱乐色彩. 孙艳丰 范霞 尹宝才关键词:光流 弹性图匹配 GABOR小波 主动形状模型 MPEG-4 Research on Word Segmentation for Chinese Sign Language It remains to be a difficult issue to convert Chinese language into Chinese sign language, which makes it hard... Yinchao Cheng关键词:DISAMBIGUATION SSC:Gesture-based game for initial dementia examination 2006年 This paper presents a novel system assisting medical dementia examination in a joyful way: the object just needs to play a popular game SSC against the computer during the examination. The SSC game’s target is to detect the player’s reacting capability, which is related closely with dementia. Our system reaches this target with some advantages: there are no temporal and spatial constraints at all. There is no cost, and it can even improve people’s mental status. Hand talk technology and EHMM gesture recognition approach are employed to realize the human computer interface. Experiments showed that this system can evaluate people’s reacting capability effectively and is helpful for initial dementia examination. LIU Jun-fa CHEN Yi-qiang XIE Chen GAO Wen关键词:DEMENTIA 基于K均值/SCHMM多级分类的手语识别 2008年 本文提出了一种具有多级分类的手语识别方法,该方法采用K-均值/SCHMM(半连续隐马尔可夫模型)多级分类方法。在第一级中采用K-均值方法进行全局粗略搜索,划定目标词的大体范围。在第二级中,待识别的手语词特征与该范围内每一个手语词的SCHMM做运算,计算概率最大的为识别结果。实验结果表明,与采用单级的SCHMM识别器相比,在保持识别率基本相同的前提下,该方法能使识别速度提高近45%。 闫鹏飞 孙艳丰 孔德慧关键词:手语识别 聚类 SCHMM 面向移动计算终端的渐进几何简化方法 被引量:5 2007年 在移动计算终端上进行移动三维图形计算是一个重要的课题.针对移动计算终端屏幕小、计算能力低、无线网络带宽受限等特点,研究如何进行移动三维图形的渐进显示具有十分重要的意义.提出了利用Kobbelt四边形细分算法的逆过程迭代地进行简化的方法,通过迭代地把模型分割为奇点和作为简化模型的偶点,实现了对四边形网格几何模型的渐进式简化;提出了渐进显示的模式,通过把每一层的奇点作为可添加的细节信息,可以支持在终端上渐进显示不同细节模型并实现原模型的无损还原.完整的简化方法简单快速,可以高效地实现移动三维图形的渐进简化显示.最后在型号为Mio336的PDA上的实验结果表明,研究成果在移动计算终端上进行实时交互等方面具有很好的应用前景. 罗笑南 林谋广 姬长波 李志勇