国家高技术研究发展计划(2001AA114160)
- 作品数:11 被引量:110H指数:7
- 相关作者:尹宝才姚鸿勋高文陈益强谷春亮更多>>
- 相关机构:北京工业大学哈尔滨工业大学中国科学院更多>>
- 发文基金:国家高技术研究发展计划北京市自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 基于句子级的唇读语料库及其切分算法被引量:12
- 2005年
- 论文对适合唇读研究的连续音节双模态语料库及其语料切分算法的设计和研究工作进行了讨论。介绍了基于句子级的双模态语料库HITBi-CAVDatabaseII的设计和建立,形式化地讨论了该库的主要特点及基于语音能量的语料切分算法的可行性。该切分算法在基于能量的语音切分算法基础上,结合了双模态语料库的一些特征,实现了对语料的自动切分。
- 洪晓鹏姚鸿勋徐铭辉
- 关键词:唇读
- 基于颜色手套的中国手指语字母的动静态识别被引量:22
- 2002年
- 作为一种高度结构化的语言,手语具有与口语和文字语言一样的表达能力。基于视觉的手语识别不仅更加符合人们的习惯而且具有非常广阔的应用空间。该文采用指尖染色和手指染色的颜色手套模型实现了可以识别中国手指字母表30个基本手形的动静态手势识别系统,识别率达到100%。
- 李勇高文姚鸿勋
- 关键词:计算机
- 基于形变模型的人脸建模及其应用综述被引量:13
- 2003年
- 形变模型(morphable model)是近几年提出的人脸建模新方法。基于若干原型人脸的知识,该方法实现了真实感三维人脸的自动建模,并在图像分析、人脸识别、表情动画等方面的应用中取得了良好效果。回顾了基于形变模型的人脸建模的研究概况、基本原理及应用情况,并对形变模型的进一步应用和发展进行了展望。
- 尹宝才胡永利程世铨谷春亮
- 关键词:形变模型人脸建模人脸识别
- 基于数据挖掘的语音驱动三维人脸动画合成被引量:6
- 2002年
- 提出采用数据挖掘的概念,利用神经网络,聚类以及统计学方法从大量语音视频库中发现语音与唇动以及人脸表情之间的关联模型,并应用于语音驱动人脸动画合成中,本文提出的方法不仅可很好地解决语音与人脸动画的同步,同时还具有易训练,鲁棒性强,可扩展等特性。实验表明,基于数据挖掘技术的合成模型非常有效,极大提高了动画人物的真实感和可信度。
- 陈益强高文王兆其姜大龙左力
- 关键词:数据挖掘语音驱动计算机
- 一种真实感三维人脸编辑算法
- 本文提出的三维人脸编辑算法,可从若干已生成的真实感三维人脸及其特征(面部器官)中,选择器官进行自由组合,生成新的真实感三维人脸。该算法在选定进行器官替换的人脸面部及替换器官后,需首先进行纹理图像预处理,使待组合的人脸面部...
- 刘媛媛孔德慧尹宝才
- 关键词:真实感插值纹理映射
- 文献传递
- 基于MPEG-4的人脸表情动画被引量:9
- 2003年
- 为了减少人脸表情动画中奇异的变形,提出了一种用人脸表情库来实现人脸表情动画的方法。这种方法利用人脸表情库中模型的先验知识来约束模型变形,有效地防止了奇异变形的产生。该方法首先对照MPEG-4中定义的人脸定义参数(FDP)选取一些特征点,然后根据人脸动画参数(FAP)来计算这些特征点的位移,最后由人脸表情库实时地组合出新的人脸表情。
- 邹自强尹宝才孔德慧
- 关键词:人脸动画图像处理
- 块匹配算法在基于MPEG-4的人脸特征提取中的改良及应用
- 2003年
- 首先对视频内容进行了分析,针对不同人脸的光照效果和色度变换效果做了平滑处理,以减少灰度突变区域。然后运用匹配算法进行像素匹配。为减小计算量,添加了特征点位置约束关系和梯度约束关系的限制,同时改进了相关系数的计算方法,这样不仅有效提高了匹配准确度,同时还减少了计算复杂度。试验证明匹配效果显著,而且计算量没有增加。
- 王雁来尹宝才孔德慧谷春亮
- 关键词:块匹配算法MPEG-4人脸图像特征提取图像处理
- 基于CHN的骨龄自动评价方法研究被引量:9
- 2003年
- 研究了基于“中国人手腕骨发育标准CHN法”的骨龄自动评价方法 ,包括手腕骨X射线图像中骨骼边缘的自动提取和骨骼成熟度的自动分级 应用活动形状模型 (activeshapemodels,ASM) ,结合了特定的先验知识 ,提出多模板多训练集的方案 ,改善了边缘检测的效果 ;通过考察一系列形状几何信息并结合灰度信息 ,将CHN标准中有关的文字描述转化为数字特征 ,采取多层次分步骤的方法用于最终的骨龄自动评价
- 王珂王巍尹宝才
- 关键词:边缘检测ASM
- 3G网络视频流媒体服务系统研究与实现被引量:21
- 2005年
- 随着无线技术的发展,网络带宽的增加,特别是第三代移动通信技术的成熟,使无线视频应用成为可能。文章正是以此为应用背景,使用第三代合作伙伴计划(3GPP)相关协议设计开发了无线网络视频流媒体服务系统。系统采用服务器-客户端结构,使用AudioVideoStandardMobile(AVS_M)[1]视频压缩标准压缩视频数据,并将AVS_M码流用3GP文件格式封装,存放于服务器供传输,会话层协议使用Real-TimeStreamingProtocol(RTSP)/SessionDescriptionProtocol(SDP)协议,传输层协议使用Real-timeTransportProtocol(RTP)/RTPControlProtocol(RTCP)协议。这篇文章着重讨论了AVS_M码流的3GP文件封装和流媒体系统的结构。
- 白刚杨猛李锌尹宝才
- 关键词:系统结构
- 基于多尺度形状描述子的手势识别被引量:4
- 2004年
- 随着计算机性能的提高和人机交互技术的发展,手势识别越来越受到人们的重视,尤其是基于视觉通道的手势识别,使人机交互变得更加便捷。但由于人手是复杂形变体,现有的方法对运动过程中手的形变的描述不够充分。该文从视觉角度提出了一种新的手势建模的方法-多尺度形状描述子。从分析手的基本形状入手,利用了圆形的轴对称和中心对称的几何特点,具有旋转和尺度不变性。该描述子从多个尺度对手势进行形状描述,在一定程度上解决了手势的精细区分问题。
- 杨筱林姚鸿勋
- 关键词:视觉手势识别手语