针对虚拟视点绘制中出现的伪轮廓和空洞问题,提出一种改进的虚拟视点绘制算法。根据深度信息标记出深度图像的不可信区域,通过多阈值图像分割技术对图像进行分割处理,利用三维图像变换生成虚拟视点图像,并采用局部中值滤波消除目标图像中存在的细小空洞。对绘制出的两幅图像进行融合处理,并应用图像修复法填充剩余的空洞。实验结果表明,该算法能获得的虚拟视点图像质量较高,同时与MPEG提供的虚拟视点绘制标准参考软件相比,生成的虚拟视点PSNR值提高了0.74 d B。
为了使立体视频中的比特分配更加符合人眼视觉感知特性,提出了一种非对称质量的立体视频编码码率控制算法。首先,建立了左右帧的码率分配比例与量化参数差值之间的立体指数RRQ(Rate-ratio Quantization)模型。然后,将码率控制算法分为SGOP(Stereoscopic Group of Pictures)层、立体图像对层和帧层等3个码率控制层。在SGOP层计算每个SGOP的目标码率和关键帧的量化参数;在立体图像对层根据剩余比特数和缓冲区饱和度计算每个立体图像对的目标比特;在帧层则通过分析双目视觉掩蔽效应,用一种适合于立体视频的率失真优化方法合理分配左右帧的目标码率。实验结果表明,本文算法的码率控制偏差平均值为0.21%;立体视频客观质量比对称质量算法和Wang的算法分别提高了0.23dB和0.06dB,且质量波动较为稳定。因此,该算法基本满足网络带宽传输要求。由于充分利用了人眼双目视觉特性,可满足人们对立体视频的视觉需求。
考虑到人眼视觉关注特性在视频质量评价(VQA)中所具有的重要作用,提出了一种结合人眼视觉关注特性的视频质量评价方法。首先利用三维Sobel算子以及恰可察觉失真模型得到全局显著图,对全局显著图的每个显著像素点构建结构张量来求取一帧的全局质量;然后利用视频运动信息以及人眼中心关注特性求得局部显著图来进行感知加权,得到一帧的局部质量;最后均衡局部与全局质量得到视频中一帧的质量,并采用机器学习的方法获得时域加权模型,对视频帧进行加权,从而得到客观视频质量评价值。在LIVE视频数据库上进行性能测试,得到PLCC(Pearson Linear Correlation Coefficient)为0.827,SROCC(Spearman Rank Order Correlation Coefficient)为0.802,与已有相关算法相比,所提出的VQA方法的评价结果更接近人眼的主观感知。
针对现有I帧错误隐藏方法不能平衡恢复图像质量与算法复杂度的问题,提出了一种高效的I帧分区错误隐藏方法。首先,利用视频帧之间的运动相关性将丢失宏块分为运动宏块和静止宏块。对于静止宏块,采用帧拷贝法进行掩盖;对于运动宏块,再根据其周围正确解码宏块的纹理信息将其分为平滑块和纹理块。对平滑块采用双线性插值法进行恢复;对纹理块利用比较精细的指数分布权重的加权模板匹配(WTE)法进行掩盖。实验结果表明,与WTE算法相比,所提方法的峰值信噪比(PSNR)平均提高了2.6 d B,计算复杂度平均降低了90%。对于场景连续的具有不同特征和分辨率的视频序列,所提方法都具有一定的适用性。
针对高效视频编码(HEVC)帧内预测过程中的高计算复杂度问题,提出一种基于纹理特征的预测模式选择和编码单元划分的快速帧内预测算法。利用每一深度层纹理方向强度判断编码单元是否需要进行分割,并且减少候选模式数量。首先,在每一深度层编码单元上结合像素方差,以像素点为单位计算相应的纹理方向强度,确定其纹理复杂度并结合阈值策略预测最终划分深度;其次,比较垂直和水平方向强度关系及统计预测候选模式概率分布,以减少预测模式数量,确定最优候选模式子集,进一步降低编码复杂度。所提算法与平台HM15.0相比,编码时间平均节省51.997%,BDPSNR(Bjontegaard Delta Peak Signal-to-Noise Rate)仅降低0.059 d B,BDBR(Bjontegaard Delta Bit Rate)仅上升了1.018%。实验数据表明,在保证信噪比和比特率基本不变的同时,所提算法能有效降低编码复杂度,利于HEVC的实时视频应用。