期刊文献+
共找到766篇文章
< 1 2 39 >
每页显示 20 50 100
基于门控时空注意力的视频帧预测模型
1
作者 李卫军 张新勇 +2 位作者 高庾潇 顾建来 刘锦彤 《郑州大学学报(工学版)》 北大核心 2024年第1期70-77,121,共9页
针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采... 针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采用多尺度深度条形卷积和通道注意力来学习帧内及帧间的时空特征,并利用门控融合机制平衡时空注意力的特征学习能力;最后,由空间解码器将高级特征解码为预测的真实图像,并补充背景语义以完善细节。在Moving MNIST、TaxiBJ、WeatherBench、KITTI数据集上的实验结果显示,同多进多出模型SimVP相比,MSE分别降低了14.7%、6.7%、10.5%、18.5%,在消融扩展实验中,所提模型达到了较好的综合性能,具有预测精度高、计算量低和推理效率高等优势。 展开更多
关键词 视频帧预测 卷积神经网络 注意力机制 门控卷积 编解码网络
下载PDF
注意力与特征融合的未来帧预测异常行为检测算法
2
作者 张瑜玮 王燕妮 《探测与控制学报》 CSCD 北大核心 2023年第4期150-156,共7页
针对异常行为检测模型中检测准确度较低,目标异常类型判断不准确等问题,提出注意力与特征融合的未来帧预测异常行为检测算法。该算法采用无监督生成对抗网络模型,通过计算真实帧和预测帧之间的误差来判断当前帧是否为异常帧。在生成网络... 针对异常行为检测模型中检测准确度较低,目标异常类型判断不准确等问题,提出注意力与特征融合的未来帧预测异常行为检测算法。该算法采用无监督生成对抗网络模型,通过计算真实帧和预测帧之间的误差来判断当前帧是否为异常帧。在生成网络中,以U-Net网络结构为基础,首先引入SoftPool层,减少池化过程中的信息损失;其次引入即插即用的轻量级注意力机制,增强背景信息和目标信息差,有效提升网络性能的同时不增加网络的复杂性;然后,在U-Net编码器低层构造了一种新的特征融合模块来增强图像全局信息的依赖性;最后,为了融合上下文信息,提取更丰富的特征作为输出图像,构造一种新的特征提取模块添加到网络特征图的输出部分。判别网络以马尔可夫判别器为基础,使网络更加关注图像的细节特征。实验中,采用CUHK Avenue数据集和UCSD Ped2数据集对该算法进行验证。实验结果表明,改进后的网络在CUHK Avenue数据集上检测精度达到了85.4%,在UCSD Ped2数据集上检测精度达到了92.4%,证明了该算法的有效性。 展开更多
关键词 生成对抗网络 人体异常行为检测 未来帧预测 特征融合 轻量级注意力机制
下载PDF
基于多支路聚合的帧预测轻量化视频异常检测
3
作者 黄少年 文沛然 +1 位作者 全琪 陈荣元 《图学学报》 CSCD 北大核心 2023年第6期1173-1182,共10页
复杂场景下的视频异常检测任务具有重要的研究价值与应用意义。尽管基于预测的视频异常检测方法在性能方面取得了显著进展,但仍面临诸如高模型参数量和待进一步提升的检测性能等挑战。针对这些问题,提出了一种基于多支路聚合的帧预测轻... 复杂场景下的视频异常检测任务具有重要的研究价值与应用意义。尽管基于预测的视频异常检测方法在性能方面取得了显著进展,但仍面临诸如高模型参数量和待进一步提升的检测性能等挑战。针对这些问题,提出了一种基于多支路聚合的帧预测轻量化视频异常检测模型,模型采用多支路聚合的Transformer单元作为基本结构,显著减少了模型参数量和计算成本,并提升了检测精度。在此基础上,设计了多支路Transformer融合的编码器,在提取正常事件的时序运动特征的同时采用多分支连接操作实现多层特征融合,提升编码器特征优化能力。同时,设计了基于K-means的多支路聚类解码器,缓解正常特征多样性对异常性能检测的影响。在3个权威数据集UCSD Ped2,CUHK Avenue和ShanghaiTech上的实验结果表明,与当前主流算法相比,该模型具有更低的计算成本及良好的检测性能。 展开更多
关键词 帧预测 视频异常检测 多支路聚和 TRANSFORMER
下载PDF
基于深度卷积长短时神经网络的视频帧预测 被引量:7
4
作者 张德正 翁理国 +1 位作者 夏旻 曹辉 《计算机应用》 CSCD 北大核心 2019年第6期1657-1662,共6页
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学... 针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学习输入序列图像的位置信息变化特征和空间结构信息变化特征;然后,将学习到的变化特征输入到与编码网络通道数对应的解码网络中,由解码网络输出预测的下一张图;最后,将这张图输入回解码网络中,预测接下来的一张图,循环预先设定的次后输出全部的预测图。与卷积LSTM神经网络相比,在Moving-MNIST数据集上的实验中,相同训练步数下所提方法不仅保留了位置信息预测准确的特点,而且空间结构信息细节表征能力更强。同时,将卷积门控循环单元(GRU)神经网络的卷积层加深后,该方法在空间结构信息细节表征上也取得了提升,检验了该方法思想的通用性。 展开更多
关键词 视频帧预测 卷积神经网络 长短时记忆神经网络 编码预测 卷积门控循环单元
下载PDF
应用残差生成对抗网络的路况视频帧预测模型 被引量:4
5
作者 袁帅 秦贵和 晏婕 《西安交通大学学报》 EI CAS CSCD 北大核心 2018年第10期146-152,166,共8页
在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧... 在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧路况图像,应用多个级联的残差模块初步提取输入视频流的图像特征;利用感知网络强化对视频流中物体运动特征的提取;通过使用双重判别器提高生成对抗网络生成的图像的质量;用Adam方法来优化网络权值的深度学习过程。基于生成对抗网络这种半监督的学习框架,训练后的模型可以预测出一段路况视频流下一时刻的同输入视频流具有时空一致性的帧图像。应用车辆检测领域常用的KITTI数据集对生成对抗网络模型进行训练和测试,实验结果表明:与主要依赖于像素均值的方法相比,RB-GAN模型预测图像的分辨率提高了2~4倍,达到256像素×512像素,在图像锐度标准上提高了1~2个数量级,同时图像也更加符合人眼视觉的主观感受,所预测得到的路况视频帧图像质量更高,更具有实用性价值,可以更好地为诸如检测算法等其他下游算法提供有效的特征信息。 展开更多
关键词 生成对抗网络 深度学习 自动驾驶 路况视频帧预测
下载PDF
一种新型H.264/AVC多参考帧预测方法 被引量:1
6
作者 姜峰 姜东 刘芳 《电视技术》 北大核心 2012年第15期17-20,共4页
在H.264/AVC视频压缩标准采用的几项关键技术中,使用多参考帧预测可以增加最佳匹配块的检索概率,进而大大提高了编码效率。受B帧直接(direct)预测模式的启发,提出了一种新的基于扩展帧的多参考帧预测方法,由多参考帧中的共同位置块及其... 在H.264/AVC视频压缩标准采用的几项关键技术中,使用多参考帧预测可以增加最佳匹配块的检索概率,进而大大提高了编码效率。受B帧直接(direct)预测模式的启发,提出了一种新的基于扩展帧的多参考帧预测方法,由多参考帧中的共同位置块及其参考块扩展得到一个新的抽取帧,增加了原始序列的时域分辨率,使得扩展帧更加接近当前帧,提高了运动估计中最佳匹配的检索概率,进而提升了编码效率。仿真结果证实该方法的编码性能好于H.264/AVC参考软件。 展开更多
关键词 H.264/AVC多参考帧预测抽取直接模式
下载PDF
动态卷积生成对抗网络的视频帧预测方法研究 被引量:2
7
作者 安利智 何平 +2 位作者 张薇 石钰阳 田宇 《小型微型计算机系统》 CSCD 北大核心 2022年第2期278-284,共7页
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征... 针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧;在判别网络中,采用一个3D卷积网络一次性接收全部视频帧.在实验中,使用Adam方法优化模型的参数,采用KTH和BAIR Robot Pushing数据集作为训练数据集.实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是人眼的主观感受上,动态卷积生成对抗网络均优于变分生成对抗网络,其在结构相似性度量指标下提高了14.5%,在学习感知图像块相似性指标下提高了7.69%,并且生成的预测视频更加流畅,具有更高的实用价值. 展开更多
关键词 视频帧预测 卷积动态神经平流单元 生成对抗网络 变分生成对抗网络
下载PDF
基于层次B帧预测结构的自适应图像组算法
8
作者 吴仲谋 梅顺良 《电视技术》 北大核心 2010年第S1期52-55,共4页
与目前普遍应用的IB…BP预测结构相比,在相同参考帧数目前提下,层次B帧预测结构对大部分序列,在相同码率情况下,其图像客观质量PSNR平均提高了1 dB左右。但是,对不同运动特性的图像序列,选择不同图像组大小的层次B帧预测结构编码,编码... 与目前普遍应用的IB…BP预测结构相比,在相同参考帧数目前提下,层次B帧预测结构对大部分序列,在相同码率情况下,其图像客观质量PSNR平均提高了1 dB左右。但是,对不同运动特性的图像序列,选择不同图像组大小的层次B帧预测结构编码,编码性能差异较大。基于此,提出了基于层次B帧预测结构的自适应图像组大小编码技术,并给出了具体的图像组大小判断方法和编码过程。实验结果表明,相对于固定图像组大小的层次B帧预测编码技术,对所测序列,本文提出的方法编码性能提高了0.60 dB左右。 展开更多
关键词 层次B帧预测结构 自适应图像组 视频编码
下载PDF
视频帧预测算法探究
9
作者 刘志超 《电脑知识与技术》 2021年第10期249-251,265,共4页
视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来... 视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来介绍了该领域常用的数据集并给予评价,最后从视频预测算法的运行流程和最新的论文角度上,总结该领域算法的发展方向。 展开更多
关键词 视频帧预测 长短时记忆网络 自编码器 生成对抗网络 注意力机制 强化学习
下载PDF
基于神经网络的HEVC帧间预测方法及其硬件研究
10
作者 陶乐溪 施隆照 《中国集成电路》 2024年第4期75-81,共7页
相比于H.264,高效视频编码标准(HEVC)提出了许多新技术,提高了编码性能,但是也显著提高了编码复杂度。本文从硬件实现的角度出发,对已有的帧间CU划分预测神经网络的结构进行了多方面的优化,使其参数减少了70%,加法和乘法运算分别减少了... 相比于H.264,高效视频编码标准(HEVC)提出了许多新技术,提高了编码性能,但是也显著提高了编码复杂度。本文从硬件实现的角度出发,对已有的帧间CU划分预测神经网络的结构进行了多方面的优化,使其参数减少了70%,加法和乘法运算分别减少了60%、58.2%。并对优化后的卷积神经网络参数采用10位定点数方案进行定点化处理,进一步有效减少硬件资源的开支。对比于HEVC参考软件(HM16.5),优化后网络引起的BD-BR和BD-PSNR平均损失为1.718%和-0.056dB,平均节省35%~52%的编码复杂度,并且定点化处理后引起的性能损失可忽略不计。 展开更多
关键词 HEVC 预测 卷积神经网络 低复杂度 神经网络定点化
下载PDF
应用于VVC无损帧内编码的残差二次预测算法
11
作者 陈国捷 《工业控制计算机》 2024年第2期107-108,共2页
在VVC无损帧内编码中,为了无失真地压缩视频,会跳过变换、量化等操作。未经过变换的帧内预测残差之间,存在较强的空间相关性。基于此,提出了一种残差二次预测(Residual Secondary Prediction,RSP)算法,来进一步降低残差能量。算法对经... 在VVC无损帧内编码中,为了无失真地压缩视频,会跳过变换、量化等操作。未经过变换的帧内预测残差之间,存在较强的空间相关性。基于此,提出了一种残差二次预测(Residual Secondary Prediction,RSP)算法,来进一步降低残差能量。算法对经过帧内预测生成的残差样本进行二次预测,得到二次残差,选择绝对值之和较低的残差组作为最终的预测残差。在VVC测试模型(VTM)12.3上应用RSP算法,相较于基础的无损帧内编码,平均可以节省5.65%的比特率,编码时间增加14.6%,解码时间下降17.5%。RSP以增加较低编码复杂度为代价,高效地提升了VVC无损帧内编码的性能。 展开更多
关键词 无损编码 预测 预测残差 二次预测 通用视频编码(VVC)
下载PDF
基于样本的VVC无损帧内梯度预测算法
12
作者 陈国捷 《工业控制计算机》 2024年第1期132-133,共2页
为了进一步提升VVC无损帧内编码的性能,在BDPCM编码工具的基础上,利用样本之间的关系,对其进行改进,提出了一种基于样本的梯度预测(Sample-based Gradient Prediction,SGP)算法。在该算法中,预测样本由对应预测方向上的相邻参考样本,以... 为了进一步提升VVC无损帧内编码的性能,在BDPCM编码工具的基础上,利用样本之间的关系,对其进行改进,提出了一种基于样本的梯度预测(Sample-based Gradient Prediction,SGP)算法。在该算法中,预测样本由对应预测方向上的相邻参考样本,以及参考样本之间的梯度信息获得,获得的预测样本被限制在一定范围内。在VVC测试模型(VTM)12.3上的实验结果表明,提出的SGP算法在VVC无损帧内编码中平均节省了5.30%的比特率,编码时间增加了17.7%,解码时间下降了19.5%。相较于BDPCM可以达到的3.88%平均比特率节省,SGP所带来的比特率节省大幅度提升,并且编码时间和解码时间都更短。 展开更多
关键词 图像编码 无损压缩 预测 梯度预测 通用视频编码(VVC)
下载PDF
基于深度值前向投影的视频帧插值模型
13
作者 陈祖儿 郑明魁 +1 位作者 张承琰 易天儒 《信息技术与信息化》 2024年第4期5-8,共4页
视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对... 视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对前向投影过程进行线性加权,并具有深度平移不变性,对重叠像素区域的前景物体边界和背景像素的像素重建有一定的效果提升。实验结果表明,所提出的算法在公开的视频帧内插数据集Vimeo-90k上测试结果良好,与其他算法相比,在PSNR、SSIM和LPIPS性能评价指标上均能达到较为优秀的性能指标,验证了算法的优越性。 展开更多
关键词 视频插值 视频帧预测 前向投影 深度估计 图像合成
下载PDF
HEVC帧内率失真优化预测模式的并行流水线硬件设计 被引量:2
14
作者 林志坚 丁永强 +1 位作者 杨秀芝 吴林煌 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期95-103,共9页
近年来,随着人们对视频数据需求的不断增加,视频的分辨率和帧率也在不断地提高,而实时视频序列的压缩编码速度往往受到帧率和分辨率的影响,分辨率和帧率越大,编码所需要的时间越长。为了实现更高分辨率和更高帧率的视频序列实时压缩编码... 近年来,随着人们对视频数据需求的不断增加,视频的分辨率和帧率也在不断地提高,而实时视频序列的压缩编码速度往往受到帧率和分辨率的影响,分辨率和帧率越大,编码所需要的时间越长。为了实现更高分辨率和更高帧率的视频序列实时压缩编码,文中设计了一种新的帧内率失真优化预测模式的并行流水线硬件架构,该架构支持最大64×64编码树单元的帧内预测编码。首先设计了9路预测模式并行方案;然后,按照Z型扫描顺序实现以4×4块为基本处理单元的流水线硬件架构,并复用32×32预测单元的预测数据,用以代替64×64预测单元的预测数据,减少运算量;最后,基于该流水线架构,提出了一种新的哈达玛变换电路,用以实现高效的流水线处理。实验结果表明:在Altera Arria 10系列的现场可编程门阵列上,该9路模式并行架构仅占用75 kb的查找表和55 kb的寄存器资源,主频可以达到207 MHz,完成一个64×64编码树单元的预测仅需要4096个时钟周期,最大能够支持1080 P分辨率99 f/s全I帧的实时编码;与已有设计方案相比,文中方案能够用更小的电路面积实现更高帧率的1080 P实时视频编码。 展开更多
关键词 预测 现场可编程门阵列 模式并行 高效视频编码
下载PDF
高效视频编码帧内预测算法优化与硬件架构设计 被引量:1
15
作者 熊启金 丁永强 林志坚 《无线电通信技术》 2023年第5期953-959,共7页
高效视频编码(High Efficiency Video Coding,HEVC)标准引入了更加灵活的块划分结构和丰富的帧内预测模式,显著提高了视频压缩效率,但其计算复杂度也随之提高,不利于硬件实现。提出了一种面向硬件实现的帧内预测优化算法,解决了帧内预... 高效视频编码(High Efficiency Video Coding,HEVC)标准引入了更加灵活的块划分结构和丰富的帧内预测模式,显著提高了视频压缩效率,但其计算复杂度也随之提高,不利于硬件实现。提出了一种面向硬件实现的帧内预测优化算法,解决了帧内预测过程中对重构数据的依赖性。在算法优化的基础上设计了一种基于4×4基本块复用的18路预测模式并行的高吞吐量全流水线硬件架构。实验结果表明,在Xilinx Virtex7现场可编程门阵列实验平台上,该硬件架构仅占用99 k的查找表和57 k的寄存器资源,最大可支持4K@52FPS的全I帧实时视频编码。在相同帧率条件下,所消耗的硬件资源相比其他现有方案减少54%,相较于HM16.7编码性能指标BD-rate仅增加5.91%。 展开更多
关键词 高效视频编码 预测 硬件 现场可编程门阵列
下载PDF
基于LightGBM的H.266/VVC快速帧间块划分算法
16
作者 顾亿炜 黄新彭 +1 位作者 林兴斌 滕国伟 《工业控制计算机》 2024年第1期72-75,共4页
新一代视频编解码标准H.266/VVC在多个编码核心模块引入诸多新的技术,旨在提高视频编码的压缩效率,同时也带来复杂度显著增加。在块划分方面,在H.265/HEVC中四叉树划分(QT)的基础上增加了多叉树划分(MT),导致划分情况增多;此外帧间引入... 新一代视频编解码标准H.266/VVC在多个编码核心模块引入诸多新的技术,旨在提高视频编码的压缩效率,同时也带来复杂度显著增加。在块划分方面,在H.265/HEVC中四叉树划分(QT)的基础上增加了多叉树划分(MT),导致划分情况增多;此外帧间引入众多编码模式,使得确定每个CU的帧间最优模式的计算过程变得更加繁复,这些帧间预测技术极大增加了复杂度,阻碍了其在实际中的应用。因此提出了基于LightGBM的快速帧间块划分算法,通过分析常规的时空以及上下文特性,还引入多个新特征。通过选择大量相关性较强的特征并建多个LightGBM模型,并以此设计了全新的块划分流程,使得整体块划分过程显著缩短。实验结果表明,与H.266/VVC参考软件VTM10.0相比,平均降低33.98%计算复杂度,且BDBR仅增加了1.77%。 展开更多
关键词 H.266/VVC 预测 块划分 LightGBM
下载PDF
基于H.264编码帧内预测模式的视频监控算法研究 被引量:2
17
作者 张娜 周冬 +2 位作者 张俊为 桂江生 包晓安 《浙江理工大学学报(自然科学版)》 2017年第3期432-437,共6页
为了降低视频监控中H.264编码帧内预测模式计算复杂度,在分析了帧内预测模式选择过程的基础上,提出了一种改进的提前终止选择算法。该算法根据画面的抖动状况以及INTRA16×16模式下的纹理特征来获取最佳阈值,并根据预处理阈值计算... 为了降低视频监控中H.264编码帧内预测模式计算复杂度,在分析了帧内预测模式选择过程的基础上,提出了一种改进的提前终止选择算法。该算法根据画面的抖动状况以及INTRA16×16模式下的纹理特征来获取最佳阈值,并根据预处理阈值计算出最佳预测模式,从而降低了预测模式的计算复杂度,增强了在不同监控场景下的适应能力。将该算法与模式选择算法、多级模式预测方法进行实验分析,分别在比特率、帧预测次数和计算时间上进行比较,结果表明:通过改进后的算法可以有效去除模式的预测数,避免了不必要的预测计算,同时保持了H.264编码原有的特性。 展开更多
关键词 视频监控 视频传输 H.264编码 帧预测模型
下载PDF
一种结合帧级特征预测的多任务学习声纹确认方法
18
作者 李晋 《长江信息通信》 2023年第6期1-4,共4页
目前主流的声纹确认算法通常采用有监督、区分性的训练方式得到神经网络模型,如卷积神经网络(Convolutional Neural Network,CNN)、长短时记忆网络(Long-Short-Term Memory Network,LSTM)等,再利用该神经网络模型提取语音中包含个性化... 目前主流的声纹确认算法通常采用有监督、区分性的训练方式得到神经网络模型,如卷积神经网络(Convolutional Neural Network,CNN)、长短时记忆网络(Long-Short-Term Memory Network,LSTM)等,再利用该神经网络模型提取语音中包含个性化信息的声纹模型向量,从而进行相同人或不同人的声纹相似性比对。文章提出一种结合帧级特征预测的多任务学习训练方式,额外增加对帧级特征进行预测的神经网络模型分支,通过联合训练达到提高声纹确认算法性能的目的。在基准VoxCeleb三个测试集合上开展的实验结果表明,本文提出的方法可以有效提升声纹确认算法性能。 展开更多
关键词 声纹确认 多任务学习 级特征预测
下载PDF
一种分层次B帧双向预测直接模式
19
作者 郑嘉利 倪光南 覃团发 《计算机应用研究》 CSCD 北大核心 2015年第7期2222-2225,共4页
分层次B帧是一种基于闭环运动补偿的时域可伸缩性视频编码,其特点是解码重构后的B帧可作为参考帧。针对分层次B帧的特点,提出一种新的B帧双向预测直接模式。通过挖掘相邻帧间的时域相关性,利用B帧作为参考帧时的前后向运动矢量进行时域... 分层次B帧是一种基于闭环运动补偿的时域可伸缩性视频编码,其特点是解码重构后的B帧可作为参考帧。针对分层次B帧的特点,提出一种新的B帧双向预测直接模式。通过挖掘相邻帧间的时域相关性,利用B帧作为参考帧时的前后向运动矢量进行时域缩放,精细当前块在直接模式下的运动矢量精度。仿真实验证明,该方法相对于传统的编码方式,编码性能增益平均提高0.46 d B。 展开更多
关键词 可伸缩性视频编码 分层次B 运动补偿时域滤波 B帧预测模式 直接模式 双向预测
下载PDF
快速帧内预测模式选择新方法 被引量:19
20
作者 李世平 蒋刚毅 郁梅 《电子学报》 EI CAS CSCD 北大核心 2006年第1期141-146,共6页
为了提高编码性能,H.264采用了KDO(率失真优化),但与此同时带来的是计算复杂度的增加.本文着重分析了H.264中快速帧内预测模式选择的问题.为了降低帧内预测模式选择的计算复杂度,提出了一种高效的快速帧内预测模式选择算法.... 为了提高编码性能,H.264采用了KDO(率失真优化),但与此同时带来的是计算复杂度的增加.本文着重分析了H.264中快速帧内预测模式选择的问题.为了降低帧内预测模式选择的计算复杂度,提出了一种高效的快速帧内预测模式选择算法.首先,对Pan的基于边缘方向直方图的快速算法进行了改进,同时提出了基于参考象素特征的4×4快速帧内预测模式选择算法,并将两者进行了结合.实验结果表明,本文算法和H.264校验模型JM61相比,I帧编码时间降低61%~69%,而PSNR基本保持不变,输出码率仅略有增加;与Pan的基于边缘方向直方图快速算法相比,本文算法的I帧编码时间降低12%~33%,PSNR和输出码率均基本保持不变. 展开更多
关键词 预测 编码复杂度 预测模式选择
下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部