期刊文献+
共找到776篇文章
< 1 2 39 >
每页显示 20 50 100
基于门控时空注意力的视频帧预测模型
1
作者 李卫军 张新勇 +2 位作者 高庾潇 顾建来 刘锦彤 《郑州大学学报(工学版)》 北大核心 2024年第1期70-77,121,共9页
针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采... 针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采用多尺度深度条形卷积和通道注意力来学习帧内及帧间的时空特征,并利用门控融合机制平衡时空注意力的特征学习能力;最后,由空间解码器将高级特征解码为预测的真实图像,并补充背景语义以完善细节。在Moving MNIST、TaxiBJ、WeatherBench、KITTI数据集上的实验结果显示,同多进多出模型SimVP相比,MSE分别降低了14.7%、6.7%、10.5%、18.5%,在消融扩展实验中,所提模型达到了较好的综合性能,具有预测精度高、计算量低和推理效率高等优势。 展开更多
关键词 视频帧预测 卷积神经网络 注意力机制 门控卷积 编解码网络
下载PDF
基于多支路聚合的帧预测轻量化视频异常检测 被引量:1
2
作者 黄少年 文沛然 +1 位作者 全琪 陈荣元 《图学学报》 CSCD 北大核心 2023年第6期1173-1182,共10页
复杂场景下的视频异常检测任务具有重要的研究价值与应用意义。尽管基于预测的视频异常检测方法在性能方面取得了显著进展,但仍面临诸如高模型参数量和待进一步提升的检测性能等挑战。针对这些问题,提出了一种基于多支路聚合的帧预测轻... 复杂场景下的视频异常检测任务具有重要的研究价值与应用意义。尽管基于预测的视频异常检测方法在性能方面取得了显著进展,但仍面临诸如高模型参数量和待进一步提升的检测性能等挑战。针对这些问题,提出了一种基于多支路聚合的帧预测轻量化视频异常检测模型,模型采用多支路聚合的Transformer单元作为基本结构,显著减少了模型参数量和计算成本,并提升了检测精度。在此基础上,设计了多支路Transformer融合的编码器,在提取正常事件的时序运动特征的同时采用多分支连接操作实现多层特征融合,提升编码器特征优化能力。同时,设计了基于K-means的多支路聚类解码器,缓解正常特征多样性对异常性能检测的影响。在3个权威数据集UCSD Ped2,CUHK Avenue和ShanghaiTech上的实验结果表明,与当前主流算法相比,该模型具有更低的计算成本及良好的检测性能。 展开更多
关键词 帧预测 视频异常检测 多支路聚和 TRANSFORMER
下载PDF
注意力与特征融合的未来帧预测异常行为检测算法
3
作者 张瑜玮 王燕妮 《探测与控制学报》 CSCD 北大核心 2023年第4期150-156,共7页
针对异常行为检测模型中检测准确度较低,目标异常类型判断不准确等问题,提出注意力与特征融合的未来帧预测异常行为检测算法。该算法采用无监督生成对抗网络模型,通过计算真实帧和预测帧之间的误差来判断当前帧是否为异常帧。在生成网络... 针对异常行为检测模型中检测准确度较低,目标异常类型判断不准确等问题,提出注意力与特征融合的未来帧预测异常行为检测算法。该算法采用无监督生成对抗网络模型,通过计算真实帧和预测帧之间的误差来判断当前帧是否为异常帧。在生成网络中,以U-Net网络结构为基础,首先引入SoftPool层,减少池化过程中的信息损失;其次引入即插即用的轻量级注意力机制,增强背景信息和目标信息差,有效提升网络性能的同时不增加网络的复杂性;然后,在U-Net编码器低层构造了一种新的特征融合模块来增强图像全局信息的依赖性;最后,为了融合上下文信息,提取更丰富的特征作为输出图像,构造一种新的特征提取模块添加到网络特征图的输出部分。判别网络以马尔可夫判别器为基础,使网络更加关注图像的细节特征。实验中,采用CUHK Avenue数据集和UCSD Ped2数据集对该算法进行验证。实验结果表明,改进后的网络在CUHK Avenue数据集上检测精度达到了85.4%,在UCSD Ped2数据集上检测精度达到了92.4%,证明了该算法的有效性。 展开更多
关键词 生成对抗网络 人体异常行为检测 未来帧预测 特征融合 轻量级注意力机制
下载PDF
基于深度卷积长短时神经网络的视频帧预测 被引量:7
4
作者 张德正 翁理国 +1 位作者 夏旻 曹辉 《计算机应用》 CSCD 北大核心 2019年第6期1657-1662,共6页
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学... 针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学习输入序列图像的位置信息变化特征和空间结构信息变化特征;然后,将学习到的变化特征输入到与编码网络通道数对应的解码网络中,由解码网络输出预测的下一张图;最后,将这张图输入回解码网络中,预测接下来的一张图,循环预先设定的次后输出全部的预测图。与卷积LSTM神经网络相比,在Moving-MNIST数据集上的实验中,相同训练步数下所提方法不仅保留了位置信息预测准确的特点,而且空间结构信息细节表征能力更强。同时,将卷积门控循环单元(GRU)神经网络的卷积层加深后,该方法在空间结构信息细节表征上也取得了提升,检验了该方法思想的通用性。 展开更多
关键词 视频帧预测 卷积神经网络 长短时记忆神经网络 编码预测 卷积门控循环单元
下载PDF
应用残差生成对抗网络的路况视频帧预测模型 被引量:4
5
作者 袁帅 秦贵和 晏婕 《西安交通大学学报》 EI CAS CSCD 北大核心 2018年第10期146-152,166,共8页
在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧... 在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧路况图像,应用多个级联的残差模块初步提取输入视频流的图像特征;利用感知网络强化对视频流中物体运动特征的提取;通过使用双重判别器提高生成对抗网络生成的图像的质量;用Adam方法来优化网络权值的深度学习过程。基于生成对抗网络这种半监督的学习框架,训练后的模型可以预测出一段路况视频流下一时刻的同输入视频流具有时空一致性的帧图像。应用车辆检测领域常用的KITTI数据集对生成对抗网络模型进行训练和测试,实验结果表明:与主要依赖于像素均值的方法相比,RB-GAN模型预测图像的分辨率提高了2~4倍,达到256像素×512像素,在图像锐度标准上提高了1~2个数量级,同时图像也更加符合人眼视觉的主观感受,所预测得到的路况视频帧图像质量更高,更具有实用性价值,可以更好地为诸如检测算法等其他下游算法提供有效的特征信息。 展开更多
关键词 生成对抗网络 深度学习 自动驾驶 路况视频帧预测
下载PDF
一种新型H.264/AVC多参考帧预测方法 被引量:1
6
作者 姜峰 姜东 刘芳 《电视技术》 北大核心 2012年第15期17-20,共4页
在H.264/AVC视频压缩标准采用的几项关键技术中,使用多参考帧预测可以增加最佳匹配块的检索概率,进而大大提高了编码效率。受B帧直接(direct)预测模式的启发,提出了一种新的基于扩展帧的多参考帧预测方法,由多参考帧中的共同位置块及其... 在H.264/AVC视频压缩标准采用的几项关键技术中,使用多参考帧预测可以增加最佳匹配块的检索概率,进而大大提高了编码效率。受B帧直接(direct)预测模式的启发,提出了一种新的基于扩展帧的多参考帧预测方法,由多参考帧中的共同位置块及其参考块扩展得到一个新的抽取帧,增加了原始序列的时域分辨率,使得扩展帧更加接近当前帧,提高了运动估计中最佳匹配的检索概率,进而提升了编码效率。仿真结果证实该方法的编码性能好于H.264/AVC参考软件。 展开更多
关键词 H.264/AVC多参考帧预测抽取直接模式
下载PDF
动态卷积生成对抗网络的视频帧预测方法研究 被引量:2
7
作者 安利智 何平 +2 位作者 张薇 石钰阳 田宇 《小型微型计算机系统》 CSCD 北大核心 2022年第2期278-284,共7页
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征... 针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧;在判别网络中,采用一个3D卷积网络一次性接收全部视频帧.在实验中,使用Adam方法优化模型的参数,采用KTH和BAIR Robot Pushing数据集作为训练数据集.实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是人眼的主观感受上,动态卷积生成对抗网络均优于变分生成对抗网络,其在结构相似性度量指标下提高了14.5%,在学习感知图像块相似性指标下提高了7.69%,并且生成的预测视频更加流畅,具有更高的实用价值. 展开更多
关键词 视频帧预测 卷积动态神经平流单元 生成对抗网络 变分生成对抗网络
下载PDF
基于层次B帧预测结构的自适应图像组算法
8
作者 吴仲谋 梅顺良 《电视技术》 北大核心 2010年第S1期52-55,共4页
与目前普遍应用的IB…BP预测结构相比,在相同参考帧数目前提下,层次B帧预测结构对大部分序列,在相同码率情况下,其图像客观质量PSNR平均提高了1 dB左右。但是,对不同运动特性的图像序列,选择不同图像组大小的层次B帧预测结构编码,编码... 与目前普遍应用的IB…BP预测结构相比,在相同参考帧数目前提下,层次B帧预测结构对大部分序列,在相同码率情况下,其图像客观质量PSNR平均提高了1 dB左右。但是,对不同运动特性的图像序列,选择不同图像组大小的层次B帧预测结构编码,编码性能差异较大。基于此,提出了基于层次B帧预测结构的自适应图像组大小编码技术,并给出了具体的图像组大小判断方法和编码过程。实验结果表明,相对于固定图像组大小的层次B帧预测编码技术,对所测序列,本文提出的方法编码性能提高了0.60 dB左右。 展开更多
关键词 层次B帧预测结构 自适应图像组 视频编码
下载PDF
视频帧预测算法探究
9
作者 刘志超 《电脑知识与技术》 2021年第10期249-251,265,共4页
视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来... 视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来介绍了该领域常用的数据集并给予评价,最后从视频预测算法的运行流程和最新的论文角度上,总结该领域算法的发展方向。 展开更多
关键词 视频帧预测 长短时记忆网络 自编码器 生成对抗网络 注意力机制 强化学习
下载PDF
基于神经网络的HEVC帧内预测组合快速算法
10
作者 范俊宇 宋立锋 《广东工业大学学报》 CAS 2024年第3期131-140,共10页
为了提升高效视频编码(High Efficiency Video Coding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(Coding Tree Unit,CTU)的帧内划分结构,从而减少了... 为了提升高效视频编码(High Efficiency Video Coding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(Coding Tree Unit,CTU)的帧内划分结构,从而减少了编码器对CTU进行四叉树递归遍历划分的编码时间。原始编码策略中粗模式决策通过基于残差经哈德曼变换的预测残差绝对值总和(Sum of Absolute Transformed Difference,SATD)的损失值来估计率失真优化过程中的率失真损失值来进行加速,但仍会耗费一定的编码时间。提出一种方法通过采样搜索的方式减少粗模式决策过程中计算的模式数,从35种模式降低到了18种模式,降低了粗模式决策过程中计算估计损失值的时间。由粗模式决策过程得到的较优的多个候选帧内模式来进行率失真优化,为了缩减粗模式决策需要计算的候选模式数,在候选模式列表中根据前后帧内预测角度模式的估计损失值的差距来筛选掉部分可能性较低的候选模式实现早停止决策,从而减少需要进行率失真优化的候选模式数量,进而减少率失真优化过程的计算时间。本文提出的算法在测试序列上平均实现78.15%的编码时间缩减,BD-PSNR为-0.168 d B,BD-RATE为3.49%。 展开更多
关键词 视频编码 神经网络 预测 快速算法
下载PDF
面向硬件的AVS帧内预测算法改进
11
作者 蔡江震 吴林煌 黄贺焜 《电视技术》 2024年第5期41-47,共7页
为了面向低延时的浅压缩场景提供更加适配的编码方案,并降低硬件实现成本,提出一种基于数字音视频编解码技术标准(Audio Video coding Standard,AVS)浅压缩算法的帧内预测模式优化以及快速率失真优化算法。该算法通过减少原有算法帧内... 为了面向低延时的浅压缩场景提供更加适配的编码方案,并降低硬件实现成本,提出一种基于数字音视频编解码技术标准(Audio Video coding Standard,AVS)浅压缩算法的帧内预测模式优化以及快速率失真优化算法。该算法通过减少原有算法帧内预测所需的预测循环次数,以及打破各块之间的数据依赖关系等措施,克服了原始方案不适合硬件流水并行处理的限制,提高了编码的效率和稳定性,从而既保障了算法的视频质量,又使新的硬件实现方案更符合实际应用需求。实验结果表明,该算法优化方案能够有效改善实际面向低延时浅压缩场景下的编码效果。 展开更多
关键词 数字音视频编解码技术标准(AVS) 浅压缩 预测 快速算法
下载PDF
基于神经网络的HEVC帧间预测方法及其硬件研究
12
作者 陶乐溪 施隆照 《中国集成电路》 2024年第4期75-81,共7页
相比于H.264,高效视频编码标准(HEVC)提出了许多新技术,提高了编码性能,但是也显著提高了编码复杂度。本文从硬件实现的角度出发,对已有的帧间CU划分预测神经网络的结构进行了多方面的优化,使其参数减少了70%,加法和乘法运算分别减少了... 相比于H.264,高效视频编码标准(HEVC)提出了许多新技术,提高了编码性能,但是也显著提高了编码复杂度。本文从硬件实现的角度出发,对已有的帧间CU划分预测神经网络的结构进行了多方面的优化,使其参数减少了70%,加法和乘法运算分别减少了60%、58.2%。并对优化后的卷积神经网络参数采用10位定点数方案进行定点化处理,进一步有效减少硬件资源的开支。对比于HEVC参考软件(HM16.5),优化后网络引起的BD-BR和BD-PSNR平均损失为1.718%和-0.056dB,平均节省35%~52%的编码复杂度,并且定点化处理后引起的性能损失可忽略不计。 展开更多
关键词 HEVC 预测 卷积神经网络 低复杂度 神经网络定点化
下载PDF
基于动态自重构结构的3D-HEVC帧内预测算法并行化实现
13
作者 杨航 山蕊 +1 位作者 杨坤 崔馨月 《计算机工程与科学》 CSCD 北大核心 2024年第11期1931-1939,共9页
3D高效视频编码3D-HEVC中帧内预测算法在专用硬件上的实现具有一定的局限性,无法满足帧内预测算法多种模式灵活自主切换的需求,导致编码性能差,硬件资源利用率不高。针对这一问题,提出一种新的3D-HEVC帧内预测算法在可编程动态自重构阵... 3D高效视频编码3D-HEVC中帧内预测算法在专用硬件上的实现具有一定的局限性,无法满足帧内预测算法多种模式灵活自主切换的需求,导致编码性能差,硬件资源利用率不高。针对这一问题,提出一种新的3D-HEVC帧内预测算法在可编程动态自重构阵列处理器上的实现方法,该方法基于动态自重构机制,通过可编程控制器实时收集阵列执行状态,监测到阵列对当前任务执行结束后自主下发新的执行任务。通过对不同预测模式映射方案的硬件自主重构,实现算法的灵活切换。实验结果表明,与相关工作相比,该方法在提高灵活性的同时,硬件资源减少了49.1%,计算延迟减少了29.2%。将测试序列经过整个帧内环路测试,测试结果显示,图像质量良好。 展开更多
关键词 动态自重构 阵列处理器 3D高效视频编码 预测 并行化
下载PDF
基于卷积神经网络的HEVC帧内预测算法优化
14
作者 李轩 冷雨馨 《现代电子技术》 北大核心 2024年第11期69-77,共9页
作为HEVC标准中最基础、最重要的技术之一,帧内预测对实现视频编码的高速、高质量和高压缩率具有重要的作用。文中针对帧内预测复杂性问题进行研究,提出一种基于深度卷积神经网络(CNN)的方法,通过学习来预测CTU的划分,从而减少HEVC帧内... 作为HEVC标准中最基础、最重要的技术之一,帧内预测对实现视频编码的高速、高质量和高压缩率具有重要的作用。文中针对帧内预测复杂性问题进行研究,提出一种基于深度卷积神经网络(CNN)的方法,通过学习来预测CTU的划分,从而减少HEVC帧内编码的复杂性。通过建立一个大规模的CTU划分数据库,并利用CNN的能力学习各种CTU划分模式,能够准确地预测CTU的划分,从而避免了传统的穷举搜索,实现了HEVC编码复杂性的显著降低,提高了编码效率。实验结果表明,提出的方法在测试序列和图像上分别将帧内编码时间减少了62.25%和69.06%,与其他最先进的方法相比,比特率分别仅增加了2.12%和1.13%,达到了优化的目的。 展开更多
关键词 高效视频编码 预测编码 卷积神经网络 深度学习 编码单元 深度决策 编码块分割
下载PDF
应用于VVC无损帧内编码的残差二次预测算法
15
作者 陈国捷 《工业控制计算机》 2024年第2期107-108,共2页
在VVC无损帧内编码中,为了无失真地压缩视频,会跳过变换、量化等操作。未经过变换的帧内预测残差之间,存在较强的空间相关性。基于此,提出了一种残差二次预测(Residual Secondary Prediction,RSP)算法,来进一步降低残差能量。算法对经... 在VVC无损帧内编码中,为了无失真地压缩视频,会跳过变换、量化等操作。未经过变换的帧内预测残差之间,存在较强的空间相关性。基于此,提出了一种残差二次预测(Residual Secondary Prediction,RSP)算法,来进一步降低残差能量。算法对经过帧内预测生成的残差样本进行二次预测,得到二次残差,选择绝对值之和较低的残差组作为最终的预测残差。在VVC测试模型(VTM)12.3上应用RSP算法,相较于基础的无损帧内编码,平均可以节省5.65%的比特率,编码时间增加14.6%,解码时间下降17.5%。RSP以增加较低编码复杂度为代价,高效地提升了VVC无损帧内编码的性能。 展开更多
关键词 无损编码 预测 预测残差 二次预测 通用视频编码(VVC)
下载PDF
基于样本的VVC无损帧内梯度预测算法
16
作者 陈国捷 《工业控制计算机》 2024年第1期132-133,共2页
为了进一步提升VVC无损帧内编码的性能,在BDPCM编码工具的基础上,利用样本之间的关系,对其进行改进,提出了一种基于样本的梯度预测(Sample-based Gradient Prediction,SGP)算法。在该算法中,预测样本由对应预测方向上的相邻参考样本,以... 为了进一步提升VVC无损帧内编码的性能,在BDPCM编码工具的基础上,利用样本之间的关系,对其进行改进,提出了一种基于样本的梯度预测(Sample-based Gradient Prediction,SGP)算法。在该算法中,预测样本由对应预测方向上的相邻参考样本,以及参考样本之间的梯度信息获得,获得的预测样本被限制在一定范围内。在VVC测试模型(VTM)12.3上的实验结果表明,提出的SGP算法在VVC无损帧内编码中平均节省了5.30%的比特率,编码时间增加了17.7%,解码时间下降了19.5%。相较于BDPCM可以达到的3.88%平均比特率节省,SGP所带来的比特率节省大幅度提升,并且编码时间和解码时间都更短。 展开更多
关键词 图像编码 无损压缩 预测 梯度预测 通用视频编码(VVC)
下载PDF
基于雷达回波进行降水场预测的无监督学习模型训练策略 被引量:1
17
作者 于霞 朱智睿 +2 位作者 段勇 李冰洁 杨海波 《沈阳大学学报(自然科学版)》 CAS 2024年第2期121-131,共11页
为了提高降水场预测模型的学习效率与预测性能,在预测模型的训练阶段提出一个改善的训练策略,使其可以充分学习物体运动轨迹以及物体运动时的外观变化。通过在一个雷达回波数据集和一个公开数据集上进行对应实验,可以显示出该方法在两... 为了提高降水场预测模型的学习效率与预测性能,在预测模型的训练阶段提出一个改善的训练策略,使其可以充分学习物体运动轨迹以及物体运动时的外观变化。通过在一个雷达回波数据集和一个公开数据集上进行对应实验,可以显示出该方法在两项指标的性能表现上具有明显提高,证明了该方法的有效性。 展开更多
关键词 机器学习 深度学习 降水预测 循环神经网络 帧预测
下载PDF
基于深度值前向投影的视频帧插值模型
18
作者 陈祖儿 郑明魁 +1 位作者 张承琰 易天儒 《信息技术与信息化》 2024年第4期5-8,共4页
视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对... 视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对前向投影过程进行线性加权,并具有深度平移不变性,对重叠像素区域的前景物体边界和背景像素的像素重建有一定的效果提升。实验结果表明,所提出的算法在公开的视频帧内插数据集Vimeo-90k上测试结果良好,与其他算法相比,在PSNR、SSIM和LPIPS性能评价指标上均能达到较为优秀的性能指标,验证了算法的优越性。 展开更多
关键词 视频插值 视频帧预测 前向投影 深度估计 图像合成
下载PDF
HEVC帧内率失真优化预测模式的并行流水线硬件设计 被引量:3
19
作者 林志坚 丁永强 +1 位作者 杨秀芝 吴林煌 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期95-103,共9页
近年来,随着人们对视频数据需求的不断增加,视频的分辨率和帧率也在不断地提高,而实时视频序列的压缩编码速度往往受到帧率和分辨率的影响,分辨率和帧率越大,编码所需要的时间越长。为了实现更高分辨率和更高帧率的视频序列实时压缩编码... 近年来,随着人们对视频数据需求的不断增加,视频的分辨率和帧率也在不断地提高,而实时视频序列的压缩编码速度往往受到帧率和分辨率的影响,分辨率和帧率越大,编码所需要的时间越长。为了实现更高分辨率和更高帧率的视频序列实时压缩编码,文中设计了一种新的帧内率失真优化预测模式的并行流水线硬件架构,该架构支持最大64×64编码树单元的帧内预测编码。首先设计了9路预测模式并行方案;然后,按照Z型扫描顺序实现以4×4块为基本处理单元的流水线硬件架构,并复用32×32预测单元的预测数据,用以代替64×64预测单元的预测数据,减少运算量;最后,基于该流水线架构,提出了一种新的哈达玛变换电路,用以实现高效的流水线处理。实验结果表明:在Altera Arria 10系列的现场可编程门阵列上,该9路模式并行架构仅占用75 kb的查找表和55 kb的寄存器资源,主频可以达到207 MHz,完成一个64×64编码树单元的预测仅需要4096个时钟周期,最大能够支持1080 P分辨率99 f/s全I帧的实时编码;与已有设计方案相比,文中方案能够用更小的电路面积实现更高帧率的1080 P实时视频编码。 展开更多
关键词 预测 现场可编程门阵列 模式并行 高效视频编码
下载PDF
高效视频编码帧内预测算法优化与硬件架构设计 被引量:2
20
作者 熊启金 丁永强 林志坚 《无线电通信技术》 2023年第5期953-959,共7页
高效视频编码(High Efficiency Video Coding,HEVC)标准引入了更加灵活的块划分结构和丰富的帧内预测模式,显著提高了视频压缩效率,但其计算复杂度也随之提高,不利于硬件实现。提出了一种面向硬件实现的帧内预测优化算法,解决了帧内预... 高效视频编码(High Efficiency Video Coding,HEVC)标准引入了更加灵活的块划分结构和丰富的帧内预测模式,显著提高了视频压缩效率,但其计算复杂度也随之提高,不利于硬件实现。提出了一种面向硬件实现的帧内预测优化算法,解决了帧内预测过程中对重构数据的依赖性。在算法优化的基础上设计了一种基于4×4基本块复用的18路预测模式并行的高吞吐量全流水线硬件架构。实验结果表明,在Xilinx Virtex7现场可编程门阵列实验平台上,该硬件架构仅占用99 k的查找表和57 k的寄存器资源,最大可支持4K@52FPS的全I帧实时视频编码。在相同帧率条件下,所消耗的硬件资源相比其他现有方案减少54%,相较于HM16.7编码性能指标BD-rate仅增加5.91%。 展开更多
关键词 高效视频编码 预测 硬件 现场可编程门阵列
下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部