期刊文献+
共找到148篇文章
< 1 2 8 >
每页显示 20 50 100
电子信息类专业学位研究生 培养体系改革与实践——以中国传媒大学信息与通信工程学院为例
1
作者 陈梦 李树锋 金立标 《工业和信息化教育》 2023年第9期48-54,共7页
随着中国特色社会主义进入新时代,专业学位研究生教育是经济社会进入高质量发展阶段的必然选择,是今后研究生教育改革发展的战略重点。通过分析当前我国电子信息类专业学位研究生教育发展困境,中国传媒大学信息与通信工程学院根据自身... 随着中国特色社会主义进入新时代,专业学位研究生教育是经济社会进入高质量发展阶段的必然选择,是今后研究生教育改革发展的战略重点。通过分析当前我国电子信息类专业学位研究生教育发展困境,中国传媒大学信息与通信工程学院根据自身发展现状和学科特色,在学科规划、培养目标、课程体系、专业实践、产教融合基地建设、学位论文标准、导师队伍建设和招生等方面开展了一系列改革与实践,以期提高电子信息类专业学位研究生实践创新能力和培养质量,培养适应我国经济信息化建设需求的高层次专业技术人才。 展开更多
关键词 专业学位研究生 培养体系改革 电子信息类
下载PDF
跨学科视域下工程类专业本科人才培养:以中国传媒大学人工智能专业为例
2
作者 殷复莲 王爽 章文辉 《中国新闻传播研究》 2021年第6期218-229,共12页
高等工程教育发展进入了新阶段,成为国际关注的焦点。本文首先调研了国内外高等院校高等工程教育改革经验,进一步指出了我国高等院校工程类人才培养存在的普遍问题;在此基础上,围绕高等教育人才培养的三个根本问题,本文尝试给出了高等... 高等工程教育发展进入了新阶段,成为国际关注的焦点。本文首先调研了国内外高等院校高等工程教育改革经验,进一步指出了我国高等院校工程类人才培养存在的普遍问题;在此基础上,围绕高等教育人才培养的三个根本问题,本文尝试给出了高等工程教育人才培养模式改革的着力要素和实施路径,包括"课程"要素、"项目"要素、"学生"要素以及"教师"要素;接下来,本文将中国传媒大学人工智能专业作为典型案例,探讨其将传媒特色融入人工智能专业人才培养的可行性,以期为高等工程教育人才培养模式改革提供参考。 展开更多
关键词 高等工程教育 人工智能 本科人才培养 跨学科 传媒
下载PDF
提高研究生培养质量的思考与实践——以中国传媒大学为例 被引量:1
3
作者 陈梦 李博 金立标 《工业和信息化教育》 2019年第7期48-52,共5页
提高研究生培养质量是发展研究生教育的根本,是推进教育创新的保证。本文主要围绕研究生培养问题进行探讨,通过分析目前研究生培养过程中存在的问题,重点介绍了中国传媒大学信息与通信工程学院在研究生课程教学、科研创新能力培养和学... 提高研究生培养质量是发展研究生教育的根本,是推进教育创新的保证。本文主要围绕研究生培养问题进行探讨,通过分析目前研究生培养过程中存在的问题,重点介绍了中国传媒大学信息与通信工程学院在研究生课程教学、科研创新能力培养和学术交流等方面所采取的一些改革措施,旨在探索提高研究生培养质量的有效途径。 展开更多
关键词 研究生 培养质量 课程教学 科研创新 学术交流
下载PDF
面向传媒行业的物联网工程专业建设探索
4
作者 李树锋 金立标 +1 位作者 胡峰 宿宝心 《物联网技术》 2023年第1期150-154,共5页
随着“新工科”建设在各大高校的深入开展,高等教育正面临着前所未有的新形势、新任务和新挑战。本文主要围绕物联网工程专业,针对新工科背景下应用型人才培养模式,从传媒行业的角度讨论了新工科背景下物联网工程的行业需求及专业建设... 随着“新工科”建设在各大高校的深入开展,高等教育正面临着前所未有的新形势、新任务和新挑战。本文主要围绕物联网工程专业,针对新工科背景下应用型人才培养模式,从传媒行业的角度讨论了新工科背景下物联网工程的行业需求及专业建设。同时,以学生的创新精神和实践能力培养为中心,为培养广电传媒行业的物联网工程人才做出了改革和探索。 展开更多
关键词 新工科 物联网工程 传媒行业 专业建设 课程思政 实践
下载PDF
船舶间可见光通信技术的MAC协议开发与实现
5
作者 王萌 《舰船科学技术》 北大核心 2023年第17期158-161,共4页
船舶间可见光通信技术近年来逐渐受到关注,可见光通信技术利用可见光波段进行通信,具有高速、低功耗、安全等优点,适用于船舶间的短距离通信。目前,对于船舶间可见光通信技术研究还相对较少。本文针对船舶间可见光通信技术的MAC协议开... 船舶间可见光通信技术近年来逐渐受到关注,可见光通信技术利用可见光波段进行通信,具有高速、低功耗、安全等优点,适用于船舶间的短距离通信。目前,对于船舶间可见光通信技术研究还相对较少。本文针对船舶间可见光通信技术的MAC协议开发与实现问题进行研究,搭建了船舶可见光通信的系统框架,提出一种基于时隙分配的MAC协议设计方案。该方案具有较高的通信速率、较低的通信延迟和较好的通信质量,可以为船舶间可见光通信技术的应用提供一定的参考和借鉴。 展开更多
关键词 可见光通信 MAC协议 通信速率
下载PDF
基于宽带极化纯度估计的极化测量定标修正
6
作者 白杨 殷红成 +1 位作者 黄培康 刘芳 《系统工程与电子技术》 EI CSCD 北大核心 2024年第2期428-436,共9页
对扩展目标极化散射特性进行测量时,通常期望精确获得宽带高分辨条件下目标各散射中心的极化特征信息,但由于各极化分量散射的信号对测试系统的正交极化通道存在能量泄漏,会严重影响较弱的极化散射分量的测量准确性。基于极化散射测量... 对扩展目标极化散射特性进行测量时,通常期望精确获得宽带高分辨条件下目标各散射中心的极化特征信息,但由于各极化分量散射的信号对测试系统的正交极化通道存在能量泄漏,会严重影响较弱的极化散射分量的测量准确性。基于极化散射测量定标原理与宽带高分辨极化测量表征模型,分析了干扰量的产生原因以及对散射中心测试结果的影响机理,提出了一种基于宽带正交极化纯度估计进而修正复杂目标极化测量结果的方法,并通过对金属球、金属二面角组合和类弹头金属模型3类典型目标的实测,验证了其有效性。 展开更多
关键词 极化散射矩阵 极化定标 高分辨 雷达目标测量
下载PDF
“数字电路与系统设计”课程改革与实践
7
作者 何晶 李冬梅 +2 位作者 刘昌银 杨霏 杨刚 《电气电子教学学报》 2024年第1期62-64,共3页
“数字电路与系统设计”是电子信息类专业重要的专业基础课。针对课程教学中存在的问题,对课程进行了改革。对课程内容进行重构,形成了更高效的从数字逻辑基础到复杂数字系统设计的学习路径;在教学实践中,采用自顶向下的设计方法培养学... “数字电路与系统设计”是电子信息类专业重要的专业基础课。针对课程教学中存在的问题,对课程进行了改革。对课程内容进行重构,形成了更高效的从数字逻辑基础到复杂数字系统设计的学习路径;在教学实践中,采用自顶向下的设计方法培养学生的工程思维和能力,使用线上资源提高教学效率。课程改革提高了教学效率,也提高了学生的工程实践能力,取得了良好的教学效果。 展开更多
关键词 数字电路与系统设计 课程改革
下载PDF
基于深度Q网络的云演艺延迟敏感业务QoE优化
8
作者 李宛青 李树锋 +1 位作者 刘健章 胡峰 《中国传媒大学学报(自然科学版)》 2024年第1期49-55,共7页
网络中的资源分配问题一直备受关注,特别是在超高清视频流的传输中,对资源的有效管理至关重要。然而,随着网络服务的多样化和不断增加的业务类型,传统的资源分配策略往往显得不够灵活和智能。深度Q网络(Deep Q-Network,DQN)是一种能够... 网络中的资源分配问题一直备受关注,特别是在超高清视频流的传输中,对资源的有效管理至关重要。然而,随着网络服务的多样化和不断增加的业务类型,传统的资源分配策略往往显得不够灵活和智能。深度Q网络(Deep Q-Network,DQN)是一种能够自适应地学习和调整资源分配策略的神经网络模型。它基于神经网络与Q-Learning算法,通过不断尝试和学习来决策最佳的资源分配方案。本文旨在研究一种在云演艺场景下基于深度Q网络的延迟敏感业务资源调度算法,以满足当今网络中多样化的业务需求。仿真结果表明,基于深度Q网络的延迟敏感业务资源调度算法使得用户体验质量(Quality of Experience)指标显著提升,表明所提算法能够更好地满足延迟敏感业务的需求。 展开更多
关键词 深度Q网络 资源调度 延迟敏感业务 用户体验 网络资源分配
下载PDF
一种新颖的基于偏振调制器的无码元走离效应的倍频毫米波光载无线系统
9
作者 戴思源 陈新桥 陈旭 《中国传媒大学学报(自然科学版)》 2024年第2期9-18,共10页
为了克服基于马赫-曾德尔调制器(MZM)的倍频毫米波光载无线系统(Radio Over Fiber,ROF)中的MZM存在的直流偏置漂移问题和ROF中的码元走离效应,本文提出了一种基于偏振调制器(Polarization Modulator,PolM)的无码元走离效应的倍频ROF系... 为了克服基于马赫-曾德尔调制器(MZM)的倍频毫米波光载无线系统(Radio Over Fiber,ROF)中的MZM存在的直流偏置漂移问题和ROF中的码元走离效应,本文提出了一种基于偏振调制器(Polarization Modulator,PolM)的无码元走离效应的倍频ROF系统。在中心站,利用PolM产生±1阶边带信号,利用复合射频(Radio Frequency,RF)信号来驱动PolM,实现将下行数据信号仅调制在+1阶边带上。复合RF驱动信号由两路信号合成,其中一路信号由数据信号通过相位调制器调制RF驱动信号形成,另一路信号是由数据信号经电放大器进行放大形成。在基站,利用光纤光栅(Fiber Bragg Grating,FBG)反射出部分-1阶边带做上行链路的光载波,实现载波重用;利用透过FBG的±1阶边带在光检测器(Photo Detector,PD)中的拍频产生倍频毫米波信号。在误码率为10-9情况下,经20、40和60公里的传输后,下行链路功率代价分别为1dB、1.2dB和1.22dB,上行链路的功率代价分别为0.5 dB、0.8 dB和1 dB。本文设计的方案能有效地克服光纤色散导致的码元走离效应,极大地提高了系统的传输距离,在ROF系统中具有重要的应用前景。 展开更多
关键词 微波 偏振调制器(PolM) 光载无线系统(ROF) 码元走离效应
下载PDF
基于人工智能技术的轻量级网络入侵检测系统设计
10
作者 董卫魏 王曦 +2 位作者 钟昕辉 冯世杰 王美虹 《现代电子技术》 北大核心 2024年第5期108-111,共4页
以提升网络入侵检测技术水平为目的,设计基于人工智能技术的轻量级网络入侵检测系统。该系统数据采集层利用若干个用户探针连接IDS检测服务器后,使用网络数据包捕获模块捕获用户网络运行数据,再通过传输层内防火墙、核心交换机和MQTT/C... 以提升网络入侵检测技术水平为目的,设计基于人工智能技术的轻量级网络入侵检测系统。该系统数据采集层利用若干个用户探针连接IDS检测服务器后,使用网络数据包捕获模块捕获用户网络运行数据,再通过传输层内防火墙、核心交换机和MQTT/CoAP通信协议将用户网络运行数据发送到逻辑运算层内,该层利用数据预处理模块对用户网络运行数据进行去噪预处理后,将其输入到基于人工智能的网络入侵检测模块内,通过该模块输出轻量级网络入侵检测结果,然后将检测结果发送到展示层,通过入侵告警信息、数据可视化展示等模块实现人机交互。实验表明:该系统运行较为稳定,可有效检测不同类型网络入侵的同时,其检测及时性和入侵告警能力较好,应用效果良好。 展开更多
关键词 人工智能 轻量级 网络入侵 检测系统 数据采集 硬件结构 无监督 免疫优化
下载PDF
在役舞台机械装备安全完整性等级评估技术研究
11
作者 胡齐航 王会芹 +3 位作者 李梦洁 张晶晶 武艺 郑刚 《中国传媒大学学报(自然科学版)》 2024年第2期27-34,共8页
近年来,我国的演艺产业正处于快速发展时期,舞台机械装备的大量使用在丰富演出效果的同时,也带来了一系列安全隐患,增加了演出事故发生的可能性。演出安全要求的提高对在役舞台机械装备的使用和维护提出了更高的要求。本文以安全标准ISO... 近年来,我国的演艺产业正处于快速发展时期,舞台机械装备的大量使用在丰富演出效果的同时,也带来了一系列安全隐患,增加了演出事故发生的可能性。演出安全要求的提高对在役舞台机械装备的使用和维护提出了更高的要求。本文以安全标准ISO 13849为基础,结合安全完整性评估理论,研究了面向在役舞台机械装备的安全完整性评估技术方法。论文采用风险图法对在役舞台升降台进行了风险评估,参照安全标准ISO 13849对某在役舞台升降台的安全回路进行了PL/SIL等级的计算,验证结果表明该在役舞台机械装备的安全回路满足功能安全要求,采用的评估方法可行、有效。 展开更多
关键词 在役舞台机械 安全完整性 ISO 13849
下载PDF
基于ConvMixer架构的高效点云分类方法
12
作者 王淳 赵艳明 冯燕 《中国传媒大学学报(自然科学版)》 2024年第1期56-64,共9页
近年来,视觉Transformer模型在点云分类等三维计算机视觉任务中显现出潜在的优越性,但其有效性来源仍然模糊不清。研究它们在视觉任务中的性能是完全归功于Transformer结构本身的优越性,还是至少部分得益于使用局部块作为输入表示,是非... 近年来,视觉Transformer模型在点云分类等三维计算机视觉任务中显现出潜在的优越性,但其有效性来源仍然模糊不清。研究它们在视觉任务中的性能是完全归功于Transformer结构本身的优越性,还是至少部分得益于使用局部块作为输入表示,是非常必要的。受此启发,本文提出了一种简单但仍然有效的点云分类和分割模型PointConvMixer,用ConvMixer架构取代了Point-BERT中的标准Transformer。PointConvMixer在ModelNet40数据集上的整体分类准确率达到92.3%,在ShapeNet Parts数据集上进行点云部分分割时mIOUI和mIOUC分别为85.4%和83.9%,均优于基于Transformer的对比模型。此外,本文还进一步提出PPFConvMixer,其利用高效的局部特征描述符PPF增强了PointConvMixer,从而优化了点云分类性能。在查询半径为0.25m时,PPFConvMixer的总体分类准确率达到了93.8%。 展开更多
关键词 三维点云分类 深度学习 ConvMixer Point Pair Feature
下载PDF
一种基于JSON格式的网络信息安全系统数据传输方法 被引量:17
13
作者 赵薇 邓夏唯 +1 位作者 付睿翎 蒋佳芮 《中国传媒大学学报(自然科学版)》 2020年第3期22-28,共7页
随着互联网技术的快速发展,亟需普及网络信息安全知识,提高网络信息安全意识。本文搭建了网络安全教育系统,设计触发器事件库、对话剧本库、题库的JSON文本,解析JSON文本结构,实现客户端与数据库的数据传输和交互。JSON格式简单,便于管... 随着互联网技术的快速发展,亟需普及网络信息安全知识,提高网络信息安全意识。本文搭建了网络安全教育系统,设计触发器事件库、对话剧本库、题库的JSON文本,解析JSON文本结构,实现客户端与数据库的数据传输和交互。JSON格式简单,便于管理员维护,为系统的有效运行提供了保障。 展开更多
关键词 JSON UNITY3D 网络信息安全 文本结构
下载PDF
IPTV用户画像系统设计与实现
14
作者 罗泽文 周敏 +2 位作者 张政 侯玉娟 崔健 《广播电视网络》 2024年第1期61-64,共4页
基于SpringBoot、Vue.js和Spark、Click House等技术,本文设计和实现了IPTV用户画像系统,其能够按照可设定的流程自动调取用户数据并进行清洗和整理,计算得出用户标签数据,实现个人用户画像和用户分群的可视化分析。该系统不仅可以为IPT... 基于SpringBoot、Vue.js和Spark、Click House等技术,本文设计和实现了IPTV用户画像系统,其能够按照可设定的流程自动调取用户数据并进行清洗和整理,计算得出用户标签数据,实现个人用户画像和用户分群的可视化分析。该系统不仅可以为IPTV运营商提供一个自动、便捷的用户标签管理系统,也可为其提供深入洞察用户需求的可视化展示。 展开更多
关键词 IPTV 用户画像 标签计算 前后端分离
下载PDF
视听觉融合效应及其信息融合处理方法综论
15
作者 蒋伟 王爽 +1 位作者 蒋玉暕 刘京宇 《中国传媒大学学报(自然科学版)》 2019年第6期6-11,49,共7页
本文将视觉信息和听觉信息相互影响并共同作用于人的现象称为视听觉融合效应,并且针对该效应提出了以信息融合处理为核心的研究方法。首先,本文由日常生活中的普遍现象发现视听觉融合效应。其次,在研究和评判相关领域研究现状的基础上,... 本文将视觉信息和听觉信息相互影响并共同作用于人的现象称为视听觉融合效应,并且针对该效应提出了以信息融合处理为核心的研究方法。首先,本文由日常生活中的普遍现象发现视听觉融合效应。其次,在研究和评判相关领域研究现状的基础上,本文明确了视听觉融合效应的研究对象及其基本概念。再次,以总体研究框架为依据,本文给出了研究视听觉融合效应的研究方法与技术路线,并对其可行性进行了论证。接着,本文分析了视听觉融合效应的研究重点与难点。最后,本文展望了视听觉融合效应及其信息融合处理的广阔的应用前景。 展开更多
关键词 视听觉融合效应 信息融合处理 机器学习 主观评价实验 感知特征
下载PDF
利用自动化控制程序实现AGV小车在可视化产线与模拟产线上的一致性
16
作者 汪子啸 江伟彬 汪胜国 《自动化应用》 2024年第5期29-32,共4页
在大规模发展无人工厂的背景下,数字孪生技术快速兴起。结合实际案例,提出利用自动化控制程序,实现AGV小车在可视化产线与模拟产线的一致,包括瞬间动作一致,各产线相同阶段运行时间相同。该程序解决了各产线数据同步、实时性的问题,为... 在大规模发展无人工厂的背景下,数字孪生技术快速兴起。结合实际案例,提出利用自动化控制程序,实现AGV小车在可视化产线与模拟产线的一致,包括瞬间动作一致,各产线相同阶段运行时间相同。该程序解决了各产线数据同步、实时性的问题,为生产安全性、数据可靠性、实时性、一致性提供了支持。 展开更多
关键词 模拟产线 可视化 AGV小车 自动化控制程序
下载PDF
基于模仿学习的决策树码率自适应算法研究 被引量:1
17
作者 王博 张远 杨咏蓓 《计算机工程》 CAS CSCD 北大核心 2023年第5期206-214,共9页
码率自适应(ABR)算法是提升流媒体服务质量的有效方法,主要分为启发式算法和基于学习的算法两类。传统的启发式算法基于固定的规则,难以应对多变的网络环境,基于深度强化学习的算法映射表达能力较好,但其鲁棒性不佳且可解释性较差。针... 码率自适应(ABR)算法是提升流媒体服务质量的有效方法,主要分为启发式算法和基于学习的算法两类。传统的启发式算法基于固定的规则,难以应对多变的网络环境,基于深度强化学习的算法映射表达能力较好,但其鲁棒性不佳且可解释性较差。针对上述问题,提出一种基于模仿学习的决策树码率自适应算法ABRTree。针对帧级别直播传输系统设计有效的专家ABR算法,并对专家算法的时序经验数据进行离散化处理。采用分类回归树作为码率决策的基础模型,基于专家算法给出的示例数据,采用DAgger算法进行决策树的训练。在此基础上,通过剪枝操作剔除出现较少的样本,从而提升决策树模型的泛化性。实验结果表明,ABRTree在多种视频场景下均能保证画面质量,同时取得较低的端到端延时和较少的卡顿,相比BBA、HYSA和FrameMPC算法,ABRTree算法的QoE性能可以提升1.0%~29.1%,且决策树模型能够直观表达输入特征与码率决策之间的关系,具有较好的可解释性和映射表达能力。 展开更多
关键词 HTTP自适应流媒体 码率自适应算法 决策树 模仿学习 流媒体直播
下载PDF
DynArt ChatGPT:一个动态非遗年画的生成平台
18
作者 靳聪 周满玲 +4 位作者 张竣淞 王洪亮 张佳一 王晶 徐明亮 《图学学报》 CSCD 北大核心 2023年第6期1212-1217,共6页
ChatGPT吸引了跨领域的兴趣,因其提供了一个领域的会话能力和推理能力。年画是中国非物质文化遗产的重要组成部分,在过去,年画常作为一种主要的宣传手段。作为商品生产,其有着巨大的宣传推广量与经济价值。在以科技为主导的现代社会,中... ChatGPT吸引了跨领域的兴趣,因其提供了一个领域的会话能力和推理能力。年画是中国非物质文化遗产的重要组成部分,在过去,年画常作为一种主要的宣传手段。作为商品生产,其有着巨大的宣传推广量与经济价值。在以科技为主导的现代社会,中国非物质文化遗产的保护与发展遭遇到了发展经济、技术更新和文化变迁的三大矛盾,产生了传承乏人、创新不易、保护不力的诸多问题。为了弘扬与发展中国传统美术,本文产生了一个设想:能否将ChatGPT的会话功能与非遗文化中的传统美术进行组合呢?基于此设想,构建了一个系统——动态非遗年画生成系统(DynaArt ChatGPT)。DynaArt ChatGPT可通过提取ChatGPT给出的样例中的关键词,然后再根据关键词生成一段与样例相关的描述,并将描述输入到Lumen5模型中,Lumen5就会根据该输入的描述生成相应的动态视频,经过实验本文认为动态画生成系统可以对一些耳熟能详的中国民间故事进行全新的演绎。 展开更多
关键词 动态画生成系统 ChatGPT Lumen5 陕西凤翔戏出年画 天津杨柳青年画
下载PDF
基于具身交互的听觉数字孪生及无人机作战应用
19
作者 靳聪 吴凤鹃 +2 位作者 李波 郭子淳 王晶 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第12期256-262,共7页
听觉数字孪生技术应用在扩展现实、军事虚拟仿真、游戏交互中是必不可少的,以实现身临其境的视听体验。音频的空间化渲染必须与视觉反馈一致,并以最小的延迟响应时间和用户动作进行具身交互。声音的波动性对逼真的具身交互和沉浸式渲染... 听觉数字孪生技术应用在扩展现实、军事虚拟仿真、游戏交互中是必不可少的,以实现身临其境的视听体验。音频的空间化渲染必须与视觉反馈一致,并以最小的延迟响应时间和用户动作进行具身交互。声音的波动性对逼真的具身交互和沉浸式渲染提出了严峻的挑战,并导致巨大的计算成本。从封闭到开放、静态到动态、室内和室外混合区域的虚拟场景到虚实融合的扩展现实体验,带来了运算复杂度的剧增。以一种音频视角来实现“以人为本”的模拟听众和数字孪生体之间的映射关系,通过听觉数字孪生体描述听者和虚拟环境之间的交互行动,建立基于具身交互的面向无人机作战场景的听觉数字孪生系统,实现了扩展现实体验下的空间音频孪生及多感官具身交互,讨论了无人机作战场景下的应用。 展开更多
关键词 数字孪生 军事虚拟仿真 扩展现实 具身交互 空间音频
下载PDF
基于语义嵌入学习的特类视频识别
20
作者 吴晓雨 蒲禹江 +1 位作者 王生进 刘子豪 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3225-3237,共13页
暴力视频传播已经成为网络环境治理面临的隐患之一,暴力视频这类特类视频的智能识别技术对维护互联网内容安全具有重要意义.由于采集来源的多样性,暴力视频分布通常呈现较大的类内方差和较小的类间方差,常见的暴力视频识别模型难以适应... 暴力视频传播已经成为网络环境治理面临的隐患之一,暴力视频这类特类视频的智能识别技术对维护互联网内容安全具有重要意义.由于采集来源的多样性,暴力视频分布通常呈现较大的类内方差和较小的类间方差,常见的暴力视频识别模型难以适应复杂多变的暴力场景.同时,暴力一词本身具有高度抽象的语义,如何从有限数据中学习通用的暴力语义表示成为一大难点.针对这些问题,本文基于语义嵌入学习的思想,构建了一种新颖的多模态暴力视频识别模型,主要由三部分构成.(1)多模态特征提取.考虑到视频具有多模态属性,采用了三种不同的深度神经网络分别提取表观、运动、音频三种模态的特征表示.(2)多模态特征融合.为获得鲁棒的通用视频表示,设计了一种轻量级的多模态特征融合模块(Multimodal Efficient Fusion Module,MEFM),该模块包括共享空间映射与多模态特征交互两部分,在对多模态特征进行充分交互的同时,又能够有效抑制不同模态信息之间的干扰.(3)语义嵌入学习.为适应不同数据分布的暴力数据集,提出了一种基于语义嵌入的多任务学习方法,通过引入中心损失构建暴力语义中心,并采用余弦嵌入损失将暴力样本向中心聚合、非暴力样本进行离散,形成具有语义判别性的特征表示,从而增强了模型的泛化能力,减少了数据噪声的干扰.在VSD2015,Violent Flows和RWF-2000三个公开数据集上的实验表明,本文提出的暴力视频识别模型较已有方法分别提升了4.79%,0.81%和1.5%,取得了具有竞争力的结果. 展开更多
关键词 暴力视频识别 多模态特征融合 语义嵌入 多任务学习
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部