题名 潜在空间中的策略搜索强化学习方法
1
作者
赵婷婷
王莹
孙威
陈亚瑞
王嫄
杨巨成
机构
天津科技大学人工智能学院
出处
《计算机科学与探索》
CSCD
北大核心
2024年第4期1032-1046,共15页
基金
国家自然科学基金(61976156)
天津市企业科技特派员项目(20YDTPJC00560)。
文摘
策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的变化。为了解决上述问题,提出了一种基于潜在空间的策略搜索强化学习方法。将学习状态表示的思想拓展到动作表示上,即在动作表示的潜在空间中学习策略,再将动作表示映射到真实动作空间中。通过表示学习模型的引入,摒弃端到端的训练方式,将整个强化学习任务划分成大规模的表示模型部分和小规模的策略模型部分,使用无监督的学习方法来学习表示模型,使用策略搜索强化学习方法学习小规模的策略模型。大规模的表示模型能保留应有的泛化性和表达能力,小规模的策略模型有助于减轻策略学习的负担,从而在一定程度上缓解深度强化学习领域中样本利用率低、学习效率低和动作选择泛化性弱的问题。最后,在智能控制任务CarRacing和Cheetah中验证了引入潜在空间中的状态表示和动作表示的有效性。
关键词
无模型强化学习
策略模型
状态表示
动作表示
连续动作空间
策略搜索强化学习方法
Keywords
model-free reinforcement learning
policy model
state representations
action representations
continuous action space
policy search reinforcement learning method
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于图卷积神经网络的人体骨架动作识别研究进展
2
作者
杨巨成
张泉钰
王波
王嫄
陈亚瑞
赵婷婷
机构
天津科技大学人工智能学院
思腾合力(天津)科技有限公司
出处
《天津科技大学学报》
CAS
2023年第6期1-11,共11页
基金
国家自然科学基金项目(61976156)。
文摘
基于人体骨架的动作识别是实现计算机视觉智能的重要分支。本文对基于图卷积神经网络的人体骨架动作识别技术进行研究并分析,对基于频谱图卷积和空域图卷积的研究现状进行综述,并从邻接矩阵和输入特征两个角度详述了图卷积模型在人体骨架动作识别领域的研究进展。此外,对现有的基于图卷积神经网络的人体骨架动作识别算法进行了分析比较,最后展望了图卷积神经网络在人体骨架动作识别领域的未来发展方向。
关键词
图理论
图神经网络
图卷积神经网络
基于骨架的动作识别
时空域融合
Keywords
graph theory
graph neural network
graph convolutional neural network
skeleton-based action recognition
spatiotemporal fusion
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于单片机的烟雾报警系统的设计与实现
被引量:1
3
作者
侯琳
李百灵
王馨铎
于洋
杨巨成
机构
天津科技大学人工智能学院
出处
《科技与创新》
2023年第12期110-112,共3页
文摘
基于单片机的烟雾报警系统,采用单片机作为主控设备,通过单片机实现数据的采集与控制,通过对设备的硬件进行设计与对设备软件的程序编写来实现其功能。STC89C52单片机作为控制器负责整体的设备运转,通过外围辅助电路完善整体设备。LCD1602作为显示接口实现人机交互,按键设置信息,由蜂鸣器进行报警提醒,MQ-2气体传感器检测烟雾体积分数,Wi-Fi模块进行无线通信,继电器控制风扇工作。通过单片机与外围辅助完成任务的目标功能,实现基于单片机的烟雾报警系统设计。
关键词
单片机
烟雾报警
传感器
Wi-Fi模块
分类号
TP277
[自动化与计算机技术—检测技术与自动化装置]
TP368.1
[自动化与计算机技术—计算机系统结构]
题名 潜在空间中深度强化学习方法研究综述
4
作者
赵婷婷
孙威
陈亚瑞
王嫄
杨巨成
机构
天津科技大学人工智能学院
出处
《计算机科学与探索》
CSCD
北大核心
2023年第9期2047-2074,共28页
基金
国家自然科学基金(61976156)
天津市企业科技特派员项目(20YDTPJC00560)。
文摘
深度强化学习(DRL)是实现通用人工智能的一种有效学习范式,已在一系列实际应用中取得了显著成果。然而,DRL存在泛化性能差、样本效率低等问题。基于深度神经网络的表示学习通过学习环境的底层结构,能够有效缓解上述问题。因此,基于潜在空间的深度强化学习成为该领域的主流方法。系统地综述了基于潜在空间的表示学习在深度强化学习中的研究进展,分析并总结了现有基于潜在空间的深度强化学习的方法,将其分为潜在空间中的状态表示、动作表示以及动力学模型进行详细阐述。其中,潜在空间中的状态表示又被分为基于重构方式的状态表示方法、基于互模拟等价的状态表示方法及其他状态表示方法。最后,列举了现有基于潜在空间的强化学习在游戏领域、智能控制领域、推荐领域及其他领域的成功应用,并浅谈了该领域的未来发展趋势。
关键词
强化学习
深度学习
潜在空间
状态表示
动作表示
Keywords
reinforcement learning
deep learning
latent space
state representation
action representation
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于值函数估计的参数探索策略梯度算法
5
作者
赵婷婷
杨梦楠
陈亚瑞
王嫄
杨巨成
机构
天津科技大学人工智能学院
出处
《计算机应用研究》
CSCD
北大核心
2023年第8期2404-2410,共7页
基金
国家自然科学基金资助项目(61976156)
天津市企业科技特派员资助项目(20YDTPJC00560)。
文摘
策略梯度估计方差大是策略梯度算法存在的普遍问题,基于参数探索的策略梯度算法(PGPE)通过使用确定性策略有效缓解了这一问题。然而,PGPE算法基于蒙特卡罗方法进行策略梯度的估计,需要大量学习样本才能保证梯度估计相对稳定,因此,梯度估计方差大阻碍了其在现实问题中的实际应用。为进一步减小PGPE算法策略梯度估计的方差,提出了基于值函数估计的参数探索策略梯度算法(PGPE-FA),该算法在PGPE算法中引入Actor-Critic框架。具体地,提出的方法使用价值函数估计策略梯度,代替了PGPE方法使用轨迹样本估计策略梯度的方式,从而减小了梯度估计方差。最后,通过实验验证了所提算法能够减小梯度估计的方差。
关键词
强化学习
值函数
参数探索策略梯度
梯度估计方差
Keywords
reinforcement learning
value function
policy gradients with parameter based exploration
variance of gradient estimates
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于知识蒸馏与目标区域选取的细粒度图像分类方法
6
作者
赵婷婷
高欢
常玉广
陈亚瑞
王嫄
杨巨成
机构
天津科技大学人工智能学院
出处
《计算机应用研究》
CSCD
北大核心
2023年第9期2863-2868,共6页
基金
国家自然科学基金资助项目(61976156)
天津市企业科技特派员项目(20YDTPJC00560)。
文摘
细粒度图像分类任务由于自身存在的细微的类间差别和巨大的类内差别使其极具挑战性,为了更好地学习细粒度图像的潜在特征,该算法将知识蒸馏引入到细粒度图像分类任务中,提出基于知识蒸馏与目标区域选取的细粒度图像分类方法(TRS-DeiT),能使其兼具CNN模型和Transformer模型的各自优点。此外,TRS-DeiT的新型目标区域选取模块能够获取最具区分性的区域;为了区分任务中的易混淆类,引入对抗损失函数计算不同类别图像间的相似度。最终,在三个经典细粒度数据集CUB-200-2011、Stanford Cars和Stanford Dogs上进行训练测试,分别达到90.8%、95.0%、95.1%的准确率。实验结果表明,该算法相较于传统模型具有更高的准确性,通过可视化结果进一步证实该算法的注意力主要集中在识别对象,从而使其更擅长处理细粒度图像分类任务。
关键词
细粒度图像分类
知识蒸馏
TRANSFORMER
深度学习
Keywords
fine-grained visual classification
knowledge distillation
Transformer
deep learning
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于最优向量基线的参数探索策略梯度算法
7
作者
赵婷婷
李坤
刘展硕
陈亚瑞
王嫄
杨巨成
机构
天津科技大学人工智能学院
出处
《天津科技大学学报》
CAS
2023年第4期69-75,共7页
基金
国家自然科学基金项目(61976156)
天津市企业科技特派员项目(20YDTPJC00560)。
文摘
策略梯度算法是深度强化学习领域中广泛使用的一类无模型强化学习方法,在实际应用中取得了突破性进展。策略梯度算法一直受到梯度估计方差大的困扰,基于参数探索的策略梯度算法(policy gradients with parameterbased exploration,PGPE)从根本上缓解了该问题。通过最优基线技术的引入,策略梯度估计的方差进一步减小。然而,现有最优基线技术只使用标量值作为基线,忽略了策略梯度各维度之间的差异。针对此问题,本文提出一种向量基线概念并推导PGPE算法的最优向量基线表示,在理论上证明了引入最优向量基线的PGPE算法可以得到更小的梯度估计方差,并且实验验证了此算法的有效性。
关键词
深度强化学习
策略梯度
梯度估计
方差
Keywords
deep reinforcement learning
policy gradients
gradient estimation
variance
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于多模态图卷积神经网络的行人重识别方法
8
作者
何嘉明
杨巨成
吴超
闫潇宁
许能华
机构
天津科技大学人工智能学院
深圳市安软科技股份有限公司
出处
《计算机应用》
CSCD
北大核心
2023年第7期2182-2189,共8页
文摘
针对行人重识别中行人文本属性信息未被充分利用以及文本属性之间语义联系未被挖掘的问题,提出一种基于多模态的图卷积神经网络(GCN)行人重识别方法。首先使用深度卷积神经网络(DCNN)学习行人文本属性与行人图像特征;然后借助GCN有效的关系挖掘能力,将文本属性特征与图像特征作为GCN的输入,通过图卷积运算来传递文本属性节点间的语义信息,从而学习文本属性间隐含的语义联系信息,并将该语义信息融入图像特征中;最后GCN输出鲁棒的行人特征。该多模态的行人重识别方法在Market-1501数据集上获得了87.6%的平均精度均值(mAP)和95.1%的Rank-1准确度;在DukeMTMC-reID数据集上获得了77.3%的mAP和88.4%的Rank-1准确度,验证了所提方法的有效性。
关键词
行人重识别
多模态
图卷积神经网络
行人文本属性
隐含语义联系
Keywords
person re-identification
multi-modal
Graph Convolutional neural Network(GCN)
person textual attribute
potential semantic relationship
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 熵正则化下的变分深度生成聚类模型
9
作者
张志远
陈亚瑞
杨剑宁
丁文强
杨巨成
机构
天津科技大学人工智能学院
出处
《计算机科学与探索》
CSCD
北大核心
2023年第2期376-384,共9页
基金
天津市研究生科研创新项目(人工智能专项)(2020YJSZXS31)。
文摘
基于深度学习的聚类方法可以自动学习到数据的隐层特征表示,并可方便应用于高维大规模数据集上。传统深度聚类方法更多关注通过深层神经网络去提取数据的隐层特征来提升聚类精度,较少对聚类任务中数据类别的确定性问题进行分析,同时缺乏对施加约束后的离散隐向量分布的分析。提出熵正则化下的变分深度生成聚类模型(VDGC-ER),以变分自编码为基础框架,对连续向量进行高斯混合先验建模,并以高斯混合中的离散隐向量作为类别向量。通过对离散隐向量引入样本熵正则化项增强预测聚类类别的区分度,同时对离散隐向量定义聚合样本熵正则化项以降低聚类不平衡,避免局部最优,并提升生成数据多样性。之后,采用蒙特卡洛采样及重参策略估计VDGC-ER模型的优化目标,并利用随机梯度下降法求解模型参数。最后在MNIST数据集、REUTERS数据集、REUTERS-10K数据集和HHAR数据集上设计了对比实验,验证了VDGCER模型不仅可以生成高质量的样本,而且可以显著提升聚类精度。
关键词
变分自编码
概率生成模型
变分推理
熵正则化
聚类
Keywords
variational autoencoder
probabilistic generative model
variational inference
entropy regularization
clustering
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 面向短文本语义分析的标签条件神经主题模型
10
作者
王嫄
鄢艳玲
徐茂玲
胡鹏
赵婷婷
杨巨成
机构
天津科技大学人工智能学院
普迈康(天津)精准医疗科技有限公司
出处
《计算机工程与应用》
CSCD
北大核心
2023年第11期80-87,共8页
基金
国家自然科学基金(61702367,61976156)
天津市企业科技特派员项目(20YDTPJC00560)
天津市自然科学基金(19JCYBJC15300)。
文摘
无监督机器学习方法中的神经主题模型已被广泛用于自动挖掘文本潜在语义。然而,短文本篇幅有限,文中可用于推断的信息匮乏,模型难以在上下文不充分的情况下正确识别歧义词。为此,提出了一种面向短文本语义分析的标签条件神经主题模型,模型采用变分自编码器架构,在编码器输出的主题分布上引入文本的标签信息,作为主题类别级的语义标识符指导模型过滤与当前主题语义不相关的词、凝练语义并辨识歧义词在主题语境下的准确词义,引导模型推断离散一致的主题。针对短文本应用过程中主题语义分布统计显著有偏的数据特点,在模型训练过程中引入泰勒损失,通过调整泰勒多项式系数建模短文本类别分布不平衡。实验结果表明,该模型不仅能够极大提高短文本主题建模的质量,生成连贯且多样的主题,而且能有效提升下游任务性能。
关键词
神经主题模型
短文本
泰勒损失
Keywords
neural topic models
short texts
PolyLoss
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于深度学习的人脸识别方法研究综述
被引量:50
11
作者
杨巨成
刘娜
房珊珊
谢迎
机构
天津科技大学计算机科学与信息工程学院
天津农学院工程技术学院
出处
《天津科技大学学报》
CAS
北大核心
2016年第6期1-10,共10页
基金
国家自然科学基金资助项目(61502338)
天津市科技支撑计划重点资助项目(15ZCZDGX00200)
文摘
针对基于深度学习的人脸识别这一生物特征识别领域的研究热点进行了综述.阐释了人脸识别及深度学习模型的基本结构;总结了该技术在国内外的研究现状及其应用,如基于卷积神经网络(CNN)的人脸识别方法、深度非线性人脸形状提取方法、基于深度学习的人脸姿态鲁棒性建模、有约束环境中的全自动人脸识别、基于深度学习的视频监控下的人脸识别、基于深度学习的低分辨率人脸识别以及其他基于深度学习的人脸信息的识别等;分析了当前人脸识别技术在深度学习应用中存在的问题及发展趋势.
关键词
深度学习
人脸识别
卷积神经网络
生物特征识别
Keywords
deep learning
face recognition
convolutional neural network
biometric recognition
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 基于局部边缘差异二值模式的人脸识别方法
被引量:1
12
作者
杨巨成
李琼
刘娜
孙文辉
机构
天津科技大学计算机科学与信息工程学院
出处
《天津科技大学学报》
CAS
北大核心
2016年第4期69-73,共5页
基金
国家自然科学基金资助项目(61502338)
天津市科技支撑计划重点资助项目(15ZCZDGX00200)
文摘
传统的局部二值模式(local binary pattern,LBP)作为一种有效的特征提取与编码方法广泛应用于图像处理领域,但该方法只提取了图像模版中心像素值与边缘像素值的差值信息,这些信息不能全面地表征图像,并且对图像小幅度的灰度变化敏感.针对该方法的缺点,提出了一种基于局部边缘差异二值模式(local edge difference binary pattern,LEDBP)的特征提取算法,并应用于人脸识别领域.与传统的局部二值模式不同,本方法通过计算图像模版中心像素值与边缘像素值的差值来表示局部区域,其首先计算中心像素与相邻像素的边缘差值,然后使用局部三值模式的上模式(upper local ternary pattern)对边缘像素值进行编码,建立直方图后得到特征向量对图像进行表示.实验结果表明,本文算法用于人脸识别较传统的LBP等算法在识别率上有较大提高.
关键词
局部边缘差异
局部二值模式
人脸识别
局部三值模式
Keywords
local edge difference
local binary pattern
face recognition
local ternary patterns
分类号
TP399
[自动化与计算机技术—计算机应用技术]
题名 人脸识别活体检测综述
被引量:7
13
作者
杨巨成
代翔子
韩书杰
毛磊
王嫄
机构
天津科技大学人工智能学院
出处
《天津科技大学学报》
CAS
2020年第1期1-9,17,共10页
基金
国家自然科学基金资助项目(61502338)
文摘
由于人脸认证系统高安全性的需求,并且人脸容易受到照片、视频、面具等伪造攻击,进而导致人脸活体检测具有现实紧迫性.近年来,研究人员在该领域进行了大量的研究,本文介绍目前人脸识别活体检测技术的国内外研究现状,并做相应的分析以及对未来该技术的展望.
关键词
人脸识别
伪造攻击
活体检测
Keywords
face recognition
forgery attack
liveness detection
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 基于加权紧凑局部图结构的人脸识别算法
14
作者
杨巨成
王洁
王嫄
毛磊
代翔子
刘建征
吴超
机构
天津科技大学人工智能学院
出处
《计算机应用研究》
CSCD
北大核心
2021年第1期311-315,共5页
基金
国家自然科学基金资助项目(61702367,61807024,11803022,61976156)
天津市教委科研计划项目(2017KJ033,2018KJ105,2018KJ106)
天津市企业科技特派员项目(20YDTPJC00560)。
文摘
针对局部图结构算法(local graph structure,LGS)构建图结构时用到的像素点距离中心像素太远,以及在图结构形成后分配权重时没有结合周围像素点到中心像素的距离因素问题,提出加权紧凑局部图结构(weighted compact local graph structure,WCLGS)算法。该算法定义了一种混合特征提取策略,从四个方向为中心像素点构建图结构,分别在垂直方向和对角线方向捕获对称和非对称信息,并且在图结构形成后对距中心像素点近的边赋较大的权重,对距中心像素点远的边赋较小的权重。WCLGS通过提取更近的像素点信息和合理的加权策略,密切关注中心像素点的近邻元素的差异,使得中心点两侧的信息提取更加均匀充分。实验证明,与现有的一些局部图结构算法相比,WCLGS在ORL(Olivetti Research Laboratory)、AR(active record)和HD(high definition)热红外人脸数据库上有更好的识别率和性能。
关键词
局部图结构
加权紧凑局部图结构
权重
特征提取
人脸识别
Keywords
local graph structure
weighted compact local graph structure
weight
feature extraction
face recognition
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于误差反馈和面部后先验信息的人脸超分辨率重建
15
作者
杨巨成
左美然
魏峰
孙笑
白亚欣
王嫄
陈亚瑞
机构
天津科技大学人工智能学院
天津科技大学机械工程学院
出处
《天津科技大学学报》
CAS
2022年第2期35-42,共8页
基金
国家自然科学基金资助项目(61976156,61702367)
天津市教委科研计划项目(2017KJ033)。
文摘
人脸超分辨率方法对于低分辨率输入重建很有成效,这些方法往往通过一次或有限次上采样操作提高分辨率,从而构建一种基于前馈结构的网络模型,但这些方法不能完全解决低分辨率到高分辨率人脸图像之间的映射关系,因此生成的图像不够清晰,视觉感知质量差.针对上述问题,本文提出一种基于误差反馈和面部后先验信息的人脸超分辨率重建方法(face super-resolution using error feedback and facial posterior,EFBNet),以获得清晰、逼真的人脸图像.通过一组上下采样操作计算误差,然后反馈误差调整特征的中间表示.这可以理解为一种自校正过程,借助采样操作提供的误差迭代地改变最终结果.此外,设计了一种包含通道级的面部注意力损失和相对判别对抗损失的优化目标,面部注意力损失聚焦于由超分辨率结果预测的精确的后先验信息周围的面部细节,对比由低分辨率输入或中间特征预测的先验信息,该方法可以减少失真,进一步提高生成图像的质量.相对判别对抗损失有助于学习更清晰的边缘和纹理,从而提高图像的清晰度.实验结果表明,该方法可以获得更好的重建结果.
关键词
人脸超分辨率
误差反馈
面部注意力
生成对抗网络
Keywords
face super-resolution
error feedback
facial attention
generative adversarial network
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 混合变分自编码
被引量:4
16
作者
陈亚瑞
蒋硕然
杨巨成
赵婷婷
张传雷
机构
天津科技大学计算机科学与信息工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第1期136-144,共9页
基金
国家自然科学基金项目(61402332,61402331,11803022)
天津市自然科学基金项目(17JCQNJC00400,18JCQNJC69800)
+1 种基金
天津市高等学校科技发展基金项目(2017KJ034,2017KJ035,2018KJ106)
天津科技大学青年教师基金项目(2017LG10)~~
文摘
变分自编码(variational autoencoder,VAE)是一种基于连续隐向量的生成模型,通过变分近似构建目标函数,其中的生成模型及变分推理模型均采用神经网络结构.传统变分自编码模型中的变分识别模型假设多维隐变量之间是相互独立的,这种假设简化了推理过程,但是这使得变分下界过于松弛,同时限制了隐向量空间的表示能力.提出混合变分自编码(mixture of variational autoencoder,MVAE)模型,它通过多个变分自编码组件生成样本数据,丰富了变分识别模型结构,同时扩展了隐向量表示空间.该模型以连续型隐向量作为模型的隐层表示,其先验分布为高斯分布;以离散型隐向量作为各组件的指示向量,其先验分布为多项式分布.对于MVAE模型的变分优化目标,采用重参策略和折棍参数化策略处理目标函数,并用随机梯度下降方法求解模型参数.MVAE采用混合组件的方法可以增强隐变量空间的表示能力,提高近似推理精度,重参策略和折棍参数化策略可以有效求解对应的优化问题.最后在MNIST和OMNIGLOT数据集上设计了对比实验,验证了MVAE模型较高的推理精度及较强的隐变量空间表示能力.
关键词
变分自编码
混合模型
变分推理
折棍参数化
生成模型
Keywords
variational autoencoders
mixture models
variational inference
stick-breaking parame-terization
generative model
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于互信息最大化的意图强化学习方法的研究
被引量:2
17
作者
赵婷婷
吴帅
杨梦楠
陈亚瑞
王嫄
杨巨成
机构
天津科技大学人工智能学院
出处
《计算机应用研究》
CSCD
北大核心
2022年第11期3327-3332,3364,共7页
基金
国家自然科学基金资助项目(61976156)
天津市企业科技特派员项目(20YDTPJC00560)。
文摘
强化学习主要研究智能体如何根据环境作出较好的决策,其核心是学习策略。基于传统策略模型的动作选择主要依赖于状态感知、历史记忆及模型参数等,其智能体行为很难受到控制。然而,当人类智能体完成任务时,通常会根据自身的意愿或动机选择相应的行为。受人类决策机制的启发,为了让强化学习中的行为选择可控,使智能体能够根据意图选择动作,将意图变量加入到策略模型中,提出了一种基于意图控制的强化学习策略学习方法。具体地,通过意图变量与动作的互信息最大化使两者产生高相关性,使得策略能够根据给定意图变量选择相关动作,从而达到对智能体的控制。最终,通过复杂的机器人控制仿真任务Mujoco验证了所提方法能够有效地通过意图变量控制机器人的移动速度和移动角度。
关键词
强化学习
互信息
意图控制
近端策略优化算法
Keywords
reinforcement learning(RL)
mutual information
intentional control
proximal policy optimization
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 概率生成模型变分推理方法综述
被引量:1
18
作者
陈亚瑞
杨巨成
史艳翠
王嫄
赵婷婷
机构
天津科技大学人工智能学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第3期617-632,共16页
基金
国家自然科学基金项目(61976156,61702367)
天津市自然科学基金项目(18JCQNJC69800)
天津科技大学青年教师基金项目(2017LG10)。
文摘
概率生成模型是知识表示的重要方法,在该模型上计算似然函数的概率推理问题一般是难解的.变分推理是重要的确定性近似推理方法,具有较快的收敛速度、坚实的理论基础.尤其随着大数据时代的到来,概率生成模型变分推理方法受到工业界和学术界的极大关注.综述了多种概率生成模型变分推理框架及最新进展,具体包括:首先综述了概率生成模型变分推理一般框架及基于变分推理的生成模型参数学习过程;然后对于条件共轭指数族分布,给出了具有解析优化式的变分推理框架及该框架下可扩展的随机化变分推理;进一步,对于一般概率分布,给出了基于随机梯度的黑盒变分推理框架,并简述了该框架下多种变分推理算法的具体实现;最后分析了结构化变分推理,通过不同方式丰富变分分布提高推理精度并改善近似推理一致性.此外,展望了概率生成模型变分推理的发展趋势.
关键词
概率生成模型
变分推理
条件共轭指数族
黑盒变分推理
结构化变分推理
Keywords
probabilistic generative model
variational inference
conditional conjugate exponential family
black box variational inference
structured variational inference
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 产教融合视域下校企协同育人的研究与实践
被引量:18
19
作者
桑潇
杨巨成
机构
天津科技大学计算机科学与信息工程学院
出处
《中国轻工教育》
2018年第1期62-66,共5页
基金
天津市教育科学“十三五”规划课题“产教融合育人体制机制研究--基于物联网工程专业产教融合实践”(HE1018)
文摘
校企协同育人是高校实现精准人才培养,提升应用型人才培养质量以及服务地方经济发展的重要途径。本文从高校、企业和政府等校企协同育人的构成要素入手,探究阻碍校企深度融合的原因,并在此基础上提出创新和优化校企协同育人的路径:以政府为主导,规范校企协同育人的激励和约束机制,发挥好校企协同的桥梁纽带和制度导向作用;以高校和企业为主体,完善校企协同育人的合作机制,保障好高校与企业协同育人的质量与成效。
关键词
产教融合
协同育人
优化机制
Keywords
industry-education integration
cooperative talent cultivation
optimization of mechanism
分类号
G712.3
[文化科学—职业技术教育学]
题名 探究式教学模式在《物联网通信技术》课程中的应用
被引量:11
20
作者
史艳翠
郝宇
杨巨成
陈亚瑞
机构
天津科技大学计算机科学与信息工程学院
天津国土资源和房屋职业学院
出处
《科技与创新》
2017年第1期137-138,共2页
基金
产教融合育人体制机制研究--基于物联网工程专业产教融合实践(重点课题
课题编号:HE1018)
+2 种基金
天津市滨海新区开发开放与高等教育的互动研究--以物联网工程专业教育为例(青年专项
课题编号:HEYP5014)
天津市高等职业技术教育研究会规划课题"探究式教学模式在<园林树木与栽植养护>课程教学中的应用研究"(课题编号:XV465)
文摘
物联网行业的发展对学生创新能力提出了更高的要求,而探究式教学模式是培养学生创新能力的有效教学方法。因此,针对现在教学中存在的问题,将探究式教学应用到《物联网通信技术》课程中。根据《物联网通信技术》课程的特点,实施探究式教学,包括问题情境的创建、情境问题的解决、应用与拓展以及评价。通过探究式教学改革,以期提高学生学习的主动性、团队合作精神和创新能力,从而使物联网专业的学生更符合企业的需求。
关键词
探究式教学
教学改革
问题情境
物联网
分类号
G642.4
[文化科学—高等教育学]